Claude Skills:被 90% 的人低估的自动化超能力 | 三周深度实测 | 回到Axton
By 回到Axton
Summary
Topics Covered
- Skills将Prompt资产化
- 能力包封装判断逻辑
- 软编排调度子智能体
- Skills连接Prompt到Agent
Full Transcript
你好,欢迎回到 Axton Claude Skills 现在发布已经三周了 这三周我几乎每天都在用 越用越确信了一件事 这是一个有机会改变 AI 智能体 AI Agent 格局的东西 也是在当前 AI 喧嚣当中 我认为最值得大家认真关注的一项技术 很多人一听 Skills 会先有三个问号 这东西到底是干嘛的
会不会又是一个只会炒概念的功能呢 和 Project、MCP 等等 它又有什么关系呢 我先说结论 然后我们再慢慢展开 对于我这种天天写 Prompt 做自动化的人来说呢 Claude Skills 有三个 让我眼前一亮的功能点 第一,不用写一行代码 就可以把非常复杂的判断逻辑呢
封装成一个可以复用的模块 第二,原本要花四五个小时 反复人工判断的工作呢 现在五分钟就能跑完 而且结果稳定一致 第三,它不是孤零零的一个功能 而是可以和 MCP、工具调用、 多 Agent 协作,拼成一整套的工作流 如果用一句最简单的话来概括呢
就是 Prompt 告诉 AI 做什么 而 Skills 呢 告诉 AI 如何判断、以及整个流程要怎么跑 那这一集啊,我会用两个真实的案例来带你看清楚 Skills 到底是什么 为什么,我觉得它是当前最值得关注的 Agent 技术 不会写代码也没关系 你可以在今天看完之后呢 根据视频后面的五个步骤操作
直接动手就可以用起来 咱们直接开始 好,那么到底什么是 Skills 官方的定义呢是说 Skills 是指令、脚本和资源组成的文件夹 Claude 会动态加载这些文件夹以提升在专业任务上的表现 那么这里面其实有一个比较重要的特点呢
就是 Skills 会教会 Claude 如何以可重复的方式来完成特定的任务 所以我们可以把 Skills 的定义简化为可复用的指令包 因此呀,很多人听到 Skills 的第一反应就是 这不就是一个保存 Prompt 的地方吗 当然这句话没错 但是呢,完全没有体现出 Skills 厉害的地方
对我来说呢,更准确的一个理解 应该是 Skills 让你把自己的判断逻辑和处理流程 写成一个 Claude 能反复执行的模块 那这个模块长什么样子呢 好,我们来看一个具体的 Skill 的结构 这个 Skill 呢,它就是一个文件夹
里边有一个核心的 SKILL.md 的一个 Markdown 文件
里边有一个核心的 SKILL.md 的一个 Markdown 文件 它会用 Markdown 的格式来写清楚 这个 Skill 要解决什么问题 所以从本质上来说呢 SKILL.md 这个 Markdown 文件呢
SKILL.md 这个 Markdown 文件呢 它实际上就是我们的系统提示词 System Prompt 比如我们完全可以用一个最简单的 Prompt 来创建一个 Skill 把英文翻译成中文 只要这一个 SKILL.md 文件一句话
只要这一个 SKILL.md 文件一句话 它就可以当作一个 Skill 来使用 所以 Skills 本身来说,入门是非常之简单 但是它同样可以完成非常复杂的功能 Skill 这个文件的重点啊 就是它的名称和它的描述 因为 Claude 根据名称和描述来判断什么时候调用这个 Skill
所以这边描述一定要写清楚 那除了它的主文件 最重要的 SKILL.md 这个文件呢
最重要的 SKILL.md 这个文件呢 它还有一些可选的资源文件 比如固定的模板 参考文档 示例 甚至呢会有一些脚本代码 好 那你可能会想 我现在就可以写一个很长的 Prompt 把判断标准、流程步骤 注意事项全部都写进去 让 AI 每次来照着做 那这和写 Skill 有什么区别呢
这个问题非常好 确实呢 从内容的复杂度来说 Prompt 和 Skill 没有本质的区别 你完全可以写一个两三千字的 Prompt 把它当成一份迷你的工作说明书来使用 但是真正的差别呢 在于它们的形态和生命周期 Prompt 是一次性的对话内容 你需要自己保存 自己复制粘贴
模型不会知道 什么时候该用哪一个长 Prompt 而且你一次要把 Prompt 呢 全部要塞到上下文里边 这会大量的占用你的模型的上下文空间 而 Skills 呢 它是把同样的东西啊 换了一种更工程化的包装方式 它是一个文件夹 里边呢 有 SKILL.md
有 SKILL.md 以及相关的资源文件 在 Claude 启动的时候呢 它只会加载 名字和简介 觉得相关呢 才会把完整的内容给读进来 这就是 Skills 的一个很重要的特性 叫做渐进式披露 渐进式加载 而同一个 Skill 呢 本身它就是一个纯文本的一个文件夹
你可以在不同的对话 不同的产品当中复用 也可以把它进行版本管理 可以跟团队的同事一起来进行共享和协作 所以你也可以理解为 Skill 不是写出了更复杂的 Prompt 而是把复杂 Prompt 变成了一个有结构 可复用 可以自动调用的模块
这就是为什么我很看重 Skills 它把我们过去靠人肉维护的 Prompt 库呢 升级成了一套可以被 Claude 主动使用的 判断和流程的资产 这也是我的 MAPS 思维框架当中 A 架构设计部分 强调的一个核心的原则 就是资产化 什么是资产化呢
就是把你的个人技巧 隐形的知识 转换成一个可以规模化的数字资产 那这里的重点呢 就是你的知识加规模化 好,咱们概念讲清楚了 Skills 有很多种用法 今天呢,我会重点展示两种 一种呢,叫做能力包型 它是用来封装判断逻辑和处理规则
还有一种是软编排型 这是用来协调多个 sub-agents 协作 那在看具体案例之前呢 我们先来简单理解一下 这两种模式的本质区别 从 Claude 的官方文档来看呢 Skills 有三种用途 第一个就是知识包 知识包,比如品牌规范 打包在一起
那第二种呢,就是能力包 比如 PDF 处理啊 生成 Word 文档等等各种能力 那第三种呢,就是官方版的编排型 在单个 Skill 里 可以编排多步骤的流程 那今天我要展示的呢 是两种实际使用的场景 第一种就是能力包型 我会用整理笔记的 Skill
来作为例子给大家进行讲解 这种能力包型 Skill 的特点呢 就是它会封装一整套的判断逻辑和处理规则 Claude 读取后 就会按照你定义好的这些规则来进行执行 它不会调用其他 Agent 其他的智能体 只是让 Claude 按规矩做事
比如我整理笔记的这个 Skill 主要是教会 Claude 怎么样去判断内容的价值和可信度啊 怎么样提取关键信息 以及如何去进行验证 那第二种呢,是我的一种扩展用法 我叫做软编排型 它跟官方的编排型是有一定的区别 同样我这边也定义了一个 SOP
定义了标准的流程 但在这个 Skill 过程中 我会调度 sub-agents 因为在 Claude Code 里 我们可以去创建很多的子的智能体 所以这种 Skill 的特点呢 就是它不自己干活 只是定义了一套 SOP 然后主 Claude 呢 会读取这个 SOP
最终使用 Task 工具 调度多个独立的 sub-agents sub-agents 之间 会通过文件来传递上下文 不走主 Claude 好了,我们先不讲太多的理论 我们直接来看这两个案例 你就明白了 然后我们先用第一个案例 来展示一下我们的能力包型
好,首先我们来看第一个能力包型的案例 就是对我的笔记 对我的讨论记录呢 进行整理 这个 Skill 的名称是 discussion-organizer 只有一个主 Skill 文件 然后有两个可以参考的模板信息 那它使用的场景呢 就是在日常的学习当中 比如说我们学习 Skills 的过程当中
我们会记录各种的笔记 我们还会跟 AI 进行多轮对话 那在这些里面呢 都有一些非常有价值的信息 需要我们把它给最终整理出来 记录下来 那如果人工整理呢 这是一个非常耗时的事情 所以我们可以通过 Skill 来进行一个快速的预整理 使用 Skill 呢
可以在 Claude 客户端中使用 也可以在 Claude Code 里使用 其实我更推荐在 Claude Code 里使用 那如果在桌面端使用呢 可以有几种办法让 Claude 读取笔记内容 一种是用 MCP 直接读取本地文件 或者你也可以把这些文件放在你的 Google Drive 里头
让它读取 Google Drive 那这次为了简单起见呢 我就直接上传给他 然后我就要求他 请帮我整理以下这些讨论记录和学习笔记 Claude 根据我的要求 他就知道他将要使用 discussion-organizer 这个 Skill 进行整理 那在整理之前 他会需要我进行一些需求的确认 这些需要确认的内容呢
是在 Skill 里定义的 我们说清楚我们的需求之后 就可以继续 好,这时候我们就可以看到 这个 Skill 在创建知识库文档 这个 Skill 在做什么 实际上封装了四层判断逻辑 比如每一条讨论都会进行一个评估 它是核心洞察 还是一些有用的补充呢 还是一些无价值的信息
第二呢,进行可信度的一些判断 对于提到的一些论点和观点呢 要进行可信度的验证 是不是有官方的文档或者数据要支持等等 还有呢,我们提取的粒度 直接引用原话呀 还是说只需要记录主题就可以了 那最后呢,我们可能还需要一些 措辞风格的一些变化 根据你的具体的需求不同
把口语化转换成书面语等等 这是整个 Skill 在做的任务 好,创建完成 整理后的结果呢 会按照 TBRC 框架组织 可以用于个人知识库 它会提炼出核心论点 能力范围和限制等等 然后也给出了他所有的参考资源的参考链接 所以这是典型的能力包型 Skill
它会根据我们要求的四个步骤 四层的判断逻辑 来对这些信息进行挨个的处理 那他们的处理的逻辑呢 都定义在 SKILL.md 文件里
都定义在 SKILL.md 文件里 这是 Skill 的 Markdown 文件详细内容 它会有一个整体的一个流程 然后需求确认 就是我们刚才看到的需求确认的过程 所以这是能力包型 Skill 的典型场景 可以封装复杂的判断逻辑 而这里面判断的逻辑具体应该是什么呢
这就是来自于你的知识和经验 你想让它怎么去判断 你就去定义它的逻辑 所以除了在 SKILL.md 文档中
所以除了在 SKILL.md 文档中 我们给它定义了它具体要进行的操作之外呢 我们还会给它提供参考的文件 必要的时候呢 Claude 就会参考 比如说输出模板 它就会去参考这个模板的定义 这也就是我们之前提到的按需加载的好处 当我们需要 TBRC 框架时 它会参考这个模板 如果你需要的是其他的框架呢
它就不会去读取这个模板 好 接下来我们来看第二个类型的 Skill 叫做软编排型 我们先来看一下这个例子 我们所需要处理的场景 这个例子呢 是我对字幕文件处理的流程 比如我有一期视频是讲 用 AI 直接生成 Obsidian Canvas 脑图 那这个文件呢
就是那期视频的字幕文本 是标准的 SRT 字幕文件 那么当我一个视频做完 生成完字幕文件之后呢 我希望把这个字幕文件 转换成一篇文章来留存下来 所以我就需要对这个字幕文件啊 做以下一些处理 首先呢 字幕是一行一行的 所以我们需要把它先转换成一个段落的格式 其次呢
字幕是语音识别来的 所以它必然会有识别错误 我们需要针对这些可能的识别错误呢 进行校对 而在校对的过程当中呢 AI 也会提供一些修改建议 那校对完成之后 我们要根据修改建议和校对后的结果呢 来生成一个最终的一个文章 最后一步 这是根据条件来的 如果你的字幕是英文的呢
就翻译成中文 这就是对字幕处理的 Skill 它需要完成的四个阶段的任务 但是在我们的软编排的实例里面呢 这个项目任务并不是由一个 Skill 完成 而是这个 Skill 会调用四个 Agent 四个 sub-agents 我们先来看一下它的运行结果 然后边看边说 我们先进入 Claude Code 然后我们就说
把这个字幕文件转换成文章 好 首先我们就可以看到 它已经调用了 srt-workflow 这个 Skill 进行处理 并且它根据文件的内容呢 检测到是中文 所以它会执行一个三阶段的工作流 也就是不需要进行翻译 它首先运行的就是 第0阶段 字幕分段的阶段 然后它调用 subtitle-segmenter 是一个 Agent 一个 sub-agent
一个子智能体 那这边实际上相当于 给这个 sub-agent 发送 Prompt OK 第0阶段已经完成 生成了46个段落 然后开始进入到下一阶段 Stage 1 也就是它的段落的审阅 好 因为在进行内容审阅的过程当中 它需要去进行验证 所以需要调用 Web Search 这个工具 这个工具
这是第二个 sub-agent 好 Stage 1 已经完成 提供了结构优化和可读性建议 然后开始最后的内容定稿 这是第3个 sub-agent 转换完成 以下是完整的处理流程 然后最终输出的文档 包括一些中间文件 我们来看一下这个文档 OK 这就是生成的一个最终结果
那么它就把字幕呢 SRT 字幕 就转换成了一个这种 段落的文章的形式 OK 那这个案例和刚才的整理和总结 我们的学习笔记和讨论笔记的 discussion-organizer 有什么本质的区别呢 我们可以看到 实际上不是一个 Skill 在自己干活 它是根据我们定义的一个 四阶段的一个标准的操作流程
字幕分段 段落审阅 内容定稿 还有翻译 这四个阶段的流程来进行处理的 每一个阶段呢 都是一个独立的 sub-agent 就是一个子智能体 它有自己的上下文的窗口 有自己的工具白名单 还有自己的判断标准 而主 Claude 也就是主 Claude 它的角色就像是一个项目经理
它的任务就是读取我们定义好的标准 然后呢 使用 Task 工具按顺序调用 sub-agents 调用子智能体 所以我们可以看到这边它允许的工具呢 就是 Task 工具 然后它会去检查每个阶段的输出 决定下一步要走哪一条分支 OK 所以这是软编排
Skill 的典型场景 但是需要注意的就是 这种方式 只能在 Claude Code 里使用 因为会用到 Task 工具 编排这些 sub-agents Web 版不支持 OK 这两个案例我们演示完了 你可能会想 这个我能用吗 有什么限制吗 那咱们先来说一下 它的使用边界和限制 OK 这是 Claude 客户端的配置界面
使用 Skills 的前置条件 就是你必须是付费用户 然后呢 你要使用它 你必须要打开代码的执行权限 因为你的 Skills 它会依赖于文件系统的工具 和代码的执行能力 所以打开代码执行权限 其实是有一定的风险的 因此呢 就是使用 Skills 你应该尽量的 只使用可信来源
待会我们会讲详细的 上传 Skills 的操作过程 那除了 Claude 的客户端 和 Web 界面之外呢 刚才我们也看到了 我们还可以在 Claude Code 当中 使用 Skills 所以对于我们前面展示的 能力包型的这些 Skills 呢 在 Web 端和客户端 包括 Claude Code 都可以使用 但是我们刚才调度 子智能体的这个方式呢
我们只能在 Claude Code 里面用 所以这是我建议大家 使用 Claude Code 的一个原因之一 Claude Code 用起来会有更大的灵活性 那这里面 Skills 它也有几个限制 我们需要了解一下 首先呢 它 Skills 是不能跨平台同步的 你在客户端上传的 Skills 它并不能给你自动同步到 Claude Code 去 或者 API 那边去 所以呢
你最好有一个 你自己管理你的 Skills 的一个方式 那第二个限制 就像我们之前说到的 Claude 它会根据你的 Skills 的描述 来判断它应该调用哪一个 Skills 所以它的触发是根据你的描述来的 如果你的描述写的不清楚 或者你多个 Skills 的描述很接近的话
那可能就会造成这个 Skills 不能正确的被调用 所以一方面就是你要写清楚 它的描述内容 另外一方面呢 你必要的时候 你可以手工的去指定 Skills 的名称 我就要用这个 Skills 来做什么事 还有对于我们的软编排的限制呢 如果我们要用 Skills 去调度 sub-agents 这些子智能体呢 那有个限制
就是说并行的 sub-agents 呢 最多有 10 个 当然大多数场景 我们用不到这么多 那什么情况下 不适合于我们用 Skills 来做呢 比如一次性的任务 你并不需要去重复执行它 还有就是非常简单的指令 还有一种呢 是需要精确的控制 后端服务的一些流程 那这样的流程 就不适合于用我们的软编排 或者 Skills 来做了 它更适合的场景
就是硬编排 也就是用像 Make 这样的 自动化平台 去进行流程的定制 好 限制我们说清楚了 那接下来我会用 MAPS 框架 来帮你复盘一下 最后呢 再给你一套 立刻就能动手的执行的步骤 OK 这就是我的 MAPS 框架 这是我们与 AI 协作的 一个可落地的框架 包括心智模式 架构设计
人机对话和系统化 这四个维度 那么我们可以用这个 MAPS 框架 来审视一下 Skills 从心智的角度呢 这是我们从写 Prompt 到把它资产化的一个过程 相当于把隐性的知识呢 显性化 模块化 这就不再是我知道该怎么做 而是我把它封装成了可以复用的模块 那在架构阶段
Skills 可以作为中间层 它可以连接你的 Prompt 和 Agent 和智能体 我们可以通过软编排 把一项任务的声明过程 也就是它的流程过程 和它的执行过程进行分离 然后你的判断逻辑 都变成可以版本化 可以共享的数字资产 在提示工程这一部分呢 Prompt 它不再是临时的指令了
这些 Prompt 就会变成封装在 Skills 里面的规范 而 Skills 的特点呢 就是它的渐进式披露 它只在需要的时候加载 它会节省大量的 Token 同样每个 Skills 呢 我们可以进行独立的迭代和优化 所以它也具有很好的可测试性 而在 System 系统思维的这个角度呢 Skills 它不是一个孤立的功能
它是可以和 MCP 工具调用 多 Agent 进行协作的一个功能 它相当于是一个从单点的工具 到完整的工作流的一个过程 同样还有一个可组合性 sub-agents 可以被多个 Skills 复用 Skills 之间也可以互相调用 互相进行协同 这就是为什么 我说 Skills 有机会改变 Agent 的格局啊
它不是一个简单的功能更新 它是提供了一套 从 Prompt 到 Agent 的一个中间层的抽象 我们可以把判断逻辑资产化 把工作流模块化 把个人经验可复用化 所以这就是我这三周来 对 Skills 非常着迷的一个根本原因所在 好 接下来我们可以看一下 如何快速的上手 我们看完之后 今天就可以动手来
把你的第一个 Skills 创建起来 运行起来 那我们就跟着我们的这个 5A+ 框架来走 那不管是大项目 还是小项目 5A+ 方法论 都是一个很好的项目实践指南 那首先我们第一步 就是要明确自己的需求 我有哪些任务是需要重复的 这些任务里头 哪些需要复杂的判断逻辑呢 然后你把这些任务呢 就当做你的练习 你的 Skills 的一个起点
那准备资源和工具这一块 我们首先需要知道 不同平台的安装方法 我们先来看一下 Claude 的桌面端 桌面端的安装方法 就是在 Claude 的设置 Settings 里面的 Capabilities 能力这一边 然后下面找到 Skills 只要我们点击上传 Skills 就可以了 这个 Skills 呢 实际上就是一个
ZIP 的一个压缩包 比如我们整理笔记的这个 Skill 我们把它压缩成 ZIP 文件 然后扩展名改成 .skill 就可以
.skill 就可以 然后只要把压缩好的 这个 .skill 压缩包
这个 .skill 压缩包 给它拖动过来就可以了 那这是在 Claude 的桌面端 进行安装 Skills 的方法 那么在 Claude Code 里面呢 就更简单了 我们不需要压缩 在你的用户根目录下 这个 .claude 这个目录
这个 .claude 这个目录 点开之后呢 这边有 skills 这个文件夹 我们只要把这个整个文件夹 拷贝到你的 skills 目录里面 就可以了 OK 这是安装 Skills 的两个方法 很简单 那接下来的问题就是 我们从哪里获取 Skills 那基本上有三种主要的 获取 Skills 的方法 第一种就是从官方和社区获取
那这些链接呢 我就放在描述栏当中了 官方在 Claude 的客户端中 预制了一些 Skills 我们可以直接使用 也可以去学习它的结构 比如这里面的这几个 就都是官方的例子 那第二种方法呢 就是用它的 skill-creator 来创建 skill-creator 是官方提供的一个创建 Skills 的一个 Skill 这个就是最方便的来把你的 Prompt
把你的想法给转换成一个 Skills 的方式 你需要在 Claude 的客户端里面把它打开 我们就可以用这个 Skill 了 然后我们可以在一个新的对话里面 使用 skill-creator 来创建 Skills 比如我们说请使用 skill-creator 来创建一个把英文文章翻译成中文的 Skill
这就是最简单的创建 Skills 的方法了 所以刚开始呢 我会推荐大家使用 skill-creator 来进行创建 因为它零学习成本 你不用去手写 YAML 也不用手写 Markdown 这些文本 它会自动的去生成规范的文件结构 还能补充你可能会遗漏的一些部分 几分钟的时间就能把你常用的 Prompt 呢
给你变成 Skill 第三种方法呢 就是手写了 你自己创建文件夹 自己创建 SKILL.md 这个 Markdown 文件
自己创建 SKILL.md 这个 Markdown 文件 然后呢 完全去自定义你的结构和逻辑 那这种情况呢 就是适合于复杂的场景 好 这边这个翻译的 Skill 创建完成了 不但创建完成了一个 Skill 然后还给你提供了详细的使用说明和快速参考的文档 并且还针对我的工作场景进行了优化 我们可以简单的看一眼
OK 这就是他给我们创建好的英文到中文翻译的 专业翻译的 Skill 我们只需要一句话 他就给我们创建了一个详细的翻译的一个流程 还明确提到了核心原则是信达雅 其实 Skill 的 SKILL.md 这个文件
它的重点呢 就是 Markdown 和 YAML 这些概念呢 正是我的在 MAPS 课程里边的基础技术章节里面 重点教的一些内容 还包括 JSON、XML、API 这些 那当初设计这个课程的时候呢 很多人觉得学这些基础干嘛呢 但是现在你看 这些恰恰是 AI 时代最需要掌握的最基本的基础知识
那这个也验证了我一直所强调的 AI 时代它不是不需要基础知识 而是需要一些恰到好处的基础知识 既不会多到眉毛胡子一把抓 也不会知其然不知其所以然 所以如果你感兴趣呢 可以看看课程的介绍 那今天只是展示了 Skills 的基础用法 我计划会用一场更完整的直播呢
来讲解更多的 Skills 的一些技巧和工程化的一些方法论 那我们精英圈的会员呢 可以直接参与直播 课程学员呢 可以直接获得一年的精英圈会员的资格 链接呢就在评论区 希望到时候在直播当中 我们再进一步的探讨 Skills 的更多可能性 好 我们下期再见
Loading video analysis...