10分钟弄懂 什么是大模型Skill
By 程序员老王
Summary
Topics Covered
- 提示词爆炸需Skill管理
- Metadata实现智能发现
- Activation动态加载提示
- Execution按需执行命令
Full Transcript
最近
两年 新
AI
名词 的
数量 比
我 老板
给 我
画 的
饼 还要
多 从
提示 词
工程 到
智能 体
MCP
又 到
A to
A A
to
UI 而
最近 又
来到 了
大S
kill
时代
今天
我们
不用
高大 上
的 名词
用
普通人
也 能
听得懂
的话
来说 说
Skill
到底 是
什么 要
理解
Skill
我们 先
从 提示
词 说起
有 一天
我们
AI
斗江
应该
怎么
做
AI
回答 泡
黄豆
少许
磨碎
加水
适量
煮沸
最后
放盐
什么
叫做
少许
适量 是
多少 而
最最
重要 的
是 豆浆
怎么 能
放盐 呢
后来 我
知道 了
向 AI
提 问题
的 时候
要 具体
于是 我
的 问题
变成 了
告诉 我
豆浆
应该
怎么 做
回答 中
材料
具体
到克
或者
毫升
写出 每
一步 的
操作
时间
并且
最最
重要 的
我 只
喝 甜
豆浆
这样一来
AI 的
回答 就
顺畅 多
了 慢慢
的 我
就 攒
了 好多
这种
规定
输出
内容 的
提示
词当
我闻
菜谱 的
时候 我
就 把
闻 菜谱
的 提示
词 复制
过来 当
我 读
论文 的
时候 我
就 把
读 论文
的 提示
词 复制
过来
但是
后来
提示 词
实在 是
太 多
了 有
的 时候
连 我
自己 都
忘 了
写 过
这么
一个
提示 词
了 那
我 能
不能 把
所有 的
提示 词
连同
用户 的
问题
全都
发给
AI 呢
? 好像
? 好像
也 不行
首先 是
文字
太多 了
会 浪费
非常 多
的
token
而 更加
重要 的
是 问题
不 一定
和 提示
词是
有关 的
而 无关
的 信息
太多 就
容易 让
AI
感到
迷茫 那
有没有
什么
机制 能
让 我们
不 把
所有 的
提示 词
都 发给
AI
而是
根据
问题
自动 的
选出
合适 的
提示 词
呢 ?
有 的
朋友 有
的 这
就是
skill
机制
一个
不同
用途 的
提示 词
就是
一个
skill
而
skill
本身
就是
一个
文件夹
文件夹
中有
一个 叫
skill
. md
. md
的 文件
存 的
就是
提示 词
本身
我们 还
拿 菜谱
为例
比如
要求
AI
回复
材料
精确
到刻
时间
精确 到
秒 我们
对 菜谱
的 所有
要求
以及
任何 想
让 AI
知道 的
信息 都
可以
放到
skill
. md
. md
之中
但是
问题
来
了
我们
可能 有
几十个
Skill
每个
Skill
. md
. md
都 非常
的 长
我们
不能 把
所有 的
Skill
. md
. md
一块 都
发给
AI
所以
我们
需要 给
每 一个
Skill
写 一个
简短 的
介绍
这个
介绍 就
放在
Skill
. md
. md
文件 最
开始 的
位置
叫做
Meta
Data
Meta
Data
的 内容
要求
尽可能
的 简短
只 需要
概括
Skill
的 作用
就 可以
了 到
了 这里
你 可能
会 问
为什么
要 单独
有个
文件夹
来 存放
skill
. md
. md
文件 呢
这个
我们
一会
再说 当
我们 把
所有 的
skill
都 配置
好 之后
我们 再
和 AI
进行
对话
注意
一下
这里 我
在 AI
和 用户
之间 加
了 一个
代表
客户端
的 图标
这才 是
我们 和
AI
沟通 的
真实
过程
我们 的
请求 并
不是
直接
发给
AI
模型 的
而是
中间 要
经过
本地
客户端
或者
网站 的
服务器进行
转发
但是
无论是
本地
客户端
还是
网站
服务器
配置 了
Skill
之后 它
就 会
收集
所有 的
Meta
Data
信息
然后 把
它们
全都
放到
系统
提示
词中 和
用户 的
问题
一块
发给
AI
模型 又
因为
Meta
Data
都 是
简短 的
描述
所以
即使 有
很多 的
Skill
全都 发
过去
占用 的
Token
也 是
比较 少
的 这个
收集
Meta
Data
的 过程
叫做
Disc
overy
发现
AI
收到
用户 的
请求
之后
发现
问题 是
如何 做
豆浆 而
恰巧 又
有 一个
关于
如何 写
菜谱 的
Skil
lAI
通过
语义
理解
判断 出
如何 做
豆浆
应该 和
回复
菜谱 的
提示 词
有关
于是
AI 就
不 着急
回答
如何 做
豆浆 了
它 会
先生 成
一个
特殊 的
回复
要求
客户端
读取
菜谱
Skill
. MD
. MD
的
完整
内容
客户端
收到
这个
特殊
指令
之后 就
会 把
整个
菜谱
对应 的
Skill
. md
. md
全都
发给
AI
于是
AI 就
获得 了
完整 的
提示 词
和 问题
本身 也
就 能
生成
符合
用户
要求 的
回复 了
在 这个
过程
中有
两点
值得注意
首先 是
用户 只
看到 了
最初 的
问题
如何 做
豆浆 和
AI
最终 的
回复 而
中间 这
一大堆
和
Skill
有关
的
对话
用户
是
看不到
的 然后
是 关于
怎么 读
论文 的
skill
当然 它
和 当前
的 对话
是 没有
关系 的
但是
由于
Meta
Data
都 很
简短
所以 它
对
上下文
Token
数量 的
影响 是
比较 小
的 这个
动态
读取
完整
提示 词
的 过程
就 叫做
Acti
vation
激活
至此
Acti
vation
解决 了
选 哪个
skill
的 问题
但是
如果说
一个
skill
本身 就
很大 呢
比如说
菜谱
提示 词
我 不仅
要 把
我七舅
姥爷 的
口味 也
写进去
我 还要
写 我
有 什么
储具
甚至 我
还要 把
以前
收集 的
超 好吃
菜谱
100
篇 也
写进去
于是
即使
只有 这
一个
提示 词
它 也
可能 会
变得
非常 的
大 现在
我们 就
能 说
说
为什么
要 把
skill
. md
. md
单独
放到
一个
文件夹
之中 了
它 的
目的 是
为了
进一步
减小
提示 词
的 体积
因为
我们
可以 在
skill
. md
. md
中 引用
其他 的
文件
比如说
我 可以
把 超
好吃
菜谱
全都
提取 到
recipe
. md
. md
文件
里
厨具 和
口味 也
可以
单独 的
拿 出来
然后
通过
Skil
lMD
告诉
AI
他们 的
文件名
到底 是
什么
这样
我们 就
减小 了
Skill
. MD
. MD
的 体积
并且 在
AI
认为 有
必要 的
时候 还
能 使用
和 读取
Skill
. MD
. MD
相同 的
方法 按
需 读取
厨具 、
口味 和
菜谱
对应 的
文件
甚至 说
如果 你
认为
某些
文件
依然
很大
比如说
这里 的
菜谱
我们
同样
可以 让
菜谱
引用 更
多 的
文件 而
这个
关系 是
可以
一直
嵌套
下去 的
最终 让
AI
决定
到底
需要
读取
哪些
文件
Cloud
把 这个
按 需
读取
各种
文件 的
过程
叫做
Exec
ution
执行 到
这里
有人
可能 会
奇怪 了
这读
文件 和
执行 也
不 挨着
呀
为什么
要 叫
执行 呢
我们 来
回到
AI
回复
菜谱
的
流程
之中
这
是因为
这
一步
读取
关于
如何 写
菜谱 的
skill
实际上
是 AI
通过 让
客户端
执行命令
的 方式
完成 的
而 更加
有用 的
是 除了
读取
文件 的
命令
之外
AI 还
可以
执行
其他 的
命令
如果
我们
使用 的
是
Cloud
应用
或者 是
Cloud
Code
这种
本地
运行 的
程序
这些
命令
就是 在
我们
自己 的
电脑 上
执行 的
这样一来
它 就
可以
直接
访问
我们
电脑 上
存储 的
Skill
当然 也
可以
直接
操作
我们 的
电脑 做
其他 的
工作
但是
如果
使用 的
是 网页
版 命令
就 在
Cloud
提供 的
虚拟机
上 运行
由于
访问
不到
我们 的
本地
文件
我们 就
需要
事先 把
Skill
打包
上传
既然
Skill
可以
执行命令
那 我们
就 也
可以 在
Skill
文件夹
中存
一些
脚本
或者
程序 让
AI
去
执行
它们
比如说
Cloud
官方
操作
的
Skill
就 包括
了 很多
处理
文件 的
小 程序
同时 它
还 在
Skill
对应 的
提示
词中
告诉
AI
应该
如何
使用
这些
脚本
于是 当
我们 有
把
转化成
图片 的
需求 的
时候
AI 就
先 通过
Meta
Data
发现 有
一个
处理
的
Skill
然后
通过
执行命令
读取
Skill
. md
. md
从而
发现
的
Skill
中有
一个
脚本
可以 把
转化成
图片
最后
直接
命令
客户端
来 执行
这个
脚本
完成
用户 的
任务 到
了 这里
还 没完
其实
我们 还
可以
更进一步
我们
为什么
非 要
提前 写
好 脚本
呢 现在
AI 的
编程
能力
这么 强
让 他
自己 写
不行 吗
没错 这
就是
Skill
配合
Exec
ution
最最
强大 的
地方
我们
可以
直接 在
Skill
. md
. md
中 告诉
AI
我们
已经 为
它 安装
好 了
什么样
的
函数库
或者
提供 了
什么样
的 工具
比如说
在
的
Skill
中 就
有
PyPDF
、
Plum
ber
等
一系列
处理
的
Python
函数库
甚至 它
的
skill
. md
. md
文件 中
还有
一些
程序
片段
用来
指导
AI
如何
使用
这些
函数库
有 了
这些
信息
之后
即使
用户
没有 为
某个
功能
编写
专门 的
脚本
AI 也
可以
动态 的
生成
代码
然后 再
执行 来
完成
用户 的
请求
最后
我们 来
做 个
总结
Skill
本身
其实
只是
一个
用来
管理
提示
词
的
工具
我们
通过 把
Meta
Data
也 就是
提示 词
的 介绍
发送给
AI 让
AI
了解 有
哪些
提示 词
可以 用
AI 在
根据
用户 的
问题 按
需 读取
完整 的
提示 词
这个
功能
本身 是
平平
无奇 的
但是
配合
执行命令
的 能力
AI 就
可以
按照
提示 词
的 指示
执行
用户
提前
创建 的
脚本
甚至
直接
生成
代码
完成
用户 的
请求 这
极大 地
扩展 了
AI
的
灵活性
执行
能力 给
了 AI
行动 力
Skill
为 AI
指明 了
方向 当
AI
终于
学会 在
Skill
的 边界
内 谨慎
地 使用
执行 的
权力 的
时候 他
才 实现
了 属于
他 自己
的
知行合一
这里 是
成全
老王
我们
下期
再见
Loading video analysis...