LongCut logo

10分钟弄懂 什么是大模型Skill

By 程序员老王

Summary

Topics Covered

  • 提示词爆炸需Skill管理
  • Metadata实现智能发现
  • Activation动态加载提示
  • Execution按需执行命令

Full Transcript

最近

两年 新

AI

名词 的

数量 比

我 老板

给 我

画 的

饼 还要

多 从

提示 词

工程 到

智能 体

MCP

又 到

A to

A A

to

UI 而

最近 又

来到 了

大S

kill

时代

今天

我们

不用

高大 上

的 名词

普通人

也 能

听得懂

的话

来说 说

Skill

到底 是

什么 要

理解

Skill

我们 先

从 提示

词 说起

有 一天

我们

AI

斗江

应该

怎么

AI

回答 泡

黄豆

少许

磨碎

加水

适量

煮沸

最后

放盐

什么

叫做

少许

适量 是

多少 而

最最

重要 的

是 豆浆

怎么 能

放盐 呢

后来 我

知道 了

向 AI

提 问题

的 时候

要 具体

于是 我

的 问题

变成 了

告诉 我

豆浆

应该

怎么 做

回答 中

材料

具体

到克

或者

毫升

写出 每

一步 的

操作

时间

并且

最最

重要 的

我 只

喝 甜

豆浆

这样一来

AI 的

回答 就

顺畅 多

了 慢慢

的 我

就 攒

了 好多

这种

规定

输出

内容 的

提示

词当

我闻

菜谱 的

时候 我

就 把

闻 菜谱

的 提示

词 复制

过来 当

我 读

论文 的

时候 我

就 把

读 论文

的 提示

词 复制

过来

但是

后来

提示 词

实在 是

太 多

了 有

的 时候

连 我

自己 都

忘 了

写 过

这么

一个

提示 词

了 那

我 能

不能 把

所有 的

提示 词

连同

用户 的

问题

全都

发给

AI 呢

? 好像

? 好像

也 不行

首先 是

文字

太多 了

会 浪费

非常 多

token

而 更加

重要 的

是 问题

不 一定

和 提示

词是

有关 的

而 无关

的 信息

太多 就

容易 让

AI

感到

迷茫 那

有没有

什么

机制 能

让 我们

不 把

所有 的

提示 词

都 发给

AI

而是

根据

问题

自动 的

选出

合适 的

提示 词

呢 ?

有 的

朋友 有

的 这

就是

skill

机制

一个

不同

用途 的

提示 词

就是

一个

skill

skill

本身

就是

一个

文件夹

文件夹

中有

一个 叫

skill

. md

. md

的 文件

存 的

就是

提示 词

本身

我们 还

拿 菜谱

为例

比如

要求

AI

回复

材料

精确

到刻

时间

精确 到

秒 我们

对 菜谱

的 所有

要求

以及

任何 想

让 AI

知道 的

信息 都

可以

放到

skill

. md

. md

之中

但是

问题

我们

可能 有

几十个

Skill

每个

Skill

. md

. md

都 非常

的 长

我们

不能 把

所有 的

Skill

. md

. md

一块 都

发给

AI

所以

我们

需要 给

每 一个

Skill

写 一个

简短 的

介绍

这个

介绍 就

放在

Skill

. md

. md

文件 最

开始 的

位置

叫做

Meta

Data

Meta

Data

的 内容

要求

尽可能

的 简短

只 需要

概括

Skill

的 作用

就 可以

了 到

了 这里

你 可能

会 问

为什么

要 单独

有个

文件夹

来 存放

skill

. md

. md

文件 呢

这个

我们

一会

再说 当

我们 把

所有 的

skill

都 配置

好 之后

我们 再

和 AI

进行

对话

注意

一下

这里 我

在 AI

和 用户

之间 加

了 一个

代表

客户端

的 图标

这才 是

我们 和

AI

沟通 的

真实

过程

我们 的

请求 并

不是

直接

发给

AI

模型 的

而是

中间 要

经过

本地

客户端

或者

网站 的

服务器进行

转发

但是

无论是

本地

客户端

还是

网站

服务器

配置 了

Skill

之后 它

就 会

收集

所有 的

Meta

Data

信息

然后 把

它们

全都

放到

系统

提示

词中 和

用户 的

问题

一块

发给

AI

模型 又

因为

Meta

Data

都 是

简短 的

描述

所以

即使 有

很多 的

Skill

全都 发

过去

占用 的

Token

也 是

比较 少

的 这个

收集

Meta

Data

的 过程

叫做

Disc

overy

发现

AI

收到

用户 的

请求

之后

发现

问题 是

如何 做

豆浆 而

恰巧 又

有 一个

关于

如何 写

菜谱 的

Skil

lAI

通过

语义

理解

判断 出

如何 做

豆浆

应该 和

回复

菜谱 的

提示 词

有关

于是

AI 就

不 着急

回答

如何 做

豆浆 了

它 会

先生 成

一个

特殊 的

回复

要求

客户端

读取

菜谱

Skill

. MD

. MD

完整

内容

客户端

收到

这个

特殊

指令

之后 就

会 把

整个

菜谱

对应 的

Skill

. md

. md

全都

发给

AI

于是

AI 就

获得 了

完整 的

提示 词

和 问题

本身 也

就 能

生成

符合

用户

要求 的

回复 了

在 这个

过程

中有

两点

值得注意

首先 是

用户 只

看到 了

最初 的

问题

如何 做

豆浆 和

AI

最终 的

回复 而

中间 这

一大堆

Skill

有关

对话

用户

看不到

的 然后

是 关于

怎么 读

论文 的

skill

当然 它

和 当前

的 对话

是 没有

关系 的

但是

由于

Meta

Data

都 很

简短

所以 它

上下文

Token

数量 的

影响 是

比较 小

的 这个

动态

读取

完整

提示 词

的 过程

就 叫做

Acti

vation

激活

至此

Acti

vation

解决 了

选 哪个

skill

的 问题

但是

如果说

一个

skill

本身 就

很大 呢

比如说

菜谱

提示 词

我 不仅

要 把

我七舅

姥爷 的

口味 也

写进去

我 还要

写 我

有 什么

储具

甚至 我

还要 把

以前

收集 的

超 好吃

菜谱

100

篇 也

写进去

于是

即使

只有 这

一个

提示 词

它 也

可能 会

变得

非常 的

大 现在

我们 就

能 说

为什么

要 把

skill

. md

. md

单独

放到

一个

文件夹

之中 了

它 的

目的 是

为了

进一步

减小

提示 词

的 体积

因为

我们

可以 在

skill

. md

. md

中 引用

其他 的

文件

比如说

我 可以

把 超

好吃

菜谱

全都

提取 到

recipe

. md

. md

文件

厨具 和

口味 也

可以

单独 的

拿 出来

然后

通过

Skil

lMD

告诉

AI

他们 的

文件名

到底 是

什么

这样

我们 就

减小 了

Skill

. MD

. MD

的 体积

并且 在

AI

认为 有

必要 的

时候 还

能 使用

和 读取

Skill

. MD

. MD

相同 的

方法 按

需 读取

厨具 、

口味 和

菜谱

对应 的

文件

甚至 说

如果 你

认为

某些

文件

依然

很大

比如说

这里 的

菜谱

我们

同样

可以 让

菜谱

引用 更

多 的

文件 而

这个

关系 是

可以

一直

嵌套

下去 的

最终 让

AI

决定

到底

需要

读取

哪些

文件

Cloud

把 这个

按 需

读取

各种

文件 的

过程

叫做

Exec

ution

执行 到

这里

有人

可能 会

奇怪 了

这读

文件 和

执行 也

不 挨着

为什么

要 叫

执行 呢

我们 来

回到

AI

回复

菜谱

流程

之中

是因为

一步

读取

关于

如何 写

菜谱 的

skill

实际上

是 AI

通过 让

客户端

执行命令

的 方式

完成 的

而 更加

有用 的

是 除了

读取

文件 的

命令

之外

AI 还

可以

执行

其他 的

命令

如果

我们

使用 的

Cloud

应用

或者 是

Cloud

Code

这种

本地

运行 的

程序

这些

命令

就是 在

我们

自己 的

电脑 上

执行 的

这样一来

它 就

可以

直接

访问

我们

电脑 上

存储 的

Skill

当然 也

可以

直接

操作

我们 的

电脑 做

其他 的

工作

但是

如果

使用 的

是 网页

版 命令

就 在

Cloud

提供 的

虚拟机

上 运行

由于

访问

不到

我们 的

本地

文件

我们 就

需要

事先 把

Skill

打包

上传

既然

Skill

可以

执行命令

那 我们

就 也

可以 在

Skill

文件夹

中存

一些

脚本

或者

程序 让

AI

执行

它们

比如说

Cloud

官方

操作

PDF

Skill

就 包括

了 很多

处理

PDF

文件 的

小 程序

同时 它

还 在

Skill

对应 的

提示

词中

告诉

AI

应该

如何

使用

这些

脚本

于是 当

我们 有

PDF

转化成

图片 的

需求 的

时候

AI 就

先 通过

Meta

Data

发现 有

一个

处理

PDF

Skill

然后

通过

执行命令

读取

Skill

. md

. md

从而

发现

PDF

Skill

中有

一个

脚本

可以 把

PDF

转化成

图片

最后

直接

命令

客户端

来 执行

这个

脚本

完成

用户 的

任务 到

了 这里

还 没完

其实

我们 还

可以

更进一步

我们

为什么

非 要

提前 写

好 脚本

呢 现在

AI 的

编程

能力

这么 强

让 他

自己 写

不行 吗

没错 这

就是

Skill

配合

Exec

ution

最最

强大 的

地方

我们

可以

直接 在

Skill

. md

. md

中 告诉

AI

我们

已经 为

它 安装

好 了

什么样

函数库

或者

提供 了

什么样

的 工具

比如说

PDF

Skill

中 就

PyPDF

PDF

Plum

ber

一系列

处理

PDF

Python

函数库

甚至 它

skill

. md

. md

文件 中

还有

一些

程序

片段

用来

指导

AI

如何

使用

这些

函数库

有 了

这些

信息

之后

即使

用户

没有 为

某个

功能

编写

专门 的

脚本

AI 也

可以

动态 的

生成

代码

然后 再

执行 来

完成

用户 的

请求

最后

我们 来

做 个

总结

Skill

本身

其实

只是

一个

用来

管理

提示

工具

我们

通过 把

Meta

Data

也 就是

提示 词

的 介绍

发送给

AI 让

AI

了解 有

哪些

提示 词

可以 用

AI 在

根据

用户 的

问题 按

需 读取

完整 的

提示 词

这个

功能

本身 是

平平

无奇 的

但是

配合

执行命令

的 能力

AI 就

可以

按照

提示 词

的 指示

执行

用户

提前

创建 的

脚本

甚至

直接

生成

代码

完成

用户 的

请求 这

极大 地

扩展 了

AI

灵活性

执行

能力 给

了 AI

行动 力

Skill

为 AI

指明 了

方向 当

AI

终于

学会 在

Skill

的 边界

内 谨慎

地 使用

执行 的

权力 的

时候 他

才 实现

了 属于

他 自己

知行合一

这里 是

成全

老王

我们

下期

再见

Loading...

Loading video analysis...