【视频课程】我如何实践打造个人 AI 贾维斯助手 | How I Managed To Build A Personal AI ASSISTAT "JARVIS"
By 范冰 FANBING
Summary
## Key takeaways - **CLI优于GUI**: CLI工具可编程、可自动化,支持批量处理和无缝集成,而GUI需要点击交互、难以批量且孤岛式。CLI只需写脚本即可批量生成100张图片,喝咖啡等10分钟即可。 [28:11], [30:34] - **五层金字塔架构**: 贾维斯采用工具层、数据层、能力层、场景层、回顾层,从下往上搭建但从上往下使用,各层松耦合独立优化。架构由实际开发中AI提炼而成,便于维护迭代。 [20:14], [22:12] - **技能胜过提示词**: Skill是可复用的标准化工作流,一次配置反复调用,包含代码、工具和上下文,比每次输入提示词强大。输入/abc即可自动执行复杂任务。 [55:45], [57:20] - **短视频脚本自动化**: 每天抓取全网热点,生成40个书店脚本后AI评分选前10个,结合老板人设和网感自动发邮件。已产生几千到几万播放量和实际合作。 [17:53], [21:24] - **数据主权攸关**: 将公开动态、私人笔记、聊天记录全收拢到本地,避免贡献给第三方,并多重备份到本地、iCloud、NAS等4-5处。AI自动每天备份数字资产。 [15:02], [16:38] - **语音遥控贾维斯**: 用豆包耳机语音输入关键词如‘记笔记’或‘做任务’,贾维斯爬取聊天记录精炼指令后执行,如调研写文档。接近钢铁侠场景。 [27:45], [31:19]
Topics Covered
- 勿追热点夯实根基
- 数据主权聚拢个人资产
- 五层金字塔架构易迭代
- CLI远胜GUI解放双手
- Skill胜Prompt一劳永逸
Full Transcript
大家好我是范冰 那感谢您的支持 欢迎来到我如何实践 打造个人AI贾维斯助手 这门课程 接下来我要分享的呢 是我如何在最近几个月 自己亲身实践 实打实的搭建出来 一套个人的贾维斯系统 或者我们管它叫AI基础设施 那其中既包括工具资源的使用技巧 也包括具体的日常案例 还有经过一段时间
迭代打磨之后的经验复盘 还有一些资源推荐等等 希望对你有所帮助 那本次课程的结构呢 大概分为四个部分 第一部分 是项目背景和一些案例的演示 第二部分主要是介绍核心框架与思路 第三部分是实战案例与心得 最后呢是经验复盘与资源推荐 那大概的计划就是这样 另外呢想跟各位说明的是 在整个课程开发过程中啊
我提前征集了大家的建议反馈 所以我目前对它的定位就是 你不需要有很高深的编程知识 或者是计算机的能力也能看懂 因此我对课程的难度呢 适当的进行了降维处理 确保没有编程基础的基础小白 也能够上手使用 还有一些经验的大神呢 对您也能有所启发 那课程里我推荐的工具
基本上也是中国大陆 乃至全世界都能够普遍使用的工具 不太需要靠魔法来访问 这样呢 就解决了不好实操落地的问题 好那现在呢 让我们进入第一个板块 项目背景和一些快速展示 先说下我当初自己 为什么要做这么一套个人的AI贾维斯 啊我相信很多 人跟我当年一样 看了第一部钢铁侠之后呢 就是大为震撼
我至今还记得 托尼斯塔克和那个Jarvis对话的场景 他只需要说几句话 然后贾维斯就能理解他的意图 帮他做各种事情 比如说帮他查资料啊 分析数据啊 制造装备啊 或者调侃互动等等啊 那种感觉真的太棒了 所以看完电影之后 我当时还在大学呢 然后回到宿舍之后 自己立马就写了一个小工具 跑在我当时
自己的宿舍的笔记本电脑上 它可以帮我开关程序 可以帮我打开网页链接 可以关机等等 那当时是基于微软的一套语音库啊 可以做到声音识别 那我的舍友 知道我做了这么一个东西之后呢 他就故意恶搞使坏 老是喜欢趁我打游戏的时候啊 控制我电脑关机哼 没想到很多年之后呢 这个小小的尝试
在AI时代又生根发芽了 我发现多年来 我一直梦寐以求的这个技术的愿望 现如今在AI技术的发展过程中啊 让个人仅凭着你自身的能力 就可以很轻松地实现了 另外熟悉我的朋友应该也知道 就是这两年我生了娃 当了爹那生娃养娃之后呢 时间就变得极其宝贵了 每天有大量琐碎的事情要处理
比如说信息整理啊 内容创作啊 知识管理啊 财务筹划等等 那同时呢 陪伴孩子 陪伴家人的时间也不能少 这个是非常重要的 那这时候我突然意识到 如果我能用AI来提效 让AI帮我解决电脑上 那些重复性的任务 那我就能有更多时间去陪伴孩子 陪伴家人 那去年的时候 其实我就发布过一门课程 跟大家分享
我如何用AI 帮我打造100倍效率的知识萃取系统 那这门课程 当时收到了非常多的正面的反馈 很多人学完之后就反馈说啊 他们做出了自己想要的东西 然后用出来 效果特别棒 但是当时这个课程呢 也有一个局限性 就基于AI在当时的发展呢 这门课程它更侧重在知识管理
或者说是在你的思维啊意识啊 自我成长层面的 那具体到创作产出 或者说产生可以交付的实际成果 以及与外部世界的真实互动 创造实打实的价值这些方面呢 它是有局限的 这也是我现在在这个时间节点上 要基于它的基础 开发出全新的AI贾维斯的初衷之一
我希望呢 这个贾维斯能够更多地落实在产出 有结果有交付 甚至能够直接帮我赚钱的事上 这个 就是我搭建这套系统的真实的原因 那介绍到这里呢 让我们先试着给这个AI贾维斯 下一个概念的定义啊 贾维斯或者可以叫个人AI基础设施 它是2025年到目前2026年之间 整个AI开发者社区
尤其是极客圈技术圈 非常流行的一个概念 它指的是个人可以完全掌控长期运行 并且能够深度定制的AI基础设施 它的终极形态 被很多人直接称为是我的贾维斯 参考的其实就是刚才说的 很经典的钢铁侠这部电影 那AI贾维斯它有几个 核心特征啊 就是它可以持久化运行
而且你可以享受完整的主控权 以及数据的主权 同时你还可以用多智能体和多模型 进行协同架构 另外它还能实现高度的个性化 以及自我进化 那如果通俗点来说呢 就是你可以把它理解成 你自己家里养的 一个永远不睡觉 只听你话 越来越懂你 而且还真的能帮你干活的
一个超级私人AI助理 这件事放在5年前10年前 听起来还稍微有点魔幻 但是放在今天 已经完全实现了 那如果你关注AI行业的话 你会知道 像现在也就是我做课的当下 是2026年年初这个时间节点呢 有一个新出来的爆火的产品叫OpenClaw 俗称小龙虾 它其实就是某种意义上的
一个个人的贾维斯系统 只不过呢 它是开源的 它不是你自己开发的 没有为你进行深度的定制 那说到这个小龙虾Openclaw 我必须说啊 它目前呢 有很多的漏洞和安全隐患 你如果用过的话 你一定知道我在说什么啊 它也不太适合小白使用 如果你非常有个性 或者你有很多独特的需求的话 它也不太适合你 所以我们再想想
为什么你应该搭建一套 自己的专属AI基础设施 或者AI贾维斯呢 那除了很酷炫这个因素之外 我认为有如下几点原因 第一个就是系统可控 而且质量稳定有保证 来构建你自己的个人基础设施 可以在很大程度上 避免过度依赖第三方 能保持你的私密性 第二点呢
就是它的规模是可以扩展的 功能是可以定制的 那通过自己搭建基础设施 随着研究的深入和技术的提升 你将有能力 对它进行更适合自身需求的 规模化的扩展 实现某些特定的功能 那这些功能呢 通常是你个人或者公司 在业务深水区所需要的 而外部呢 第三方由于不了解你的特定需求
无法通过提供标准化的工具 来帮你实现 那不如你自己来做一套 第三个很重要的就是呃 它还可以帮你构建更长期的护城河 通过你持续开发 获取这些潜在的经验啊隐性知识 以及你人为制造出来这些信息差 就能够让你在这个快速发展的AI时代 更有个人竞争力 并且拥有商业上可以售卖的独家内容
所以我的观点是啊 AI工具要用 但你要知道它在做什么 你要时刻保持主动权 最好是用上自己亲手搭建的 这样呢没有人比你更懂它 它也会完全产出最适合你的成果 这一切 在今天其实已经不是什么科幻故事了 你肯定不用我告诉你说 如今动动嘴皮子 AI就能帮你实现很多 以往高级程序员才能做到的事情了
所以呢我希望你不要有任何的顾虑 不要有担心 今天就让我们勇敢的开始 人人都可以搞这么一套自己的贾维斯 好那现在呢 给大家快速展示一下 我这套系统里面 都实现了哪些有意思的功能 首先我们来看第一个呃 这套系统里有一个叫做推特 或者就是现在的x .com的每日自动精华总结的功能
.com的每日自动精华总结的功能 它会获取我前一天指定的 一些有意思的 我关注账号的所有推文内容 然后自动帮我提炼总结成为一份日报 那这样做的好处呢 有几个第一个 就是省得我一条一条的去看Twitter 然后第二个就是它过滤掉了不重要 或者比较敏感的内容 第三个呢
就是节省了我手动筛选排除的过程 可以让我更加专注的 直接获取精华的信息 那基于这套系统呢 如果发现了什么我特别感兴趣的内容 我才会展开去仔细看 大家可以看屏幕上 大概就是这么一个效果 它还给信息标注了重要性啊 优先级等等 这是第一个小例子 那有了获取Twitter信息的手段呢
自然也要有输出爆款文的工具 于是我们来看第二个例子 我基于个人的人设风格啊 以往产出的爆款文案等等 让我的贾维斯 学习了一整套关于我的知识 后续一旦我发现某些选题 或者资源特别优质 值得介绍给网友的时候 我就会让贾维斯基于我以往的语气 风格 快速的产出一个推特爆款文的提纲
甚至草稿 那我在此基础上呢 稍微加一点手动润色 最终把它发出去 截止目前 我已经用这套方式 产出了很多推特 或者其他平台的比较爆的文章 嗯图里大家可以看一看 里面动不动就那种几十万阅读啊 几千点赞的很火的文章 那如果你关注我的话呢 应该知道 我现在还主理了一份简体中文
世界订阅量最大的有 关AI商业化与增长的邮件列表 或者叫Newsletter 它的网址是3W点增长点AI 目前呢全球各大AI公司互联网大厂 还有各个行业的头部领导人 创始人创业者都在关注它 那现在呢 我的贾维斯系统 就会自动帮我实现 一些基本内容的提炼 草稿的撰写
还有文案的润色 以及一键发布到管理后台 有了这个工具之后呢 我编辑Newsletter的效率更高了 当然我也会把它用在很接地气的 搞流量的地方 那我现在 其实 也是上海一家连锁书店品牌的合伙人 我们书店的创始人和其他合伙人 也会自己去做短视频 搞流量呃 在做短视频的过程中呢
需要不停的寻找爆点 借鉴市场上同类型的内容 然后制作短视频脚本 从而方便拍摄 为了让内容更自然呢 我们会把脚本改的非常的口语化 增加更多的网感 目前我这套系统的工作流程是这样 首先它会每天自动抓取全网的热点 接着呢 它会结合书店当前的真实运营情况
还有出镜的合伙人的个人风格 以及语言表述能力 还有他真实的经验履历背景等等 寻找与热点结合的一个结合点 同时还要增加很多网感的风格 每天生成10个这样的短视频脚本 推送到我们眼前 我们现在呢 已经基于贾维斯产出的一些脚本 拍出了一些视频
有些播放量在几千到几万 呃听起来可能不是很多吧 但是可能对于书店 这个本身就相对狭窄的品类来说 在行业里还是不错的 而且自从开始做短视频之后啊 确实有一些同行或者潜在的客户 通过私信找上来寻求合作 也落地了很多有意思合作项目 这对我们是实打实的帮助 再看这个啊
我自己本身呢 是一个长视频的重度用户 经常看b站和油管 那有的时候我看b站 喜欢在手机或者平板上去看 如果在电脑端 要提炼一个长视频的内容 让AI帮我总结 其实很简单 有很多现成的插件或者工具 就可以搞定了 但是呢在手机上 希望用一些工具帮你去做内容的提炼
就不太方便了 你可能需要在不同的工具之间 切来切去啊 之类的那针对这个问题呢 我直接做了个工具 直接在移动端的b站官方APP里 就能够实现自动的摘要总结 总结的结果呢 会通过邮件发送给我 那这样的话呢 对于那种十几分钟 甚至几十分钟的长视频 我就不需要从头到尾傻傻的看完了 平时刷到之后
感兴趣随手对它进行一个操作 我就能够在事后进行内容的浏览 如果对内容比较感兴趣 再去完整的看这个视频 大大的节省了时间 那具体怎么实现的 后面也会给你讲 那我还会用它 去发现一些新鲜有趣的投资项目 以及一些 可以增强我的贾维斯本身的AI技能 像Polymarket
可能有些朋友听说过 它是当下全球最火的 一个新型的投资市场 或者叫所谓的预测市场 那对于这种新的品类呢 我要保持关注 所以我经常会去看看 上面有什么有意思的新项目啊 和新选题 现在呢我会用我的贾维斯 每天自动帮我检查一次 主要会从以下几个维度啊 帮我找找有什么新的投资标的
这三个维度是 第一每天最热门的投资话题有哪些 第二 每天有哪些上升趋势最快的项目 第三个呢 就是挖掘一些热度啊 虽然没有那么高 但是符合我自己兴趣偏好 个人的人设以及眼光口味的一些话题 他也会帮我抓取推送过来 那这背后的前提呢
就是基于贾维斯对我本身的了解了 呃类似的 看右边这张图 我也会从网上去获取一些AI的技能 然后他每天呢 会推荐一些呃新上线的热门技能 我会看一看 哪些是我AI用的上的 我就让他去学习 那至于这个技能的概念的 后面我也会讲到 是后续我们经常常用的一个工具
通过上述这些方式呢 让我变得更加讨巧了 不用自己总是去开发新的技能 或者每天去盯着市场 而是专注借鉴 参考别人已经筛选出来的 有意义的 有价值的 或者说已经很有共识的内容和功能 让我的AI自动帮我实现它 当然很多功能 你会发现都是基于AI对我的了解
那AI怎么去了解我呢 我做了一些设置啊 后面会展开详细讲 这里先简单提一下 那我的贾维斯 首先他会不断的学习 我在网络上公开的一些新的行为 新的动态 比如说我在b站上看了个视频 点了个赞 他会记下来 那事后通过这个视频 对我进行一些分析 比如说我在豆瓣上
会标记一些我想看或者看过的书籍 或者影视作品 我的贾维斯 也会把这些数据给下载下来 再比如说 我会在一些社交网络 像极客上发一些新的动态 新的感悟 那这些呢 贾维斯也会去学习 那既然这个系统是我自己开发的 所以除了这些公开的 网上别人也能看到信息之外 一些私下的 我不公开的东西
贾维斯也能够去学习到 比如说 我写的一些Flomo里面最新的笔记 那些呢 都是我一些不能对外公开的啊 有隐私的 或者有商业机密的一些内容 再比如说 我跟其他AI工具的聊天记录 像是豆包啊 像是ChatGPT啊之类的 那我的贾维斯也会把它们学习下来 这样呢就能够把我在外面的数据 全部都收拢到自己手上
而不是白白地贡献给其他平台 自己却捞不到好处 那这一点很重要 就是你一定要把你的一切数据 聚拢下来 然后为己所用 你看啊我做了这么多工具 做了这么多技能 那这些呢 其实 都可以算是非常宝贵的个人数字资产 那万一要是哪天电脑挂了 当机了网线被拔了 或者被人删库跑路了
那遇到奇奇怪怪的情况 导致数据丢失 那个损失肯定是非常惨重的 所以呢我这套贾维斯系统 还有一个很重要的功能 就是它会每天自动帮我备份 一切我认为重要的数字资产 那备份内容包括但不 限于我这套贾维斯系统 它本身的啊 源代码呀 产出的数据啊 技能等等
还有我自己多年积攒的笔记啊 呃还有一些产品的规划啊 再包括基于贾维斯系统 自动帮我整理 提炼的各种SOP和规则文件 这些都算是很重要的数据资产 那为了确保万无一失呢 我的数据会同步保存到很多位置 比如说我会在本地 保存到一个互联网的硬盘上
我也会备份到我的icloud空间里去 呃我还会备份到 我电脑连接的一个固态的硬盘 外置的 以及 我还会把它上传到我家用的私有云 也就是NAS上 这样一来的话呢 同一个文件至少会有4个 甚至5个不同地方的备份 那有了这些多重备份之后呢 我就会非常安心
而且这些都不需要我来打点 AI自动每天晚上都会帮我搞定了 那对于一些特别敏感的数据啊 比如说像记录了个人私钥啊 密码或者各种TOKEN的信息啊 这些我肯定不会上传到云端的 只会保存在我电脑本地 和家庭的NAS里 那带大家快速的看了几个 这里面我折腾出来的花样 和各种妙妙小工具
之后呢因为时间关系 我再给你看最后一个 就是你现在看到的这套课程 其实也是我在AI贾维斯的辅助下 所创建的 那其实去年做完一套课程之后 我感觉整个过程是非常痛苦的 那那个时候 AI助手的发展还处于当时的早期 很多环节还需要我手动来实现
或者说借助多个工 具来回跳转 那现在有了我自己打造的这套AI 贾维斯呢 一切都轻松多了 大家看屏幕上这个功能啊 就是我做的一个课程内容的提案系统 那贾维斯他会不断地给我推送呃 每天大量涌现的AI优质内容 并且帮我来评审 哪些内容适合注入我的课纲
或者说扩展我的课纲 还有哪些内容呢 可以直接成为这门课程当中的案例 或者素材 或者口播稿的一部分来源 那我也会对它进行一些批注和要求 等我手动编辑完这些批注之后呢 贾维斯就会自动根据我的批注 生成对应的稿子 稍后我只要审阅一下这些稿子 那觉得能用
我就把它用到我这门课的课程里 如果觉得太牵强啊 或者说会模糊这门课的主线任务 会模糊课程主题 那我就会将它舍弃 于是今年做课我感觉比去年爽太多了 效率也提升很多 那给大家看一张图啊 这个呢 就是我在做这门课程时候的实拍 以往做课程的时候
我要苦哈哈的对着电脑 呃这次在贾维斯的帮助下 我完全不同了 我趁着天气好的时候呢 到上海前滩的江边 找了一家星巴克坐下来 然后打开手机 就直接审批 贾维斯自动推送给我的内容 我只要一边喝着咖啡 一边勾选我所认为的 值得入选这门课的一些相关的题案
他就会在我家的电脑里帮我完成 并且呢因为内容在不断增加 他还会重新帮我去评估 最新的一些课程逻辑 包括时间分配是否 合理啊包括重点是否明确突出啊 包括是否有干扰到我的主线 或者有什么不重要的内容要舍弃等等 那确实帮我省了很多力气 我想 这个可能就是打造贾维斯这套系统
所真实的意义吧 好的那第一part先讲到这里 后面还有哪些具体案例呢 我会为大家展开 好的 那现在我们来到整个课程的第二部分 就是对于核心框架的搭建 一个良好的架构呢 有助于清晰的开发以及迭代 还有后续的升级维护 那我把我现在贾维斯整体的设计呢
归纳成了一个叫做五层金字塔结构 你可以从屏幕上看到啊 包括最底层是工具层 然后挨个往上分别是数据层能力层 场景层和回顾层 那这个架构设计有三个关键的理念 第一个就是从下往上搭建 但是从上往下使用什么意思呢 就是
你先搭建比较底层的一些基础工具 和一些数据结构 然后慢慢往上搭建场景和能力 但是使用的时候呢 是从上往下使用的 就是你在最上层 让系统不断的通过回顾变得聪明 基于这种更聪明的系统之后呢 日后使用过程中 触发一个具体的使用场景 或者说当某一个功能被激活的时候
它就会自动调用下面所有的能力数据 还有工具来帮你服务 那第二个理念 就是每一层都希望可以独立优化 那你优化工具层的时候 不影响你的数据层 而你优化能力层的时候呢 也不影响它的场景层 这样维护起来就会很方便 第三个呢 就是层与层之间要松耦合 什么意思
就是各层之间啊 通过标准接口 或者说一个唯一的调用路径 来进行连接 而不是硬绑定的 那某一天 如果你想换一个工具的时候呢 只需要稍微改改这一层 那其他层都不受到影响 那光听到这些 你是不是已经开始觉得有点复杂了 怎么怎么还没开始做呢 就有这么多层 会不会搞起来很麻烦 那我保证
你可以完全不用担心 原因有两点 第一点就是上述这些层级结构呢 其实也不是我从一开始 就自己规划好的 而是在逐渐开发的过程中 由于实际需要而慢慢自动长出来的 我只是让AI帮我做了一些提炼和整理 它就慢慢帮我总结出了 这样一个清晰的层级
并且以后去照着它执行 第二个呢 就是 当你已经知道这样做效果很好之后 你可以在项目开始的时候 就给AI设计好一些基础的指导纲领 让他在后续开发的过程中 遵循我的这种层级架构的设计 那之后的事情 让AI自动来搞定就可以了 你不需要老是去督促他 提醒他他自己就会尽量按照
我给你的这个架构 来设计这套系统 好那我来快速讲一下 这5层大概是什么意思啊 至于具体的展开呢 后面会为你详细讲解 那第一层叫做工具层 主要就是你日常要用到的开发工具 和执行工具 那最核心的就是类似像cloud code 或者腾讯的code body 或者一个开源工具 叫open code这 样的开发工具
这将是你搭建整个系统的基础 那就像造房子的时候 你需要一整套的机械设备 比如说挖掘机啊 吊车啊搅拌机等等 他们就是你最基础的开发工具 那往上走L2 叫做数据层 包括了大量的 记载了具体知识的文本数据 还有一些执行脚本和复盘文件 那我主要呢
是用obsidian这样一个笔记工具 来进行管理和手动的维护 它除了有我这么多年的笔记之外呢 也有我为大猿模型创建的一些context 就是上下文和知识库 其中包括了个人的画像啊 写作风格 历史素材 还有些项目文档等等 那这些呢 都是AI更深度理解你的关键
如果没有这层的话呢 AI就是一个通用助手 但是有了这层之后 AI就是你的私人助手 再往上是能力层 包括各种帮你实现具体功能的脚本 技能等等 那这些能力彼此之间呢 可以复用 可以组合 可以先后衔接 再往上是场景层 在不同的场景和触发条件下
会有各种各样的玩法 来帮你实现你的需求 比如说呢 我自己平时就有40多个自动化的任务 可以帮我大量的 减少在电脑前干活的时间 那每个任务呢 对应一个具体的场景 比如说 就是AI点赞会自动喂给我的贾维斯 或者有了我感兴趣的视频 贾维斯会帮我提炼字幕和摘要等等 那他们大多数啊
都是定时自动执行或自动触发的 不需要我操心 少部分呢 会比较复杂 是需要我对着电 脑或者我对着各种智能硬件来实现的 最上面呢 是定期复盘的机制 也就是回顾层 那我做了一些系统设置和工具 发现系统里哪里有问题的时候呢 他就会去优化工作流 让系统越来越聪明 以及不要这么臃肿 这里包括但不限于
让AI自动总结他今天一天做的事情 比如说踩了哪些坑 以及我是如何通过修改建议 让他自动把这些坑 转变成经验和s o p的 包括我还会让AI去学习 我对一些文件的标注 或者我主动筛选过以及剔除掉的内容 通过分析这其中的一些差异点呢
AI就会自动归纳总结 到底什么是我喜欢的 什么是我看不上的 那以上这些呢 就是对这个5层金字塔架构的 一个最基本的讲解 那接下来呢 我就会一层一层地展开 并且带着你去一步一步地搭建 好首先 我们来看最底层 也就是L1的工具层 那这里介绍的呢 就是本次最核心的开发工具
也是你今后 每天需要接触和深度使用的工具 我其实最推荐的就是cloud code 你可能已经听说过了 但是呢根据不同观众的不同情况 我这里也给了其他几个替代选项 大家可以看一下屏幕上的 先了解一下 稍后呢我会给出对比和建议 那这三个工具 除了刚才的cloud code以外
还有腾讯出的code body code 还有一个开源工具叫open code 那它们呢 都是跑在命令行里的开发工具 或者叫CLI啊 或者念CLE都可以 那我这里先插播一个概念啊 什么是CLI 跟它对应的一个概念GUI又是什么呢 呃先说GUI 这个就是我们平时最常见的
最传统的图形界面 那一般的同学在电脑上操作的时候啊 用那个鼠标在屏幕上点来点去 操作各种软件 这个呢就属于图形界面 也就是GUI的范畴 而我这次推荐的这些开发工具呢 都是在电脑的命令行里面 使用的一些开发工具 一般来说呢 我们会用c l i这三个字母 也就是CLI
来代替这样的工具作为简称 这里的c l i三个字母 其实就是command line interface 也就是命令行界面的英文缩写 那现在屏幕上出现的这两张图呃 都是Astropy公司出的两款工具 您可以先看左边这个 它叫做cloud coworker 它用的其实就是图形界面 我们可以看到有输入框
然后有可以点击的按钮 在使用它的时候呢 你可以将文件拖拽到这个界面里 或者鼠标点来点去 键盘敲来敲去 你效率越高 其实你的手部动作越多啊 很像那个打游戏里面的微操 或者APM很高的那种电竞玩家 那别人看来你很牛 但是你自己会很累 右边这个呢 就是cloud code
这也是Asrock公司出的同一款工具 其实它能实现的功能跟左边是一样的 甚至更多 但不同的是 你可以一边喝咖啡 一边让它帮你自动的解决很多的问题 而且它支持多个窗口同时运行 就像你同时雇了很多个员工 在帮你做操作 因此呢这本质上就是同一套功能
两个不同的皮肤而已 只不过左边可能更适合普通大众 那右边呢 更适合极客 以及那些有追求的 想要提升效率的专业型玩家啊 比如说这次学了这门课程的你 那为什么我很推崇CLI 而让你舍弃GUI呢 我觉得GUI工具啊 它有些致命的局限性 第一个就是它需要你点击式的交互
需要你人工介入啊 你需要盯着屏幕鼠标点来点去 它不能自动化 并且一次呢 只能控制一个界面元素 你的鼠标键盘就被占据了 你很难同时操作电脑上的多个对象 第二个呢 就是GUI工具 它一般来说比较难批量处理 你要生成100张图片的话 你可能要点100次 除非你的工具本身就支持批量操作
或者一些红的命令 或者有外挂插件 否则的话 还是需要你手动一点点来实现 第三呢就是GUI工具 它难以与其他工具集成 那很多GUI工具 它是孤岛 数据很难进去 那好不容易数据存进去之后呢 又不让你好好地取出来 把你牢牢地绑死在它的生态里 第四点就是GUI工具啊
每次操作可能都需要重新配置 或者重新加载 你上次操作记录不一定会被存下来 你下次还得重新操作一次 那与之相对的呢 我推荐给你的CLI工具完全不一样 它是可编程的 然后可自动化的 所以你可以把操作写成脚本 反复的自动执行你 还可以与其他工具进行无缝的集成
通过特有的管道命令或者接口 把不同的工具串接起来 同时一次配置还能够永久使用 也就是你把脚本写好之后 以后直接运行就可以了 那我给你举一个具体的例子啊 像用传统GUI方式 你需要打开一个AI工具在浏览器里 比如说midjourney啊 或者集梦啊
或者Google Notebook l m这样的网站 然后在里面找到输入框 输入提示词 等待系统帮你生成 然后你还要点击下载生成的内容 这过程呢 每次都要重复 那重复多了之后 你可能要盯着屏幕操作个一两个小时 但是类似的操作 我们用CL方式的话呢 你可能只要写一个Python脚本 然后二三十行代码
它就能批量帮你生成100张图片 自动地保存到你指定的目录 那你只需要一次运行脚本 然后去喝咖啡 等个10分钟就可以了 这个呢就是CLI和GUI的区别 那说到这里 你会不会担心 哎呀我不会编程怎么办呢 其实现在有AI可以帮你写脚本了 你只需要去提需求 然后指挥 以及发现问题了
让他帮你改对就行了 你不需要从0开始学编程 你只需要学会用AI帮你解决问题 帮你搞定就行了 所以我当前的整个系统呢 都是基于CLI工具去搭建的 这里稍微再引申一小下 就是如果你选择CLI工具的话呢 还可以解锁一个高级玩法 就是你可以很方便的在任何地方 用一台移动终
端设备比如说手机或者平板电脑 直接远程登录到你的电脑上 实现异地操作 比如说春节了 你回老家了 或者在度假景区的时候 你可以远程操控家里的贾维斯 帮你干活 再比如说你赖床不想起床了 那你躺在床上突然想到哎呀 我要在电脑上做点什么的时候 你只需要掏出手机 就可以在卧室里
操控你家书房里的电脑 那我经常就是这么干的 用命令行界面呢 其实比用图形界面呃 里面常用 可能什么远程桌面这种功能啊 用命令行可能更快 然后更省流量 并且你不需要额外的配置鼠标 键盘之类的东西 直接用手机上的软键盘就可以操作了 这属于比较高级的玩法呢
需要一点点的技术设置 所以在这门课里呢 我不会展开 只是给大家做一个引申 如果你非常感兴趣的话 在学完我的这个课程之后呢 可以自己上网搜一搜cloud code 或者cold body或者open code 然后在后面输入SSH 网上就会有大量现成的教程 你可以对照这些图文或者视频 自己去搞定这些配置
好在花了一些篇幅 说服你 为什么应该使用CLI工具之后呢 现在来正式聊聊 我前面讲过的三款工具 然后对它们各自特性做一个对比总结 帮你选出最适合你的一款 首先第一个就是cloudcode 这个大名远扬 它是美国顶尖的AI公司Astropy开发的 可以被看作是
AI编程助手里的最高端的产品 那它最大优 势呢就是它背后有一个强大的AI模型 也就是Astropy自家的cloud模型 这意味着 它拥有目前市面上最顶尖的智能水平 能够理解非常复杂的编程任务啊 当然 你有办法去替换使用自己指定的模型 只不过要花点功夫啊 那这种强大的能力呢
也决定了它的价格是比较贵的 cloudcode目前是没有免费版本的 基础的订阅计划每月需要17美元 那最高Max的版本呢 每月需要200美元 所以他的目标用户啊非常明确 就是那些预算充足 追求极致效率的大型企业 和专业开发团队 或者专业人员 那对比下来 我们看第二个产品
cold body code 它来自中国的科技公司腾讯 那与cloud code不同的是 cold body它的市场定位非常清晰 就是想要主打一个高性价比 它的价格呢 相对前者来说比较亲民 专业版每月差不多是10美元左右啊 并且提供免费的试用期 可以让用户先体验再决定
它使用的AI模型是腾讯自研的大模型 在处理中文 和理解中国本土的开发需求方面呢 是有一定优势的 很多工具也是开箱即用 并且帮你配置好了 不需要你再额外 前期做很多的准备工作 那但是目前呢 没办法替换它核心的模型 你就只能用腾讯提供给你的 code body 它有一个特色
就是它试图覆盖软件开发的全流程 比如它可以帮助开发者将设计图 直接转换成代码 这个呢 就大大缩短了从设计到开发的时间 对于很多追求快速迭代的中小型团队 和创业公司来说 这是一个非常有吸引力的功能 那最后我们来看第三个产品 就是open code 它非常特别 因为它不是一个商业产品
而是一个开源项目 由全球的开发者社区共同维护 它最大的特点呢 有两个第一个就是免费啊 第二个就是灵活 那所谓灵活呢 是指它不像前面两个工具那样 绑定了某个指定的AI模型 你可以把open code 看作是一个开放的平台 它可以接入市面上 几乎所有主流的AI模型
比如说open AI的GPT啊 谷歌的Gemini等等 如果你已经订阅过这些服务了 那就可以直接在open code里使用 而无需额外付费 你甚至可以在自己的电脑上 跑一个本地的模型 来保证你数据的绝对隐私 当然免费和灵活呢 也就意味着它需要自己用户啊 做一些手动的配置 稍微折腾一下 有一些学习的门槛
所以呢它更适合那些喜欢探索的 愿意自定义工具的个人开发者 学生极客等等 还有就是 对数据有严格隐私保护的用户 所以啊 大家在这里可以根据自己的实际情况 判断一下你比较适合哪一些 我的一句话建议就是 如果你能够很顺畅的 没有障碍的使用cloud code 那它绝对是首选
那如果你身在中国大陆 又不太喜欢折腾 愿意花点小钱 让大公司帮你摆平很多麻烦的细节 那你就用腾讯的code body 花钱就行了 剩下都比较方便 那如果你比较囊中羞涩 或者你很擅长折腾 技术底子也不错 那你可以试试open code 那上面这3个工具呢 大家可以自己从官网上去获取啊
官网上有非常明确的下载 或者本地安装的方式 你照着做就可以了 一般来说 安装过程不会特别的复杂 当然最终不管你选哪一款 今天我所介绍的这些经验技巧啊 还有一些功能构成呢 这三款都是通用的 你可以放心大胆的 去使用他们当中任何一个 那我的贾维斯系统呢
前期开发主要是靠腾讯的code body 因为 我想尽快的实现我脑中想要的功能 尽快的完成开发任务本身 而不是折腾这些开发工具 等到后期我的系统慢慢稍微成型 比较稳定了之后呢 我现在已经慢慢地迁移到cloud code上面 我也愿意花点时间 去折腾和打磨cloud code本身了
并且呢把code body的一些配置呢 也直接无缝地迁移了过来 好下面我给大家演示一下 获取和安装code body啊 嗯其实对于cloud code或者open code来说 功能是类似的 那cold body呢 我们访问官网会发现 它同时提供了中文版和国际版 那一般当你访问的时候 它会自动地切换成你所在的地理位置
相对应的版本 你只需要正常地下载和使用就行了 不需要太多其他的手段 来保持这种网络的访问 这也是我推荐它的原因 大家可以在它的官网3W点code body 点AI找到这款产品的获取方式 那怎么获取呢 其实也很简单啊 就是网上有一个CLI的链接 点击之后
页面上就会专门来教你 怎么在命令行中使用 比如说n p m什么什么什么啊 当你在命令行输入之后呢 系统就会开始帮你安装到命令行里了 你只要稍微等待就可以了 下面请看我的实机演示 好大家看呢 现在我就在code body的官网首页了啊 做的非常精致 非常可爱 这里还有一个忍者机械小猫
呃点击这里的CLI这个链接 这里 你就会看到它给你提供的一个命令 我们只需要复制它 好现在我们来到命令行 那我现在用的是Mac的电脑 你只需要直接在这里 粘贴刚才复制过来的这个指令 然后点击回车 你看它现在就会开始自动地运行 帮你进行安装
你只需要在这边静静地等待就行了 你看这里正在转 那么稍加等待之后呢 code body就已经装在你电脑上了 中间几乎不需要太费力气 就是这么简单 那我电脑上已经提前安装好了 这里我假设你已经安装好了 接下来呢 就是正式介绍一下 怎么使用这样的工具 那对于Mac用户来说呢 启动code body会比较简单一点
你可以直接使用系统自带的终端 这个程序 点击之后就会进入命令行界面 那如果你是一个Windows用户呢 你需要使用系统自带的一个工具 叫做WSL也就是Windows subsystem for Linux也 就是Windows的Linux子系统 来启动它的命令行工具 如果不太熟悉的话 你可以简单的搜索一下 或者问一下AI
这也是比较常用的功能 那我会对着时机进行演示 让大家看看我是怎么操作的 好那当你来到了命令行终端之后呢 很多人感觉就是那种黑客帝国一样 黑压压的底色 然后上面一些绿色光标 那这里呢 我个人喜欢用白底黑字啊 所以这个是我自己设置的 没有任何区别 仅凭个人爱好 那你可能一脸懵 来到这里
接下来我要干什么呢 这个时候 我需要你本次记住 为数不多的几个概念就登场了 如果你之前对于命令行 完全没有了解的话 只需要记住下面这3+1个命令就可以了 之所以说是3+1个命令呢 因为最后一个命令啊 其实就是你工具的名称 所以我们其实只要记住前三个 是哪三个命令呢
分别是LSPWD和CD 这就够了 首先l s它是list的简写 也就是列出来 它可以让你系统帮你列出 当前所在文件夹的一些呃 文件名称 比如说在当前界面里 我输入LS回车哎 你可以看到呃
目前我所在的这个文件夹下的文件 全部被列出来了 第二个你需要知道的命令呢 叫做PWD也就是present working directory 也就是当前工作目录的意思啊 不要以为它是什么password的简写啊 它跟密码没有什么关系 就是PWD当你输入这个命令之后呢
欸你可以看到系 统就会告诉你你正处在哪个目录里 那在这个目录下 就是你接下来要操作的目录 好第三个命令叫做CD 也就是change directory 也就是更换文件夹 当你输入这个命令 接一个空格之后 后面再跟一个
当前文件夹下的子文件夹的名称 那么现在你已经来到了子文件夹 在这个例子里呢 就是my AI这个文件夹 来我们再用p w d来看一看 你是不是已经从前面的这个 x Dash的文件夹 来到了my AI文件夹 所以后续你用code body做的很多操作
其实就是在操作这个文件夹 好这三个指令 你学会了之后 你就知道了 怎么在命令行里 找到一个你想操作的文件夹 然后用code Ali来实现它 这个时候呢 我们只需要输入cloud或者open code 或者code body 回车稍微等待一下 我们就会正式进入 你正在使用的这个产品界面了
你看它是非常可爱的 有一个像是一个毛茸茸的卡通形象 哎我们把它缩小一点 让屏幕更大一点 你可以看到大概就变成这个样子 这里会显示一些你最近的一些动态 一些需求 还有一些系统的状态信息等等 那这个就是它的主界面了 你后续的所有的魔幻的旅程 就是从这个界面开始的
那你可以试着对它输入一些命令 比如说哎 上海浦东明天天气怎么样 回车等待一下 那么它就开始自动帮你去联网 进行思考和执行 稍微等待一下 之后呢它的结果就会在这里呈现了 来我们来看一下 如果太慢的话 我会在这个视频稍微做点加速 啊 哦出来了
还算是比较快 你看 这是我在录制的当天的一些情报 大家可以看一下 是真实准确的 不是幻想出来的 没有任何幻觉 嗯我们再试一个吧 今天有什么热门AI新闻 帮我列举3条标题即可 来我们来看看 它会给我返回什么 我也很好奇啊 因为我今天一天
都在忙着这个课程的录制 我还没有关注行业 直接让他来告诉我好了 看看 哦出来了啊 啊他把今天当啊对 今天确实是2月15号 明天是2月16 没错那微软CEO宣布什么 什么什么 程序员不允许写代码 谷歌Gmail遭针流攻击 你看确实是最新的新闻 很有意思
所以 你的底层的工具层到这里也就搞定了 这就是你今后开发的主战场 好现在呢 让我们来讲第二层的数据层 这层呢非常重要 为什么呢 因为你的一切在电脑上的处理啊 本质上都是在处理数据 而有了某些特定的数据之后呢 还可以让AI更好的了解你 帮助你那以往你用ChatGPT
它是一个通用助手 它一般不知道你是谁 不知道你的写作风格 不知道你之前做了什么 除非你用的很深入 给它很多信息 但是如果你给AI构建一个上下文 直接提前告诉他你的背景 你的风格 你的历史的一些素材 或者一些履历的话呢 他就会变成你的私人助手 未来不需要你给太多 的提示词
他就能够get到你想要的 并且为你生成最个性化的输出内容 那数据层的工具 这么多年呢 我还是推荐使用obsidian这个笔记工具 为什么选它呢 首先第一个就是它本地优先 所有的数据都存在你的硬盘上 可以说永不丢失 永远可以访问 当然 你也可以花钱买它官方的同步工具
这样就可以在多个平台上进行同步了 第二个就是它用的是Markdown格式 这个格式呢 对AI非常的友好啊 可以算是一种纯文本格式了吧 而且AI可以直接读写 不需要很多复杂的解析 而且纯文本有个好处 就是十年之后你依然能够打开 不像是某些专有的格式啊
依赖某些特定的工具 一旦那些工具的公司倒闭了 那这个文件可能就打不开了 所以呢我把往年的很多Evernote 包括notion的笔记 都直接转换成了Markdown格式 保存到了OBC点上 第三个呢 就是它支持双向链接 可以实现知识的网络化 你可以把一些零散的笔记 连成一张知识网络 当然它还有一些其他优势啊
比如说支持丰富的插件 比如说 可以提供很强大的用户社区支持 等等那这些呢 就等着你自己来探索了 那关于obsidian的相关知识呢 你可以参考我去年的课程 讲的也是非常的完善 一个多小时 那之所以推荐obsidian呢 还有另一个优势 就是它可以通过插件 直接在内部运行一个cloud code
这个与我们前面推荐的产品 算是有一个天然的整合 那更酷的就是 在我制作这门课程的时候 OBC点官方刚刚发布了一个新的功能 就是说它自己也提供了CLI版 这意味着在命令行里面 你也可以操作OBC点了 从而有办法 实现更多酷炫的自动化玩法 还有脚本之间的衔接 那通过它推出这个功能 也可以看得出来啊
就是CLI这个东西 肯定不是我个人推崇 不是我个人偏好 而是像obstacle这样 有着全球广泛的资深用户 专家用户极客用户的产品 他也看到了其中巨大的市场需求 也因为这个需求呢 趋势呢更加看重这个方向了 才把它开发出来了 你看没想到吧 一个套娃可以正着套反着套啊
很有意思 那下面呢 我就给大家实际的展示一下 我当前obsidian的一些目录 还有它的层级结构的设计 好的那现在这个屏幕上呢 就是我这个陆客的这台电脑上的 obsidian客户端 那大家可以看 它有这些不同的目录和文件结构 首先第一个AI info 那这个呢 就是用来存放这整套AI
贾维斯相关的一些常用的配置 稍后我会给大家看一看里面有什么 然后business 我会存放一些呃 当前在折腾的 一些商业项目相关的内容 然后q box文件夹 其实是主要用来存入 我在外部导入的一些内容的 我用的一个工具叫q box 我把它存在这里 那research会放我正在研究的一些方向 那这里呢
有一些演示的研究资料 那tasks这里呢 定义了一些 需要我的贾维斯帮我完成的任务 一旦完成之后 他就会把结果同步到这个目录里 我会定期去清空 比如说我最近让他帮我整理 我的VIP圈子里 成员能够提供的一些贡献 以及需要共享的价值 好再往下这个叫worthy reads 这里面呢 就是主要放了一些
可能近期我觉得我需要去研究 需要去阅读的一些内容 再往下这个writings writings里面 主要存放一些我近期写作需要的素材 还有一些工作流 比如说目标读者的画像 比如说我最近抓到的一些热点 还有系统自动帮我生成的一些选题 之类的然后再往下这个x Dash 点GitHub点l
主要就是我个人的博客的网址 它现在跑在GitHub上 用的是GitHub Pages这个服务啊 最后这还有一个增长点AI 就是现在我Newsletter的一个生产力工具 那在去年的那个课程里有提到 它现在是帮我半自动的 进行相关的草稿产出 和我保存最终成品的地方 那除此之外呢
外面暂时还有两个零散的独立文件 第一个文件 是一个以当前日期命名的文件 可以叫做日历 那我会手动在里面写一些心得感悟 当然它也会帮我抓取这一天 我在网上发布的动态 或者留下的痕迹 像这个呢 就是我今天给一个搞笑视频点了个赞 那它就会把这个视频信息抓下来 后续我的AI可以通过它来了解我
更加懂我 还有这里呢会 有一个to do的功能 这个也是我创建的 一个比较神奇的文件 一旦我在这里面增加某一个内容 比如说帮我调研什么什么什么 那接下来 我的贾维斯会定期的去检查这个文件 一旦发现这个文件里有新增的to do 之后呢它就会帮我执行 执行完之后
就会在这个down里输出一个啊 这个任务已经执行完成了 然后我要去哪里 检查这个任务最终的成品 这个就是我之前的一些演示的任务 好那下面呢 给大家重点看一下第一个 这个AI info这个目录 这是一个很重要的存放配置的地方 我存放了让AI更了解我的内容 俗称上下文 其中第一个子文件夹叫l l m context
就是大语言模型的上下文 点开之后呢 这里面结构是这样子 每个目录会有不同作用 第一个叫做basic RULES 这里面呢 会存放一些 我希望贾维斯记住的最基础的信息 比如说一些常用的配置 或者我要求他指定我用自己的API呃 除此之外呢 我还会记录一些最基本的经验教训
像是这个配置说明 大家可以看一下 它有一些基本的呃一些规划 然后我希望它记住什么 然后不包含什么 都会在这里有体现 然后再包括这个写作风格指南吧 它会根据我以往的一些写作风格 总结出一些 我期望AI自动帮我写文章时候 生成的一些稿子的方向 大概是这样
好第二个叫做Dynamic activities 这个呢就是 我会不停地在网上更新最新的动作 之后呢它会把我的这些动态抓下来 然后变成我的风格 我的人设的一个记录 比如说这个consumed里 它会把我最近看过的什么视频 然后在网上的一些推荐啊
或者打分给记录下来 那当他发现我力荐了某一个呃 美剧的时候 他会知道我可能喜欢这类美剧 那么他对我的这个人的了解 会更深入一些 然后这里这个diary 会存放我这么多年的一些日记啊 通过日记 他也会了解我的真实的所思所想 这里有个豆包聊天记录的历史
会存放我跟豆包交流沟通 抓下来的一些对话记录 那这个就不给大家打开演示了 可能有一些比较私人的东西 再往下OK r里呢 会记录我这么多年的一些o OK r呀 计划呀反思之类的呃 以及完成情况 这个也交给啊AI去学习了 然后这还有s o p 你看会 我会在生活的很多层面
记录一些个人的SOP 有的比较靠谱 有些很扯淡 但是我都会记下来 好这个呢 就算是 对于我的一些个人动态的一些记录 然后再往下有个叫my flavor的 那这个东西呢 就是用来让AI学习我的各种兴趣 偏好的啊 像一些数据的标注 我希望AI哪些多去记录
哪些我可能比较没有感觉 那这些的话啊 像像一些应届生的就业困境啊 或者说一些鸡汤之类的 可能我就不太感兴趣 然后再往下这里呢 会有 一个我的投资原则这么一个文件夹 那这个东西其实是这么多年 我的一些投资心得经验 我会存放在一些Evernote里
后来我现在迁移到呃OBC店之后呢 我让cloud code和cold body 帮我把以往的一些经验直接总结了 你看他会帮我分门别类 我的笔记里都记了哪些东西 然后帮我整理成一个 像自己的小册子一样 变成了一个原则性的总结 那后续我再用AI
帮我做交易相关的东西的时候 它就会在里面查询我的交易原则 那避免说AI帮我盲目的做投资 好再往下呢 会给AI一些我的写作风格的参考 按照不同的渠道 我会给他我在不同渠道里面 比较优质的 或者比较爆的一些文案内容 然后如果按用途的话呢 我也会给他看
像给各种东西写推荐语啊 或者说我的一些日记的风格 都会对他进行一个归纳和相关的参考 然后接下来 还有一个叫personal profile的 这样一个文件夹 这里面的是对于我个人人设 身份背景的一些提炼总结 然后为给AI 那它是怎么来的呢 是嗯你熟悉我的话会知道
我这些年做了很多视频和博客 呃他们的信息量都很大 我直接将将这些视频和博客的内容 丢给AI 然后让AI帮我去 根据我以往输出的内容 去提炼他对我的认知和总结 然后会生成这些人设文件 我直接丢给了AI 那以上这些呢 就是我为给贾维斯的一些有关个人的
上下文希望他能够更懂我 那接下来 在这个AI info的基建文件夹下面 还有一个叫skill的文件夹 它记录的呢 就是我训练大模型 帮我设计的一些工作流 那这里可以展示一些演示的skills 那什么是skill工作流呢 那么接下来 正好就进入了金字塔层级的第三层 也就是能力层 好现在我们来讲能力层
那什么是能力或者skill呢 要说到技能这个关键词啊 最近很火对吧 呃除了它在最近的这个喜剧节目里 爆火出圈之外 其实在AI界 最近有很多产品 也陆续推出了skill这样一个新的功能 那skill可以理解成一个可复用的 标准化的工作流 它可以在你的命令行开发工具里啊 只输入一个单词
就开始自动欢快地帮你跑起来 提前定义好的一个动作 它可以解决一个具体的问题 而且可以组合 可以扩展 那为什么要用skill 而不是用传统的提示词或者prompt呢 那很多人用AI 其实就是去复制粘贴提示词 但是这里有个问题 就是每次都需要重新输入 但是用技能skill就不一样了 你配置一次之后呢
以后可以反复的调用 而且skill它可以包括代码 可以调用工具 可以读取上下文 也自带了提示词 它比简单的单纯的提示词要强大很多 那你可以把skill理解成 是会自己执行的一个工作 效率手册 以前你要记住一堆的操作步骤 但是现在呢 你只需要调用一个skill它
就会自动地帮你完成所有的步骤 在cloud code或者cold body 或者open code里面创建一个skill 其实很简单 你只需要跟他说请帮我创建一个skill 它的作用是什么 什么什么 它的名称是什么什么 就可以了 比如说你希望一个skill它的名称是ABC 那么你在code body里只需要输入斜杠ABC
就可以开始启用这个技能 那么单说有点抽象 我再给大家做一个实际演示 用我现在做的一个命令 那我做了一个比较简单的skill 很适合作为Demo 这个技能的名字呢 叫做ORG ORG 那它是organize的简写 也就是去帮我组织一下 帮我整理一下 帮我梳理一下 因为我是一个INT界
我很喜欢有组织的东西 其实我一开始准备给它起名叫clear的 但是我发现很多系统自带了一个命令 叫clean容易搞混 所以想了一下之后 我还是定了这么一个比较短的名字 就是ORG那这个ORG命令的主要功能呢 就是帮我清理 当前工作目录下的一些垃圾文件 临时缓存
以及没有被关掉的一些系统孤儿进程 那除了做这些清理工作之外呢 他也会做一些自动化的经验总结 和流程复盘 那我对他提的要求就是 每次我运行这个ORG命令的时候 他就得把今天跟我交互过程中 修复的问题 提出的bug 还有我给的改进建议等等 都做一些经验总结 然后输出出来 保存成一个文件
然后自己不断的去学习它 我们先启用这个命令 让它先跑着 好这个系统开始自动运作起来了 它会将这段时间来的一些问题啊 解决方案等等 变成一个个具象的文件 或者你可以理解成是经验包 所以呢这相当于是你用的越多 总结的越多 调用这个ORG的功能越多呢 你的系统也就会越聪明
越稳定而且越高级 它是不是很像一个优秀的职场员工 写日报总结的时候 往往也能写得很漂亮 很言之有物 好的这里呢 为了给你节省时间 我把中间的一些执行过程给省略了 我们来直接看一下它最终生成的结果 啊 系统已经报告了哪些地方进行了整理 哪些进行了结构检查
然后当前项目状况是健康的 那么这个skill技能 它原本长什么样子呢 我们不如直接来看一下 这个技能的文件夹 好那么重新回到这里 刚才这个ORG的skill 在这儿我们可以看一下 系统在创建它的时候 自动提供了一个readme文件 可以让你知道一下这个东西是干啥的 然后回到这个技能本身呢 它内部的提示词是这样写的
啊他会告诉你去整理哪些 然后使用场景有哪些 执行流程有哪些之类的 这些都是AI自动去帮你生成的 我只是打开让你看一眼 具体里面长什么样 其实我也不关心 我原来也不知道 好的那么这里呢 就是一个很简单的skill的讲解 那我设计skill的时候呢 会遵循一个原则
叫做小文件哲学 也就是每个skill 每个技能 它只做一件事儿 确保文件比较小 比较容易理解和维护 那如果需要 涉及到 一个复杂的项目的功能的时候呢 通常需要多个技能的组合 一个技能提取热点 一个技能用来根据最新的热点 产生文件 然后还有一个skill呢 就是将刚才产生的这个文件 作为一篇文章
发送到我自己的博客 类似这样 那怎么快速的开始设计 最适合你自己的一个skill呢 我我的经验就是 第一个就是 你要找到日常生活中 有哪些重复的任务 比如说你发现自己每周都要写周报 格式都差不多 就是内容不太一样 那这就是一个 很适合创建skill的一个契机 接下来就是让AI帮你写一个skill 去解决它
然后再往下 你用了几次之后啊 会发现其中的问题 比如说哎呀 系统报错啊 或者格式不太好之类的 你直接把这个问题描述给你的cloud code 或者open body 它会自动帮你修复 接下来通过几轮修复优化之后呢 将这个skill固化起来 以后记得经常去调用就可以了 如果你觉得自己开发比较麻烦呢 那怎么快速的
在短期之内获得更多的skill呢 有什么有价值的办法呢 那这里呢 我给大家推荐一个网址啊 叫做skills点SH 那这个网址上呢 经常会有大量的网友提交最新的 最热的最有创意的skill 你可以在上面找找 有什么能够启发你的 那这边左边也 附上了一些我测试过 比较好用的一些技能啊 比如说有fight skills
它就可以帮你发现其他的技能 你一旦找到并且下载获取之后呢 当你以后想找一找 哎呀有什么事儿我自己做不来 我希望觉得太麻烦的时候 开发一个技能时候 你不需要从头开发了 你直接输入这个find杠skills这个技能 然后后面直接附上你希望做成的事情
他就会去网上帮你找到对应的技能 然后再帮你把这个技能下载下来 有点像是吸星大法 不停的帮你去学习 网上最新最酷的前人总结出来的技能 嗯除此之外呢 还有一些其他实用技能吧 比如说像网页制作呀 比如说一个网页价值的评估啊 包括帮你生成幻灯片啊表格等等 那还有更多有意思的
我建议你自行上去看一看 当然我这里还要提醒一下 如果你对安全性看得很重的话呢 我个人不太建议你直接把来路不明的 网络上的skill下载下来使用 因为你不知道 里面会不会有什么后门啊 病毒之类的 那总体来说 就是 不建议直接使用这些来路不明的 网友提供的东西 那我建议你怎么做呢 就是
当你发现网上有一个好的skill之后呢 你把这个网址直接提交给你的code body 让他帮助你根据网友的这个创意啊 自己从零创建一个 那并且你对他进行提示 就是你创建的过程中 要尽可能的规避网上这个技能 它潜在的安全风险 要不引入任何新的问题
在这个基础上把这个技能实现出来 这样你就可以自己复刻一个来使用 并且 规避了很多网上技能带来的潜在风险 好的那么skill这个概念终于讲完了 那现在我终于可以给大家好好的讲讲 大家最近听得最多 最熟悉的三个概念 第一个也就是我们的AI基础设施 也就是今天的主题贾维斯
第二个就是智能体 这两年也很火 第三个就是刚才提到的skill 那这三个概念 彼此之间到底是什么关系呢 现在在脑子里你不用一摊浆糊了 我们先从这三个概念里 最小的这个skill 也就是技能开始说 你可以把技能呢 想象成工具箱里的单一工具 比如说一把锤子或者一把螺丝刀 它是一个模块化的
可以复用的功能单元 专门用来执行一项非常具体的任务 比如说处理一个PDF啊 生成一个图片啊 或者是调用某个网站的API 那技能本身它是没有决策能力的 它只是被动地等待自己被调用 从而完成一系列精确的指令 它可以是构成更复杂的AI功能的 一个最小的原子化单元吧 接下来呢
比skill高一层的 就是我们经常听到的智能体 那如果说skill是一个工具 那么智能体 就是 掌握了如何使用这些工具的一个工匠 那一个智能体 能够理解一个相对复杂的目标 比如说帮我写一份 关于本周销售数据的分析报告 那为了完成这个任务呢 他就会自主的规划步骤并且调用 一系列相关的技能
包括调用一个数据库查询的技能 来查询数据啊 包括调用一个数据分析的技能 来进行计算啊 再包括 调用一个图表生成和报告写作技能 来完成最终的报告 那智能体 它是一个任务的执行者 具备了目标导向 和一定的自主决策能力 当你在cloud code code body或者open code里面 输入一段提示词的时候
它开始自动运行 并且智能的做一系列动作 这个时候你就可以理解成 你激活了一个智能体 它在帮你工作了 那当然刚才提的这些CLI工具啊 它有一些很高级的功能 比如说它们大多数 都支持你创建多个子智能体 也就是SUB agent 相当于是一个大的智能体呢 调用了一堆自己的小弟
帮它自己各司其职的完成任务 这属于比较高阶一点的玩法 那这个课程里 我就不讲SUB agent的概念了 如果各位感兴趣的话呢 可以自己去研究搜索一下子智能体 然后最后就是最高级的 也就是个人AI基础设施 即是我们现在说的贾维斯系统 它是一个完整的 个人化的AI基础设施平台 那如果说智能体是工匠
那么贾维斯 就是管理着所有工匠的一个总指挥官 或者叫项目总监 那他可以实现多模态的交互 他可以自己实现任务分解与调度 以及他会持续的学习整合你的偏好 然后整合来自不同智能体 不同的外界环境的信息 变得越来越聪明 那最终呢 它能够提供一个统一的连贯的
并且高度个性化的服务体验 它是一个整体的生态系统 是所有智能体和技能协调者与管理者 那这个就是贾维斯的概念 那么说到这里 大家是不是更加明确了呢 好让我们继续往下来讲讲场景层 那前面提到的工具数据能力 其实都是为了这层来服务的 场景层是什么呢 其实就是真实的各种自动化的任务
每个任务对应一个真实的场景和需求 它会定时执行 不需要人工触发 或者有些东西 就是靠你来手动要求执行的 那像我自己的话 目前有40多个自动化的任务 那这些任务全都是呃 系统跑着不断的在循环的 不需要我去操心 那某些东西呢 会在我的人为触发下 去帮我额外的实现
那这里我放一张图大家可以看 这是我每天自动执行的一些任务 和频率其中的一部分 这里面很多脚本 都是在每天凌晨自动跑一遍的 所以只要早上我一觉醒过来 我就能够看到我想要的结果 去验收我自己希望他帮我完成的任务 那你可能会好奇 他背后是不是调用了什么 非常复杂的技术框架
或者功能原理呢 那其实在背后 我只是用了一个很简单的 编程类的东西 叫做循环 嗯这用循环不是因为我技术差啊 当然我技术也没那么强 主要是因为我自己不断的尝试打磨 摸索出来的 并且当我摸索出来之后呢 我发现了一篇文章 就是Astropy公司在它的官网上 写了一篇叫
做编写高效的agent工具的文章 那是他们内部实践经验的总结 那他们的文章里也提到说 如果你能用简单的循环 来以简御繁的话 是一种非常好的方式 他们也非常推荐 看来是跟我不谋而合了 那对于不太懂技术的朋友呢 我稍微打个比方 你就可以理解成我这个贾维斯啊 他在不停的心跳
他每心跳一次的时候呢 他会自己思考一下 哎呀接下来我要做什么呀 我是不是要调用什么任务啊 或者我是不是到了该执行什么项目 工作的时候了呢 一旦发现他这次心跳的时候 有一个新的任务进来了 或者他发现到了规定的时间了 他就会开始做任务 那任务执行完成之后呢 他就会把结果输出
或者带入到下一次的心跳当中 如此循环往复 永不停歇 除非我人工把它停下来 那这种简单的模式呢 不仅更容易构建和调试啊 其实也更接近于智能体 在思考与行动之间 来回切换的一个这样的本质 好那我们现在终于来到了最后一层 就是回顾层 或者你也可以叫它复盘层
学习层自我进化层 怎么说都可以 那为什么需要回顾呢 因为系统不是搭建完它就结束的 你会发现问题 你会想优化 你会有新的需求 那回顾层呢 就是让你去定期检视这个系统 持续优化 那现在我的回顾机制分几种 一种是每日回顾 除了前面我手动定义的这个o r g ORG 这个命令之外呢
每天早上我也会收到一 封汇总邮件 这邮件里面 会有昨天所有任务的执行情况啊 哪些执行成功啦 哪些执行失败啦 如果有失败的任务的话呢 我就会去看日志 然后找出原因 然后我会有每周回顾 每周末的时候 我会收到一周的 一些有价值信息的整理 采集那哪些有信息 哪些是噪音 通过这个周报我就可以看到
因此有些像热榜啊日报之类的 我就不看 我直接把它关掉了 那每个月月初的时候呢 我还会复盘总结整个系统的效果 这个月节省了多少时间啊 这个月产出提升了多少 还有哪些新的需求正在堆积 需要去解决等等 通过这些呢 来不断的优化 我整体的这个贾维斯的架构 当然既然是我的AI贾维斯助手
那回顾这件事儿 肯定不完全是由我人肉来做的 系统它自己也会回顾 所以就产生了前面这个o r g的命令 那这个整理的命令会将回顾的结果呢 保存到本地的 一个叫reflections的文件夹里 你可以将它具象地理解成 就是一个经验包的文件夹 而且随着我这样做之后呢 还有一个意外的收获 就是现在系统里
已经记载了这么多过程当中 总结的经验了 所以 现在当我想做一门这样的课程的时候 很多课程内容的设计和来源 其实就是靠我的贾维斯 自己去帮我调取回忆 帮我去取材 甚至帮我完成初稿的一个组稿的 也就是说 现在他做课程更方便了 以前我需要花几十个小时去整理总结 现在调用它
全程只需要几十分钟或者几个小时 就完成了我最头痛的 将知识给文字化的过程 OK好 讲到这里呢 搭建这个贾维斯的5层金字塔结构 终于讲完了 有了这样一个比较清晰的框架结构 和思维模式 之后呢你的AI在搭建过程中 就会变得更加高效 而且你对它也会有更强的掌控感 后续迭代维护也会很方便
那接下来进入第三环节 我们进入了另一个很重要 也是大家会非常感兴趣的部分 就是实战案例 好 现在我们进入这个课程的第三部分 实战案例 那第一个案例呢 我要讲的一个比较常用的功能 就是用我的风格来写博客 那为什么选这个案例作为第一个呢 第一个是因为它最真实最实用 因为内容创作者的核心需求呢
其中之一就是写作 这个场景几乎每天都会遇到 第二个原因呢 就是它比较简单 这是理解skills的 一个比较简单的入口吧 没有复杂的技术细节 逻辑也很清晰 第三个就是 这个东西一旦建立起来之后呢 它是有复利的 做了这个之后呢 同类型的任务 今后可以说就是一劳永逸了 那我平时写作的需求是什么呢
我需要频繁的写作 但是每次从零开始起稿是很费时间的 我希望AI能够学习我的写作风格 生成的内容更加符合我的语言习惯 我也希望AI能调用我的历史素材 避免重复劳动 那前面讲过 skills 就是一个可以复用的工作流配置文 件它可以解决一个具体的场景问题 然后里面会包含提示词模板
包括上下文引用 包括执行逻辑 所以呢我创作了一个新的技能 叫做writing 它可以帮我来模拟我的写作风格 那这个writing的技能 大概是什么样的呢 我给大家看一下 好这个呢 就是writing这个技能 它基本的一个长相了 当然这也是贾维斯自动帮我实现的 然后它也在不断的迭代 你可以看到
这里面这个技能一直在用 然后这个writing 它的执行流程是怎么样 它会使用哪些工具 然后它日常的一个执行过程是怎么样 包括它调用了哪些具体的代码 然后它会读取哪些文件和风格指引 等等这个呢 都是writing这个技能会自带的 你看像这里 它引用了我们刚才展示过的一些内容
作为参考 好话不多说 那我们来具体执行一下 看看效果怎么样 我们还是回到这个界面啊 我们用斜杠writing来调用 然后我们来说一下 比如说请用我的风格写一篇 呃写 写什么呢 写一个纳瓦尔宝典怎么样 写一篇纳瓦尔宝典的读后感
字数大概2,000字 好现在AI就会自动调用它 对我的知识的了解 以及基于纳瓦尔宝典这本书 上网搜索相关的介绍 最后帮我整理出这么一篇文章来 我们来看看效果怎么样啊 okay好的 稍加等待 之后呢 这个系统提示我们已经创建完成了 我们来看一看
它这篇文章写得怎么样啊 好他告诉我 以范冰冰的风 格创作这篇navarre宝典读后感 大家可以看一看 呃我目前看一下 还是挺符合我的风格的 而且他的一些规范呢 还是严格的参照我给他的 比如说所有的引号 我都希望用成是直角引号
包括在数字和汉字之间要加一个空格 这也是我个人多年的一个写作习惯 他也一直都遵循了 然后如果你经常看我写的东西的话 会会发现 呃还挺像我写的 挺像那么回事儿的呵 好的那这个就是第一个 最简单的一个案例 算是讲完了 然后接下来我们难度一点点的升级 来到第二个案例
就是短视频脚本生成器 那这个案例呢 是我为一个真实的商业合作伙伴 做的项目 他确确实实的为我产生了收益 那这个客户是谁呢 我先介绍一下这个客户 或者叫合作伙伴 叫飞海啊 或者全名是郑飞海 他是上海赌和书局的创始人 他在实体书店这个行业干了十几年 现在呢在上海开书店
已经短期内开了好几家连锁店了 书店的名字就是赌和书局啊 笃定的笃 合作的合 那欢迎大家感兴趣的话呢 可以来我们书店看一下 那这个书店老板他的需求是什么呢 第一 他每天要生成几十篇短视频脚本 他不是偶尔写一篇哦 而是要持续大量的生产 为什么呢 因为抖音啊 小红书这些平台靠的就是持续输出
那你今天只发一条 然后三天不更新 那算法就不给你流量了 第二个需求就是 脚本要符合书店行业的特点 不能是那种特别通用的鸡汤文字 要懂行业 要有专业感 要让同行一看就觉得嗯 这个人很懂行 第三个需求 就是要快速的抓住实时的热点 今天这个话题火了 你要今天就能出脚本
明天拍成视频再发出去的话 可能慢了就没什么流量了 第四个就是要体现个人的风格 那飞海他的人设是什么呢 他是一个十几年实体书店的从业者 他很懂经营 他很懂做实体生意 那书店的名称定位风格特色 近期的一些经营情况 还有一些最新的荣誉等等 这些呢
都要在脚本里适当的有要有一个展现 第五个就是全程希望能做成自动化 那飞海他其实平时工作也挺忙的 没时间每天盯着写脚本 那他希望这个系统能够自动运行 每天给他自动发邮件 里面就是精选的高质量脚本 他审核一下 就能够开始用 就能开始拍 你看这个整套体系 是不是比写一个博客文章
稍微复杂一点 写博客文章可能一周要写个一篇 或者一个月写一篇 但是短视频脚本 每天可能就要出几十篇 所以呢 这是一个稍微更有挑战性一点的项目 那这个需求怎么实现呢 我的思路就是结合热点 加上批量生成 加上自动筛选 每天不是生成10篇完美的脚本
而是先草率地生成40个脚本 然后把这40个脚本再让AI帮你评分 挑出其中得分最高的10个脚本 为什么这么做呢 因为AI生成的内容 它的质量啊 是有随机的波动的 有的好有的可 能就比较差一点 如果你每天只生成一篇 那万一生成的质量不好怎么办呢 你重新生成的话又太费时间了 与其这样
不如你直接一口气生成40篇 然后总归有几篇是好的 让AI再帮你挑出其中最好的10篇 这样质量就相对有保证了 这个 可能就是量变引起质变的一个策略吧 那目前呢 整个流程是这样的 第一步就是抓取今天的热点 那这个系统呢 每天会去自动抓取全网的热榜
包括微博知乎b站 抖音等等几十个平台 那我用的这个工具呢 叫做top Hub点today 大家可以去看一看啊 这个一眼就能看到 各个平台的所有的热点 非常方便 省得跳来跳去 那这一步呢 我让AI直接帮我写了一个爬虫 去爬这个网站 它会访问这个页面 然后把页面上所有的
可能80多个板块的热门内容 先保存下来 那为了不处理多余的信息呢 我会忽略掉像是音乐热榜啊 淘宝热销商品榜这些内容 重点关注微博热搜 知乎热榜等等 具有大众讨论话题性质的一些榜单 这个脚本呢 我让AI写成了循环执行的模式 每天它会执行一次
执行时间是当天早上0点之后 这样一来呢 这个脚本就会在每天凌晨啊 自动把前一天的所有热门内容 给我抓下来 我会将收集到的这些榜单的数据呢 保存在本地 然后也是为给贾维斯 告诉他存放的位置 好抓取到热榜内容 之后呢后几步的流程就是脚本的 自动处理了 那比较抽象
所以这里呢 我绘制了一个流程图 大家可以看一下 嗯 他的第二步就是从几百条的热点当中 筛选出跟书店 文化空间实体经营相关的一些话题 这一步其实很简单 就是告诉系统 然后让他帮我去判断 哪些可能符合书店主题 哪些符合我想要的脚本方向 那我给他很多具体的要求
最终都是AI自动帮我打点实现的 那他我看了一下 他可能会重点关注像书店啊 阅读啊 文化空间实体店上海这样的关键词 然后遇到这样的关键词的时候 这个内容的权重会比较高一点 啊第三步 光有关键词还不够啊 AI可能还会再去帮我做一轮精筛 然后筛选出
可能相对更适合短视频的话题 然后给出更进一步的过滤结果 然后第四步呢 就是批量生成脚本了 针对不同的话题方向 每天自动帮我生成40个短视频脚本 这个脚本呢要求符合郑飞海的人设 他的原风格 他的其他各种内容 要求好 然后是第五步 AI呢做一个质量的评估 这40个脚本
我让AI自己帮我打分 用100分制 然后评分维度也是他帮我生成的 他会去评估开头的吸引力 专业度实用性 人设契合度 还有传播性等等这些因素 综合这些因素 AI给出一个评分 然后第六步 筛选所有打过分数的内容的前十名 把他们挑出来 第七步呢
就是把这些生成的邮件 自动的发给郑飞海 和他的短视频编导团队当 然呢也会发一份给我留底 那邮件的内容呢 除了包括完整脚本之外呢 也会包括它的评分 以及原始热点的来源链接等等 好的那么 经过这连串流程的自动处理之后呢 一个符合我们书店要求的短视频脚本 就算最终完成了 那我的合作伙伴们呢
都会在每天早晨一觉醒来的时候 很愉快的收到最新的素材 这个 帮他们节省了大量的脑力成本和时间 并且现在呢 我的短视频编导啊还会更进一步 它自己找到了其他的一些 文字生成语音的工具 可以将老板的语音啊直接录入进去 之后呢生成出AI模拟的音频 那么这样一操作之后呢
在制作这种口播类的短视频的时候 老板终于不用再亲自抽出时间来 坐下来去拍摄 去录音了 只要有了我给他提供的这些文案脚本 之后呢 系统呢就会自动模拟老板的声线 生成一段论述 然后再配上平时拍的一些短视频素材 那么一个最终的成品就算制作出来了 呃我们实际跑了几轮测试之后呢
发现效果还挺好的 很多观众根本意识不到一个视频背后 它是AI合成的声音 甚至觉得AI合成的 好像还比老版的更加亲切随和 那顺便说一下就是 如果你想在上海做短视频 或者找短视频编导来合作 那欢迎来联系我们 我们手头是有这样的服务的 OK好 我们进入下一个案例 第三个案例呢
是b站长视频的自动总结和邮件发送 这个案例的难度啊 又稍微升级了一点 涉及到你需要对你的工具 还有你常用的服务相对比较熟悉 你要有一点点的技术能力 还有一点点的想象力 那我跟你讲一下我的需求是什么 我每天呢 会大量的看b站的视频 其中有包括技术教程啊 行业分享啊呃
思考启发 当然还有娱乐八卦 但是呢我没时间一个一个 从头到尾的去完整的看这些长视频 看完了可能也就会忘了 没有沉淀 而且呢在手机端 其实缺乏比较好用的 b站视频总结工具 就算有 也得在不同的APP之间跳来跳去 很影响体验 容易当前打断这个观看进程 而且就算总结好了
你还得把它手动的复制 粘贴到你的笔记工具里来 方便以后回看 整体流程会复杂不少 所以呢我的诉求就是 希望在bilibili的APP当中啊 通过一个简单的操作 就能够自动的调用我的贾维斯 帮我去做总结处理 那经过一番研究之后呢 最终我是这样实现的啊
大家可以看这个屏幕上这个截图 当我预估一个视频挺长 但有可能挺不错的时候呢 我会直接点击它的客户端的收藏按钮 也就这有一个星标按钮 点了这个五角星之后呢 它会弹出一个对话框问我说哎呀 应该收藏到哪个收藏夹里呢 让我选一个 呃我自己创建了一个公开的收藏夹
就是叫to summarize这个收藏夹 一旦我把这个视频 收藏到这个收藏夹之后呢 我的贾维斯他就会不 断的去轮巡这个收藏夹里的内容 一旦发现新增的视频之后呢 他就会去解析这个新增的视频 随后呢 他就会生成对应的内容总结摘要 就像右边这样
然后通过一封邮件的方式发送给我 整个过程不需要我操心 我只要静静地在邮箱里等着结果 就可以了 那这个功能呢 涉及到几个技术点 首先 就是要去定期的检查Beats站的收藏夹 发现新增的视频 那b站的收藏夹分两种 一种是公开的 一种是私密的
绝大多数的收藏夹我都会设成私密的 但是为了这个工具呢 我专门创建了这个公开的收藏夹 就是to summarize 之所以要设置成公开呢 是因为我希望我的贾维斯啊 可以更轻松地爬取到他的内容 然后不需要调用太多太复杂的技术 比如说获取我的登录状态啊 获取我的账号密码之类的 我认为呢
一个公开的收藏家做这个事 没什么大碍 反而能让实际的技术实现变得更简单 然后这个脚本 就会去不停地监测这个收藏夹 一旦发现新视频之后呢 就会自动调用工具去获取它的字幕 或者下载了这个视频之后呢 将它的音频生成一个对应的字幕 的文字稿 这里面涉及到比较硬核的技术了
不过呢你不需要知道细节 你只需要记住名字就行了 让AI来帮你调用 大家可以看屏幕中间这两个工具啊 嗯一般会用到的 一个叫做y t d l p 一个叫做f f m p e g都是开源工具啊 当然是AI自己可以去搞定的 前者呢是用来下载视频的 后者呢
可以用来把音视频提取成文字 那这两个工具 其实也是当时贾维斯自己帮我找到 亲测可用 我没有花太多脑筋 但是效果呢 是很不错的 好有了这个工具帮你完成字幕提取 接下来呢 就是根据文字稿 调用AI来总结视频要点 那么这个呢 就是大模型的常规操作了
最后生成了这个要点总结之后呢 会发送到我的office文件夹里 和发一封邮件给我 那整个过程呢 就实现了 你看怎么样 整个思路还是比较清晰的 那有了这个工具之后呢 往往一个十几分钟 甚至几十分钟的视频 我只要扫读一下 在半分钟到1分钟之内 就能够快速了解 这个视频到底讲了什么
以及适不适合我 如果我看了摘要 仍然觉得很有兴趣的话 我才会认真花时间去看完这个视频 好我们来看最后一个最高阶的 相对来说最难的案例 就是用语音来遥控家里的贾维斯 帮你做任务啊 我认为这是一个很有未来感 很有科技感的案例啊 我自己做出来也很满意 那先说一下我的需求是什么呢
我希望我在散步逛街 或者开车 或者带孩子 类似这种腾不出手的场景里面 我可以纯靠动动嘴皮子 就进行语音输入啊 不需要手动打字 就能够启动家里的贾维斯帮我做任务 比如说我对贾维斯说啊 你去帮我创建一篇笔记 内容是刚才一 个小时之内 我跟豆包聊天的内容总结
或者我跟我的贾维斯说 请搜索我最近三天内 写的AI相关的笔记 以及我看过的跟AI相关的视频 然后写一篇归纳总结最新趋势的稿子 字数在2,000字以内啊 再比如我还可以跟他这么说啊 请帮我全网调研一下 然后做一篇汽车养护基本知识的
偏向小白的深入浅出的基础知识文档 然后最好图文并茂 要求是5,000个字 要形成体系 巴拉巴拉 类似这种语音输入的指令呢 只要不是特别离谱 在我开发的这个 贾维斯的功能范畴之内 那么它都能够在我语音下达指令之后 开始做任务 帮我把它们搞定 怎么样听起来是不是很酷
嗯真的很接近钢铁侠电影里 托尼斯坦克在做的事情 那要实现这个功能呢 有几个不同的技术环节需要串联起来 第一个就是语音的输入和系统接入 这个具体怎么实现的呢 我使用的工具呢 就是豆包它官方出的一个智能耳机 硬件叫做Olaf friend哎 也就是这张图里面 这个美女
耳朵上戴的这么一个智能体的耳机 那这个耳机 其实我已经在很多场合 都给大家安利过了啊 我自己实际用了一年多时间 效果是挺好的 那它是一款挂耳式的蓝牙耳机 支持同时连接两台设备 然后平时在手机上安装完豆包的APP 之后呢 通过蓝牙连接到你这个耳机之后
你只需要随时的说出豆包 豆包这个关键词 那么你耳朵上的这个蓝 牙耳机它就会被激活 耳机一旦激活呢 就会连到你的手机上 开始接收你的语音输入 所以你对它说任何话 豆包也会在第一时间接收到 并且开始给你执行 那有了这样一个工具之后呢 我专门去研究了一下
发现豆包的网页版 它会记录 我跟蓝牙耳机之间的聊天内容 并且有一个专门的移动版 聊天记录的网页 大家可以看一下这个页面啊 我做了一些脱敏处理 然后给你看一看啊 其实上半句这个提问 就是我给豆包的一个指令 然后下半部分就是没有徽匡的 这个就是豆包的反馈
那豆包怎么回答不重要 重要的是我给豆包说了什么 关键是要提取这些内容 然后我家的贾维斯 其实主要看的就是这个 灰框里的 就是我给豆包说的这些命令 他会爬取下来 那我的贾维斯具体做了什么呢 我让他做了一个脚本 然后帮我模拟豆包网页版 登录之后的状态
然后从这个登录之后的网页里呢 就去抓取我跟豆包最新聊天记录里 我说的这些要求 那我提前设计好了一些专属的关键词 比如说当我说的要求 前三个字是记笔记的时候 贾维斯就会帮我在obsidian里 去记一个笔记 如果我头三个字说的是做任务 或者帮我做个任务
或者帮我调研一下类似的关键词 的时候一旦触发 贾维斯识别到了 那么这关键词后面所有的内容 所有的句子 都会被当成一个指令传递给贾维斯 贾维斯会对于指令进 行语义上的理解提炼和精炼 在不损失信息 不产生幻觉以及不乱编的这个前提下
他会帮我把内容 整理成一个比较工整的需求 然后呢他就会像我在电脑上 直接跟他对话一样 开始处理这个需求 那么这张图呢 就是展现了整体大概的一个流程 大家可以看看 这里面最重要的 我觉得是第一个环节 就是找到合适的工具 来帮你进行语音的输入 还有第三个环节 是我当时做的时候
觉得自己比较有想象力的 就是通过前几个字来做内容的判断 然后后面就开始执行 呃然后第五个环节 其实就是直接调用一个Python脚本 或者说直接调用cloud code 去帮我完成任务了 是不是这样一说完之后 你发现其实也没有那么玄幻 其实还挺好做的 我希望后续呢 会有更多的智能硬件或者是智能桌搭
能够帮我在各种场景下 搭建更多强大的贾维斯 甚至这些硬件呢 我希望它们能够长出 跟现实世界交互的一些功能 有手有脚 或者有些奇怪的玩意儿 我一定会第一时间购入 然后到时候来跟大家分享 好的那么以上呢 就是几个由浅入深的案例介绍 这些案例有些共性啊 首先他们都是高度自动化的
是尽量让机器去做那些重复 机械的事情 从而把我自己解放出来的 第二个你会发现数据为王 数据在这些当中很重要 你的数据其实就是你的核心壁垒 所以你不应该把这些数据到处发送 或者授权给 其他第三方或者平台 而是应该尽可能的将他们纳为己用 并且呢 将你在网络上各个地方的个人数据
都收束到自己这里 以及通过一些方式 把你大脑里的一些隐性的知识呢 提炼出来 变成一个文本化 然后喂给你的贾维斯 最后你会发现 这些项目都是有很强的复用性的 这些方案呢 一旦用好了 你会从中源源不断的产生复利 如果后面的例子对你来说 稍微有些理解门槛的话 你可以先把前面几个简单的例子
先自己亲手做一做 搭建一下 在动手的过程中 你慢慢就会有所收获 那随着你经验值的上涨呢 后面的内容对你来说 也就越来越好理解了 好再稍微小小补充一个 既然智能耳机都能做语音输入了 那么更常规一些的 怎么在电脑上和手机上做语音输入呢 这里给大家重磅推荐一个 我最近刚切换过来不久
但是非常喜欢的一个工具 叫做tabless 它是我目前使用下来 感觉最好的一个AI驱动的语音输入法 装上它之后呢 你只需要对着你的设备录入一个语音 它就能够自动帮你解析 并且生成一段更加规整流畅 而且符合上下文语境的对话 此外 它还能够提供一些智能修正功能
包括自动添加符合上下文语境的格式 等等高级功能 呃它的使用门槛其实也不高 你第一次使用的时候 就会有一个非常清晰快速的教程 带你如何使用 用到现在呢 我发现它是我最喜欢的语音输入工 具啊我这门课的竹子稿 也是我先用这款工具口述 然后他帮我来整理的 最后
我再用更加有清晰条理的方式读出来 这样呢 就能减少我大量的剪辑工作量 所以在这一步的最后呢 我将这个工具推荐给你 没用过的话呢 你赶紧试试 绝对不会后悔的 好的 我们终于来到了今天的最后一章 那这一部分呢 我要给你一些 我这段时间以来的经验复盘 希望能对你有所帮助 首先呢
我想先给你一些技术效率方面的建议 帮你在工程构建的时候呢 更加顺畅 技术效率的第一个经验建议就是 你要让你的CLI工具 自动配置好它应该享有的权限 这句话什么意思呢 就是如果你刚开始使用啊 你会发现 当你在命令行里进行开发的时候 系统跑着跑着突然就停下来了 他会问你说哎
我能不能进行这个操作呀 哎我想访问你这个文件行不行啊 我删除那个文件行不行啊 他就会一直在那等着你 然后你得不停地去点击yes或者no 否则呢他就卡在那 你得一直盯着 这个就很不自动化 所以呢我们要做的就是告诉AI 有一些不高危的 不敏感的操作 你就不用问我了 你直接往下执行就行了
哪些比较安全呢 比如说查看我本地电脑里一些文件 然后列出当前目录下的一些文件夹 然后包括创建和编辑一些新的文件 这些操作其实没有那么危险 让他自己去操作就可以了 相反如果有一些操作呃 涉及到下面这些 就会比较危险 你最好先来问我 比如说删除某些指定目录下的文件 特别是根目录
再比如说 编辑系统配置目录下的一些文件 这些就比较危险 那针对类似的问题呢 你完全可以给你的CLI工具 发一个请求 跟他说请你帮我配置好相关的权限 不要每次都问我一些很简单的啊 不危险的权限 确认这种操作 你默认自己搞定就可以了 只有在遇到高危操作的时候
才来询问我的意见 你就把我刚才说的类似这种话 直接给你的code body或者你的cloud code 它就会开始自动地进行配置 配置完了之后呢 你重启一下 后续使用的时候就不用这么麻烦了 每次坐在电脑前面 等着它来问你yes no了 它就会自己很流畅地跑完整个过程 这个就非常顺畅 好我的第二个建议呢
就是用好系统里的符号链接 或者有的叫软链接 那在Mac里面 这个符号链接 它被称为symbolic link 呃什么意思呢 就现在我用的一些数据管理工具 像是obsidian 它主要是加载某一个特定文件夹下的 所有内容 但是如果我的Markdown文件 我的脚本 以及我想提供给AI的其他文件
分散在你电脑里的好几个不同的位置 它不在同一个目录下 但是呢 你又想在同一个obsidian的窗口里 或者同一个文件夹下看到 同时呢你又不想手动复制好几份 经常复制来复制去 然后确保各个地方的数据是 同步的那你该怎么办呢 这个时候呢 你可以善用系统自带的一个叫软链接 或者符号链接的功能
你可以把这个功能理解成 就是在b位置 为a位置的文件建立一个映射 这个映射呢 虽然不是文件的本体 但你在映射的文件上 进行相关操作的时候呢 会直接影响到那个本体的文件 这个就是符号链接的概念 有了这样一个工具之后呢 就有一个很巧妙的操作了 就是你可以把
原本在obsidian文件夹之外的文件 通过符号链接 映射到你的obsidian文件夹里 这样 你就可以像操作obsidian的内部文件 一样 去访问管理和编辑一个外部文件了 那我目前呢 就是这么干的 呃至于怎么操作 你还是在cloud code里直接给他下命令 告诉他请把这个文件夹
和这个文件夹建立符号链接就行了 它会自动帮你搞定好 我的第三个 有关技术效率方面的建议呢 就是你永远要记得 不断地给AI提供足够多的上下文 它才能够真正地成为你的私人助手 那我建议你有时间的时候呢 把你头脑里的一些隐性的 从来没有在网上 或者电脑里数字化过的 一些有价值的信息
写出来或者呢 就是用刚才介绍的tabless这样的工具 录入到电脑里 作为上下文 喂给你的贾维斯 你也可以把你过往产生过的一些文件 像是博客啊 视频之类的 通过AI自动将它们提炼成背景信息 或者上下文 当然你也可以 像我一样 将你在网上的很多行动轨迹啊 通过脚本抓取下来 然后喂给你的贾维斯 总之呢
只要你持续不断的给他提供更多 更详细的信息 他就能够更加了解你 以往这些操作 如果放在网上提供给其他的平台的话 对你来说个人隐私就会被别人利用 甚至泄露 这个呢就不太安全 但是因为现在这套贾维斯系统 在你自己的电脑上 所以你对它有绝对的掌控权 你对所有的文件
系统有安全的自我防护能力 所以你就可以大胆的去做这些事儿 这个就是我提倡的 打造个人贾维斯的最大的好处之一 好然后呢 再给大家一些 关于成本控制方面的建议 因为我看到大家在预购的时候提问 都很关注成本 比较在意怎么样用划算的投入 来实现效益RY的最大化 那第一个建议就是
你可以强制要求 你那个比较昂贵的模型啊 让他优先调用你自己比较便宜的脚本 这句话有点绕 什么意思呢 我给你解释一下 就是我现在自己也会用腾讯的code body 那他使用的是腾讯自家的模型 截止我做客的时候呢 你只能用腾讯自家模型 你暂时没有办法把它替换成 你自己其他的大模型
或者API那么我自己用下来发现 如果用量比较大的话 成本还是比较高的 我自己可能平均每天 要花个一两百块钱 这个对于企业级的开发者来说 可能司空见惯 但如果是个人用途 或者你是个学生的话呢 每个月为此 新增几千块钱的消耗 比起其他模型来说 确实是有点贵的 那为了解决这个问题呢
我在开发途中想到一个办法 就是我自己首先写了一个Python脚本 专门用来调用其他的 性价比更高的那些大模型的API 比如说国内的Kimi 比如说deep seek 那这个我自己准备的Python脚本呢 它实现的 其实就是一个最基本的流程跑通 也就是提问回答的功能
那当你在给他发一段提示词之后 他输出对应的回答 这么一个最基本的功能 就变成了一个演示脚本 或者叫demo 好准备好这个Demo之后呢 我对code body下了一条命令 就是请你生成一个规则 如果未来你要生成的内容 但凡字数大于200字
或者但凡是代码行数超过5行 你就不要用你自己这个模型来生成了 你必须先调用我刚才的那个Python脚本 参照它的方式 以及它里面的这个模型的流程 用它来帮我生成 那这样的话呢 其实就是我搞了个套娃 我让那个贵的模型去调用便宜的模型 来生成我要的东西
那通过这个方式 相当于是额外嵌套了一层 之后呢整个生成过程 就不需要大量的消耗 code body自身的那个API的TOKEN的成本了 从而呢就把价格给打了下来啊 这个一个小技巧教给大家 第二个关于成本控制方面的建议呢 就是脚本的优先级 要高于提示词的优先级 也就是说
如果一个功能可以用脚本来实现的 话呢我建议你 最好优先让cloud code 帮你构建这样一个脚本 而不是每次都给cloud code输入提示词 让它来帮你执行 因为你每次输入提示词呢 都会消耗TOKEN 花的是你的真金白银 但如果 你先让cloud code帮你生成一个Python脚本
那么它能帮你产出稳定的成果的话 后续你就不需要通过提示词 来花这个TOKEN钱了 我现在做法呢 就是会把常用的功能 一个个都变成脚本 然后让这些脚本自动执行 或者通过skill 通过技能去激活这些脚本 那只有 在我充分评估投入产出比的前提之下 极少数情况
我才会优先使用提示词来帮我干活 好那讲到这里呢 最后我再给你两个很重要提醒 第一个就是希望你不要沉迷追热点 我知道很多人对AI又兴奋又焦虑 每天看到新工具啊 新概念啊 就害怕自己落后了 那我想告诉你就是不要追着热点跑 不要formal 打个不恰当的比方呢 就是AI时代有很多KOL
他们很像是大航海时代的 所谓的航海家 那在这个时代 有很多航海家替你去出海探宝 并且他们不断的声称哎呀 我又发现了新大陆 我又找到了新的物种 要变天了 又有新的模式了等等 但是呢 很多也就是此起彼伏的叫嚷一番 就结束了 甚至还有几个 没有看过地图的所谓的航海家
天天都在叫嚷着他们发现新大陆 那么对于这种情况呢 你不要焦虑 不要着急把精力啊 一边放在打磨自己船坚炮利的技术上 一边呢 研究怎么样去压榨自己的领土 压榨自己的那一亩三分地的这个属地 等你夯实了这些根基之后呢 你再顺势的去圈下这些前人的航海家
帮你探寻出来的这些临近的板块 将他们纳入自己的势力范围之内 就可以了 就放心吧 绝大多数那些航海家擅长的只是航海 不是海战 不是怎么去殖民 而你如果作为一个领主的心态 你学会海战和殖民的话 你将会更好的去吸收 他们帮你打下的世界
然后你会在当中获得最大的收益 那你在构建自己AI系统的时候呢 也要问问自己 就是这个东西能解决我哪个真实的 或者高频的问题吗 能不能先简单试一试 这样你就不会被信息的洪流淹没了 能够尽可能保持清醒的判断力 嗯还有一些朋友 他搭建一个新系统 或者打磨工具的时候呢 也容易陷入一个误区
叫做太过于沉迷打磨系统本身 像我以前一样 也会花3个小时优化一个功能 可能只能节省10分钟的时间流程 而且后续只会重复利用一次 结果呢就是系统越来越复杂 冗余的一次性工具呢 也越来越多 但是 实际的工作产出没有得到太多的推进 也就是忘记了你真实的任务 忘记了你真实的目的
那么现在痛定思痛 我反思之后 我的建议呢 就是你的系统要节约时间 而不是帮你浪费时间 如果你发现自己每天都在调教系统 而没有在做真实的 工作那就会很有问题啊 你要保持人的主体性 让系统作为你的辅助 而不是你变成系统的辅助 你在不断的去优化它
你变成了它的工具人 那一个功能一上来 其实能用就可以了 不要过度的追求完美 你要做的呢 就是用这个系统快速的完成工作 而不是把它打磨到100分 但是却一直没有开始真正的工作 第二个建议呢 就是我希望大家 能够保持与真实世界的关联 不要让自己完全的活在AI世界 或者活在现在的数字世界里
偶尔回到物理世界 你会发现很多东西其实更简单啊 我自己的实践就是 每天早上呢 我会在纸上写下今天最重要的三件事 注意是纸上哦 不是电脑上或者在手机上 写完纸上之后呢 放在显示器的旁边 那这个纸条就会一直提醒我 今天最重要的事 最重要的三件事是什么
就不容易被其他事情带偏了 AI只是你的手段 不是目的 就是不要在这个阶段就过于沉迷于AI 直接让自己就赛博永生了 觉得自己无所不能 但是忽略你真实的生活 周围的家人以及爱你的亲戚朋友 你做这一切 其实就是为了让你此生 能够比以往任何时候 过得尽量更轻松
更愉快更顺畅 更健康因此呢 我希望你学会了我这些东西之后啊 能够让自己更加轻松的解放 而不是在数字的世界里越陷越深 忘记了怎么跟他人进行真实 有效的交流 如果那样的话呢 AI带给你的就得不 偿失了 好的那到这里呢 再附送你一些延伸资源的链接 如果你对今天课程的话题感兴趣
还想去探究更多的话 可以通过这些资源顺藤摸瓜 找到更多有意思的分享 呃临近尾声 相信大家今天呢也吸收了很多东西了 关于后续围绕AI 还有什么好玩的分享呢 我还有一些初步的想法 包括第一个 就是探究一下AI如何去协助投资理财 那我想大家研究 AI如何真正帮你去赚真金白银 这次课程呢
其实我没有刻意的包含这部分 主要有两个原因 第一个就是投资理财赚钱 这其实是一个比较完整宏大的命题 然后它涉及到的信息和专业知识呢 也很难用普世性的语言 向没有这方面以往经验的朋友去解释 他可能会花费大量的篇幅 第二个就是涉及投资理财呢
需要更谨慎的规划和更长时间的验证 在我自己拿不准之前呢 我不太放心自己去传授经验 以免误导大家 给大家带来损失 嗯第二个我想探究的话题就是 AI是否能够帮我做一门 你现在看到的这样的一个课程 有什么提效的方法 因为通过制作现在这门课程呢 我发现由于AI的协助啊
效率比去年制作那个100倍知识萃取课 提升了很多 信息量呢也更大了 这当中我摸索出了很多 用AI贾维斯帮我打下手 帮我全链入去协作的一些经验 那我后续可能会将这些经验进行迭代 在内部私下跑通之后呢 我可能 要不要再开一门课 教大家如何用AI做课 用AI写书
甚至制作更多的虚拟商品 和信息类产品 来帮你赚这个钱 感兴趣的话呢 欢迎继续关注我 关注方式在这里 最后一页 好这里有我的微信 还有我常用的一些链接 然后这个课程官网就是3W点增长点 AI到这里呢 整个课程就算是结束了 我希望这门课不只是教你用某个工具
而是帮你建立一种新的工作方式 一种AI时代的生存能力 如果你觉得这个课对你有价值的话呢 我建议你立即开始行动 用不了一两个月 你就会感谢今天的自己 最后再给自己打个广告 我是范冰 那么我自己 有些公司 我们也会为企业提供以下一些服务 包括AI应用落地的培训 然后包括企业公关和增长 营销相关的服务 还有
就是企业内部AI基础设施搭建的服务 如果感兴趣的话呢 你可以来联系我 最后感谢大家的支持 我们下次再见
Loading video analysis...