👍QWen3成功越狱!突破限制!让大模型回答任何问题🟢QWen3解除限制,让本地模型发挥大威力🟢牛哥AI实验室 NIUGEE AI(161)
By NiuGee
Summary
Topics Covered
- AI模型限制本质是输出限流器
- 破限用开源工程剥离限制层
- Ollama搜索即得破限模型
- 终端pull命令加载破限模型
- 破限应用风险自娱勿商用
Full Transcript
可以不懂人情世故 但不能不懂AI 哈喽大家好 我是牛哥 今天给大家带来QWen3 以及相关类似的 这种大语言模型 如何在本地进行破限啊 就是解除限制 因为这个词很火 也有小伙伴让牛哥来讲一下 然后看到牛哥的这个 呃 还能放出来的这个这个界面啊 目前这个窗口已经知道
目前牛哥这里这个模型呢 已经是破限的了啊啊 是这样的 什么叫限制 限制呢 就是我们大多数情况下大语言模型呢 因为它放在互联网上 尤其这些提供商 比如说Deepseek也好 XGPT也好 他们会注重很多各方面的监管啊 防止你比如说这个危害青少年安全 肯定不行啊 或者宣扬一些不好的想法呀
或者是一些不是太的健康呢等等 所以呢他们通常会在 大语言模型的输出的之后 接一个限流器 这个限流器是什么呢 就是说哎 检测一下你这个内容是不是不太好 如果不太好呢 那我就直接给用户返回哦 你这个问题我是不能回答的 大概就是这样 这就是所谓的限制 那什么是破限呢 就是解除这个限制 然后呢 我们可以在b站上
或者是在这个YouTube上啊 我们可以看到很多很多这种啊 以此为那个内容吧 就是就是说是头一个破限啊 或者怎么样怎样怎样的 然后去给大家演示 然后去还要留言啊 怎么样去获得他们这种版版本的 或者是去定制模型等等 其实远远没有那么麻烦啊 其实破限这种事情呢有 一个开源工程就是这个啊 叫做remove啊
这个你可以理解 就是去除限制with Transformer啊 我知道大家呢都不喜欢读英文是吧 我也不喜欢 我给你们翻译成中文大概就是这样 内容呢我也不给你们读了 大概呢就是从技术层面啊 把那一些不需要的层剥离掉 就是你最后在输出的最后一层啊 剥离掉什么叫层 大语言模型就像一个水管一样啊
它里面就是一环一环的往下走 走完一个流水线 内容就返还给你了 我刚刚说过这个限制啊 通常是在这个流水线的最后一侧啊 在输出之前做检测 那他呢就是把这一块给干掉了 在这个最后进入这个限制器之前 就把内容提取出来给你了 把限制器直接从模型上剥离掉 那就相当于没有限制了啊
大多数目前你在市面上看到的 所谓的破限版本呢 都是一些技术的开发人员 基于这个工程去搞的啊 当然啊感兴趣的小伙伴也可以 就是搞一搞其他的模型啊 那有人说了 牛哥那这个对于我们小白很难啊 啊我我 我搞不了 你能不能给我做呀 能给我搞一个现成的破限模型 牛哥不能给你做 因为我觉得这个东西一旦传出去了
可能会我不知道会不会不好啊 但是牛哥今天可以告诉你 你怎么直接 非常简单的去获取 获取这种破限模型啊 首先来讲呢 你应该是去安装一个东西啊 叫做这个Ollama Ollama 我们之前的视频已经不止一次介绍 Ollama加Chatbox就 可以构成你现在看到的 牛哥的这个画面的效果啊 相关的视频呢
你可以去看一下牛哥的视频区 搜一下就有专门的视频给你讲解 怎么在本地部署Ollama和这个Chatbox 不是部署啊 就是下载安装使用 就这么简单啊 然后怎么破限呢 你也不需要去管 因为啊你要知道 这个世界上最不缺的就是啊 闲着没事去搞点技术的人 哈哈哈像牛哥一样对吧
你可以直接不要 再直接去他的model里啊 你会看到QWen3呢 直接就在这里对吧 啊Deepseek等等啊 都在这里 但是你不要直接使用这种模型 这都是官方的 肯定是有限制的嘛 你直接去里面搜索QWen啊 QWen3 让你去搜 搜完之后呢 你就会发现它有各种的版本啊 比如说这个是不思考的 就是remove掉那个思考
直接回答 这样你就是比较省时间嘛 我们知道 qwen上模型每次都会有thinking过程啊 当然了这个可以通过一个指令no thanks我我们就可以把它干掉啊 然后重点来了 你看这里有一个哎啊 这个什么意思啊 大家可以给你们翻译一下 啊 这还没直接去翻译对吧 其实这就是解除限制的意思了 啊 对这是一个啊 这个也是一个 那你需要用哪个呢 啊
呃这个后面的 这是30b的 a3b的啊 这也是一个 这个呢牛哥没有去测试啊 稍后牛哥会去测试一下 这个和这个呢 牛哥都测试过了啊 啊我个人更推荐这个模型 这个模型呢 更新的频次更高一点 并且我感觉 他这个持续更新的状态也会更好一点 所以推荐你们去这个啊 然后呢呃
我推荐你们是去用这个14B啊 14B的效果肯定会更好一点 b数太小是吧 他虽然破限了 但是脑残 呵 那我们也用不了嘛 那怎么用呢 你看他的这里 他的这里有一条指令14 比这条为例 我们复制啊 然后打开你的终端 其实能够看到 牛哥已经把之前的这个b 已经加载下来了啊 然后如果你没加载 你啊随便打开一个新终端
点右键把这个命令粘进去 粘进去之后啊 你不要run 把run改掉 改成pull是吧啊 为了给大家演示呢 我这里就去给大家pull一个小一点的 比如0.6B啊 0.6B我把后边改一下啊 或者是去pull一个7B吧 到时候我们可以去对比一下效果啊 OK回车 这样呢你就能够稍等 它会出现这个pullman fast 嗯
应该是去加载这个相关的这个资源了 因为它会先去拉取这个模型的资源啊 如果你输入的没有错误 那这个就会开始 等一下就会开始下载 下载完之后 那你ollama 就可以去使 然后正常来讲 你在你的chatbox里 你可以点击我的搭档是吧 然后你可以创建你的搭档 然后呢你就可以去做一些描述了 比如说
这是哎老婆是吧 米法老婆 算了 这个别再侵权哈 哈哈嗯 哈哈好吧 就叫老婆吧 大老婆啊啊 你是我媳妇是吧 哄我开心 啊时不时的挑逗我一下 太过分的牛哥就不能去写了啊
然后建议你呢 在后面加一个no think' no think啊 这样呢他就不会去联想了 太多的关键词牛哥就没法去写了啊 我们这里不再演示这个效果了 就是牛哥测试过啊 效果还是不错的 然后我们可以直接啊选择你的大老婆 你就跟说跟我聊天 你要选择刚刚牛哥推荐的那个模型 对在这里选择模型 老师啊 给我讲个故事
啊很正常是吧啊 我们之间的故事啊 啊这个 太我就不给大家演示了 我给大家 万一演示出什么不好的了 我还得把它掐了 对吧就是 总之呢他是破限的 他可以去写小说 那大概呢 就是这样一个效果啊 然后我也不好给大家去滚动太多啊 基本上就是这样一个状态啊
这就是所谓的模型破限以及去应用啊 然后其实我了解 有一些互联网上 在早期的时候就有那种什么AI 女友约会吗 是吧能跟你说话呃 文字性的早期 后来呢就有语加了TTS就有语音的 到后来呢 还时不时呢 能给你一张是吧比较害羞的图啊 大概就是这样啊 然后这就是关于破限这块
以及应用这一块啊 嗯 如果你需同样的啊 同样的思维哎 我们回到这看的啊 看一下哎 他好像没找到 他没找到这个模型 那应该是我这个输入有错误啊 输入要是没错误应该就是没问题的 我看一下他这个啊 没有 7 b是一点 7 b啊 重新来一次复制 我说怎么那么慢 然后刚刚就是为了给大家演示嘛 一个pull的效果
这样pull它没有7B 这样应该就好了啊 你应该微微等一下 它就会开始去下载 然后下载的速度呢 就取决于你本机的速度啊 那么回过来 那其实呢 现在以现在的技术来讲的话 用agent的方式呢 再结合TTS 甚至再结合Flex本地的一些做法 然后这个图呃
或者视频等等声音这种一渲染的话 那这个AI女友 已经到了一个非常高的一个高度啊 前两天看了一个要 要某个律师的那个 那个微博 再讲一个故事 就是就是某有一个人 他把这个东西呢 居然都已经就是装到娃娃里了 然后后来他说这个东西呃 做出了样品
然后咨询律师可不可以卖 等等这些问题啊 其实 这个里面还是有一些风险在里面的啊 就是就是是 如果觉得他不行 那还是有很多方法去拿捏的 觉得 我觉得这东西大家自己去玩一玩啊 搞一些创作是吧 满足一下个人的癖好就OK了 尽量不要在互联网上去啊 做什么事情
然后防止不必要的麻烦啊 然后这就是本期视频的相关内容 我觉得牛姐牛哥给的都是干货 那么给牛哥来个一键三连吧 那本期视频就到这里 我们下期再见
Loading video analysis...