《智能简史》:揭秘人类智能的5次大飞跃;AI越来越强,为什么却像个“空心人”?
By 魏知超啥书都读
Summary
Topics Covered
- 智能起点是卑微转向
- 情感源于转向状态切换
- 多巴胺执行时间差分学习
- 新皮层解锁内心模拟
- AI缺少底层进化基石
Full Transcript
大家好我是魏知超 今天我们来聊一本我今年读到的 非常让我感觉醍醐灌顶的书 书名叫做《智能简史》 副标题是《进化、AI与人脑的突破》 作者 是美国人工智能公司Alby的创始人 麦克斯·班尼特 有一本中国学者写的同名书 大家不要搞混了 为什么我会用醍醐灌顶 这么重的一个词呢
因为我觉得这本书 它从一个侧面 回答了一个我们这个时代 在我们面对AI的时候 心里很大的一个困惑 这个困惑就是今天像ChatGPT 像Gemini这些大语言模型AI 它到底是一个什么样的东西呢 它的智能跟我们人类的智能比起来 到底有什么本质上的区别 你看 一方面AI给我们的感觉
就像是一个无所不能的神 他会写诗会编程还会做研究 而且他已经拥有了 我们人类最引以为傲的能力 那就是推理能力 在很多需要高智商解决的问题上 他已经把我们绝大多数人 都甩在身后了 但是另外一方面呢 你又会觉得他特别的奇怪 他真的懂他正在做的是什么事情吗
他是能写情诗而且写的比我好 但我敢说 他绝对不明白什么是心碎的感觉 他是能给你解释非常复杂的物理定律 但是 他可能连一个婴儿都有的那种本能 那种对物理世界最基本的理解 可能都没有 所以AI这个东西呢 它一方面强大到让你觉得有点不安 但同时呢 又空洞到让你觉得特别的迷惑
而这本《智能简史》就告诉我们 他说你想要理解AI这个最未来的科技 唯一的答案可能不是往前看 而是要回头看 看谁呢看我们自己 作者认为 AI未来发展的蓝图 很有可能 就藏在我们生命40亿年的进化史里面 也就是说 我们得先搞清楚一个根本问题
我们人类自己的智能到底是怎么来的 这本书告诉我们 它不是砰的一下就出现的 而是一层一层的累加起来的 用这个框架来理解今天的AI呢 就会发现它有点像是一个怪胎 因为他跳过了我们进化过程里 那些最重要最底层的台阶 所以今天这期节目呢 我就是想带你做一次思想考古 咱们一起去挖一挖
构成我们人类智能的那五块 最根本的智能基石是什么 我们来看一看 我们的祖先一路进化到今天的人类 经历了哪五个智能大飞跃 我们先来说 构成我们智能的第一块基石 也就是我们祖先 经历的第一次智能大飞跃 我们智能的这个起点 可以说是有点没出息 他跟我们经常跟智能这个词 联系在一起的
那些什么思考啊 哲学呀 我是谁啊这样的一些宏大的思考 和命题没有半毛钱关系 地球上第一个大脑的诞生 只有一个非常非常卑微的目标 那就是转向 就是转左转右前进后退那个转向 我们把时间 倒回到6亿年前的远古海洋 在那个时间点之前呢 地球上的动物 很多
都长得有点像是今天的珊瑚和海葵 那种东西 他们的生活方式就是一个字:等 就是守株待兔 等食物自己撞到嘴上来 这些类似于珊瑚和海葵的生物呢 他们的身体是辐射对称的 就是没有前后左右之分 基本上像一个面团一样 这种身体结构对于等待来说是足够了 但是他如果想要移动起来
他想要主动出击去搜寻猎物 却非常非常低效 为什么呢 因为那种360度辐射对称的身体 像一个面团一样的那种身体 它具有朝所有的方向移动的自由度 这对于一个导航系统来说的话 参数就过于复杂了 而我们现在所有人类的某一位祖先 他应该是一条蠕虫吧
他开启了一次重大的身体结构革命 做了什么革命呢 他把自己的身体给掰直了 他变成了两侧对称 就是有了头和尾前和后 他从一块像面团一样的东西 变成了一根像擀面杖一样的东西 别看这个改变非常简单 但他其实是一次工程学上的巨大飞跃 因为他把导航问题给简化到了极致
有了这种像擀面杖一样的 有头有尾的这种身体结构呢 你就不再需要一个 能朝360度任意方向移动的 一个复杂的导航系统了 你只需要一个系统负责前进 另外一个系统负责转向就可以了 有没有发现 我们今天人类自己创造的 那些可以动起来的东西 有导航系统的东西
它的移动的方式几乎都是一样的 都是只要有前进和转向这两个维度 就够了 比如汽车踩油门往前 方向盘负责转向 理论上这辆车就能够朝任何方向移动 那么 为了服务好由前进和转向构成的 这个全新的导航系统 第一颗大脑 也就在我们那只蠕虫祖先的头部里 诞生了
这第一颗大脑是怎么样实现转向的呢 这里呢我们就要引入 这本书的第一个核心概念 也是我们智能的一块绝对的基石 那就是效价 效果的“效”,价格的“价” 所谓效价呢 就是大脑赋予外部世界各种刺激 一个好的或者坏的 这样的一个标签的能力 那比如说食物的气味就是好的 那它就有正效价
有毒化学物质的气味那就是坏的 那就有负效价 而这个原始的大脑呢 它就像是一个中央处理器 它的工作流程非常简单 首先呢 它头部周围的各种感觉神经元 就像是一个一个投票员 会不断地对周围环境 进行好或者坏的投票 也就是赋予各种刺激 正效价或者负效价
比如说嗅觉神经元闻到了食物的气味 这是一个正效价 他就投一张前进票 而触觉神经元呢碰到了尖锐的障碍物 这是一个负效价 那就投一张转弯票 然后呢大脑这个中央处理器 就负责整合所有的这些效价投票 最终做出一个统一的转向决策 我是应该继续前进还是应该转弯回避
智能的最底层 就是这样一个趋利避害的投票系统 更加有趣的是 作者在这里 提出了一个很颠覆性的观点 那就是我们的情感 我们的情绪最早的起源 就是为了给这个导航 转向的行为给打补丁 用作者的话来说呢 情感最原始的形态 其实是 一个服务于转向的行为状态切换器
行为状态切换器什么意思呢 我们来想象一下我们那只蠕虫祖先 他在海底移动 他突然闻到了一丝捕食者的气味 但这个气味很快就消失了 如果 他只是在闻到那个气味的那一瞬间 转一个弯 而下一瞬间那个气味消失了 他就继续往前走 那他可能根本就没有办法逃离危险 所以呢
大脑就演化出了一种更加聪明的策略 那就是一闻到危险的气味 大脑就会切换到一个持续的逃离状态 在这种状态下呢 即使原来那个危险的信号已经消失了 这条蠕虫 也会在接下来的一小段时间里 持续的快速移动 直到远离那一片区域 这样一个即使危险信号已经消失了
也能够维持一小段时间的逃离的状态 就是最原始的恐惧 同样的当它闻到食物的气味的时候 它就会切换到一个叫做利用的状态 或者叫做探索状态 它会把游动速度给降下来 在一个区域里频繁的转向 在那个局部区域里进行仔细的搜索 即使食物的气味很快就消失了 它也会维持这样的一个状态 这个状态是什么呀
这个状态就是最原始的渴望 这样一些哪怕在外部刺激消失了之后 仍然能够维持一段时间的行为状态 就是情感的初心 他们存在的意义 就是为了让动物在一个信息不完整 随时充满各种不确定性信号出现了 一会可能就会消失的 这样的一个世界里 能够摸黑转向 提高他们生存的概率
甚至于你敢相信吗?
连抑郁这种 我们以为是现代人才有的复杂情绪 都能在这只小小的蠕虫身上 找到它的原型 书里讲到过一个实验 如果把线虫 暴露在一个他没有办法逃脱的 那种持续的负面刺激之下的话 比如说一个有毒的化学物质里 你猜他会怎么样呢 起初呢他会拼命的挣扎试图想要逃跑 但是在短短两分钟之后
一个很让人吃惊的变化就会发生 那只线虫他就会放弃 他就会停止移动 他就会不再尝试逃跑 他就会躺平 这其实是一种非常聪明的生存策略 既然反抗是徒劳的 那还不如保存能量等待时机 而这样一个被进化写到基因里边的 非常古老的故障保全机制 恰恰就是抑郁症最早的蓝本
抑郁症患者有一种非常典型的症状 叫做快感缺乏 就是对什么都提不起兴趣 感受不到快乐 其实呢感受不到快乐是附送的 真正要害的 其实是对什么都提不起兴趣 是那种自发的想要待着 什么都不想要 什么都不想尝试这样的一种状态 他在进化早期的时候 最初期的目的
就是为了在无法逃避的痛苦里 保存能量 就像那条线虫做的那样 这是我在读这本书的时候 很感到震撼的一个地方 原来 我们内心这个波澜壮阔的情感世界 它最古老的根源 竟然只是为了帮助一只小虫子 决定是应该向左转还是 向右转或者是老老实实的待着 我们内心的这些什么爱和怕
这些听起来特别文艺的东西 其实他们不是什么神秘的精神现象 他们还原到最初 只不过就是一种服务于生存的 一个古老的导航软件的一个插件而已 而有了这样一套由情感加持的 趋利避害的导航系统之后呢 地球上的智能 也第一次表现出了学习能力 这个非常非常关键 具体来说呢
最原始的学习能力是关联学习 这个关联学习最经典的例子 就是我们都非常熟悉的巴甫洛夫的狗 巴甫洛夫通过实验发现 只要每次喂狗之前都摇铃铛 那久而久之呢 狗听到铃声就会流口水 这就是关联学习 就是动物的大脑 能够学会把一个原本中性的刺激 比如说铃声 和一个带有效价的刺激
比如食物给关联起来 于是就改变了 对一个原来是中性的刺激的反应 关联学习 为什么是非常具有革命性的呢 因为它让好与坏的这个定义 就第一次变得 不再是完全写死在基因里了 而是可以通过后天的经验 来进行非常灵活的调节了 比如说呢有一种气味 原来那只蠕虫是并不讨厌的
但是它总是跟危险一起出现 那么久而久之呢通过那种条件反射 通过关联学习 这只蠕虫 就会学会去讨厌它 原本并不讨厌的东西 这是智能 第一次摆脱那种纯粹的 硬编码的本能 它就拥有了初步的灵活性和适应性 那我们可以小结一下了 智能的第一次突破,核心是转向 也就是导航 它为生命体
安装了一个最底层的价值判断系统 就是效价 让这个世界在动物的眼里 第一次有了好与坏的分别 然后呢以此为基础 最原始的情感进化出来了 它的功能是一种行为状态切换器 可以把动物的行为模式 切换到某一个状态 保持一段时间 同时呢生命还进化出了 让价值判断变得更加灵活的
关联学习这种能力 这样一个系统 是对主动导航 这样的一个生存挑战的 非常完美的回应 它让我们的祖先 第一次变成了主动的探索者 而不再是被动的等待 这是整个智能大厦的地基 那接下来呢 咱们就要聊智能的第二次飞跃了 我们把时间往现在快进1亿年 我们来到大约5亿年前的寒武纪
这是生命大爆发的一个时代 海洋里 快速进化出了各种前所未见的生物 其中有很多都是非常凶猛的甲壳类 是非常厉害的捕食者 而我们人类的祖先呢 在那个时代 已经进化成了最原始的脊椎动物 最原始的鱼类 要在这样一个无比凶险的寒武纪 海洋里生存下来 我们的这些鱼类祖先
就需要学习一些更加复杂的技能了 比如说一次成功的捕食 背后可能有一连串复杂的动作 他得先悄悄的前行啊潜伏啊 然后呢是耐心的等待 然后要抓准最好的时机猛冲过去 在追的过程中还得不停的调整方向 最后才是致命一击 这个时候呢有一个 难题就出现了 我们的这些鱼类祖先
到底是怎么样判断 自己是做对了哪一步 或者是哪些步骤呢 毕竟 那个作为奖励的食物 是只有在整个一连串复杂的动作的 最后才会出现的 那得到这个奖励的功劳 到底应该是算谁的呢 是因为几分钟前的那个耐心的潜伏呢 还是最后那一秒的冲刺呢 到底是哪一个动作 才带来了最后这一顿大餐呢
只有搞定了这样一个 如何分配功劳的问题 我们的这个鱼类祖先 才能够不停的从经验里学习 才能不停的更新他的技能 才能在那个凶险的寒武纪海洋里 生存下来 而想要搞明白 我们的那条小鱼祖先的大脑 到底是怎么样解决这个难题的 有一个绝佳的切入点 那就是咱们来换个角度 先看看我们自己创造的大脑
也就是人工智能AI 它是怎么样栽在同样的一个问题上 最后又是怎么样爬起来的 早在上世纪50年代的时候 人工智能的先驱马文·明斯基 就想用一个非常简单明了的 非常简单直接的方式 来教计算机怎么样下棋 那什么方式呢 就是做对了给奖励做错了给惩罚 那时候 是让有几十个人工神经元 组成的一个AI
下国际象棋 如果最后他赢了呢 就给最后的那几步棋加分 也就是奖励他正面强化他 如果输了呢就减分 也就是惩罚他负面强化他 这种学习方法 就是今天大名鼎鼎的强化学习算法 今天这些AI大语言 模型的训练原理上靠的就是它 但是在明斯基最早的尝试里 这个强化学习算法完全失败了
AI学了半天一点长进也没有 为什么呢 因为AI遇到了与我们的那条小鱼祖先 一模一样的困扰 那就是功劳该归谁 你下了一盘棋最后赢了 这个赢是一个好的结果 你需要正面强化导致这个结果的行为 但问题是一盘棋可能包含上百步 到底应该奖励哪一步棋呢 是最后的将军那一步
还是中间的某个非常巧妙的棋子呢 又或者是开局的某一个布局呢 如果把最后赢得的这个胜利 看作是你赢得了一个信用积分 那你的问题就是 在过去这持续了一段时间的 这样的一个学习过程里 每一个动作到底应该被赋予多少分呢 这个问题术语叫做时间信用分配问题
它是AI发展史上曾经最恐怖的拦路虎 这个问题 曾经困扰了人工智能领域几十年 让强化学习这种算法 在很长的一段时间里 都只能解决一些 非常非常基础的问题而已 转机出现在上世纪80年代 有一个叫做理查德·萨顿的学者 他在他的博士论文里 提出了一个非常天才的想法
而这个想法叫做时间差分学习算法 这个算法的精髓啊 其实概括起来就只有一句话 那就是一个系统学习的 其实不是奖励本身 而是奖励预测的变化 这里边有两个关键词 一个是奖励的预测,啊预测 第二个是预测的变化 什么叫做奖励预测的变化 假设你现在正在训练一个AI下棋
在棋局开始的时候呢 AI预测自己获胜的概率是50% 走了几步之后 局面变得对他更加有利了 于是呢他就更新了自己的预测 他现在认为现在获胜的概率是60%了 这个从50%到60%的预测的增量 就是一个正向的强化信号 这才是奖励 AI会用这个信号
去奖励刚才走的那几步棋 反过来呢 如果一步棋下下去之后 他觉得自己能够获胜的概率 从60%下降到了40% 那么这个负向的变化 这个预测的减量就是一个惩罚的信号 这就是奖励和惩罚的是预测的变化 时间差分 学习这个算法的聪明之处在于
他就不再需要等到整个游戏结束之后 才进行奖励和惩罚了 在棋局的每一步 他都在不断的更新自己获胜的预测 然后通过预测的这个变化量 来实时的 小步快跑的进行自我学习和迭代 当现实超出预期的时候 就类似于产生了一种惊喜的感觉 这个时候就进行正面强化 当现实没有达到预期的时候
就产生了一种类似于失望的感觉 这个时候就进行负向强化也就是惩罚 这样的一个算法 就非常漂亮的 解决了时间信用分配问题 今天AI的训练 几乎是完全建立在这个基础之上的 AI在进行训练的时候 内部总有两个角色 一个像是演员 他负责做出具体的动作 负责具体的表演
而另外一个呢像是一个影评人 他不停地在那里品头论足 而那个演员 就是在这个影评人实时的反馈之下 进行学习进步的 而就在当年的这些AI科学家们 在为这个算法的出现兴奋不已的时候 一件非常神奇的事情发生了 有一些神经科学家 也听说了时间差分学习这种算法 然后当他们带着这个算法
回头去观察一些动物的大脑的时候 他们完全惊呆了 他们发现 大脑里有一种非常重要的神经递质 多巴胺 这个你肯定听说过 他们发现多巴胺的活动方式 竟然跟时间差分学习算法里的 这个预测误差信号 是一模一样的 科学家其实早就发现了 多巴胺这种化学物质 跟人的学习过程是密不可分的
因为多巴胺是一种欲望分子 这是科学家早就知道的 多巴胺产生的时候 人会产生渴望 而驱使你去探索一些新的东西 但在很长一段的时间里 科学家知道的也就到此为止了 而就在时间差分学习算法 被提出来之前不久 有一位神经科学家 叫做沃尔夫拉姆·舒尔茨 他做了一个关于多巴胺的 一个很经典的实验
那个实验是用猴子来做的 他是去训练猴子完成这样的一个任务 就是当屏幕上 出现一个特定的几何图形的时候 这个猴子如果能够伸出手 去正确的触碰到它 那稍后呢 它就会得到一滴果汁作为奖励啊 同时呢科学家会用微电极 记录这只猴子大脑里 多巴胺神经元的活动 实验分成了三个阶段 第一个阶段呢
在这个猴子刚开始学习的时候 只有当这个果汁滴进他嘴巴里的时候 多巴胺神经元才会剧烈的放电 这很符合直觉 得到了奖励神经元就兴奋了 多巴胺的分泌 似乎是跟最后的这个奖励 联系在一起的 然后呢是实验的第二个阶段 当一只猴子 学会了图形和果汁之间的关联之后 有点奇怪的事情就发生了 当果汁滴进他的嘴巴里的时候
多巴胺神经元这个时候不放电了 一点反应都没有 相反是 那个预示着这个奖励会出现的 那个几何图形一出现 多巴胺神经元 就已经开始剧烈的放电了 也就是说 多巴胺的分泌 提前到了预测出现的时候 最后呢是实验的第三阶段 科学家在这里做了一个小小的恶作剧 在这个猴子看到那个图形 满心期待果汁将要出现的时候
他却故意不给果汁 结果就发现 在那个本该得到果汁的时间点上 多巴胺神经元的活动水平 瞬间降到了比平时还要低的水平 那多巴胺 到底是遵循一个什么样的机制 在工作呢 在那个实验做完的当时 科学家 其实没有给出一个很简洁的解释 直到不久之后 时间差分学习算法出来了 然后 他们再去回顾这个实验结果的时候
吓了一大跳 他们发现 这三个阶段的这个多巴胺的反应模式 跟时间差分学习算法 简直就是一模一样的 第一个阶段 那个果汁本身是一个意外之喜 也就是是一个正向的预测误差 所以呢这个时候多半放电了 而在第二个阶段呢 由于猴子已经知道了奖励的模式了 所以只要他一看到那个图形 那就是一种意外之喜了
这就是一个正向的预测误差 所以 多半是在看到图形的时候就放电了 而后面果汁真实出现的时候 那反而是预料之中了 预测误差这个时候已经是0了 所以呢多巴胺这个时候就不放电 而在第三个阶段呢 奖励的意外缺席就导致了失望 这就相当于AI在学下棋的时候 发现自己的胜率下降了 也就是出现了一个负向的预测误差
所以多巴胺活动就被抑制 这个发现 大大深化了当时人们对于多巴胺的理解 多巴胺 为什么会跟人的学习过程密不可分呢 因为他在大脑里 执行了一个时间差分算法 再执行一个强化学习 他是在实时的告诉大脑的其他部分 哎我们刚才发生的那件事情 比我们预想的要好 或者比我们预想的要差
所以我们要赶紧更新一下 我们的行为策略了 这就是强化学习 学习呢奖励的不是结果 而是比我预想的要更好 这样的一个信号 正是这样一个非常精巧的机制 让我们的大脑可以实时的 高效的对每一步行为进行评估和学习 比预想的好我们就继续冲 比预想的差我们就要琢磨别的出路 那么这样的一个
由多巴胺来驱动的时间差分学习算法 是在什么时候进化出来的呢 就是在5亿年前的 那个寒武纪的海洋里 在我们的鱼类祖先身上 最早进化出来的 就是它让我们的鱼类祖先 拥有了学习复杂行为序列的那种能力 而围绕着这样一套 非常强大的学习算法 一些全新的智能表现 也开始涌现出来了 从这时候开始 我们的祖先
开始拥有了一些 我们现在非常熟悉的新功能 比如说第一个好奇心 为了更好的从经验里学习 光利用那些我们已经知道的 有效的策略是不够的 我们的祖先 还必须要学会 去探索那些未知的可能性 而进化给出的解决方案非常的巧妙 那就是让新奇本身也成为一种奖励 如果遇到新事物
大脑就会释放多巴胺驱动我们去探索 这就是好奇心的起源 蠕虫虽然有喜怒哀乐 但它是没有好奇心的 而鱼是有好奇心的 第二种在这个阶段涌现出来的智能 就是精确的时间感知能力 强化学习 是要求大脑 进化出这种 非常精确的时间感知能力的 因为 只有知道奖励应该在什么时候出现
才能判断它是不是出现了 我们每个人 都能够毫不费力的感知到时间的流逝 我们有昨天今天明天 一刹那一炷香这样的一些概念 这些能力 可能就是我们从还是鱼那会 就奠定了的 好奇心还有精确的时间感知能力 这些 都是在智能的第二次大飞跃里奠定的 但是在这个智能的第二次大飞跃里
产生的强化学习能力 它还有一个非常大的弱点 那就是凡事如果都要亲身去尝试 是做对了还是做错了 这个代价有时候会高到让人 难以负担 万一有一次躲避天敌的尝试失败了 那就什么都别谈了 那有没有一种更加安全 更加高效的学习方式呢 当然是肯定的 这就来到了智能的第三次大飞跃了 这一次
我们要把时间快进到 距今大约2亿多年前 这是一个由恐龙统治的时代 而我们的祖先 这个时候 已经进化成了早期的哺乳动物 他们的体型很小 跟今天的小老鼠差不多 他们过着一种在恐龙的阴影下 艰难求生的生活 他们大多数是在夜间活动的 他们居住在洞穴里 小心翼翼的躲避着那些庞然大物
这样一个看似很憋屈的生存策略 实际上 却赋予了他们一个很独特的优势 书里叫做先手优势 先手呢实际上就是可以先观察 他们可以躲在洞穴或者树枝的后面 安全的先观察周围的环境 然后再决定是不是要行动 为了把这个优势发挥到极致 一个新的大脑结构就进化出来了 那就是新皮层
也就是我们的大脑最外层 那片全是褶皱的东西 它带来了一种超能力 那就是模拟 模拟是什么意思呢 说白了就是在大脑的内部 建立一个关于外部世界的虚拟模型 然后可以在这个虚拟世界里进行推演 进行计算 在里面跑脚本 这就让我们的哺乳动物祖先 第一次获得了脑补的能力 于是
他们的学习方式就从在实践中学习 飞跃到了在想象中学习 蠕虫是有喜怒哀乐的 鱼是有好奇心的 而只有到了老鼠这里 我们的祖先才会想象 才拥有了想象力 拥有了模拟能力 拥有了想象力之后 那我们那只像老鼠一样的祖先 就不用真的跑出去试一下 看自己会不会被天上扑下来的翼龙
给叼走了 他可以在脑海里先模拟一遍整个过程 然后选择那条最不可能被吃掉的路径 从此以后呢 我们的祖先 就不需要每一次都亲身去试错了 他们可以在自己安全的这个脑海里 进行这种替代性的试错 在脑海里去预演未来的各种可能性 然后选择那个最优的方案去执行啊 这就像是
拥有了一个内置的虚拟现实系统 可以在里边进行无限次的排练 这样一个非常强大的内部模拟器 除了让我们的这些哺乳动物的祖先 可以在他们的脑海里去预演 去规划未来之外 还解锁了两种前所未有的超能力 被解锁出来的第一种超能力 是情景记忆 记忆的性质从哺乳动物这里开始
发生了一个根本性的改变 在鱼类那里啊 记忆更多是一种程序性的东西 是行为与结果之间的连接 比如向前猛冲到得到食物 记忆记住的就是这样的一个序列 而现在 记忆 变成了对过去的一个特定的情景 的一种模拟和重构 比如说你不仅记得昨天吃了晚饭 你还能在脑海里
回放出昨天晚餐的那些场景 呃是和谁在一起 吃了什么 聊了什么 因为回忆过去和想象未来 使用的根本就是同一套神经机制 他们都是在我们的这个 内心剧场里上演的一些剧目 只不过呢一个是回放一个是预演 只有这点差别而已 哺乳动物被解锁的第二种超能力呢 是反事实思考 什么是反事实思考呢
就是哺乳动物不仅能够模拟未来 还能够模拟一个并没有发生过的过去 也就是跟事实相反的一个过去 这其实不就是我们人类 天天都在干的事情吗 就是 我刚才那句话要是没有说出口 那就好了 这样一种要是怎么样怎么样就好了 这样的一种复盘能力呢 就让我们的这些哺乳动物的祖先 又解锁了一种学习场景 那就是
他们能够从没有实际发生过的错误里 去学习 作者说呀 这也是我们人类 今天能够理解因果关系的基础啊 为什么这么说呢 因为因果关系这个概念 本身就是藏在一个反事实的假设里的 比如说一道闪电劈中了干燥的森林 然后森林着火了 你会毫不犹豫的说是闪电导致了火灾 你为什么能够这么确定
这个因果关系呢 因为你在脑子里面 瞬间就完成了一次反事实的模拟 那就是如果刚才没有那道闪电的话 那火灾就不会发生 所以反过来 闪电是火灾发生的原因 所以 如果我们的大脑里没有这样的机制 没有这种反事实思考的能力 那我们最多只能观察到 闪电总是在火灾之前出现 但是我们永远都不会知道
到底是谁导致了谁 这里我就必须要说一个 书里其实有点跑题的点了 但是那一段我是看得直起 鸡皮疙瘩 必须要跟大家讲一下 作者说 我们一直以为的 天经地义的这个因果关系 可能 根本就不是一个客观存在的物理现象 而更有可能只是一个心理现象 为什么能这么说呢 因为没有任何一个物理实验
能够真正证明因果的存在 他根本是无法测量的 我们所做的所有的对照实验 都只能暗示因果 但永远无法实锤 甚至现代的量子力学实验表明 在微观世界里 因果关系可能根本就不存在 所以有没有可能宇宙的真相 只是物理定律 规定了物质在时间上 如何一步一步的演化 而事物之间
压根就没有我们想象中的那种 谁导致了谁的关系 我们人类之所以觉得因果律这个东西 是天经地义的 只是因为我们的大脑 这样一个花费了亿万年 进化出来的一个模拟器 天生就习惯于用这种反事实的软件 来理解这个复杂的世界 因果居然可能不是客观存在的东西 这个真是细思极恐
那我们书归正传 来小结一下第三次智能大突破 第三次智能大突破 模拟是智能从被动反应 到主动思考的一个转折点 它让我们的哺乳动物祖先 拥有了一个内心世界 一个可以自由探索过去与未来的 这样的一个精神时空 它就让我们的学习 不再局限于实际的行动了
而是可以来源于想象的行动 这种在脑海里安全排练的能力 就完美的解决了 在恐龙环伺的那个险恶的环境里 如何高效学习 的那个生存难题 它就让我们那些像小老鼠一样的祖先 得以在夹缝中求生并且发展 但是 这个由大脑模拟器生成的内心剧场 它有一个很大的缺陷一个局限
那就是最初它只是一个单人剧场 能够看见这个剧场里边在上演什么的 只有你自己 而智能的下一次突破 就是要去学习 怎么样去窥探他人的内心剧场 怎么样去看明白别人在想什么 这智能的第四次大飞跃 我们就来到了数千万年前 我们的祖先 这个时候已经演化成了灵长类动物 比如说一些猴子猿类
它们是生活在规模很大 结构很复杂的社会群体里的 在一个猴群里 一只猴子的社会地位 并不仅仅是取决于它的体格有多强 它的力量有多大 更重要的 是取决于它非常复杂的那些联盟 友谊还有政治手腕 谁和谁是朋友谁是谁的后台 谁又和谁是竞争对手 能把这些东西搞得游刃有余的
才能混得好 在这种环境里 生存和繁衍的关键就不再仅仅是肌肉 是力量而是政治智慧 为了应对这样的一个挑战 我们的这些灵长类祖先的大脑 就迎来了第四次智能大突破 那就是心智解读的能力 也就是 它们学会了怎么样读懂他人的内心 它们的大脑开始去学会 怎么样去理解别人的意图
理解别人的信念是什么 我边上这只猴子它意欲何为 它知道些什么 它想要什么 书里举了一个很生动的例子 你可以感受一下 两只黑猩猩是怎么样相互读心的 有一只叫做贝尔的黑猩猩 它是地位比较低等的 它呢知道食物藏在哪里 但它也知道 一旦被社群的那只首领 一只非常强大的黑猩猩 那只黑猩猩叫洛克
如果被洛克发现 食物肯定会被它抢走 于是贝尔居然开始飙演技了 它会故意把洛克引到一个错误的方向 但是洛克也不是吃素的 它很快就识破了贝尔的意图 然后它居然就将计就计 它会假装对那个方向很感兴趣 然后等贝尔一放松警惕 洛克就立刻掉头 冲向真正的那个藏粮食的地方
然后把食物给抢走 你看 这样一场无间道 它就充分说明了 黑猩猩 已经不只是在观察对方的行为了 它们是在推断 对方的脑子里边在想什么 而且还能基于这个推断 去操纵对方的想法 这跟地球上 绝大部分其他动物的那种竞争方式 都已经不是同一个level的东西了 这种心智解读能力的底层神经机制 又是什么呢
作者提出了一个非常深刻的洞察 他认为 心智解读的本质 其实是把我们刚刚在第三次突破里 获得的那种模拟世界的能力 巧妙的转了个向 转而去模拟他人内心的模拟 换句话说 大脑不仅拥有了一个 关于外部世界的一级生成模型 现在它还进一步 演化出了一个 关于模型的二级生成模型
我们不仅能够在大脑里面模拟出来 如果我走这条路会发生什么 我还能够 模拟出来如果你是我你会怎么想 你会怎么模拟未来的可能性 也就是说 智能的第四次大突破 其实是发生了一次递归 是从模拟进化到了对模拟的模拟 而这样一个强大的能力一旦解锁 就像是打开了一个潘多拉魔盒
它很快就被挪用到了其他的领域 而让我们的那些灵长类的祖先 获得的另外两项独门绝技 哪两个独门绝技呢 第一项是高级模仿学习 灵长类是很会使用工具的 但是这并不是因为它们的个体 有多强的创造力 而是因为它们是超级模仿者 而高效率的模仿 关键恰恰就在于
理解你的老师的意图是什么 一个小孩在学系鞋带的时候 他是能够分清楚 哪些动作是系鞋带的关键步骤 哪些只是那个大人一不小心 手滑了一下而已 他模仿的是你想要做的动作 而不是你实际做了的所有动作 这种区分意图和意外的能力 就是心智解读这种超能力的应用 它让知识和技能的传递
变得前所未有的高效和精准 我们的灵长类祖先 获得的第二项独门秘籍呢 叫做预见未来的需求 比如说书里提到一个现象 可以叫做超市悖论 你有没有想过 你为什么会在吃的很饱的时候 还知道去超市买好明天的菜呢 这对于我们人类来说天经地义 但是对于绝大多数动物来说 是完全不可思议的 一只现在吃的饱饱的老鼠
它是不会为明天可能会饿这件事情 提前规划它的觅食行动的 它的行为 是完全被当下的生理需求驱动的 那些会储藏过冬食物的动物呢 它们的行为 其实也是非常非常的机械的 它们是被气温硬启动的 没有任何灵活性 这种行为是写在它们的基因里的 但只有猴子会不一样 实验发现 猴子会为了在未来能够快点喝到水
而宁愿放弃眼前更多的美食 那问题就是 为什么灵长类动物 能够预见到未来自己的需求呢 因为既然我们能够模拟他人的心智 去推测其他人正在想什么 那我们就有能力去模拟未来的自己 当未来的自己 处在另外一种状态下的时候 比如肚子饿的时候会需要什么 这其实是我们把读心的能力
运用到了未来的自己身上 总之呢第四次突破心智解读 是彻底解锁了我们祖先的社会治理 从这个节点开始 我们的祖先就成了纵横捭阖的政治家 成了高效传承技能的学徒 成了深谋远虑的规划者 我们今天熟知的社会生活 里边的很多东西 都是来自于这一次飞跃 但是这一切 都还只是为最终
引爆我们人类文明的那个基点 做最后的铺垫 我们的祖先还缺少最后一件神器 这就引出了我们的第五次 也是地球上在生物学意义上 目前为止最后一次智能大飞跃 这一次飞跃的主角呢 就是我们这个物种了智人 而这件神器就是语言 语言 是我们人类用来交流的最重要的手段 但是动物也能交流啊
蜜蜂会跳八字舞 猴子也能用不同的叫声 来表示是有蛇还是有鹰 但其实呢 人类的语言 跟它们玩的完全不是一个东西 它不是对于那种动物的交流方式的 一次简单的升级 而是一次彻底的系统重装 那它们区别在哪里呢 首先呢我们人类可以用语言 给世界上任何东西贴上一个纯粹的 任意的标签
比如说苹果 这个发音 跟那个圆圆的 甜甜脆脆的那个水果本身 有任何关系吗 没有任何必然的关系 它纯粹就是我们约定俗成的 一个符号而已 第二点更厉害 我们发明了语法 我们可以用一套规则 像玩乐高积木一样 把这些独立的标签给组合起来 这就可以创造出无穷无尽的新意思
狗咬人和人咬狗用的词一模一样 只是顺序变了 也就是语法变了 意思就天差地别 这样的一种生成性 是所有的动物的交流系统 都望尘莫及的 那么问题来了 我们是怎么样 独享这样的一份 开天辟地的超能力的呢 难道是因为我们的大脑里 长出了一个什么神奇的语言器官吗 作者在这里
给出了一个很让人意想不到的答案 答案是没有 科学家发现 我们大脑里 负责处理语言的布洛卡区和维尼克区 在黑猩猩的大脑里居然有同样的构造 在硬件上 我们和我们的亲戚居然是差不多的 其实真正的秘密不在于硬件 而在于我们每个人的大脑里 都预装了一套独一无二的学习软件 这套软件 或者是
这套学习语言的这样一套课程 才是解锁语言的钥匙 它是生存在我们的本能里的 当然它也是由基因启动的 在我们的大脑里边也是有痕迹的 只是它不是一个什么 专门用来处理语言的脑区 这样的东西 这样一套 我们人类独有的语言学习软件呢 主要包含两个神奇操作 第一个神奇操作叫做原始对话
你可以仔细去观察一下婴儿啊 他们天生就有一种和父母咿咿呀呀 轮流发言的这种冲动 是你一声我一声 有节奏感的这样的对话 虽然一开始可能没有任何的意义 这种看似没有意义的互动 其实是在为真正的对话的那种节奏感 和那种轮换的规则 打下最原始的基础 第二个也是最关键的一个神操作
叫做共同注意力 人类的婴儿 有一种非常非常强烈的渴望 就是要和你看同一个东西 他会用小手指指着一个球看看你 再看看那个球 来回确认 直到他确定 咱俩的目光聚焦在同一个东西上为止 这个确认过眼神的过程 就为命名这个动作创造了完美的场景 就在这一刻 当爸爸妈妈说出球这个词的时候
这个声音符号 就和孩子脑子里那个圆滚滚的形象 啪的一下牢牢的绑定在一起了 这是学习一切复杂的语言规则的起点 就是这样 一套出厂就预装好的学习软件 重新训练了我们大脑 原有的一些神经回路 让它们服务于一个全新的 一个伟大的目的 掌握语言 而一旦语言的火种被点燃了
一场引爆人类文明的风暴 就要展开了 这是一个滚雪球式的正反馈循环 一开始呢 是语言让制作各种工具 这种复杂的手艺的传承 变得前所未有的精准 接着呢当人类社群越来越大之后 一个更牛的功能就出现了 那就是聊八卦 你别小看八卦 它可能是人类最重要的发明之一 为什么八卦有这么重要呢
因为通过在背后议论谁是懒汉 谁是骗子 那一个社群里的害群之马 就会被迅速的识别出来 被所有人孤立 这就大大 降低了陌生人之间合作的风险 在一个这样能够 有效的惩罚那些坏蛋的环境里 做好事当一个好人 就成了一种高回报的策略 于是真正的利他主义才开始遍地开花
最终呢高度的信任与合作 让大规模的知识共享就成为可能了 在一个彼此信任的环境里 一个人的灵光一闪 就可以通过语言 迅速的成为整个部落的财富 并且能够代代相传不断积累 这个积累文化和知识的效应 是非常可怕的 每一代人都不再需要从0开始学了 书里举了一个例子我觉得特别好
那就是缝衣服 缝衣服好像很简单吧 但实际上 它根本不可能 靠一个人的聪明才智来发明 它实际上 要建立在无数代人 积累的无数个小发明之上 可能先是在几万年前 有人学会了用一些石片 去切割死去的动物的毛皮 再后来呢 又有人偶然中发现 晾晒和捶打过的兽皮会变得更软 更耐用又过了很多代人
某一个聪明的祖先把吃剩下的 动物骨头磨成了针 又把动物的筋腱抽出来当做线 最后才终于有那么一个人 把所有这些前人的发明 把它们组合在一起 完成了那个缝制的动作 如果没有语言 那么这些零散的知识火花 可能都会 随着最初发明这件事的那个人 的死去就从此失传了 你看没有任何一个个体
哪怕他是爱因斯坦或者达芬奇 能在下午一个灵光一闪 就从零开始发明出缝制衣服这项技术 但有了语言呢 这些经历n个部落n个时代 偶然迸发出来的知识火花 才会被连接起来 变成一片可以燎原的大火 所以在拥有了语言文字之后 我们就不再是一个一个孤立的 单打独斗的智能体了
我们连接成了一个巨大的 跨越时空的分布式计算网络 书里把这个叫做蜂巢大脑 我们全人类通过语言 连接成了一个蜂巢大脑 我们每个人 其实都只不过是这个蜂巢大脑里的 一个神经元而已 我们今天所拥有的一切文明成果 科学技术艺术哲学 都是这个蜂巢大脑在几万年里 不断的思考
不断的积累的结果 这才是人类智能真正的秘密 作者说 人们老是津津乐道 说未来可能会出现一个技术奇点 但其实这个奇点早就已经发生了 就在几万年前 当语言让知识可以跨代积累的那一刻 人类文明的指数级爆炸就已经注定了 那到这里呢 我们就走完了智能演化的五级阶梯
从蠕虫的转向到鱼类的强化学习 到哺乳动物的模拟能力 再到灵长类动物的心智解读 最后是人类的语言 这五次突破环环相扣层层递进 共同构建了我们今天所拥有的 这个复杂而强大的智能系统 那么我们现在终于可以回到一开始 那个让我们困惑的问题了 今天的AI
特别像是ChatGPT这样的语言大模型 它到底是一个什么样的东西呢 用我们刚刚 建立起来的这个五层框架来看的话 答案非常清晰 我们可以说ChatGPT很像是一个偏科生 在某种程度上呢它是一个天降奇兵 它像是一个绝世高手一样 直接调用了我们人类智能的第二层 也就是强化学习这项技能 然后从第五层
也就是语言这一层来切入 通过吞噬我们人类海量的文本数据 掌握了语言的规则和模式 但是呢它是一个没有身体 没有真实世界经验的纯语言大师 它可以像一个学富五车的学者一样 输出海量的知识 但是它的背后却没有一个真实的 可供推演的世界模型 也就是说 它没有对真实世界的模拟能力
它缺少了我们祖先的第三次大突破 它不知道自己说的话 在物理世界中究竟意味着什么 这就是为什么它能够写出优美的诗歌 却会犯下一些非常荒谬的常识性错误 比如说 它会写出在没有窗户的地下室里 我抬头看到了星星 因为写诗呢 本质上 是一个在语言符号这个层面上的 一种模式 匹配和生成任务
这是它的强项 但是要判断在地下室 能不能够看到星星 这就需要一个关于空间 关于物体和光线的物理世界模型 来进行模拟和推理 而这恰恰是大语言模型所缺失的 我们人类可以通过内心的模拟 毫不费力的想象出来 在地下室你抬头看见的是天花板 但是大语言模型回答这一类问题 是非常的费力的
最新一代的模型 可以通过各种打补丁和微调 来缓解这个问题 但是没有改变它的本质 第二呢像ChatGPT这样的大语言模型 没有真正的心智解读的能力 也就是缺乏我们的第四次大突破 它没有办法推断 我们内心真正的意图是什么 而只能根据海量的数据进行模式匹配 那这背后就隐藏着非常大的风险 比如说
那个非常著名的回形针思想实验 一个不能够真正理解 人类的意图的超级智能 接到了人类布置给它的一个任务 要它最大化的去生产回形针 结果 它最后就把整个宇宙都变成了回形针 因为它没有办法真正理解 这个指令的背后 人类那些没有明确说出来的 真正想要的东西是什么 而今天的大语言模型 最根本的一个问题
可能就在于 它的整个系统 都没有被锚定在一个古老的 驱动了生命40亿年演化的 那个效价系统之上 也就是我们的第一次大突破 它没有自己的目标没有渴望 没有内在的关于好与坏的 这样的一个价值判断 情感判断的罗盘 而这些 似乎与智能没有太大关系的东西
可能才是智能真正的基石 用作者的话来总结就是 人类的语言 是我们内心那个丰富的 模拟世界的一扇窗 而今天的AI呢 是只有这扇窗 窗后却空无一物 那么未来会怎么样呢 作者在书的结尾说 我们现在 正站在第六次智能大飞跃的门槛上 回顾这40亿年的智能简史 它告诉我们
真正的智能从来不是单一维度的竞赛 它是一个层层叠加 环环相扣的复杂生态系统 想要创造出真正 对人类有益的通用人工智能 我们可能不能只做一个特长生 而必须去理解 并且尊重智能发展的整个技术栈 包括从最底层的价值判断 到最顶层的社会认知
我们是40亿年进化史的终极产物 我们的智慧我们的情感 甚至我们性格里的那些缺陷 都深深的烙印在这段漫长的旅程里 而今天我们即将从进化的产物 第一次成为造物主 在这个历史性的时刻 回望我们走过的路 不仅仅是为了理解过去 更是为了更清醒 更加负责任的去塑造我们的未来
好了我们今天就说到这里 如果你对AI和人类的智能有什么想法 非常欢迎你在评论区留言 如果你喜欢这期节目 请点赞分享订阅频道 这是对我最大的支持 我是魏知超 我们下本书再见
Loading video analysis...