The Thinking Game | Full documentary | Tribeca Film Festival official selection
By Google DeepMind
Summary
## Key takeaways - **人生目标:解决通用人工智能**: 我的的人生目标就是解决通用人工智能,并且在这一路上,以人工智能作为终极工具,来解决世界上所有最复杂的科学问题。我认为它比互联网更厉害,比手机更厉害,我觉得它更像是电或者火的出现。 [02:12], [02:30] - **DQN端到端学习乓乓球**: 我们没跟它讲过规则,要怎么得分,什么都没告诉过它,只告诉它要尽量得分,然后它就开始了得分之路。这是历史上第一次有人做这种端到端学习,三个月后就没有人类能击败它了。 [10:28], [10:48] - **阿尔法狗第37手创意棋**: 第37步棋出其不意,我觉得这步棋非常有创意。专业评论员们几乎一致表示,没有哪个人类棋手会选择第37步这样的走棋,阿尔法狗说第37步棋有万分之一的概率是由人类棋手走的。 [17:12], [18:04] - **阿尔法零零人类知识自学**: 阿尔法狗以前需要几个月来训练,但阿尔法元可以在早上开始训练,完全随机对弈,等到了茶歇时就能达到超人类的水平,等到了晚餐时,它将成为有史以来最强大的象棋实体。 [21:11], [22:22] - **阿尔法折叠破解蛋白折叠**: 半个世纪之后,我们终于找到了蛋白质折叠问题的解决方案。阿尔法折叠在CASP14中以近50%的优势击败第二名,预测出两亿个蛋白质结构公之于众,推动生物医学进展。 [01:13:42], [01:15:26] - **围棋如斯普特尼克时刻**: 阿尔法狗是一次警钟,是“斯普特尼克”时刻,它开启了一场人工智能太空竞赛。中国政府下令切断了转播信号,地球上诞生了新事物。 [19:47], [20:30]
Topics Covered
- Brain inspires AGI path
- Games prove general learning
- AlphaZero self-teaches mastery
- AGI demands urgent governance
- AlphaFold solves protein folding
Full Transcript
2023年 嗨 阿尔法 你好 你能帮我写代码吗?
我曾经过训练来回答问题 但我可以学习 你思想很开明 谢谢 很高兴你对我满意 这个人在干什么?
他是一名开发人员 你觉得他在干什么?
这个问题很难回答 他可能正在研究一项新功能 修补漏洞之类的 -很有可能 -是的 你看到我的背包了吗?
那是羽毛球拍 是壁球拍 但很接近 那是羽毛球拍 不是 但你不是第一个犯这种错误的人
人工智能技术一直以惊人的速度发展 人工智能现在很风靡 现在有人警告说 这种情况当然令人担忧 这是一场人工智能的军备竞赛 我们不知道这一切会如何演变 但显然一些事正在发生 暂停人工智能!
我有点不安 戴密斯哈萨比斯 打造人工智能 在我看来是人类有史以来最激动人心的旅程 如果真要认真对待它 时间并不宽裕 人生苦短
我的人生目标就是解决通用人工智能 并且在这一路上 以人工智能作为终极工具 来解决世界上所有最复杂的科学问题 我认为它比互联网更厉害 比手机更厉害 我觉得它更像是电或者火的出现
英国伦敦 世界各国领袖和人工智能专家们 齐聚参加首届全球人工智能安全峰会 讨论这项快速发展的技术的风险以及… 我认为这对全人类来说都是个极其关键的时刻 感觉我们正面临着 一些即将发生的不可思议的事 我来为大家介绍一下今天报纸的一些反应 我想通用人工智能已经很近了 显然 人们对它能做什么 它将带领我们如何发展 这就是我一生为之奋斗的时刻
2007年 伦敦大学学院 我一直对人类大脑非常感兴趣 伦敦大学学院认知神经科学研究所 所以我全心研究神经科学 因为我想从人类大脑上获得人工智能的灵感 我记得自己曾问戴密斯 “终局是什么?” 伦敦大学学院 认知神经科学教授 埃莉诺马奎尔 所以你要来这学习神经科学 如果你努力 也许能拿到博士学位
他说:“我想能够解决人工智能问题 “我想能够解决智能问题” 人类的大脑也许是整个宇宙中 存在的唯一 能证明可以实现通用智能的证据 而且我认为这栋楼里 应该有人跟我一样对通用智能感兴趣 然后谢恩的名字出现了 今天的下一位演讲者是谢恩莱格 他来自新西兰 并在那里接受了数学和古典芭蕾的训练 机器真的变得更智能了吗? 有人说是 有人说不是 这并不太清楚 我们知道它们现在的计算速度变得快多了 但在通用智能方面 我们真的在进步吗? 我们俩都对通用人工智能 非常感兴趣 我今天要讲的 是建立通用人工智能的不同方法 我和我的同事戴密斯哈萨比斯 正在研究将理论神经科学理念 融入进去的方法 我觉得我们俩守护着一个 不为人知的秘密 我和谢恩知道学术界 没人会支持我们所做的事 几乎可以说在学术界 “人工智能”一词 是个令人尴尬的词 如果你说自己在研究人工智能 那显然你不是一个真正的科学家 于是 我说服谢恩说正确的做法 是创办一家公司 好吧 我们要研究通用人工智能 谢恩莱格 这或许是根本不可能的 我们不太确定要怎么做 但我们有些想法 或者说方法 大量的资金、巨大的风险 很多很多的计算
如果成功 这将是有史以来 最大的成就 对吗?
对一个典型的投资者来说 投资这种事是很难的 几乎就像买彩票差不多 我要讲一下神经科学系统 以及它可能如何帮助我们建立通用人工智能 为此寻找初始资金非常困难 神经科学的快速发展 我们要研究解决所有智能问题 可以想象一下我们找投资时看到的一些表情 普通合伙人、联合创始人、伦敦风投合伙人 大卫加德纳 我是个风险投资人 每年要看大约七百到一千个项目 但只会给其中百分之一的项目投资 也就是每年大概八个项目 也就是说99%的时间 你都会拒绝 等一下 我跟你说 这是有史以来最重要的事 我给你们详尽讲解这是怎么建立的 解释它如何与大脑联系 为什么是现在 然后你问我说 “但什么是你的…你要怎么赚钱? “你的产品是什么?” 这个问题也太普通了 是吧? 你刚才没听我在讲什么吗? 智能机器? 再想想 我们需要的投资者并不一定 过度炒作的疯狂梦想家们 是因为认为这是最佳投资决策而投资的 他们可能会因为他们觉得这真的很酷而投资 他是硅谷版的 《绿野仙踪》的幕后之人 逆行者 Paypal、Facebook、YouTube和Yelp的建立 都与他息息相关 如果人人都说“X” 彼得蒂尔怀疑“X”的反面 很可能是真的
《福布斯》 有Facebook后的生活 彼得蒂尔是我们第一个大投资人 但他坚持要我们来硅谷 因为只有在那儿我们才能… 那里有人才 而且我们可以建立那样的公司 但我当时非常坚持应该选在伦敦 因为我认为伦敦是一个非常棒的城市 而且我知道剑桥大学 牛津大学和伦敦大学学院 有非常优秀的人才 在硅谷 每年都有人创办公司 如果失败了 就放弃再开始搞新东西 那样不利于进行长期研究 2010年 所以 我们对他来说完全是异类 好的 欢迎各位来到DeepMind 那么 我们的使命是什么?
我们将其总结为 DeepMind的使命是建造 世界上第一台通用学习机器 所以我们一直强调的“通用”和“学习” 是其中的关键 我们的使命是建造通用人工智能 这意味着我们需要一个通用的系统 不是用来学做任何特定的事 那是人类智力的关键部分 我们人类可以学习做很多很多事 这当然需要付出很多努力 但其中一件让我夜不能寐的事 就是不浪费这个能真正创造不同 并带给世界重大影响的机会 最早加入DeepMind的那些人 已经相信这个梦想 但我想这是他们第一次 找到一个其他梦想家都在的地方 如果你们喜欢 可以说我们让“曼哈顿”项目的人才 聚集到一起解决人工智能的问题 我们头两年处于完全隐身模式 研究责任和战略高级顾问 海伦金 所以我们不能告诉任何人 我们在做什么或在哪里工作 一切都很模糊 完全没有公众曝光 找不到公司的网站 办公室在一个秘密地点 杂乱先生 本 那时有人来参加面试时 他们会非常紧张 应用研究部经理 本科宾 我至少碰到过一位面试者说 “我刚刚给我妻子发了短信 告诉她我要去的具体地方 “以防这是个可怕的骗局 “我会遭到绑架” 投资人 我最喜欢的一位新人 是一名投资人
我跟他已经合作了一年 是伊隆马斯克 如果你们不认识他的话 这个就是他 在我们交谈前 他并没有真正思考过人工智能 他的使命是死在火星上什么的 但不是死在火星撞击中 所以… 伊隆马斯克 对于如何构建人工智能 我们做了一些重大决定 这是一个强化学习设置 当说到建造人工智能代理时 我们就会想到这种设置 研究 基本上是由代理 也就是人工智能 以及与之互动的环境构成 我们认为 只要对游戏的使用 有严格的约束 它们就是人工智能发展的完美训练场 雅达利 我们想试着创建一种算法 可以用来训练玩几十款不同的雅达利游戏 所以就像人类一样 你得用同一个大脑来玩所有游戏 《机器人坦克》 《吃豆人》 你可以把它想成你把游戏卡带给代理 然后说:“行了 有了那盘卡带 “把它想成你就生在那个世界里 “跟那些图像像素互动 看看你能得多少分 强化学习副总裁 大卫西尔弗 “你能做什么?”
所以你要做的就是用Q函数 QK… Q学习是强化学习里最早期的方法之一 我们所做的是将强化学习和深度学习 结合到一个系统里
之前没有人将二者大规模地结合起来 以取得显著成果 而且我们需要证明这一理论 我们试验的第一个游戏是《乓》 它看上去是最简单的 我们还没有告诉它 它在控制什么或是它应该做什么 它只知道得分是好事 并且它必须学习自己的控制功能 并建立起一切…这些是首要原则 雅达利程序 DQN人工智能代理
当时效果并不太好 我跟谢恩说 “也许我们错了 我们甚至连《乓》都玩不好” 想到我们还要努力多久 才能真正成功创建一个通用智能系统 有点让人伤脑筋 感觉该放弃这一想法 接着突然 我们拿到了第一分
我们想:“这是偶然吗?” “不 不是 它现在真的得分了” 那真的很令人激动 它之前甚至都不知道怎么挥拍 结果突然就完全能做对了 接着它得了一些分 然后赢了第一场比赛 接着 三个月后就没有人类能击败它了 我们没跟它讲过规则 要怎么得分 什么都没告诉过它 只告诉它要尽量得分 然后它就开始了得分之路 这是有史以来第一次有人做这种端到端学习 “好的 我们已经以相对普遍的方式 取得了进展 “我们现在来试试另一个游戏” 然后我们试了《Breakout》 在开始的一百场比赛后 代理表现不佳 它大部分时候都打不到球 但它开始领悟了要点 知道了球棒应该朝着球打 在三百场比赛后 它的水平几乎和任何人类一样出色 我们觉得:“这挺厉害的” 但我们让系统又玩了两百场比赛 它做到了一件很惊人的事 它发现最佳策略 是在一侧打通一条通道 并把球打到墙后面的位置 最后 代理真正做到了你认为它会做到的事 这种感觉很棒 对吗? 在我们做研究时 这是我们所能期望的最好结果 首席技术官 科雷卡沃库奥格卢 我们开始试验50个游戏 可以说我们有一个秘技 能应对以前从未玩过的游戏 我们会用它来运行算法 DQN可以从头开始自我训练
我们想:“这是偶然吗?” “不 不是 它现在真的得分了” 那真的很令人激动 它之前甚至都不知道怎么挥拍 结果突然就完全能做对了 接着它得了一些分 然后赢了第一场比赛 接着 三个月后就没有人类能击败它了 我们没跟它讲过规则 要怎么得分 什么都没告诉过它 只告诉它要尽量得分 然后它就开始了得分之路 这是有史以来第一次有人做这种端到端学习 “好的 我们已经以相对普遍的方式 取得了进展 “我们现在来试试另一个游戏” 然后我们试了《Breakout》 在开始的一百场比赛后 代理表现不佳 它大部分时候都打不到球 但它开始领悟了要点 知道了球棒应该朝着球打 在三百场比赛后 它的水平几乎和任何人类一样出色 我们觉得:“这挺厉害的” 但我们让系统又玩了两百场比赛 它做到了一件很惊人的事 它发现最佳策略 是在一侧打通一条通道 并把球打到墙后面的位置 最后 代理真正做到了你认为它会做到的事 这种感觉很棒 对吗? 在我们做研究时 这是我们所能期望的最好结果 首席技术官 科雷卡沃库奥格卢 我们开始试验50个游戏 可以说我们有一个秘技 能应对以前从未玩过的游戏 我们会用它来运行算法 DQN可以从头开始自我训练
达到人类的水平 甚至超过人类的水平 我们建造它不是为了玩其中任何一款游戏 我们可以丢给它一堆游戏 它会自己想出对策 这很神奇 自然 学习曲线 突然间 你有了一个在任何情况下 都会做出回应并学习的系统 这是一个巨大的突破 自学人工智能软件 在电子游戏中达到了人类的表现水平 从很多方面来说 它都可以被称为是通用智能的第一起实例 研究科学家 莫里沙纳汉
虽然我们是一家资金充足的初创公司 束缚我们手脚的是计算能力不足 我意识到这会大大加快 我们构建出通用人工智能的进度 我以前能经常见到戴密斯 我们一起吃午饭 他确实 跟我说有两家公司想收购DeepMind 可他不知道该选哪一家 问题在于有旨在盈利的公司 真正理解这项研究的重大意义吗? 这些公司会给足研究时间来取得成果 而不会紧盯着研究人员说 “我们希望从中获得商业利益”吗?
2014年 据报道 谷歌以四亿英镑的价格 收购了DeepMind 使这家人工智能公司 成为迄今为止它在欧洲最大的一笔收购 这家公司由37岁的创业家戴密斯哈萨比斯创立 联合创始人兼首席执行官 谷歌DEEPMIND 戴密斯哈萨比斯 收购之后 我开始指导并和戴密斯共事 听取他的想法 谷歌前执行总裁兼首席执行官 艾瑞克施密特 他从根本上来说是一位科学家和自然科学家 他想通过科学解决世界上的所有问题 而且他相信科学能实现这一点 这种人在一家科技公司里并不常见
我们不仅加入了谷歌 而且在伦敦独立运营 打造我们自己利于取得研究突破 而不是关注于产品的文化 进行纯粹的研究
我们的投资人不想出售 但我们决定这么做是实现使命的最佳选择 在它成熟前 我们在很多方面都低估了其价值 你本可以以高得多的价格卖掉它 原因在于不能浪费时间 在大脑依然处于运转状态时 有很多东西要破解 我依然活着 所有这些事都得去做 所以你没多少…我是说 多少… 你愿意用多少亿换另一个五年 来完成自己的既定目标? 好吧 我们突然有了这个超级计算工具 我们要用它来做什么呢?
围棋是棋牌类游戏的巅峰之作 它是有史以来人类设计的最复杂的游戏
这款游戏中的潜在棋谱 比宇宙中的原子还多 围棋是人工智能的圣杯 多年来 人们看着这个游戏 会觉得“哇 这太难了” 我们用人工智能试验过的所有东西中 每次尝试围棋都会失败 这正是为什么感觉 它是真正的研究进展试金石 我们刚刚收购了DeepMind 他们在研究强化学习 而且他们是游戏界的世界级专家 所以当他们介绍说 他们可以在一场无法进行计算的对弈里 击败顶级围棋棋手时 我心想:“这还挺有趣的” 我们的下一步终极目标 是在两周多之后跟传奇李世石对战 2016年 韩国首尔 一场前所未有的比赛即将在韩国展开 李世石准备重拳出击 李世石可能是过去十年里最伟大的棋手之一 我将他看作是围棋界的罗杰费德勒
他到场 而且突然间出现了上千名 来自韩国各阶层的顶级围棋棋手 《韩国先驱报》 到场的还有戴密斯 以及这支优秀的工程师团队 他以极具创意的走棋而闻名 所以这对我们来说会很难 我认为李世石会击败这些家伙 但他们会好好表现 这对一家初创公司来说是非常棒的
我去见了技术小组 他们说 “让你们看下我们的算法是如何运作的” 如果逐步分析这款游戏 我们可以看到阿尔法狗的思维模式 我们对阿尔法狗的训练 始于让它观看十万场 厉害的业余棋手的比赛 我们首先让阿尔法狗模仿人类棋手 然后通过强化学习 它与不同版本的自己 对弈数百万次并从错误中学习 这很有意思 好的 各位 你们将会见证历史
对弈开始 他真的非常专注 确实 看看他 第37步棋 这步棋出其不意 我觉得这步棋非常有创意
是的 这步棋令人兴奋 我喜欢这样的走棋 专业评论员们几乎一致表示 没有哪个人类棋手会选择第37步这样的走棋 所以 我看了一下阿尔法狗 查看它的想法 阿尔法狗同意那种评价 阿尔法狗说 第37步棋有万分之一的概率 是由人类棋手走的 我原以为阿尔法狗是基于概率计算的 而且它只是一台机器
但阿尔法狗肯定很有创意 围棋已经被研究了几千年 阿尔法狗发现了一些全新的东西 谷歌DeepMind挑战赛 他投子认输了 李世石刚刚投子认输了 他被打败了
在这场人机大战中 电脑成为了胜者 谷歌让它的DeepMind团队 跟世界上最聪明的大脑之一对弈 而且获胜了 就是在那时我们意识到 DeepMind的人知道自己在做什么 并重视由他们自己发明出来的 强化学习
基于那次经历 阿尔法狗变得越来越好 他们还有一张图表记录着他们的进步 我说:“这什么时候才会停止?” 戴密斯说 “等我们击败世界上最厉害的 “那位中国棋手的时候” 2017年 中国 乌镇 柯洁对弈阿尔法狗
柯洁 阿尔法狗 我想我们会看到阿尔法狗艰难胜出 阿尔法狗领先很多 第一局下到一半时 世界最佳棋手表现不佳 黑棋该怎么走呢?
看上去很难 在关键时刻 中国政府下令切断了转播信号 谷歌神一般的阿尔法狗人工智能 令全球最顶尖的围棋棋手手足无措 就在那一刻 我们告诉全世界 地球上诞生了新事物
在20世纪50年代 当俄国人造卫星“斯普特尼克”号发射时 它改变了历史进程 这是美国想要在太空时代生存下去 必须要应对的挑战 这一直被称为“斯普特尼克”时刻 “斯普特尼克”时刻在美国引发了巨大反响 加州大学伯克利分校计算机科学教授 斯图尔特拉塞尔 在科学和工程学的资助方面 特别是在空间技术方面 对于中国来说 阿尔法狗是一次警钟 《经济学人》作者兼副执行编辑 肯尼斯库基尔 是“斯普特尼克时刻” 它开启了一场人工智能太空竞赛 英国伦敦 我们的一个重大想法成功落地了 而且现在全世界都知道了 如果之前已经有人成功登月 那登月就会更容易
人工智能由谁以及如何建造很重要 我一直都能感受到那种压力
阿尔法狗带来激动之余 也引发了一连串事件 跟李世石对弈时 我们其实有一个基于人类数据 基于人类棋手数百万场对弈而训练的系统 我们最终找到了一个 对整个系统来说更巧妙的新算法 它实际上剥离了所有人类的知识 并且完全从零开始 成为我们称之为“阿尔法元”的项目 “元”的意思是训练过程中 完全没有人类的知识
它不是从人类数据 而是从自身的比赛中进行学习 所以 它实际上成了自己的老师 第2353局 黑白对弈 “阿尔法元”是一项实验 旨在验证我们要在这些系统中投入多少知识 以及它们的学习速度有多快、多高效 “阿尔法元”没有任何规则 它通过经验学习
下一个阶段是让它更加通用 让它可以进行任何两人游戏 比如国际象棋 事实上 是任何其他类型的完全信息两人游戏 进展非常顺利 非常非常顺利 速度很快 阿尔法狗以前需要几个月来训练 但阿尔法元可以在早上开始训练 完全随机对弈 等到了茶歇时就能达到超人类的水平 等到了晚餐时 它将成为有史以来 最强大的象棋实体 -非常棒 太棒了 -是啊 它找到了自己的进攻风格 国际象棋特级大师 马修萨德勒 来对付目前的防守 我是说我完全没想到 我同意 其实我也没想到 而且这让我感觉很有趣 鼓励我重拾象棋 看到国际象棋中 竟然还有比我们想象中更深的深度 真是令人兴奋
我其实是通过游戏进入到人工智能领域的 起初是棋牌游戏 我当时想:“我的大脑是怎么做到的?” 它到底在做什么?
起初是棋牌游戏 我当时想:“我的大脑是怎么做到的?” 它到底在做什么?
我从很小的时候就有了这样的意识 所以我一直在想关于思考的事 英美两国的国际象棋冠军开始一系列比赛 1986年 英国伦敦 跟他们一起对弈的还有英美两国最年轻的棋手们 戴密斯哈萨比斯代表英国出站 戴密斯四岁时 第一次展现出了在国际象棋方面的天赋 戴密斯的父亲 科斯塔斯哈萨比斯
到六岁时 他成为了伦敦八岁以下的冠军 我的父母非常有趣且不寻常 我觉得他们很像波西米亚人 我父亲年轻时是个创作型歌手 他的偶像是鲍勃迪伦
我们以前常去露营地 然后去参加大概为期四天的国际象棋锦标赛 戴密斯的母亲 安吉拉哈萨比斯 因为他很厉害! 国际象棋让你喜欢的地方是什么?
这是一种非常棒的思考游戏
我当时是我所在的年龄段 世界排名第二的棋手 但尽管我正朝着成为职业棋手的方向迈进 我当时认为那就是我今后的职业 不管我有多喜欢国际象棋 比赛的压力都非常大 对我来说绝对不是什么好玩的游戏 当我输掉比赛时 我爸妈会很不高兴 而且如果我忘了什么 他们就会很生气 因为那样对他们来说损失很大 去参加那些锦标赛要花很多钱 而我父母并不富裕
我父母说 “如果你有兴趣成为一名专业国际象棋棋手 “那这就很重要 就像你的考试一样” 我记得大概在我12岁时 1988年 列支敦士登 我去列支敦士登参加在山上举办的 一场国际象棋锦标赛 我们当时在一个巨大的教堂里 有数百名国际象棋棋手 跟我对弈的是前丹麦冠军 他那时肯定有三十几岁了
当时走棋的时限很长 比赛可以持续一整天 新闻 比赛进入到了第十个小时 来到了非常不寻常的终局 我认为那应该是个平局 但他一直想要赢 纠缠了几个小时 最后 他用了个小伎俩
我所要做的就是放弃我的皇后 然后棋局就会陷入僵局 可我当时太累了 我以为被将军是无可避免了 于是我就弃子认输了 他跳了起来 开始大笑 他问 “你为什么要认输?这是平局” 他立刻用夸张的动作 给我演示平局该怎么走棋
他问 “你为什么要认输?这是平局” 他立刻用夸张的动作 给我演示平局该怎么走棋 我感到很不舒服
这让我思考剩下的比赛… 我们是在浪费头脑吗? 这就是脑力最好的用武之地吗? 那栋楼里所有人的脑力? 如果可以把那三百个大脑 连接到一个系统上 那种脑力水平也许能够用于根治癌症 这种直觉让我觉得 即便我热爱国际象棋 我也不该一生都从事这个
这让我思考剩下的比赛… 我们是在浪费头脑吗? 这就是脑力最好的用武之地吗? 那栋楼里所有人的脑力? 如果可以把那三百个大脑 连接到一个系统上 那种脑力水平也许能够用于根治癌症 这种直觉让我觉得 即便我热爱国际象棋 我也不该一生都从事这个
2018年 联合创始人兼首席人工智能科学家 谢恩莱格 戴密斯和我 我们的计划一直都是在DeepMind 招募一些世界上最杰出的科学家 以便拥有必要的人脑力 来创建一个人工智能系统
根据定义 通用人工智能中的 “通用”二字尤为重要 我想象的是能够和代理交谈 代理可以回话 并且代理能够解决 它没见过的新问题 那是人类智力一个非常关键的部分 而且令人难以置信的是其认知的广度和灵活性
我们所知道的唯一自然通用智能是人类 我们显然从环境中学到了很多 所以 我们认为模拟环境 是创造通用人工智能的方法之一 玩具 早期的人类 不得不去解决逻辑问题 他们被迫解决导航、记忆问题 而我们在那个环境中进化了
世界部部长 西蒙卡特 如果我们能创造出那个环境的虚拟世界 那将是我们在DeepMind所做的一切的 一个完美的测试和训练场地
他们所做的 是创建孩童性质的环境 让代理在其中生活玩耍 环境设计师 盖伊西蒙斯 那个听上去 就是这个世界上最有趣的事 小孩子通过撕东西、乱扔食物 以及获得爸爸妈妈的回应来学习 研究科学家 穆雷沙纳汉 这对代理的训练方式而言 似乎是一个重要的想法 这个人形物体应该站起来 随着他的重心上升 它会得到更多分值
你会给代理奖励 而它从奖励中进行学习 比如你某件事做得好 你就会得到正面奖励 某件事做得不好 你就会得到负面奖励 它似乎要站起来了
还是有点摇摇晃晃的 -它喜欢倒着走 -是的 现在整个算法在努力进行优化 以尽可能多地获得奖励 结果发现它在倒着走 这足以获得很好的分数了
当我们学习寻找方向 在世界里四处走动时 我们不会从使用地图开始 我们从自身的探索开始 在没有父母的陪伴下探索穿过公园 研究部副总裁 拉亚哈德塞尔 或是在小时候找到从学校回家的路
我们当中有些人有了一个想法 如果有个环境 让一个模拟机器人在其中必须向前奔跑 我们就可以在它前进的道路上设置各种障碍 看它能否驾驭不同的地形 这个想法就像一个跑酷挑战 它的动作并不优美 但它从没接受过拿着水杯跑步 却不让水洒出来的训练
你设定目标 说 “向前移动 前进速度 “你会因此得到奖励” 学习算法会解决如何移动这组复杂关节的问题 这就是以奖励为基础的强化学习的力量所在 我们的目标是尝试创造代理 将它们放进它们一无所知的环境中 不管你给它们抛出什么问题 它们都能通过玩耍 最终自己想出解决办法 现在 我们希望能有一个系统 能够解决尽可能多的不同类型的问题
一个人需要多样技能才能与世界互动 如何处理复杂的图像 如何同时操控数千个东西 如何处理缺失的信息 我们认为所有这些 都通过这个叫《星际争霸》的游戏得以体现 它的训练目标仅仅是 在这种情况下、这个画面下 一个人类会怎么做? 我们从大型语言模型中汲取灵感 你就训练一个预测下一句话的模型 重大研究部副总裁 奥里奥尔维尼亚尔 早上好! 很高兴今天早些时候见到你! 这跟在《星际争霸》里预测下一步行动 完全如出一辙 跟在国际象棋或围棋里两名棋手轮流走棋不同 在《星际争霸》里 玩家要连续做出决定 除此之外 你甚至无法看到对手在做什么 对于最佳对策不再有一个清晰的定义 这取决于你对手的行动 这样我们就能得到一个更加流畅 自然、快速、更具反应性的代理 这是个巨大的挑战 让我们看看我们能做到什么程度
我的天! 我是个低级别业余玩家 研究科学家 蒂姆利利拉普 水平将就 但是个低级别业余玩家 这些代理还有很多需要改进的地方 我们无法击败蒂姆这种水平的玩家 这有点令人担忧 在那个时候 感觉 那会是一个非常漫长的挑战 也许需要几年时间
我的天! 我是个低级别业余玩家 研究科学家 蒂姆利利拉普 水平将就 但是个低级别业余玩家 这些代理还有很多需要改进的地方 我们无法击败蒂姆这种水平的玩家 这有点令人担忧 在那个时候 感觉 那会是一个非常漫长的挑战 也许需要几年时间
丹尼是DeepMind里 最厉害的《星际争霸2》玩家 软件工程师 丹尼尤伽塔玛 我每天都在跟代理玩 已经有几周时间了 我能感觉到代理进步很快 我们打败了丹尼 那对我来说已经是一项巨大的成就了 下一步 我们会约个职业玩家对战 《星际争霸》职业玩家 达里奥“特洛”温施
感觉有点不公平 你们没人是支持我的 考虑到我们两个月前的处境 我们现在的处境比我想的要好得多 我现在在好好消化这一切 但这非常棒 现在我们终于可以 向公众展示我们目前所做的了 这是迈进了一大步 是真正的冒险 -享受胜利吧 恭喜 -谢谢 我们将在伦敦进行现场直播 这真的要实现了 《星际争霸》职业玩家 格泽戈尔兹“玛纳”柯明茨 欢迎来到伦敦 我们将现场直播一场表演赛 由“玛纳”对战阿尔法星际
截至目前 阿尔法星际对战职业玩家的战绩为十战全胜 在比赛开始前 有谁有什么想法吗? 我只是想看一场精彩的比赛 当然了 精彩的比赛 我们都很兴奋 行了 让我们来看看“玛纳”的本事吧 阿尔法星际目前主导着比赛节奏 哇 阿尔法星际打得很聪明
我感觉自己就如同 正在从阿尔法星际的视角看一位职业人类玩家
我以前从没近距离观看过《星际争霸》的职业玩家 没见过每分钟点击鼠标八百次 我不理解怎么会有人能做到点击鼠标八百次 更别说八百次都是有效点击了 又是重重一击 阿尔法星际简直残酷无情 我们要小心 因为我们中很多人从小就玩游戏 而且现在也玩 所以 对我们来说 把游戏只看作是游戏 是纯粹的娱乐工具很自然 而不是公众可能看到的 那种更军事化的视角 你不能见到了火药却只用它来制作烟花爆竹 所有技术本身都指向特定方向
我很担心人工智能 会被用于军事目的
而且这也更加清楚地表明 斯坦福大学政治学教授 玛格丽特莱维 让人类社会控制这些新技术 有多重要 滥用人工智能可能造成巨大的影响 战争会以超出人类理解的速度爆发 并且需要更强大的监管
你要如何一直压制 比你强大得多的东西? 可以想象这样的技术主宰金融市场 超越人类研究员 领导人类领袖 并可能用超越我们理解的武器制服我们 理论物理学家 史蒂芬霍金 所以我们应该着眼于第一次就把事情做对 因为那可能是我们唯一的机会
你要如何一直压制 比你强大得多的东西? 可以想象这样的技术主宰金融市场 超越人类研究员 领导人类领袖 并可能用超越我们理解的武器制服我们 理论物理学家 史蒂芬霍金 所以我们应该着眼于第一次就把事情做对 因为那可能是我们唯一的机会
科技可以用来做可怕的事 科技可以用来做美好的事 并解决各类问题
DeepMind当初被谷歌收购时 -是的 -你让谷歌承诺 你们开发的技术不会被军方 -用于监视 -没错 -是的 -给我们讲讲这件事 我认为技术本身是中性的 但我们作为一个社会或人类、公司和其他东西 其他实体和政府决定如何使用它 才是决定事物好坏的关键 我个人认为持有自动化武器 是一个非常糟糕的主意
阿尔法星际现在的操作非常聪明 DeepMind在伦敦 所创造的事物 确实有一种类似于曼哈顿计划的元素 罗伯特奥本海默 罗伯特奥本海默 和戴密斯哈萨比斯之间有种联系 就是他们都向人类释放了一种新的力量 不过“玛纳”在进行反击 天啊! 我认为奥本海默 和曼哈顿计划的其他一些领导者 沉浸在开发那项技术的兴奋之情 以及对其可实现性的期待之中 阿尔法星际在哪? 阿尔法星际在哪? 哪里都看不到阿尔法星际的小队 他们没有早早细致地考虑到 他们的那项研究在道德层面的问题 作为掌握强大新技术的科学家 我们应该 首先在受控条件下去理解它
胜利! 比赛结束 “玛纳”击败了阿尔法星际
胜利! 比赛结束 “玛纳”击败了阿尔法星际
我真实的想法是 这如实反映出了我们目前所处的位置 我觉得那部分还不错 -我为你感到非常高兴 -我很高兴 所以 干得好 我的观点是在搞技术创新时 我们不该 一味追求快速和不破不立 因为事后补救的代价是沉重的 -谢谢 -非常感谢 好好休息 你们做得很棒 -谢谢 好吗? -谢谢你邀请我们
在我八岁时 我用参加国际象棋锦标赛 获得的奖金买了第一台电脑 我有种直觉 认为计算机 是可以扩大思维力量的神奇设备 我上学期间有几个朋友 我们有一个黑客俱乐部 写代码、做游戏 1990年
然后在暑假期间 我会整天翻看游戏杂志 比赛 有天我注意到有一个 原创版本的《太空侵略者》的创作比赛 获胜者在牛蛙制作公司获得了一份工作 千载难逢的机会! 当时的牛蛙制作公司是全欧洲最好的 游戏开发公司 我当时真的很想去那工作 看他们是如何制作游戏的
牛蛙制作公司总部位于吉尔福德 始创于一个伟大的创意 那个创意演变出了游戏《上帝也疯狂》 成为一款全球畅销游戏 在20世纪90年代 没有人才招聘机构 创始人 牛蛙制作公司 电子游戏先锋 彼得莫利纽克斯 你不能走到外面对人说 “来游戏行业工作吧” 它在当时甚至都算不上是一个行业 所以 我们才想出了举办竞赛 而且当时有很多人申请参赛 赢取加入牛蛙制作公司工作的机会! 从速!翻到第93页! 其中一个便是戴密斯 《国际象棋入侵者》 作者:戴密斯哈萨比斯 太空侵略者遇上国际象棋? 我至今仍清楚地记得 戴密斯来的那天 他走进门 看上去大概12岁上下
我心想:“天啊 “我们该拿他怎么办?” 我当时申请了剑桥大学 我被录取了 但他们说我年纪太小了 所以我要等一年 得等到至少17岁才能入学 于是我决定那年 去牛蛙制作公司工作 当时他们甚至都不能合法雇用我 所以我的薪水都是装在棕色纸信封里发的
我心想:“天啊 “我们该拿他怎么办?” 我当时申请了剑桥大学 我被录取了 但他们说我年纪太小了 所以我要等一年 得等到至少17岁才能入学 于是我决定那年 去牛蛙制作公司工作 当时他们甚至都不能合法雇用我 所以我的薪水都是装在棕色纸信封里发的
我感觉自己处在最前沿 而且每天发明东西非常有趣 后来 几个月后 也许所有人…一百万人都会玩这个游戏 在那个年代 电脑游戏必须要更新换代 必须有比射击游戏更新颖的游戏类型 有一款游戏可以让你设计 和建造自己的主题公园的游戏 岂不是很棒吗?
我和戴密斯开始讨论《主题公园》这一游戏 《主题公园》 这个游戏允许玩家建造一个世界 并看到玩家在那个世界里所做选择的后果 人类玩家给这个主题公园 规划布局 设计过山车 并给炸鱼薯条店的东西设置价格 我研究的是人们的行为 他们有自主性 这就等同于人工智能 所以我要做的是模仿有趣的人类行为 这样跟这个模拟的互动就会更具趣味性 戴密斯的工作内容是些很搞笑的东西 比如设置这些店铺的位置 如果离惊险的过山车距离太近 那过山车上的人就会呕吐 因为他们才刚吃过东西 然后当其他人看到地上的呕吐物时 他们也会呕吐 这样就得有很多清扫人员 以便赶在被人们看到前快速清扫干净 这就是好玩的地方 作为玩家 你要进行补救 然后它会对你做出反应 他所做的那些细微的模拟动作 是一项前所未有的发明 独一无二! 阿美加评论 那款游戏令人难以置信地成功 《主题公园》成为十大最畅销游戏之一 那也是我们第一次 见证人工智能的作用 风险投资人、伦敦风投合伙人、艺电公司前CEO 大卫加德纳
我们当时正在为圣诞节购物 等载我们回家的出租车
我清楚地记得当时戴密斯 以一种极其不同的方式 牛蛙制作公司前程序员 谈论人工智能 一种我们通常不讨论的方式 他说除了娱乐 人工智能在其他方面也很有用 它对于帮助世界很有用 以及人工智能可能会改变世界 我对戴密斯说:“你想做什么?” 环境设计师、牛蛙制作公司前程序员 盖伊西蒙斯 他对我说 “我想成为解决人工智能问题的人”
彼得提出给我一百万英镑 叫我不要去读大学
但我从一开始就有个计划 我的计划一直都是要去剑桥大学读书 我想我的很多同学都觉得我疯了 你为什么不拿钱 一百万英镑可是一大笔钱 在20世纪90年代 那可是一大笔钱 对吧? 对于一个17岁的穷小子来说 他就如同一粒即将破土而出的小种子 但在牛蛙制作公司 他是无法做到的
我不得不送他去了火车站 我至今依然记得 这个小精灵角色消失在那条隧道里的画面 那是个令人极其伤感的时刻
我对剑桥有着浪漫的憧憬 它有着一千年的历史 走在图灵 牛顿和克里克曾走过的街道上 我想探索宇宙的边缘 1994年 英国剑桥 到剑桥入学前 我其实一直都在工作
每年夏天 我要么下专业国际象棋 要么工作实习 所以我心想:“行了 我现在要尽情地玩 “看看做个正常青少年是什么样的” 来啊!来啊! 努力工作 尽情玩乐
来啊!来啊! 努力工作 尽情玩乐
我第一次见到戴密斯 是因为我们俩都进入了皇后学院 剑桥大学同学 蒂姆史蒂文斯
我们一群朋友 经常在酒吧喝啤酒 玩桌上足球 我以前下快速国际象棋 棋子从棋盘上飞走 一分钟内就下完一局棋 戴密斯坐在我对面 我看着他 心想 “我记得你 还是小时候的事” 我曾和戴夫在伊普斯维奇 参加过同一场国际象棋锦标赛 我以前为了奖金常去那里 参加当地国际象棋俱乐部的比赛 我们当时学的是计算机科学 有些人在17岁时 会来告诉所有人 关于他们自己的一切 “嘿 我之前在牛蛙制作公司工作 “并且打造出了世界上最成功的电子游戏” 但他完全不是那样 在剑桥时 我和戴密斯 都对计算神经科学感兴趣 想要理解计算机和大脑 是如何结合到一起的 大卫和戴密斯都来找我指导 事出巧合 1997年 计算机视觉和模式识别教授 约翰道格曼 他们在剑桥大学就读的第三年 也是最后一年 也是第一位国际象棋大师 被计算机程序打败的那一年
今天第一轮国际象棋对弈的双方 分别是世界排名第一的国际象棋冠军 加里卡斯帕罗夫 跟名为“深蓝”的对手 这场对弈旨在测试人类大脑能否能智胜机器 我记得卡斯帕罗夫输掉上一场棋赛的事
卡斯帕罗夫投子认输了! 当“深蓝”击败加里卡斯帕罗夫时 那简直是一次分水岭 在这件事中 我对“深蓝”的印象并不深 卡斯帕罗夫的思维让我印象更深 他在国际象棋上的造诣 跟野兽般的机器不分伯仲 但当然了 卡斯帕罗夫 还能做到人类能做到的其他所有事 这是一项巨大的成就 而“深蓝”只会下象棋
卡斯帕罗夫投子认输了! 当“深蓝”击败加里卡斯帕罗夫时 那简直是一次分水岭 在这件事中 我对“深蓝”的印象并不深 卡斯帕罗夫的思维让我印象更深 他在国际象棋上的造诣 跟野兽般的机器不分伯仲 但当然了 卡斯帕罗夫 还能做到人类能做到的其他所有事 这是一项巨大的成就 而“深蓝”只会下象棋
它的系统里 缺少了我们所认为的智能 即通用性和学习的想法
剑桥大学非常棒 因为 你在那里会认识很多学习不同学科的人 有科学家、哲学家、艺术家 地质学家、生物学家、生态学家 那里一直都有人谈论各种话题 我很关注蛋白质折叠的问题 蒂姆史蒂文斯 对于蛋白质折叠这个问题会讲很多很多 几乎就像传教一样 蛋白质 是生物学里最美好巧妙的其中一样东西 它们是打造生命的机器 它们建造一切 掌控一切 是生物学的基础
蛋白质由氨基酸链构成 氨基酸链折叠形成蛋白质结构 如果我们能从蛋白质的氨基酸序列 预测蛋白质的结构 那么就当然可以畅想 一种能治愈癌症或分解塑料促进环保的 新型蛋白质的诞生
我想的是:“人类是否 “真的智慧到能够折叠蛋白质?” 我们无法解决这个问题 从20世纪60年代起 我们就认为 一般来说 如果我知道蛋白质的氨基酸序列 我应该就能计算出它的结构 所以如果按下一个按钮 它们就全都会弹出来 那将是 马里兰大学生物学家 约翰穆尔特 那会带来影响
我想的是:“人类是否 “真的智慧到能够折叠蛋白质?” 我们无法解决这个问题 从20世纪60年代起 我们就认为 一般来说 如果我知道蛋白质的氨基酸序列 我应该就能计算出它的结构 所以如果按下一个按钮 它们就全都会弹出来 那将是 马里兰大学生物学家 约翰穆尔特 那会带来影响
它在我的脑子里挥之不去 “哦 这是个非常有趣的问题” 我觉得它是可以解决的 但我认为需要人工智能来解决 如果我们能破解蛋白质折叠的难题 那它就能改变世界 英国伦敦 自入学剑桥大学起 我就一直在想蛋白质折叠的问题
如果破解了蛋白质折叠问题 那就极可能帮助攻克阿尔茨海默病 痴呆症和药物开发等难题 攻克疾病也许会是我们能带来的最重大的影响 成千上万非常聪明的人 尝试过解决蛋白质折叠问题 我认为现在该由人工智能登场了 2018年
我们需要一种合理的方法 来将机器学习应用在蛋白质折叠问题上 我们偶然创造出了这款《Foldit》游戏 游戏目标是移动这个3D蛋白质模型 你的每次移动都能得分 你把这些结构制作得越精确 它们对生物学家也就越有用 我花了几天时间观察我们能做得多好
我们做得还算不错 但即便你是世界上最出色的《Foldit》玩家 你也无法解决蛋白质折叠的问题 所以我们必须跨越这个游戏 游戏一直 都只是我们算法的试验场 我们的终极目标可不仅仅 是破解围棋和《星际争霸》游戏 而是破解现实世界的难题
研究科学家 约翰江珀 我记得有传言说 戴密斯在研究蛋白质 我跟DeepMind里的一些人聊了聊 我会问 “你在研究做蛋白质折叠吗?” 但他们会巧妙地转移话题 当这种情况发生两次时 我差不多就知道了 所以我觉得自己应该提交简历 好的 各位 欢迎来到DeepMind 我认识你们其中一些人 这可能是你们来此的第一周 但我希望你们全都准备好了… 对我来说 这份工作最吸引人的地方 就是它跟这个更宏大的目标之间的联系 人工智能在科学上的应用 蛋白质折叠 如果我们能解决科学中的一些根本问题 很多其他人、公司和实验室等等 就可以在我们的成果的基础上进行其他工作 现在就是你们为这个故事添加篇章的机会 我来的时候确实有点紧张 我还在努力 我以前没上过生物课 我们没花几年时间 去观察并理解这些结构 研究科学家 安德鲁西尼尔 我们只是梳理数据以及我们机器的学习模型 问题 氨基酸序列 在机器学习中 你用类似教学卡片的方式训练网络 这是问题 这是答案 答案 蛋白质结构 这是问题 这是答案 但在蛋白质折叠方面 我们并不是在进行 那种可以使用无线数据的 DeepMind标准任务 你的任务是提高下国际象棋或围棋的水平
只要电脑允许 你想下多少局棋都可以 关于蛋白质 我们掌握着大量数据 这些数据是各个实验室在半个世纪里 通过耗时的实验方法取得的 这些艰苦的方法可能需要几个月或是几年 才能确定一个单一的蛋白质结构 而且有时 你永远也无法确定某些结构
所以我们才会使用这么小的数据集 来训练我们的算法
当DeepMind开始研究折叠问题时 他们跟我们说了他们所使用的数据集 欧洲分子生物学实验室副所长 兼EMBL-EBI主任 伊万伯尼 以及他们破解这一难题的可能性 很多人都做过尝试 但这个世界上至今还没人破解蛋白质折叠的问题 我心想:“祝你们好运吧” 如果我们能破解蛋白质折叠的问题 它将具有不可思议的医学意义 这是科学的循环 你进行大量探索 然后进入开发模式 你专注而且明白这些想法有多好 来自外部的竞争对这一点来说是最有用的
所以我们决定加入 蛋白质结构预测技术的关键测试(CASP) CASP 我们开始努力并加快得出 CASP联合创始人 约翰穆特 针对蛋白质折叠问题的解决方案 说到CASP 我们会说 “看啊 DeepMind在研究蛋白质折叠 我们就是这么优秀 “而且也许我们比其他人更优秀 “也许并非如此” CASP有点像研究蛋白质折叠的奥运会 高级科学家及EMBL-EBI荣誉所长 珍妮特桑顿
CASP是一项全球性竞赛 每两年举行一次 结构预测关键评估 各参赛队 会拿到大约一百个蛋白质的氨基酸序列 然后他们尝试运用计算的方法 来解出这个蛋白质折叠问题 预测 这些蛋白质已经 通过实验室实验得以确定 但尚未公之于众 基础事实 这些已知结果代表了黄金标准 所有计算预测都将与其进行比对
我们用分数 来衡量这些预测结果的准确性 超过90分 95分 解决方案 会被认为成功破解蛋白质折叠的问题 欢迎各位 来到优胜者的首场半决赛 尼克和约翰对阵戴密斯和弗兰克 请加入我们 过来吧 这将是一场激烈的比赛 当我得知戴密斯要破解蛋白质折叠问题时 分子生物学家 蒂姆史蒂文斯 我一点也不惊讶 这正是戴密斯的行事风格 他喜欢竞争 第一场比赛结束 比分是10比7 参加CASP的目标不仅仅是赢下那个竞赛 而是让那个竞赛不再被需要 CASP总共发布了20个目标 我们当时想 也许就用标准的机器学习参赛 看看我们能在竞赛中走多远 与其花几天进行一次实验 我们可以每天进行五次实验 很好 干得漂亮 各位
相比于看我们的预测 能让我看看真正的那个吗? 真正的答案应该是这样的 它比我想的要更接近圆柱形 结果不是很好 好吧 我们把所有合理的算法都用上了 结果却跟正确答案差了好远
相比于看我们的预测 能让我看看真正的那个吗? 真正的答案应该是这样的 它比我想的要更接近圆柱形 结果不是很好 好吧 我们把所有合理的算法都用上了 结果却跟正确答案差了好远 这说不通啊 我们原本认为只需 动用我们最好的算法就能解决这个问题
我们有点天真了 我们应该立刻学习这个 我现在担心的是 我们从给出非常糟糕的解答 转变为给出中等糟糕程度的解答 我觉得我们需要某种新技术 来处理这些东西 解决蛋白质折叠问题 还有一周就到CASP了 现在要快速部署这项新技术
你已经尽力了 除了等待CASP的结果 没什么能做的了 新泽西州普林斯顿大学
爱因斯坦有桩很有名的事迹 在他生命的最后几年 当他在这里时 他和库尔特哥德尔有过交集 他说自己之所以依然来上班的原因之一 就是为了能走回家和哥德尔讨论一些事 那是对库尔特哥德尔极大的称赞 让人知道他有多出色
高等研究所成立于1933年 在早期 那里浓郁的科学氛围 吸引来了一些有史以来 最杰出的数学家和物理学家 让他们在同一时间集中出现在同一地点 维格纳 魏尔 哥德尔 爱因斯坦 奥本海默 这里的创立原则 是不受约束地追求知识 即使你并不知道自己在探索的东西 会衍生出一些很棒的东西 而且有时它们最后会很有用处 当然了 这也正是我在DeepMind努力去做的一些事 你们认为需要取得多少重大突破 才能实现通用人工智能? 我估计可能要十几个这样的案例 但愿在我的有生之年能实现这一点 -是的 好的 -不过 所有科学家都会这样想 对吗? 戴密斯获得过很多荣誉 他去年当选了英国皇家学会成员 他还是皇家艺术学会成员 掌声欢迎戴密斯哈萨比斯 自学系统的力量 戴密斯哈萨比斯 IAS 2019年5月
我的梦想一直都是让人工智能辅助科学成为可能 我认为我们去年最令人兴奋的项目 就是我们在蛋白质折叠方面的努力 我们称这个系统为阿尔法折叠系统 我们把它输入进CASP 我们的系统在难度最高的类别里 最为精确地预测出了43种蛋白质中的25种 所以我们是最先进的 但我们仍然需要… 需要明确的是在解决蛋白质折叠的问题上 我们依然还有很长的路要走 不过我们正在为此努力并在开发许多其他技术
2019年 “给我一个支点 我就能撬动地球” 阿基米德 请开始吧 CASP13 结果 快速汇报一下 这是我们的CASP最终排名
我们在这次竞赛里以近50%的优势击败了第二名 但说到解决蛋白质折叠问题 让其可以为生物学家所用 我们还有很长的路要走 这是令人担忧的地方
这些预测的质量各不相同 其实用性与之前的方法没有区别 阿尔法折叠没有获得 足以让其切实得以被利用的数据 诺贝尔奖获得者 弗朗西斯克里克研究所CEO 保罗纳斯 比如说像我这样的人查验我自己的生理问题
那个时刻让人感觉有些惭愧 因为我们觉得自己非常很努力 也成功了 而且在一个难住了全世界的问题上 我们的表现是最好的 我们知道我们很烂 最长的梯子 并不能帮你登上月球 团队里有不少人认为 这在某种程度上是一场愚蠢的冒险
而且我在破解蛋白质折叠问题上可能犯了错 也许考虑人工智能的现状 那还是太难了 如果想做生物学研究 就得做好失败的准备 因为生物学非常复杂 我管理一间实验室将近50年了 在其中一半时间里 当研究不出成果时 为了给同事们打气 我得当个业余精神科医生 而且很多时候 差不多百分之八九十 都不起作用 如果你站在科学的最前沿 我可以告诉你 你会失败很多次
我只是感觉很失望 我学到的教训是有雄心是件好事 但需要掌握好时机 领先你所在的时代50年是没有意义的 在取得实际成果前 你是不可能坚忍度过50年的 你会按耐不住地去做尝试
戴密斯哈萨比斯 当我们谈到通用人工智能 人工智能的圣杯时 很难清楚地知道我们是在谈论什么 我们今天会看到哪些片段? 我们从花园开始 这是从观察区看到的花园的景象 研究科学家和工程师们可以分析并协作评估 实时情况 在19世纪 我们会认为像电视、潜水艇 或飞往月球的火箭这些东西是不可能的 然而 儒勒凡尔纳却写了这些东西 而且过了一个半世纪 它们真的出现了 我们将真正地 对人工智能代理的文明进行实验 一旦实验开始 这将是有史以来最令人兴奋的事 那样我们怎么睡得着? 我会睡不着的 完整的通用人工智能 将能完成人能做到的认知任务
且其规模可能远超人类 一个超级智能体的能力 真的远超我们的想象 这就好比让大猩猩去想 在爱因斯坦提出相对论时 它会做什么
人们经常问我这样的问题 “要是你错了呢 要是离实现通用人工智能还很遥远呢?” 我会想我从来不担心这个 我的担心其实刚好相反 我其实担心没等我们真正准备好它就来临了
感觉我们是在争分夺秒地实现通用人工智能 我们现在在开发的原型和模型 事实上正在改变 我们对智能的认知
最近 我们有了足够强大的代理 它们开始组队玩游戏 然后跟其他队比赛 我们看到代理表现出合作性社交动态 可我们并没有事先编程植入这些动态 这完全是从它们自己的经历中学习获得的
一开始 我们的想法是要建立一个智能系统 并让全世界相信我们做到了 我们现在开始考虑我们是否要建造 我们自己都不认为是完全智能的系统 并且我们要让世人相信它们不是 嘿 阿尔法 你好 我们今天在哪? 你现在身处纽约现代艺术博物馆
算是吧 这是什么画?
这是米开朗基罗的《亚当的诞生》 我觉得那幅画不在纽约 你说得对 它在梵蒂冈城 你觉得我们现在是在那里吗?
不 那我怎么会看到这幅画?
你现在看到的是那幅画的电子复刻作品 是的 谁住在这栋房子里?
一位宇航员 马克 这位宇航员叫什么名字? 他叫马克 这是阿尔伯特爱因斯坦提出的一个著名方程式 它表明能量和质量是等价的 你要怎么跟一个五岁的孩子解释它呢?
马克 这位宇航员叫什么名字? 他叫马克 这是阿尔伯特爱因斯坦提出的一个著名方程式 它表明能量和质量是等价的 你要怎么跟一个五岁的孩子解释它呢?
想象你有一块大石头 你想知道它有多重 马克有危险吗? 没有 马克没有危险 为什么?
因为那不是一只真恐龙
好吧 你为什么回答不出我的问题? 我想我无法回答出你的问题 因为我对这个话题的了解不够 好吧 你怎么才能学到更多知识呢? 我可以通过读书、文章和网站 了解更多关于这个主题的信息 你可以教我 我的结论是 如果你现在认为我们所做的就是 向所有人类学习 并一次性了解它们所有的知识 还有互联网的信息 你就会了解这个世界上的很多东西 比如人类能做到的所有事的很大一部分 现在 我觉得说“它或许行得通”更合适 这是个重要的时刻 这是谁? 这是上帝向亚当伸出手 通用人工智能的出现将把人类历史分为两部分 它出现前以及它出现后的部分 他为什么要向亚当伸出手?
好吧 你为什么回答不出我的问题? 我想我无法回答出你的问题 因为我对这个话题的了解不够 好吧 你怎么才能学到更多知识呢? 我可以通过读书、文章和网站 了解更多关于这个主题的信息 你可以教我 我的结论是 如果你现在认为我们所做的就是 向所有人类学习 并一次性了解它们所有的知识 还有互联网的信息 你就会了解这个世界上的很多东西 比如人类能做到的所有事的很大一部分 现在 我觉得说“它或许行得通”更合适 这是个重要的时刻 这是谁? 这是上帝向亚当伸出手 通用人工智能的出现将把人类历史分为两部分 它出现前以及它出现后的部分 他为什么要向亚当伸出手?
上帝伸手触摸亚当以赐予他生命 它会给我们一个 能彻底改造整个人类文明的工具 你觉得这幅画的意义是什么?
这幅画对我来说意义重大 好吧 比如?
我认为这幅画提醒着我们 我们彼此相连 而且我们都是比更宏大的世界的一部分 说得真好
当你跨越“通用人工智能 在未来某天可能会实现”的这一屏障 转而说 “不 我在有生之年就能见证它的实现”时 你的想法就发生了变化 通过观察来引导自己 对于如何利用它 我们务必谨慎 并且要深思熟虑
必须要考虑它的顶级目标是什么 如果是为了让人类幸福 那是哪些人?幸福是什么意思? 我们的很多集体目标都非常微妙 就算是人类也很难理解
技术总是会有我们的价值观植入其中 这不仅跟技术相关 也关乎道德 所以对于置入其中的东西 我们必须非常谨慎
现实是这是个由人类、由我们创造出来的算法 将我们看重的价值观 赋予到我们创造出来的代理身上意味着什么? 让这些人工智能系统 看起来这么像人类 使它们能够捕捉人类的情感和理性的目的何在 因为它们其实也在利用人类的弱点 这些系统的情感和思想 基本上都来自人类生成的数据 不论好坏 目前这场由人工智能引发的技术变革 跟工业革命有相似之处 工业革命是一场令人难以置信的取代过程 编剧工会罢工! 编剧工会 把人工智能留在科幻里 停止人工智能! 我们必须考虑谁将被取代 以及要如何给予他们支持 这项技术的到来比世人所想的或者说 法律总顾问兼治理主管 托马斯卢 甚至比我们18个月、24个月前所想的要快得多 所以这是一次巨大的机会 令人极为激动 但同时也是重大的责任 它发生得太快了
我们该如何管控它? 我们如何决定什么可以 什么不可以? 人工智能生成的图像变得越来越复杂 深度伪造 利用人工智能生成虚假信息 并操纵人类心理的问题 只会更加恶化 选举中的人工智能:对民主的威胁 通用人工智能即将到来 不论是否是在DeepMind中诞生
我们该如何管控它? 我们如何决定什么可以 什么不可以? 人工智能生成的图像变得越来越复杂 深度伪造 利用人工智能生成虚假信息 并操纵人类心理的问题 只会更加恶化 选举中的人工智能:对民主的威胁 通用人工智能即将到来 不论是否是在DeepMind中诞生
它的到来无可避免 所以我们最好建立起机构来保护我们 这需要世界各国协作 而且我担心 人性会越来越差 而不是越来越好 我们需要更多人 认真对待并思考这件事 是的 这很严肃 让我很担心 让我担心 是的 如果你收到一封邮件说 一个优于人类的外星文明即将抵达地球 各国政府将召开紧急会议 我们将加班加点地想出应对之策 通用人工智能的到来 将是我们人类面对的最重要的时刻
我的梦想是在实现通用人工智能的路上 我们会创造出对人类有用的 革命性技术 这就是我想通过阿尔法折叠系统去实现的东西
我认为现在比以往任何时候 都更需要解决蛋白质折叠问题 这真的很难 2019年 但我会研究到底 绝不放弃 从这里开始 我们需要加倍努力并尽快实现 我觉得我们不能再浪费时间了 阿尔法折叠更新 所以 我们要组建一个蛋白质折叠突击小组 组长是约翰 是的 我们见识过了阿尔法… 我们会尝试一切 很多很多东西 目标是证明我们能解决这整个问题 我觉得要做到这一点 需要结合一些行业知识
我们有些优秀的工程师在做这项工作 但他们没有接受过生物学训练 作为一名计算生物学家 在我最初加入阿尔法折叠小组时 我并没有立即就对什么事充满信心 研究科学家 凯瑟琳图尼亚苏维纳库尔 比如我们会不会成功 生物学不可思议地复杂
就如同一座非常遥远的山 我开始研究潜在温度 看看我们能不能 作为小组里为数不多从事过生物学方面工作的人 你会感受到巨大的责任感 “我们期待着你在这个突击小组里有所成就” 这太吓人了 突击室 但我想来这里的原因之一 就是做重要的事 这是缺失物的数量 那利用 你所掌握的物理知识呢? 用那个作为数据来源? 但如果那是系统性的 不过那样就不对了 如果那是少见的系统性错误 你可能会学习到那种系统性错误的物理知识 小组已经在尝试想出多种方法来…
我们的目标是生物学相关性
所以我们重写了 阿尔法折叠用来学习的整个数据管道 不能在创作阶段强迫它 你必须给那些花朵绽放的空间 我们赢了CASP 然后又回到画板上讨论有什么新的想法 我会说他们花了点时间 才回到之前所在的位置 但带着新的想法 接着 现在 我认为 我们看到了这些新想法的优点 它们可以更深入 对吧? 所以这是个非常重要的时刻 我已经看过那样的时刻很多次了 但我现在知道这意味着什么了 而且我知道现在该施压了 增加侧链可以提高直接折叠 这带来了很大的进展 -我们来具体说说 -太好了 过去四个月 我们取得了巨大进步 阿尔法折叠小组组长 约翰江珀 在CASP13期间 我们得花一两天才能折叠其中一种蛋白质 研究科学家 理查德埃文斯 而现在 我们一秒就能折叠数十万种 是的 简直难以置信 这个模型的速度要快上好几个数量级 与此同时 质量上也要更好 我们让许多结构达到了高精度水平 我们正在快速提升系统 开始真正触及问题核心 干得很棒 我们的状态看上去不错 还剩下五六周时间吗?是六周吗? 什么…你们的计算能力够吗? 我…多多益善
我之前会为CASP感到紧张 但随着系统开始运转良好 我现在没之前那么紧张了 感觉最近事情有了新进展 一切都会好起来的
2020年 首相宣布了英国有史以来 针对国民生活最严格的管制 我必须给英国人民一个非常简单的指示 请你们务必待在家里 感觉我们像是在科幻小说里一样 我给父母送吃的 确保他们跟外界隔离并且是安全的 我觉得这突显了 人工智能辅助科学的巨大需求
你一直都知道类似这样的事是有可能发生的 但从没有人真正相信 它会在自己的有生之年发生 阿尔法折叠面谈会 -你在录了吗? -是的 -好的 大家早上好 -嘿 好的 CASP已经开始了 整天穿着睡裤坐着真好 我以前从没想到我会住在一栋 同时发生这么多事的房子里 我竟然在房间里尝试解决蛋白质折叠问题 而我的丈夫则在另一个房间里试着让机器人行走
到目前为止 我们在CASP拿到的最难的蛋白质之一 是SARS-CoV-2蛋白 名为ORF8 ORF8是一种冠状病毒蛋白 它是抑制免疫系统的主要蛋白之一 我们非常努力地改进我们的预测 非常非常努力 可能是在单一目标上 花费时间最长的一次 直到我丈夫说 “现在已经是午夜了 你得上床睡觉” 所以我想今天是实行封锁的第102天 我女儿在写日记
现在你可以随意外出 我们收到了最后一个目标 对方说他们不会再发送 属于我们这个CASP类别的目标了 所以我们要确保我们能得到最好的答案 一开始公布结果 我就坐下来开始看 CASP联合创始人 约翰穆特 有谁的蛋白质结构最接近正确答案 -你好 -你好
难以置信 CASP终于结束了 我觉得至少该举杯庆祝了 我不知道大家是不是都有杯子可以举起来 如果没有 那就举起你的笔记本电脑 我过一分钟可能会发表讲话 我觉得我该那么做 但我不知道该说什么 所以让我想想 我觉得应该 阅读电子邮件
当约翰在小组交际时说 “我要读一封邮件” 我心想:“哇 约翰 你可真会逗乐” 我们现在居然要读一封邮件 这是我今天大约四点时收到的
发件人是约翰穆特 我把它读出来 邮件里说:“我想你们知道 “你们团队在CASP14中表现得非常出色 “不论是相对于其他组 “还是在模型的绝对准确性方面” “恭喜你们完成了这项工作 “真的非常出色” 结构非常好棒 非常非常棒
半个世纪之后 我们终于找到了蛋白质折叠问题的解决方案 解决方案 当我看到这封邮件 读过之后 我心想:“哦 天啊!” 我妻子问我:“一切都还好吗?” 我给我父母打电话说:“嘿 妈妈 “我有事要告诉你 “我们做了一件事 可能是件大事” 当得知CASP14的结果时 我大吃一惊 我太激动了 这是个我之前认为 我这辈子都无法解决的问题 阿尔法折叠 下一步 现在我们有了一个 可以供科学家实际应用的工具 这些人问我们 “我有这种和疟疾有关的蛋白质” 或是跟某种传染病有关 “我们不知道它的结构 “我们能用阿尔法折叠来解决这个问题吗?” 我们可以在一个月之内轻松预测出所有已知的序列 在一个月之内预测出所有已知的序列吗? 对 轻轻松松 十亿 二十亿 而且它们… -那我们为什么不那么做呢? -没错 -我们应该经常那么做 -我是说 那样要好得多 我们为什么不那么做? 所以这是其中一个选择 -没错 -有这个… 我们应该…这是个好主意 我们应该运行现存的所有蛋白质 然后再发布出去 之前怎么没有人提出这个建议? 我们当然应该这么做 我们为什么要考虑提供一项服务 然后人们提交他们的蛋白质? 我们只要把所有蛋白质折叠
然后把结果公之于众就行了 谁知道从中会有多少发现? 戴密斯给我们打电话说 “我们想将这个公开 “不仅确保代码是公开的 “我们还要让所有人 “都能便利地获得这些预测结果” 这真是太棒了 就如同拉开窗帘 看到整个蛋白质结构世界
他们公布了两亿个蛋白质的结构 这些是馈赠给人类的礼物 在阿尔法折叠公之于众的那一刻 我们将不再是阿尔法折叠故事中 最重要的人物了 不敢相信全都发布了 我的天啊!
在日本有很多活动 我们目前有655个用户 我们目前有十万个并发用户
今天太疯狂了 这是你们所有人特别努力的成果 我们会一辈子都记住这些时刻 我为阿尔法折叠感到兴奋 对我的研究来说 它已经推动了很多进展 而且这还只是开始 我的猜想是 每一项生物和化学成就 都会在某种程度上与阿尔法折叠有关 DeepMind利用人工智能攻克 被忽视的致命疾病 英国广播公司 新酶素的发现可能有助于 应对塑料污染危机 AZO材料 DeepMind人工智能预测数百万有害的 基因突变 《硅共和国》 阿尔法折叠人工智能研发 可以帮助治愈癌症的分子注射器 《科技时报》 阿尔法折叠的应用是一个标志性时刻 一个令人无法忘记的时刻 因为世界得以改变 阿尔法折叠是人工智能史上最重要的成就 《福布斯》
2023年 如今所有人都意识到了 我和谢恩20多年来所知道的事 那就是人工智能将成为人类 最重大的发明 列车很快就要到达终点站了
创新和能力的步伐正在加速 就像我们推下山坡的一块巨石 现在它不断加速
我们现在正处于人类历史的一个十字路口 人工智能有可能在各方面改变我们的生活 英国人工智能安全峰会 它的重要性不亚于电的问世 英国人工智能安全峰会 我们应该研究科学方法 并试着以一种严格的方式 去理解每一步 人工智能:为公众利益服务 这是一个重大的机遇时刻 利用这项技术 可能会让我们所知道的一切变得黯然失色
嗨 阿尔法 嗨 这是什么?
这是棋盘 如果我是白棋的一方 你会建议我怎么走棋?
我会建议你把你的棋子从E2走到E4 如果你是黑棋的一方 你现在会怎么走?
我会采用西西里防御 是个不错的选择 谢谢 你现在看到的这个是什么?
这是个铅笔雕塑 如果我移动其中一支铅笔会怎么样?
如果你移动其中一支铅笔 这个雕塑就会散架 那我最好别动它 这或许是个好主意 通用人工智能现在蓄势待发 显然 下一代将生活在一个因人工智能 而发生根本变化的未来世界 如果你想负责任地对其进行管理 那每一刻都至关重要
这是我一生一直为之奋斗的时刻 这是一个很好的思考游戏 2024年 戴密斯哈萨比斯和约翰江珀 因蛋白质结构预测 获得诺贝尔化学奖 翻译: 杨婕
Loading video analysis...