【人工智能】OpenAI激进押注基础设施 | Sam Altman A16Z访谈 | 三个战略 | 错误反对垂直整合 | Sora的爆火 | AI科学家 | 规模扩展上限 | 能源和开源
By Best Partners TV
Summary
Topics Covered
- 垂直整合加速AGI使命
- Sora铸就世界模型关键
- 未来界面视频加感知硬件
- 两年内AI科学家发现突破
- 能源瓶颈太阳能核能主导
Full Transcript
大家好,这里是最佳拍档,我是大飞 最近OpenAI的热度不小 一边是火爆出圈的Sora 2 另一边是各种引人注目的投资合作 而且还在几天前的开发者日上发布了一大堆新品 人们不禁要问了 OpenAI这是要干啥呢?
背后又有什么样的逻辑呢?
关于这些问题 OpenAI CEO Sam Altman在a16z的最新采访中一一做了回应 他不仅详细阐述了OpenAI的三大核心战略 而且也提到了Sora 2、未来人机交互界面等热点话题 甚至还直言自己天生就不是一个适合管理公司的人 那Altman究竟在这次访谈中都说了什么呢 今天我们就来简单的回顾一下 一上来
a16z合伙人埃里克·托伦伯格Erik Torenberg发出了一个疑惑 OpenA作为四家公司的组合 包括一家消费技术公司、一家大规模基础设施运营公司、一家研究实验室 以及一家从硬件到应用集成的新公司 背后的考量究竟是什么呢?
奥特曼对此表示 一切的核心目标主要有三个 OpenAI希望成为人们的个人AI订阅服务 为了支持这一点 OpenAI还必须构建海量的基础设施 而最终的使命在于构建对人们非常有用的AGI 当被问到OpenAI的基础设施 是否会卖给其他公司使用时 奥特曼表示目前只支持自用 未来就不好说了
紧接着Erik提到了一件早年间的趣事 早期OpenAI被问到商业模式的时候 奥特曼曾经用玩笑般的口吻回复 我们会问AI,它会为我们解决的 虽然这个答案 当时在外界听起来有点可笑 但是后来AI能力的进化确实也让有目共睹 甚至到了现在 奥特曼自曝也会经常问AI一些关于组织运营的问题 而在这一次的访谈中
他再一次强调了基础设施和研究的紧密关系 研究能够让OpenAI能够做出出色的产品 而基础设施能够让OpenAI进行研究 这就像一个垂直的堆栈一样 奥特曼表示 自己曾经一直反对垂直整合 但是现在他认为自己错了 他解释说 虽然经济理论倾向于公司只做一件事 但是在OpenAI的案例中 为了实现使命
他们必须做比原先想象中更多的事情 他还引用了iPhone的例子 称iphone是科技行业最令人难以置信的产品 并且指出它是极其垂直整合的 随后 谈话的话题转到了最近火出圈的Sora身上 虽然Sora很好玩 但是还是有不少的网友提出了质疑 为什么要把宝贵的GPU投入到Sora上呢?
对此,奥特曼是这么回应的 虽然Sora表面上看似乎与AGI不相关 但是他敢打赌 如果他们能够建立一个“真正出色的世界模型”, 这对于AGI的重要性将超出人们的想象 就像人们或许会认为ChatGPT与AGI的关联不大一样 但是实际情况是 在ChatGPT出现以后 当人们再去谈论AGI的时候
不会再直接说“这不可能发生”, 或者“我们不在乎”了 所以说,它对于启迪心智非常的重要 社会和技术必须共同演进 不能等到最后才把东西扔出来 整体而言 关于将Sora融入OpenAI战略的理由 奥特曼给出了这样几点说法 一、制作优秀的产品是很酷的 人们喜欢Sora; 二、为了共同演进
让社会“尝到即将发生的事情的味道”很重要; 三、世界很快就必须应对令人难以置信的视频模型 并且整个社会将经历一些调整; 四、让世界迅速了解视频的发展方向非常重要 因为视频比文本有更多的情感共鸣; 五、Sora将帮助OpenAI推进AGI的研究; 六、并非所有的事情都只看重效率
沿途也必须有一些乐趣和喜悦 不过说归说,奥特曼也还是透露了 整体上投给Sora的计算资源只是一小部分 另外值得一提的是 自从Sora 2发布后 国内外的社交网络还掀起了一股 以生成奥特曼为主角的视频的整活儿风潮 对此奥特曼还专门发了一条帖子回应 言语之中不乏苦笑无奈
说到视频模型,Erik顺带问到 奥特曼在8月份 曾经说过模型已经在聊天用例方面达到饱和了 那么未来的交互界面会是怎样的呢?
对于这个问题 奥特曼首先做了一番澄清 他表示当时自己是在非常狭隘的意义上 谈到聊天问题 也就是说 如果你只是想进行最基本的聊天式对话 那么它已经很好了; 但是聊天界面能为你做的事情 这个还远远没有饱和 在他的设想中 未来的界面会包括两部分 一是像Sora那样实时渲染视频的世界模型;
二是一些新的环境感知硬件设备 它们能够真正的理解上下文 并且知道什么时候向用户展示信息 而当被问到“未来几年内 模型将能够做到今天做不到的什么事情?
”时,奥特曼兴奋的表示 他自己最看好“AI科学家”。
他指出 图灵测试的概念已经“飞快地掠过了”, 在他看来,图灵测试的等价物 一直是AI能够自主进行科学研究的时候 就像他们第一次在GPT-5上看到的例子一样 并且他还预测,两年内 模型将承担更多的科学工作 并且做出重要的发现 而时至今日 奥特曼表示自己最大的惊讶 就是“发现了很多新东西”。
他曾经以为 OpenAI偶然发现了Scaling Law这个巨大的秘密之后 就不会再有这么幸运了 但是深度学习这项技术持续的给予了他们奇迹 他说道 当我们获得推理模型的突破时 我当时认为再也不会有那样的突破了 但是没想到这项技术能如此出色地运作 这似乎太不可思议了 但是
这也许就是当你发现一个重大的科学突破时的感受 如果这项突破真的是非常大的 而且是相当基础性的 那么这种感觉会持续有效 而至于大语言模型能走多远?
奥特曼充满自信的表示 我们能够用当前的技术 制造出寻找到下一个突破的东西 顺带一提,奥特曼还承认 他们最初认为 数十亿人都想和同一个AI说话的想法 是非常天真的 在谈话中他直接表示 个性化确实是终极答案 理想情况下 AI会通过与用户的短暂交流 来了解他们的喜好并且自行推断
但是在短期内 用户可能只需要选择一个预设的个性就好了 接下来 奥特曼也回应了OpenAI最近与英伟达、AMD和Oracle等公司进行的合作 他的原话是 我们决定是时候进行一次非常激进的基础设施押注了 因为他对摆在面前的研究路线图 以及使用这些模型将带来的经济价值 从未如此的自信过 基于这个信心
他也意识到了OpenAI需要得到整个行业、或者行业中佼佼者的支持 这涉及到从电子级别到模型分发 以及介于两者之间的所有事情 他还表示,OpenAI将与更多的人合作 让大家期待OpenAI在未来几个月内的更多动作 面对信心爆棚的奥特曼 主持人话锋一转 问到了他对规模扩展上限的问题
奥特曼随即也稍微冷静了下来 承认“限制肯定是有的”, 但是如果他们对模型能力发展的预测是正确的 那么限制离我们今天所处的位置 还非常遥远 他继续补充说 即使OpenAI只能拥有如今的模型 他们也会继续扩大规模 但是如果真的只有今天的模型了 那么他们也许不会如此的激进 另外
当被问到OpenAI如何在产品和研究之间分配资源的时候 奥特曼表示,当存在资源限制的时候 几乎总是会优先将GPU提供给研究 而不是支持产品 因为基于构建AGI的这个终极目标 研究总是享有优先权 最后,在采访的不同阶段 奥特曼还零零碎碎提到了自己与AI的关系
他表示,其实自己打小就是“AI迷”, AI始终是他想要做的事情 大学一二年级的时候 他曾经在AI实验室工作 并且学习了物理学和计算机科学 不过在那个时候,AI对外界来说 还是个完全不起作用的东西 并且最初当OpenAI团队开始弄明白了深度学习和Scaling Laws的时候 整个领域和投资者都“非常痛恨它”,
认为这不是一个吸引人的解决方案 另外 他还谈到了自己从投资者到CEO的职业角色转变 他坦承自己 天生就不是一个适合管理公司的人 相比管理一家公司 他认为自己还是更适合做投资者 在他看来 投资者更倾向于理论上的市场效率 即每个公司只做一件事 而且通常是一种“好的感觉”; 而运营一家公司
则需要处理组织动态、冲突解决 以及各种繁琐的细节工作 常常是一种“坏的感觉”。
包括早期管理OpenAI的时候 他表示自己的“实际运营经验非常少”, 他甚至开玩笑的说 简直不敢相信自己还在经营着这家公司 当然了 他也表示那是他职业生涯中“最有趣的几年”, 得以看到顶尖人才们进行的、惊人的历史性工作 最最后,除了以上这些 奥特曼还提到了一些关于能源和开源的话题 我简单总结一下 首先
他认为能源是AI最大的瓶颈之一 如今,AI与能源已“合二为一”, AI的指数级增长将依赖于更廉价、更丰富的能源 他预计 短期内美国新增的能源将主要来自于天然气 但是从长远来看 他认为主导的能源将是太阳能加储能 以及核能 不过,他所指的核能 包括了小型模块化反应堆SMR
以及核聚变在内的整个核能技术栈 其次,他批评了西方长期排斥核能 是一个令人难以置信的愚蠢决定 核能的推广速度 取决于它是否具有完全压倒性的经济优势; 第三,他认为开源是好的 但是他也担忧 像DeepSeek这样的中国开源模型 主导市场会带来一定的风险; 最后,他认为AGI的到来是连续性的
而非一个类似于奇点大爆炸的时刻 好了 以上就是Sam Altman这次访谈的主要内容了 那么大家是怎么看待奥特曼的这些观点呢?
欢迎在评论区留言 感谢收看本期视频,我们下期再见
Loading video analysis...