LongCut logo

E231|从B2B到A2A:Agent新基建,如何让“一人企业”做全球生意?

By 硅谷101播客

Summary

Topics Covered

  • B2B采购时间从5天缩短到1天
  • 30%-40%的中小企业是单人企业家
  • 单位Token的智力密度决定产品成败
  • AI产品经理要能预判6个月后的模型能力
  • 面对新模型毫无感觉才是最危险的

Full Transcript

Hello 大家好 欢迎收听《硅谷101》 我是泓君 随着AI Agent越来越智能 未来会不会出现一人公司 想象一下 当你要开一家线下的礼品店 Agent里面有一个专家团 可以帮你去做选品 运营 打跨越语种的电话 管理供应链 一个人就可以面向全球做生意

今天我请来了 阿里巴巴国际业务部的总裁张阔 他从一个大厂核心业务的决策逻辑 来分析一下 他是怎么样把阿里26年的经验 做成了一款B2B的AI工具 叫Accio 目前已经拥有1000万的月活用户 全球B2B业务的交易额 高达30万亿美元 但是数字化的渗透率

还有很大的空间 大家都知道 跨境B2B业务 是阿里巴巴的商业原点 AI能不能撬动那个 互联网都没有办法改变的 庞大的存量市场 成为一个新的增长点呢 这既是一个AI如何 去重塑B2B贸易的典型案例 也是在OpenClaw Claude Cowork 这些新技术引发剧烈变动的周期中

一个掌舵人的决策逻辑 张阔也提出了一个 非常有意思的判断 面对新模型 你的公司是兴奋 焦虑 还是毫无感觉 最后一种才是最危险的 下面就请收听我与张阔的对话 Hello 阔 你好 你好 最近我知道GTC期间您也在硅谷 要不要聊一下 您在硅谷最近的一些感受

因为现在大家有一个问题 就是觉得国内会有一点点信息焦虑 但同时大家又觉得 国内的信息还是挺快的 您觉得 你来了硅谷以后 硅谷跟国内AI的发展 给你的体感上会有什么不一样 我觉得从硅谷跟国内比 可能投资人的生态 和整个创业者的生态 还是有比较大的差别的

我自己跟创业者 和我们自己的最终用户 跟他们聊得比较多 我觉得这可能也分两个层面 一个就是创业者生态 它的多元化 我觉得可能看到得更多一点 比如说在美国 我们除了说现在所有的创业 可能都跟AI有关以外 AI相关的产品的支撑 就是AI底层的这些基础设施

其实大家也投入非常多的内容 也非常多分层的 生态位里边的角色出现 你比如说像TogetherAI Fireworks 这已经规模比较大了 它的存在就是要帮助上面这些应用 更容易地获取模型 更低成本地去做推理 再往上层面就是做各种各样的

比如去赋能AI产品的一些 小的构建型基础设施 比如说做语音到文字等等 你感觉好像是大模型 前面会去做这些方向 但是就是有非常多的小公司 在某些垂直领域里边 能做得比别人快一步 永远你感觉在推土机前面 几十米在跑 但它一直能保持一定的身位

并且也能在这个大的环境里面 有一定的生态位 很多的企业就愿意用这些中小企业 提供的某一个角度的技术领先产品 我们也跟很多这种公司在合作 比如它的语音转文字 就是转得非常好 无论是时效还是准确性等等 它自己也是一个独立生态 有哪些软件 比如我们合作的有叫Whisper Flow Whisper Flow 这个很好

对 跟我们的Accio 和阿里巴巴.com也有合作

和阿里巴巴.com也有合作 因为我们现在也是多模态的 输入内容的查询的增速可能是100% 更多的人愿意一段语音 拍张照片 发个视频上来 然后找到相关的商品 我们也要在这个方面 把体验打磨到最好 所以也要跟最好的硅谷公司合作 第三类就是垂直应用象限的 现在硅谷有一些讨论 说AI上来之后对SaaS等等

可能有影响 我觉得这个可能也分两面看 对于SaaS这种商业模式 无疑基于Token Base 基于使用的这种计量方式 跟原来基于坐席的计量方式 比起来可能还是一个更优的 下一代商业模型的基础 但是也有非常多的SaaS公司 我看到它比较成功的转型 也是因为有AI的加持 让它的产品比原来的产品更好用

比如我们最近也看了一家 帮助这些连锁的线下超市 包括提供食品的餐饮连锁 去做小时工招聘 你比如这个蓝领 要跟原来文本做交互 通知你几点来 人家都不乐意 到场率非常低 现在跟一个Agent去做交互 这Agent跟他讲好所有的事情 你要穿什么样的衣服来 你要怎么去报到 车停哪 你病假的情况是什么样的 干多少小时

就可以给你去记社会保障等等 就它的了解更多 于是它的到场率就更高了 所以你不能一概而论 反正这出来了 于是你就都不好 那也不是 对 这是我最近听到最好的一个观点 其实只要你用得好 它可能反而是一个利好 关键都是在于人怎么用 没错 我觉得在整个硅谷层面 还是看到全世界各地的人

包括全世界的钱都向这去涌入 你说国内焦虑 这也很焦虑 每天晚上 比如说搞一个小的路演 Road show之类的 就请500人可能1000人来 最后门都关不上 从平时到周末 大家都是这个情况 还是有非常多的想法涌出 第二个 可能要离开硅谷 情况就又不太一样了 包括北美也是一样 它可能核心关心的还是

到底产生什么价值 就你刚才讲Token经济 这也不理解到底是什么 但对于中小企业 它一定是理解ROI是什么 什么东西能给我带来价值 这个“带来价值”本身 对他们可能是个更重要的事情 现在大家还是在一个 要充分地去论证和推进 怎么能把底层的Token 变成一个真正商业价值的过程

对 您来的这周正好是GTC的这一周 也是硅谷最热闹的这一周 我注意到这次在Jensen Huang 他的主题演讲上 包括在他开源的论坛上 他其实提到最多的一个词 就是OpenClaw 我可以想象 这个帮他带来了很多的算力需求 但是确实 连他都说 他觉得中国现在大家已经开始 在比赛“养龙虾”了

中国对“龙虾”的热度 其实是比美国人的热情要更高的 上次其实我们俩吃饭也聊到 您觉得在这个时间点上 真正应该关注的是 Anthropic的Cowork 而不只是OpenClaw 可不可以展开讲一讲 好的 我先讲一下前面这部分 因为Jensen Huang这次可能核心的 大的逻辑还是想讲Token经济

因为确实从芯片的角度来讲 对于单Token的算力 包括成本 还是指数级下降 在这个基础上 可能会衍生出很多应用 OpenClaw可能就是 在这个大的基础里边 最近比较现象级的应用 问题就是 因为OpenClaw还不是一个 非常简单易用的开箱即用的产品 要把它东西配置好

变成一个能解决你问题的产品 还是相对对技术有点要求 这个门槛也挡住很多人 当然更重要的是 你到底能产生什么价值 长期留存下来的工作流 可以帮助你解决问题 但如果这个东西 留住的工作流非常有限 可能过一段时间你会看到退潮 在硅谷 我觉得Claude Cowork 这个设计范式也非常吸引人注意

至少有一段时间 每做一个插件 可能股市都会受一些影响 虽然它还在一个研究预览版的早期 但是能看到非常多的下一代的 工作台或者是Agent平台的影子 它分层的开放架构 它产品的设计体系 包括因为它本身是 基于Anthropic的模型 它跟Claude模型之间的 磨合的匹配度还是非常高的

对 您刚刚这段话启发了我 是不是OpenClaw 更适合2C的应用场景 因为我觉得从产品设计上来说 你其实只要把它接好 我在一个聊天的对话框里 告诉它一个事情 它就可以帮我去爬网页 包括把音频转成文字 甚至比如说我们的这个播客 假设录音出现了一些瑕疵 它还可以帮我去修音频 补瑕疵 去回声 但是Cowork它是不是

更适合一个2B的工作场景 因为我觉得大家在用AI的时候 有两种思想一直在争论 我们到底应不应该 把很多的工作分步骤来解决 因为很多人认为 凡事我还要一 二 三步 每一步我告诉你怎么做的 就证明人还在控制这个流程 它的思想就还不够AI原生 但是反过来想 如果我真的是一个企业

我要真的把整个AI 运用到我的播客制作中 我需要有一个非常明确的流程 告诉它 一 二 三你要做什么 且你每一步的准确性都要达到 就你不能是一个 给我质量不能保证的产品 所以我在想这两个产品 它是不是其实对应的 还是一个不一样的工作范式 OpenClaw 因为它本身开源 和泛化的能力比较强

不基于任何一个模型 因为它本身下面可以接多个模型 可以接多个工具等等 有人对它挑战得比较多的 也是在这里边 因为开放性过强 以至于你进去到底做什么做得好 它的整个强化学习怎么设计 因为它其实开放的范式 到底什么东西做得好 怎么能记住这个做得是好的 这点还是需要花比较大的时间

去磨合的 包括它的安全性的问题等等 Claude Cowork 我觉得这个产品设计的面向对象 可能更清晰一些 其实就是Knowledge Worker 知识工作者 最开始比较典型的类型 就是开发人员 程序员 然后可能是分析师 做研究的 做金融的 律师等等 就是原来需要大量的

跟邮件和Word Excel 以及一些互联网的信息 去做交互的这个过程 也就是对于那些问题 其实处理得还是比较好的 然后你说是一次性都处理完 还是一步一步来 我觉得这两个可能还不是一个 核心的分野 因为这最Agentic的工具 做得比较好的事情 它其实是所有工具的工具

不同的人用这个产品 最后你肯定用出你自己的样子 因为你想要去完成的事情不一样 所以你会在每一个步骤上 设计和给它校正 就这个步骤做得是不是对的 如果对的进到下一个步骤 否则的话 你所有的步骤 可能缠在一起 你假设要做一个播客 要搞18步 每一步有误差10% 你最后90%的18次方 那你基本上最后是个不可用的结果

就是你每一步要去 跟它去做Verify 验证 一定要把核心的步骤 差错率搞到最低 你用你自己的 衡量这个事情成功的标准 你这个指标是什么样的 就是大家基于自己的专长 去告诉整个Agent工具这个产品 最终你的输入和输出 要符合这个标准 那就是一个好的结果 然后AI不断地去强化学习这个结果

最后产生一个你更能接受的工具 这个过程 如果不是开放式的 其实AI很难去衡量 中间哪一步做错了 它一定是 你有办法跟它去做交互 告诉它哪一步 你能够把它做得更准确 这个工具最终 才能给你起到最大作用 但是 它一旦学会 接下来的推理过程和执行过程 就很简单 单位Token产生的经济价值会更大

要让AI去做到准确 这个事情就很难 它是一个门槛很高的事情 没错 而且不同的行业 我觉得这个stake(风险)是不一样的 刚才比如讲OpenClaw 如果帮助你每天去收集一些 外部的信息 我觉得这个可能是一个阈值的事情 收集得准还是不准 是不是符合你胃口 这个事情 它可能是一个stake

你要基于这个信息去做量化交易 那就是下一个stake的事情 如果你需要这个信息 指导你未来一年 或者更长时间的生产作业 对你的整个生意的ROI 产生很大的影响 那又是下一个阈值的事情 对于每一个不同的领域 产出的期待阈值不一样 你对工具的使用方法 包括工具本身 工具背后这个模型

我觉得都是需要重新设计 才能更好地发挥作用 对 今年我注意到 你们去年推了一个叫做Accio Work 它是帮很多的外贸2B的厂家 解决自己垂直领域的问题 然后用AI来做 今年我知道你们的这个软件 很快也要升级了 你能不能讲一下升级在哪些地方

因为这一两年AI发展得特别快 大家在这种非常快的节奏里面 你是怎么去考虑你的迭代 以及你现有业务跟传统业务的平衡 好的 首先我们当时也做了一个推演 就是B2B的生意 未来可能都会走向A2A 就是Agent to Agent 我们今天其实是 两个平行的业务系统

有一个就是市场平台 就阿里巴巴.com 阿里巴巴.com自己

阿里巴巴.com自己 它的所有这些搜索 沟通 推荐 交易 物流等等 整个这套体系 其实也在快速地用AI重构的过程 原来买家从搜索一直到交易的过程 可能跟最早的搜索引擎 包括电商平台很像 今天你去基于阿里巴巴.com 基于它的AI模式去做事情 你就觉得它也是一个

类似AI原生的产品 非常多的交互是你跟AI去做交互 让AI帮你去筛选大量的信息 帮你推进整个订单的流程 帮你去做最好的物流 包括支付条件的建议 最后帮助买家跟卖家 快速完成线上的交易 另外一条线就是Agent to Agent 我们去年推出的产品叫Accio

就是Accio.com或者Accio.AI

就是Accio.com或者Accio.AI 到今年3月份的月活跃用户 已经到1000万 它还是一个月度环比增长速度 非常快的产品 它核心想解决的 其实是围绕采购这一端的问题 但是采购有向前跟向后延展的部分 比如说它最开始采购的起点

是先找到下一个产品是什么 尤其对于中小企业 就是定义它下一个“杀手”的产品 到底是什么 这是非常重要的事 如果这个事搞对了 可能企业的现金流和业务 就走入正轨 如果要是搞错了 可能就非常多的时间 非常大的试错成本 所以一般从研究开始 到形成这个想法 就Ideation

再做产品的设计 Design 然后再进入到 供应商的筛选 沟通环节 然后再进入到交易的流程 然后进入到商品的运输 售后等等这些流程 Accio是希望前面把整个采购 更大程度地自动化 通过AI帮助它提效 我们看到 基于这种Agentic Base的模式 它从输入一个想法

比如输入一个咨询开始 到最终建立一个 比较稳固的商业关系 基本上它的时间 是缩短到原来的五分之一 就是原来你用一个礼拜 要去办这件事 我专指采购沟通这个过程 你现在可能一天之内就可以完成 因为原来有语言的问题 时差的问题 原来买家跟卖家之间的设计 没有AI的帮助 相对来讲

可能是一个比较潦草的想法开始 然后卖家帮助你逐步地去完善设计 今天AI可以帮助你直接形成设计包 形成一个非常专业的 technical的设计文档 包括图片 文字 3D等等 这样的话 买家跟卖家的交互 就可以非常高效 顺畅 也比较专业地去完成 对 这个采购我理解成 它其实就是一个卖家

去定义产品的能力 以前是怎么做的 为什么它的整个采购过程 会需要五天 AI做了什么 让它可以把这个环节缩短成一天 第一步 AI包括Accio的产品 可以帮助他做的事情是什么 就是帮他去理解 或者是index(索引)全网的信息 从产生一个想法开始 你可能要做大量的

碎片化的信息的研究 就是类似的商品有哪些 类似的商品在Amazon 或者在其他平台上被研究的情况 交易情况 评价是怎么样的 它的趋势是怎么样的 大概其商品定价在什么范围 要在这个范围基础上 你要去算利润是不是合理等等 这是一个要设计产品的过程 就这个过程 原来其实也需要有大量的研究工作 然后也有一些

比如在Web2.0时代的研究工具 帮你提供一些数据等等 但这些数据你要让它做到非常 第一个 完整 第二个 非常及时性和准确性 其实在没有AI 和智能体工具的帮助下是比较难的 因为它既要做到宽度很宽 同时要做到它去读取那个网页 和当时的信息 要保证这个准确度非常准确 所以其实您指的采购

它不仅仅说我是一个想法 它还包括我的这个想法 在实现的过程中 它的供应链是不是可以支持 你的产品的设计 我们拿苹果手机举例 你要用一个什么样的钢化玻璃 然后你业界是不是 已经有这些技术了 它的设计上可不可以支持 供应链可不可以支持 是有这些环节的 我再把这个问题

稍微迁移到大模型领域一下 用你们的这个工具 跟用 比如说Claude 或者ChatGPT Gemini 它会有什么本质上的不一样吗 我理解 其实现在大模型 在做这种深度的调研上 他们也做得很好 至少我们现在的理解 对于我们自己的模型和整个工具 有四个方向的投入

我觉得是 至少当下的模型 可能做得不够好 或者我们需要在它上面 去额外做很多工作的 第一个方面就是关于信息的准确性 有一些信息非常关键 比如这些信息就包括 你最终能够达到的商品价格 即使我们今天去分析买卖之间 沟通的上下文案 合同等等 也要找到你这个商品里边 最真实的价格是什么

哪些里边可能是之前的隐藏价格 或者额外加进去的内容 你还是要找到这个市场 最好的一个方案是什么 然后有的 比如你最终要拿到这个到手价 去掉物流的费用 去掉关税的费用 这些都需要非常精确的信息 另外还有一些 就是要很多平台上的signal信息 哪一类事情能做到 哪一类事情不能做到 每天在阿里巴巴.com上

每天在阿里巴巴.com上 都有上百万的沟通 对于不同设计的想法的沟通 对于不同的技术细节的沟通 这些事情都会去形成最终对于你 整个从想法形成到设计包 这个过程中的一些 非常精确的输入跟指导 它既基于我们过去26年的积累 也基于大量的 现在积累的一些互联网的工具

其实搜索也是一种工具 索引 所有这些内容也是一种工具 这些工具 把它组合在一起 我觉得能解决第一个层面问题 就是你的信息要尽量准确 你不能说可能它100%准确 但它90%或者99%地接近这个事实 可能对于这些用户来讲 就比大模型产生的幻觉要好很多 对 定价差一点点 对商家的利润是决定性的因素

对 就要帮助他尽量准确地去 拿到这个信息 第二个方面的探索就是 你要形成一个比较有效的 强化学习的机制 就是Reinforcement Learning机制 你们怎么去做这种评估 因为强化学习里面最重要的就是 我要去评估结果 然后让它顺着一个正确的评估方式 一直去优化

所以你觉得在评估的过程中 有哪些是非常核心跟细节的点 你们怎么去评估这种 可能没有一个标准答案的问题 是的 第一个我们肯定是先要把 所有步骤里边的每一步 尽量把它搞对 因为它本身这个问题stake就比较高 它就是一个比较严肃的和贵的问题 所以用户在跟平台做交互的时候

它其实就会给非常多的反馈 就这个设计 往这个分支是好还是不好 这个技术是满足还是不能满足 这个利润空间到底是能满足 不能满足等等 它本身就会给平台很多的反馈 在这个反馈的过程中 我们就会把逻辑的链条记录下来 它本身去优化的方式就是 我们尽量让每个Token 能产生的价值更大 不要漫无目的地去做推理 或者去做搜索

按照这个方式去做 可能单位Token的经济价值最大 能产生的效率最高 这就是我们不断地奖励 这个系统的过程 第二个 在国际站有个好处就是 它能够形成一个闭环的反馈 最终你有个想法 到底最终形成了交易 还是没形成交易 你是持续去买还是说试了几次之后 发现这事失败了 就不行了 这些都是一个更长期的

可以回到这个平台里面的信号 当有越来越多的行业 越来越多的人在去使用的过程 整个这个产品可能越来越 向一个对的方向去发展 也包括它研究的方向 所以其实你撮合了更多的交易 对它来说就是一个正反馈 可以这么理解 每个行业会需要不同的 强化学习的训练方法吗 还是说现在大家的

强化学习的训练方法是一样的 细节到每一个行业 我现在可能还没有更多的信息 给你去反馈 但是2B跟2C 肯定这方面差别很大 因为它周期长 其实每一步都有很多反馈 比如这个物流价格是合理不合理 关税算的价格是合理不合理 这个商品到了用户手上 再进到下一步的访问过程中 信号的周期

包括它的长度等等都会非常长 所以我们对于长上下文的推理 可能花的精力也会更多一些 第三个 还是要有一定的 安全和可靠性保障 要确保 因为2B的 风险比较高的这个问题 信息的完整性 我们要去判断 同时每一步骤推理的严谨性 我们也要有保障 同时安全性我们也要分层去保障

就这个数据本身是安全的 我要去访问你自己的 所有的这些系统里边的 信息 数据等等 它要做沙箱上的隔离等等 再一个 因为推理的周期很长 如果出错了 我需要能够向前回滚 要确保整个推理的过程 我们要保证你的上下文 一直传递下去 最后一个 因为这个周期很长 我们下一个版本推的叫Accio Work

第一个版本就叫Accio 它是一个基于浏览器的Agent系统 Accio Work你理解是装在桌面上的 它除了从设计到采购以外 它需要帮你可以完成 你所有的日常操作 日常操作变成你要开店 卖商品 管理库存 包括去接受客服的反馈等等 这些因为有Computer-Use Brower-Use

我们可以帮最终的用户 海外这些买家 完成他的下一步 但下一步进入到售卖 售后这个环节 你可以理解 它的上下文就是无限长 从想法开始到采购结束 它可能是一个月左右的周期 接下来你可能进入到半年 或者一年左右的 整个商品销售的周期 你要把无限长的上下文的信息

分层地存储下来 有一些就像现在大模型一样 上下文 就跟人的思考一样 咱们现在对话 我就要把现在能拿到的信息 最好的方式推理展现 有一些内容 比如像多模态内容 一定要把它索引起来 之前你设计的这些产品的内容 其实对于你现在这个产品的设计 就有很大帮助 还有些信息你就是 需要的时候你去访问

比如这个产品进入到售卖周期了 有非常多客户的反馈 Feedback等等 这些信息也可以收集起来 让你在下一轮再做商业的时候 帮你去优化 最后一个方向我们刚才讲的就是 这种无限长周期的上下文的设计 以及内容的存储 所以围绕着数据的准确性 围绕着强化学习 这个奖励的机制

信息的安全 包括鲁棒性 和最后我们超长周期的推理等等 这几个方向 还是我们需要花非常多的努力 从模型和工具层面做一些突破 才能真正解决好2B的商业问题 对 刚刚这个讲得特别的完整 关于你刚刚提到的这个Accio Work 我其实还有很多问题 他们怎么去管理自己的日常工作 但在此之前有一个问题是

如果底层的大模型更新了 或者说模型的能力大规模地提升了 你觉得对你们现有的工作 跟Accio本身的这个模型来说 它是一个好事 还是说一个你需要马上执行 快速地切新模型 它是一个什么样的状态 我们期待的就是 每当有一个新的SOTA模型出现

整个这个产品 应该变得比以前更聪明 或者它的体验更好 这才能体现出 你是一个AI原生的产品 或者一个Agentic原生的产品 如果说出现新模型 其实跟你没关系 那是个更大的问题 同时 因为我们知道 整个这个产品 其实无论是在它的垂直专业度 还是它对于模型本身的要求上 还是有非常非常多的工作的

我觉得它肯定不是一个 上来一代模型 然后所有这些事情就都要重做 肯定不是这个状态 因为我们本身现在的模型 就是基于SOTA 除了千问作为我们的一个基础底座 我们在上面做很多优化以外 在多模态上做得好的模型 在编程能力上做得比较好的模型 在Agent推理能力上做得好的模型 我们都尽量地把最好的模型 在最好的应用场景里边利用起来

当Agent不断执行过程中 就是不断地去压缩Token 让它每一次的执行 可以效率变得更高 你现在是接入的 DeepSeek跟Qwen对吗 国内的开源模型主要就是Qwen 海外的SOTA模型 就是所有的这些SOTA模型 它是两个版本 就是分国内跟海外 不 国内的模型 我指的是国产的这些大模型 因为阿里本身 我们跟千问的合作关系更紧密一些

当然 Accio这个产品 现在更多的是海外中小企业在用 所以所有海外的这些SOTA模型 我们也会使用 了解 了解 刚刚你提到了Accio Work 它是一个工作流 可以帮大家管理 在订单执行过程中的各种问题 现在从商家的角度来说 他们在执行过程中 会遇到哪些问题 我知道以前他们可能是会用 各种各样的SaaS产品

去处理这些问题的 因为最近Cowork出来以后 大家也在说是不是SaaS已死 SaaS的模式在被颠覆 我觉得正好这一个环节 我们可以从你的这个产品来展开 去聊一聊大家现在的观点 跟实际企业在应用中 有什么样的差距 好的 Accio Work 如果跟原来的Accio比起来

我觉得可能有两个差别 第一个差别 我们是希望把整个 商家经营环节的闭环完整掉 原来你可以理解 我们帮助他做了所有的研究 到商品的设计 到Sourcing 采购这个环节 之后就是他日常的商业操作环节 他要开店

经营线上的店 经营线下的店 然后接下来要完成下一轮的补货 下一轮的商品设计 然后要进入到售后的客服 包括销售的环节 如果企业本身还有雇员 可能也有薪酬 财务 税务等等这些要求 我们希望这个Agent平台 第一 我们自己提供的能力 核心从原来研究到采购的全部能力

这是我们可以帮他做的 第二个 利用现在的泛化的AI能力 帮助他去经营很多 比如说开店 发布商品等等 我们现在都可以基于Brower-Use 和Computer-Use的这些能力 帮他在Shopify等等 这些国外的市场平台上去做经营 第三部分就是相对垂直领域的 比如说人力资源 薪酬 财务 税务 我们就会接入一些在硅谷

或者在美国做得很好的 这些Agent的产品 或者说垂直象限的产品 把它接入到Accio的Work里边 最终目的还是希望给这些中小企业 一个开箱即用的体验 刚才您讲的 Claude Cowork 基于一些插件 对于一些SaaS有影响 可能它的这个影响 还是集中在大企业这个层面上

对于中小企业 它可能不是若干个SaaS的问题 对于中小企业 就大部分的北美线下 无论是Nailsalon(美甲沙龙) 还是Food Chain(食品供应链)等等 你去他那一般都有一个很小的 后台办公室 那个很小的后台办公室里面坐的人 基本还都是纸质办公 就什么薪酬 什么帮他们记 他的社会保障的问题等等 记他工作了几小时这些 很多还都是纸质工作

我们今天首先能把它数字化 其次现在基于Agentic基础的产品 能让整个流程更简单 基于Agentic这套体验 至少我们觉得 跟原来的SaaS体验比起来 它是有可能做得更简化的 而且它对于每一个中小企业 它都有办法去定义 大概自己的核心流程 逻辑是什么

如果要听每个人的 你就发现 你就要给每个人都重新定制一遍 这在原来SaaS的世界 其实是比较难做到的 除非你是预算100万美金 1000万美金以上的 可能有人专门帮你去做 但对于中小企业来讲 今天你有的条件就是 你可以把你自己的成功标准 输入给这个模型 或者输入给这个Agent产品 它就基于你的这些输入 去形成一个新的工作流

专门为你完成你自己的 产品定义 产品发布 包括你自己做营销 做社媒的这个过程 而且这个过程都可以更加自动化 因为我们至少30%到40%的企业 可能就是Solopreneur 就是“一人企业” 我原来设计商品 花一个礼拜 三四天的时间 我觉得是值得 但是我后边还要花 一个礼拜 三四天的时间

去做所有其他的细节的工作 要把它发到多个店铺上去 要在多个社交媒体上发内容 要在所有的平台上回顾客的反馈 再管理库存 再去进货等等 这些事就很花时间了 我们觉得所有这些事情 也是可以基于Accio Work 把它自动化掉 大部分工作人需要做比较少的交互 就可以由AI通过多Agent方式 去协同来完成

好的 你指的中小企业 它是一个什么样的企业 比如说你说有 百分之三四十的中小企业 它是“一人公司” 这跟我理解的不太一样 因为我们以为 阿里巴巴B2B的贸易 应对的是很多的 比如说沃尔玛的 后台供应链的N个环节 如果从国际站上来讲 它的用户肯定是分层的

一年可能采购几百万美金 上千万美金的也有 包括沃尔玛跟Amazon 我去看它 也在国际站采购 他们自己也非常多的什么包装 以及自己的产品 也是在国际站上去做采购 整个金字塔结构的客户群体 也是有的 因为有非常多的比较稳固的企业 其实从最开始也是单人企业家 开始去构建的 我开始想做一个咖啡店

后来我这个商品做好了 我就变成了一个咖啡的连锁店 再去进货 我就不是给一家店进货 因为非常多的进货 整个经济的形态其实就是这样 最底层有非常多的个体经营者 在上边 个体经营者就变成了 一个比较大一点的商家 或者变成一个连锁商家 再往上就是我们大家能看到这些 比较头部的稳固的企业家 我们这边的商家其实也是一样

他很多的大客户 就是跟他伴随起来成长 所有那些企业都是发现了一个问题 然后定义一个产品 开始做采购 慢慢他这个问题确实是个真问题 然后能规模化了 那他的供应商就会跟他一起去成长 所有这些实体经济的中小企业者 就是我们这个产品核心面对的对象 所以我们今天去看 面向他们 无论你给他一个OpenClaw 还是给他一个Claude Cowork

它上面的一些产品基础的逻辑 包括它基础的开放架构 还是有点难理解的 你就今天打开一个产品 从前面到后面告诉你 这有Skills 这有Hook 这有Agent 这有Connector 这是Plugin 对 大家有点晕 对 你要是没点技术背景 你可能不理解 每一个分层到底是什么意思 我为什么要点开每个东西去配一遍 而且我觉得对实体企业来说

这些没有接触过AI的人 你让他自己去搭一个OpenClaw 都很难 第一步就卡住了 对 核心还是我们希望 这是个开箱即用 比较简单的产品 能够解决他们日常一些关键的问题 同时ROI一定是在它的合理范围内 所以你们的这个商业模式 是怎么样的 就Accio 订阅还是 Accio 我觉得是两部分 一部分比较好理解的

就是Token Base 就是我们自己有一些工具 它会去消耗一些Token 同时我们有一些三方的合作伙伴 比如税务 人力资源与薪酬 和财务等等 他们接入到这个平台 变成一个子智能体 也可以去消耗一些Token 这就是Token Base 就基于实用 但是可能设一个cap(上限) 一个月20美金 还是多少 如果过了之后可能就不用了 或者说你就用免费的额度

当然你可以基于自己的使用量 去提高自己的套餐 第二大类的事情其实就是 基于市场平台这些商业模式 因为你本身也是供求关系 那你的广告 和你的服务中间产生的费用 比如说金流 物流等等 就可以继续成为你 原来的这个商业模式 其实它是两个轨道并行 对 我觉得佣金模式还比较好理解 但是广告模式

就比如说在AI到来以后 如果大家现在比如说 我连搜索跟采购 都开始在AI软件里面去完成了的话 那传统的市场平台 它的广告会受到冲击吗 我觉得首先就是展示那种广告 肯定没有什么太大意义 大家更多的还是 基于效果的广告为主 我们现在去看到 AI 比如对于阿里巴巴.com来讲

比如对于阿里巴巴.com来讲 它两方面都有帮助 第一个方面就是它让搜索量变多了 AI让搜索量变多了 这个怎么理解 因为AI它更好地理解了你的意图 你原来可能输一个非常短的关键词 在非常多的供应商里面去找 现在你可以比较丰富地去表达 你到底想要的是什么 把你自己想要的各种参数 需求上下文限制

你把它都说清楚了 这样我就可以帮助你找到 更精准的供应商 因为你有多模态的输入 语音 还是图片等等 你可以拍一个照片 或者拍一个你自己原来做的设计包 或者是PDF上传 我就可以去理解 然后更好地匹配供应商 而且原来匹配供应商 很多是基于标题 关键词等等 现在匹配供应商都是 既基于他的商品的全部上下文信息

也包括他上传的 所有私有数据库的这些信息 那些里面更多的是他工厂的能力 证书 用户的用例等等 就是做更好的匹配 所以因为你给他的结果更好了 所以他愿意更多地 进来去搜索跟交互 第二个就是对广告本身 我们觉得也有帮助 对广告本身一部分你可以理解就是 因为搜索量变多了 供需匹配变大 能生产同一个商品

绝对不是全世界只有一个人 它可能是有非常多 比如说10个 100个能生产类似产品 给出核心价格的 这个时候我们告诉他 这是一条广告 首先他是知道的 第二个这个广告出现 它的原因是什么 它到底匹配了你哪些标准 所以这个商家 会出现在这个广告位上 这时候的买家也会有意愿 去跟这个商家交流 我们自己看到整个今年的

从搜索跟广告来讲 也是今年我们整个 增长比较快的两个轨道 我理解您刚刚提到的这一层的AI 它还是传统AI 就是基于算法的精准推荐 现在有了新型的生成式AI 就像Accio这样的一个工具 因为我昨天就直接说 我要订一个 硅谷101周边的纪念品 帮我匹配一些供应商 它下面有给我呈现很多的供应商

但是它最终还是有给我选择一两条 包括有发邮件来联系我 我理解现在我已经可以 通过这样的一个AI工具 直接完成一个需求了 当然比如说我偶尔也会 想要去网站上 或者下面很多的呈现里面去找一找 有没有设计更有趣的 更好的 但整体来看 AI匹配的需求更精准了 广告位就减少了 对 这个理解肯定是对的

刚才你那个事情也可以分两部分 第一部分就是 你想找一个周边 它帮你设计周边这个过程 肯定是个Token Base的商业模式 因为设计的过程 其实还不涉及到供需匹配 后边进入到供需匹配过程 你原来可能给你1000个结果 现在给你5个结果 这5个结果过程中 如果要做广告 那它的核心跟原来的杠杆平衡 它必须是个更精准的结果

它不能是像原来一样不精准 然后同时给你硬塞广告 这肯定没有意义 现在有一个更大的数据集 其实也验证就是Google 原来大家对它担心也是说 AI概览或者这个AI模式 会不会冲击它原来的广告 其实事实上 你从它最近这个财报来看 它既做到了用户的停留时长 和查询数变多 同时也做到了它广告的数变高

就是因为它的广告更精准 点的人更多 更多广告主愿意为这条付费 而不像原来 大家反正都是 CPC(按点击付费)都搞一堆 但是点完了之后这个用户的意图 或者跟你匹配的效率很差 对广告主来讲也是一种浪费 你觉得未来的商业模式 会变成什么样 因为我觉得这可能是一个 短暂的过渡状态

因为现在基于生成式AI的技术 你匹配给它的东西更加精准了以后 其实如果我们说按结果付费 跟这个ROI的转换 它肯定是提升的 那在ROI提升的过程中 大家都是受益者 比如说阿里 谷歌 甚至是商家 都是受益者 但是长远来看 我觉得在大家效率都提升的状况下 它是会被慢慢拉平的

然后我们也看到 新的AI原生的应用也开始出现了 像Accio 它其实就是一种 未来你觉得整个的商业模式 它会变成什么样呢 至少互联网这个时代 商业模式大概就四到五种 有一些商业模式 它也会进入到AI这个时代里边 这件事的核心逻辑 还是创造什么价值 有一些价值

比如我帮助你做了一个更好的设计 帮助你做了一个更好的 对全世界的调查 可能它这个价值比较好的衡量方式 就是Token Base的方式 不过最终大家要衡量的 赢的标准就是 我单位Token的智力密度更高 或者我单位Token产生的价值更高 那这类的服务就会胜出 它还是一个 相对来讲 是以使用量为基础的商业模式

第二个 比如拿阿里巴巴.com为例

第二个 比如拿阿里巴巴.com为例 尤其是效果的广告 从长期来讲 它可能也是一个存在的商业模式 因为你最终也有一个 供需匹配的过程 就是有人愿意为了更好的需求让利 要么我是商品上让利 要么是我愿意用广告的方式 去给他们做更多的展现 这个商业模式可能也会持续成立 第三个就是基于平台侧的 所有供应链的服务

比如说我们提供担保交易的服务 也有一定的抽成 但这个非常少 可能就一到两个点 这个担保交易的服务 它核心是类似一个保险的服务 当你跟他做了若干次交易 如果中间出现争议 平台要进来去看是谁的问题 首先平台要去给补偿 然后再去追另外一侧的问题 这个就是平台提供的额外服务

本身这个产品在供应链上 无论是在担保交易 还是你在做支付条件 还是在做物流等等 它跟原来的商业模式也是一样的 只不过你把这个规模变大了 全世界30万亿美金的交易额 从国际站今天来讲 我们大概700亿美金 其实渗透率还非常少 就是让更多的中小企业 可以参与到全球的交易里边 我们可以给他去提供

跟他现在这个世界比更高效的服务 那你就可以带来 更多的增量GDP和增量价值 所以它的商业模式有一些是 现有世界就可以自动延续到 Agent世界的 当然也有一些Agent世界里边 它基于使用量的使用 可能比SaaS的基于坐席的使用 此时此刻就是领先的 可能这种模式未来就会持续超越 或者占更大的份额 我觉得这个其实整体上来看就是

如何让这个服务跟效率再优化一层 基于现在的新技术 没错 那你觉得在这样的一个过程中 AI的核心优势是什么 AI比如说Accio这个产品 你们做 跟基于阿里的背景做 跟一个创业公司做 它最核心的优势有什么不一样 我觉得比较好理解的部分就是

因为阿里巴巴.com 是阿里集团的第一块业务 大概做这件事情有26年左右的积累 在平台侧 其实每天有上百万 上千万的 沟通 查询 交易在发生 这些都是信号 我会帮助你这个系统 去完成强化学习的过程 而且因为它可以形成一个闭环 所以在这一方面上

你能完成的事情可能效率会更好 另外就是Accio 或者是我们整个阿里巴巴.com 这个产品 其实也是背靠阿里集团 我们跟千问有比较多的合作 要确定我们整个 对于模型的理解和使用 还是可以保持一定的领先性 同时我们也会加入大量的 我们自己对于模型的 中期训练和后期训练的过程 也会注入一些数据

进入到早期训练过程 让它领先的壁垒越来越大 同时因为有更多的人用 其实这个Agentic产品也有数据飞轮 有更多的人用 它就会记住更多的工作流 更多的工具在什么情况下 可以有更好的表现 这样的话 你整个这个产品会进入到 下一个飞轮去转的过程 因为本身我们还是比较聚焦我觉得

不是跟现有的大部分AI的产品 面向同一拨客户 当然我们这些客户可能也更挑剔 换一个角度来讲 可能预算他们也更少一些 所以对于ROI会更敏感 也会推动我们 把我们整个组织 就是我们正好这个Token经济学 要跟其他人的Token经济学比起来 我们需要更加激励的是 单位Token的智力密度 和单位Token能产生的价值

我觉得这也是会不断去 推动我们这个系统 符合这个群体 能够对这个群体产生更大价值 总结一下你们的核心优势就是 常年积累的方法论 自家也有研究模型 它可以从预训练阶段 就植入这些数据 还有本身数据它也是一个壁垒 最后还有一个数据飞轮 我在听到你们这个产品的时候 我觉得跟现在的

垂直的这些模型厂商比起来 对于2B的商家 这一定是一个更好用的产品的 但是据我观察 像亚马逊 他们内部也在做类似的事情 你觉得未来 比如说亚马逊他也推出一个 B2B的这种垂直领域的AI应用 会是你们的竞争对手吗 对于我们今天想定位的这个产品

它想要解决的问题来讲 我觉得我们自己还是比较有信心 对于中小企业 从设计的产品 到自己的日常操作的过程 当然如果说未来B2B会走向A2A 就是Agent to Agent 不光是买家Agent To卖家Agent 也包括用户自己 它的多个智能体 可能也是一个协同的过程 最终可能胜出的一个方式就是

你在一些方向上做得非常好 同时又是一个高频的工具 那你成为一个Master Agent 同时这个企业还有很多 其他的Agent需求 所以子智能体需求 这些Agents之间可以互相交流 可以去协同 共同帮助这个中小企业完成服务 亚马逊能够做得比较好的 你比如说它自己的后台系统 本来就很复杂 Agent之后让它可能更管用一些 我觉得这个方向

它应该是一个比较好的垂直领域 它自己也有优势 但如果你要把它泛化到 我其实要经营多平台 我要帮助客户 去做一个更广泛的产品设计 并且我要让它利用全球供应链 我觉得这个方向来讲 我们肯定起步比较早 并且在这方面投入的精力 也会更多一些 经验也会更多一些 如果现在你自己去评估 你们做这个产品的几个 最核心的要素

跟你评估Accio这个产品做得好不好 你核心在抓的点是哪几个 因为它比较本质的问题 不是你要消耗多少Token 而是你到底能产生多少价值 一个比较显性的数据指标 可能就是留存 这个用户持续地用这个产品 帮他做更多的设计 更多的采购 那就是一个比较好的数字信号 对于他其他的日常这些工具的使用

其实也是一样 它既有广度上的我们希望定义 有更多人用 另外就是在每一个垂直的工具上 我们要有更多的任务来去衡量 这个任务最后的完成度 和用户的采纳度是高的 并且他能持续使用 另外一个层面 就是从经济的角度来讲 我还希望单位Token的智力 和单位Token的性价比越来越高 这样这个客户就可以越来越好地

以ROI的方式去使用这个产品 我觉得这些都是 我们想衡量这件事的成功标准 唯一可能不是标准的就是 一共用了多少Token 我觉得这个还是 一个比较简单的数学 一共用了多少Token 很可能大家努力的方向就是 我多让你浪费点Token 所以其实核心还是怎么样 把这个产品做得好用 我们原来 不光这个是对Agent 其实对于整个原来阿里巴巴.com

我们也是希望 能让跨境B2B 就像在线购物一样简单 你做在线购物 大家都知道是个什么体验 但是跨境B2B可能要细分 有28个步骤 每个步骤可能跟2C比起来 都要复杂很多 从你最开始形成这个想法 一直到完成整个交货的过程 因为还有国家跟国家之间 币种之间等等这些大的差异

我们就说谁先付钱 怎么付钱 能够保证你的资金安全等等 这都是在整个这大的 28个步骤跟流程里边 我们逐步帮他去做数字化的过程 简单来说 其实这个产业 整个的产业链 包括你们沉淀的方法论 这些步骤 已经非常完善了 你们是想把所有 从开始到结尾的整个过程 闭环的流程 全部提供给这些商家

没错 最近因为大家在讨论 AI跟AI原生 也非常多 你们现在在招聘中 会偏向于什么样的人 因为有一些是比较好定义和量化的 比如说关于模型的训练 关于基础设施 关于算法等等 大家对于自己需要的人才 都有比较清晰的画像 这些人进来之前 可能你自己的论文

或者你自己的研究 或者你自己在开源社区里边的贡献 就已经能说明很多问题了 这个时候可能学历 还不是最关键的问题 如果你已经能拿得出来 比较稳固的这些工作 其实我们更多的还是基于 你这个稳固的工作来去探讨 它的面试过程 可能就跟原来不一样了 面试过程就是你打开这个论文 大家来一起来讨论论文 去看你在这里面真正的

原创的思想和贡献可能是什么 另外就是对AI用得比较充分的 这些年轻人 这个事情我觉得比较难 有一个量化的定义 有一些是可以非常稳固地判断 有一些可能更多的是 基于他平时对于工具 他对于这件事情的理解 他对于未来的预判 你像产品经理 我们进来是希望他设计的这个产品 是一个面向未来6个月

模型能力的产品 那就意味着你这个人 对于未来6个月模型可能走向的方向 和他的能力要有个基础的预判 这样你这个产品在上线的时候 是可以最好地去利用当下这个能力 这要求很高 比较高 所以我们就说 也是在一个摸索的过程 因为有一些工种 慢慢地融合在一起了 你比如说原来 产品经理写产品需求文档

然后交互设计师过来画交互 然后技术人员给你做的 跟交互设计出来一模一样 这事就结束了 但这里面的问题就在 做出来跟那个交互设计一模一样 是不是好的 就很难讲 中间就开始有各种各样的 掉链子的过程 觉得他本身设计得就不合理 你给他做一个100%还原的 可能也是不合理的 今天可能三个角色 就慢慢融合成两个角色 或者融合成一个角色

那这个人就要 对这个闭环的结果负责任 但好处就是你的效率就更高了 我相信现在工程师编程的模式 跟原来肯定有质的差别 我前两天在一个硅谷创业公司 跟他们聊天的时候 外面就比较喧哗 CEO出去看了一看说 Anthropic 宕机了 确实是那天 大概Anthropic波动了3个小时 在那三个小时中

硅谷的工程师全不会写代码 也没有人编程 现在不是去那去写代码了 大家其实都是基于上下文去给输入 然后模型生成代码 而且生成得越多 其实你越看不懂 你想做代码审查等等也很困难 这时候突然这个工具不能用了 大家就恐慌 但是某一个角度来讲也是 今天肯定做工程的方式方法 跟之前比起来就有很大的差异

你现在会要求你的团队 用这些编程Agent吗 我觉得不用要求 大家肯定都在用 或者他们用的时候 你是一个什么态度 你觉得OK 结果说话 还是也会看一看大家是怎么用的 我觉得大家从方向上来讲 肯定没有人反对 这是一个未来的方向 无论是硅谷还是中国的一些大厂

还是这些创业公司 只不过可能不同的公司 在你的工程的环境里边 会有一些差异 比如我自己看到的一些 和我们自己内部衡量的成功标准 我可以分享一下 第一个核心的问题就是 你一定要给这个工程师 设计一个Agent 最上面可能是个Master Agent 这Master Agent下面 你要管理很多Sub Agent

有的是写代码的 有的读文档的 有做代码审查的 有做检查的 已经用到这种程度了 对 就是你要有这么一套Agent框架 去帮助你的工程师 去管理你这些代码 然后你要设置护栏 你这沙箱环境要有 你不要写个代码 本来是个内部用的 然后就开放到外部去了等等 这些都是很基础的问题 大家保证在写代码 代码在做审查 还在做检查的时候

还是要有相对来讲比较高的标准的 第二个就是 大家平时去做工程的环境 我看到一个公司蛮有意思的 也是个做量化的公司 做量化公司里边 本身上线的代码都是模型 各种模型在炒股票 几个研究员在一个Slack里边聊 聊到一定程度了 艾特这个Agent 说我们谈完了 你看一下 然后去写代码 这个方法很有意思

然后这Agent进来就读一下 大家想对这个模型怎么去改变 它读完了 我明白了 写个文档MD 然后去生成一段代码 我生成好了 你们来看一下对不对 有可能人去看一下 有可能人不看 就提交掉然后看结果 因为你可以保证一定量的灰度 它不会影响全局 对于整个工程的环境的改变 其实是很重要一部分 这确保你们在这个公司里边

是用一个比较适应 你们这个工程环境 和应用环境里边 更好地去写代码环境 除了工程以外 我觉得还有很多很重要的方面 刚才你提到了一个很好的问题 就是我们衡量AI的成功与否 可能有几个标准 一个肯定不会用的标准 就是你代码量是多少 你可以生成全世界最多的垃圾代码 不改变任何商业结果

这肯定是大家最不想要的事情 所以我们可能从量化上衡量 包括我们每个季度 会有300个想法 我们已经跟踪了4年 基本上我们人类产生想法的瓶颈 大概就是阿里巴巴.com这些同学们

大概就是阿里巴巴.com这些同学们 一个季度有300个主意 当然这个主意 是从OKR最开始往下去分解的 我们有目标 然后基于这个目标我们觉得 有哪些事情可以有突破 然后进入到每个季度 开始写这些想法的文档 在这300个想法 大概其会有150个上线 还有150个做不过来 所以就是按照堆栈排名去排优先级 这150个上线的想法里边

可能有50个是有效果的 没有带来的就是没有效果的 所以最终你可能从300个想法开始 最后有50个有效果 我们就希望有AI帮助 你实际上线产生商业价值 产生实际的商业价值 和客户价值的数量是不是能变多 你从50个到100个 那咱们就是100%增长 你要50个到300个 那就到人类的上限了 我们产生想法 可能也要有更好的方法

所以现在此时此刻人类还不是上限 我们的想法根本没有那么多工程 来去实现 这就是一个可能你衡量的量化标准 同样还有量化标准就是 你做的这个AI原生的产品 如果原来它没有 现在到有 比如Accio和Accio Work 这是一个从0到1的产品 是不是能快速地规模化 变成一个大家普遍共识上的成功 比如说阿里巴巴.com

其实也存在26年了 它有非常多的指标 原来这些指标有没有非线性增长 去年涨10今年你涨20 如果有这个过程 那就说明AI在这个环境里边 起作用了 有吗 我们今年EBITA(息税摊销前利润) 大概增长到18%左右 跟去年比还是一个快速增长过程 我觉得这个 你还是有非常多的地方要做对 最后加总在一起

你可能还有一个比较好的 商业上的增速 另外还有两个 相对比较感性的衡量方式 第一个就是 当有新的模型的框架出现 你这个组织是感到兴奋 还是感到焦虑 我非常感兴趣 能展开讲一下吗 如果你感到兴奋或者感到焦虑 这两个信号在我们这都是好的

就说明你这个产品跟模型有关 跟Agent框架有关 最差的结果就是你没有感觉 外边模型出现速度很快 就像一个高速列车一样 但你在边上开个自己的老爷车 你无论开得速度再快 边上有个高铁 已经从你身边呼啸而过了 你就是再怎么样都是赶不上的 除非说你自己已经坐上高铁了 你在高铁上有个相对速度

你至少跟全世界聪明人 努力的方向是一样的 所以这个事一个基本要求就是 你的产品和组织 是要架构在AI Agent 和架构在最新的模型之上的 这样你每次有一个新的模型上来 你的所有产品都会变得更聪明 把你的所有流程都会变得更精准 你的努力方向就是跟人类努力方向 是在同一个方向上 如果反过来 来了个模型

其实你适配不适配的都无所谓 你的产品跟原来是一样的 或者你要适配花非常长的时间 那你就不是一个AI原生 构建在模型上的产品 我觉得这是一个比较好的衡量标准 当然最好的方式 你是不在恐慌那一边 你是在兴奋这边 有一个新模型和新的流程 你的组织和你的业务更兴奋 因为你原来解决不了的问题 你现在可以解决了

基于你新的模型 如果你很焦虑 那就说明 你虽然已经在模型上了 但你是个包装器 这个包装器来一次新的大的迭代 你这个价值就被挤没了 那就是一个不好的情况 对 可不可以给我们一点故事 最近让您最兴奋 或者焦虑的一次模型更新是什么 我觉得现在一般都是兴奋居多 过去一段时间 比如第一个就是多模态

是一个比较大 比较快的变化 哪一次变化 Nano Banana还是 比如Nano Banana 就比如它产生商品的细节 我们原来也要产生商品图片 无论是买家去设计一个产品 还是卖家去发自己的产品 他就希望有一个简单的照片 从白底图开始 我把你放在各种各样的场景下 当一个买家可能从想法开始 我最后要生成这个设计包

但最终生成模型的过程 这个扩散模型 它就不精准 它会经常把尺寸搞错 一个很大的机器放在桌子上 或者一个不是很大的机器 显得很大 在厂房里 这个不精准表现 原来你就要花大量的时间 上下文去做调试给它一些提示 要保证这个东西的产出 尽量要满足人的预期 但现在模型本身能力变强了

其实我们就要 相对比较简单的上下文 就可以让这个内容生成得非常逼真 但是这个生成过程只是最后一步 前面的所有这些逻辑链条 一环扣一环的判断 那个更复杂的过程就是 我们自己要对模型不断调试的过程 但是你最终产生图片的一刹那 有更好的模型来 你肯定是有更好的 更容易掌控的结果 第二个就是我们很早就在想要闭环

因为我们今天的模型 首先拥有全世界的知识 其次 我们也有最好的 全球的供应商的网络 包括我们的所有这些 线上的交易等等信号 帮助我们去做判断 下一个大想法到底是什么 谁可以制造这个 就谁可能是你最好的供应商 我们还希望去做你日常经营的过程 因为前面两部分 可能占你日常工作的10%到20%

还有80%的是你日常操作 但在没有Computer-Use 没有Brower-Use 没有这种长程上下文的 Agent的能力出现之前 其实我们要做这件事就很困难 也可以弄 但反正每个地方都很别扭 你就要大量的工程 去解决每个细节问题 当然有了这些能力 再加上有很多 Brower-Use的这些公司 去做这些基础设施 这些基础的能力

我们在解这条问题的链条上的速度 就会变得非常快 这就是为什么 我们春节就开始加班 去做Accio Work 因为就发现无论是OpenClaw 还是Claude Cowork 证明这个范式 在这个环境下是成立的 它是能够再往前去推进一步的 我们在这个基础上 就可以快速推进产品 让它对我们这个用户群体 可以产生更广泛的应用 我觉得至少 在我们的大部分案例下

我觉得还是兴奋为主 我们可能存在两种情况 一种情况就是兴奋 另一种情况就是还没感知 有过还没感知 比如说一些特别大的这种模型出来 然后你们完全没有感知的情况吗 因为我们本身也是一个 26年的系统了 这26年的不断积累 我们现在的CEO吴泳铭同志 他最早的代码 可能还在我们这个代码库里面 因为它也是一个不断积累的过程

你不断地每一个功能去做叠加 我们也想让我们整个工程 都基于AI原生的系统 那就意味着你整个系统都要重写 未来的工程师 才能大家也更AI原生的方式 去做这个代码 这个过程肯定是一个 一步一步推进的过程 未来一定是做到只要有新的模型 阿里巴巴.com里边的每一个角落

阿里巴巴.com里边的每一个角落 理论上都应该比原来更好用 而不是说不同的团队 去适配不同的模型 每次来的时候 大家都要再重新研究一遍 我这个产品怎么去适配 那这个速度肯定是慢的 所以在这个时候 您选人的标准会发生变化吗 有一些基础的事 我觉得可能是一样的 比如说你学习能力要足够强 要比较强的开放心态

因为你要进入到一个大的组织里边 你本身这些同理心等等 我觉得也都是很重要的部分 这些 你说AI时代 和原来的数字化的时代 可能对人的本色要求都是一样的 只不过在这个时代 对于这一类的工具 我们希望它可以应用得 更广泛 更灵活 在垂直在构建这个产品的基础上 你肯定是对于AI的理解

对于整个大模型相关的基础设施 这些技术的理解越多越好 理解得最多的 你可能就直接去构建 跟AI相关的产品 从底层开始去做 从模型训练开始做 理解 对于商业理解 和对于技术的理解一半一半的 你可能比较适合去做产品 因为你要面向3到6月之后的模型 去设计产品 你要对于全世界至少要走向的方向

有一个比较清晰的判断 因为这个流行语很多 出来的新的想法很多 你不能看新闻去做决定 接下来哪个事是重要的事情 你自己对于这件事情 有个更加精确的洞察 或者更加独到的观点和判断 可能对你未来会更有帮助 好 非常精彩 谢谢阔 好的 感谢 谢谢 好的 谢谢张阔

我觉得在节目的最后 这句话可能也对我们每个人都适用 在AI的时代下 大家个人的感觉是兴奋 焦虑 还是没有感觉呢 欢迎大家给我们写评论 写留言 播客的听众可以通过小宇宙 苹果播客 还有Spotify来收听我们 视频的听众可以在B站 还有YouTube上 搜索 硅谷101播客 找到我们

当然也可以通过小红书 或者是视频号来收听我们的播客 同时 如果大家 对我们的文字稿感兴趣 我们部分节目的文字稿 会发表在《硅谷101》的公众号上 我是泓君 感谢大家的收听

Loading...

Loading video analysis...