🛑Live Replay:字节跳动旗下2025火山引擎冬季FORCE原动力大会 | ByteDance's Volcengine 2025 Winter FORCE Power Conference
By CN.科技发布会
Summary
## Key takeaways - **Agent Kit代码减少96%**: 基于火山引擎最新推出的Agent Kit,参会报名Agent集成了智能推荐、智能签到和智能总结三大功能,代码量减少了96%,只需不到70行代码即可完成,且稳定性大幅提升,便于推线上生产环境。 [02:12], [02:36] - **Trae月活破160万**: Trae已成为国内第一AI IDE工具,月活用户突破160万;扣子月活开发者达300万,是国内最大Agent开发平台,这些数据体现了技术创新和开发者信赖。 [03:05], [03:29] - **Response API成本降80%**: Response API具备原生上下文管理,支持多轮对话链式管理,与缓存结合后成本下降高达80%;齐心集团基于此构建商品智能运营平台,上架效率提高80%,错漏率降至2%以下。 [16:30], [17:45] - **扣子编程拥抱Web Coding**: 扣子开发平台正式更名为扣子编程,推出Web Agent、Web Workflow和Web APP三大功能,用户只需自然语言描述需求,即可自动生成Agent、工作流和跨端应用,实现从拖拽到心流的开发范式。 [39:19], [40:09] - **Agent Kit 8分钟零代码部署**: 使用VEDK和Agent Kit,从零开始无需一行代码,即可在8分钟内完成生图生视频Agent的创建、构建和云端部署,包括身份管理和沙箱环境,确保企业级安全可靠。 [56:41], [01:05:41] - **Trae企业版代码采纳率升30%**: Trae企业版针对主流语言框架优化,代码生成的采纳率提升30%,支持超大仓库索引和复杂Coding Agent;在抖音团队,AI代码贡献率超40%,测试用例生成时长压缩至18分钟。 [01:25:26], [01:38:44]
Topics Covered
- Agent开发代码减少96%
- 编程从指令式转向目标导向
- 强化学习Serverless化降低门槛
- Web Coding人人皆可编程
- Agent Kit 8分钟企业级部署
Full Transcript
尊敬的各位来宾 亲爱的合作伙伴们 欢迎大家来到2025火山引擎冬季 force源动力大会开发者日的现场 我是主持人赵杰 谢谢 那近期呢 AI agent的开发和应用呢 已经成为了大家讨论的热点 有越来越多的开发者呢 正在利用agent开发平台 进行生产提效和创造 我们正在见证一个基于AI AI 云原生的agent开发新时代
那接下来呢 让我们用热烈的掌声有请火山 引擎总裁谭待带来精彩的开场分享 有请谭总 各位亲爱的开发者朋友们 大家上午好 非常荣幸能够在这次的这个 force大会的开发者主论坛上 和大家一起来探讨agent开发 这一快速发展的技术领域 我想作为开发者 在这个时代也是非常的兴奋的
因为每天都不断有新的技术出来 有新的东西可以去创造 当然呢 也会有一点点焦虑 对吧 因为可能不留神就会被时代落伍 那就比如说我们昨天去介绍的 这个我们的这个参会的这个agent 我想这个大家在报名 参会的时候也都体验过 那它呢其实就是一个典型的agent应用 对吧 它和以往的这种基于H5表格式的这样
的参会的报名的体验是很不一样的 那它呢 其实集成了智能的推荐智能的签到 还有智能总结这三大功能 让用户可以通过 自然语言就与agent沟通 轻松的完成这个参会签到 还有最后的这样的一个会议的总结 那这个应用呢 实际上它就是基于火山 引擎最先最新推出的agent Kit 这样的全新的这样的一个
面向agent的开发的这样的 一个平台和套件来构建的 而且呢 它相对于传统的这种agent的开发 它的整个代码量减少了96% 你只需要不到70行代码 就能完成这样三个agent 而且呢 因为它所用的服务啊 都是这个提前基于套件 基于SDK 基于service来封装好的 所以它的稳定性也有很大的提升 也更容易的把它推到
线上的生产环境去 那这呢也是我们的核心理念 我们希望让开发者能真正的把 精力集中在创造业务价值上 而不是被繁琐的这种 周边的代码所困扰 同样在工具层面 火山引擎也打造了全方位的面向 agent的开发的这个工具的生态 而且针对不同层次的开发需求 我们提供了Trae和COZE以及
一站式的智能体工作站Hiagent 那现在呢 Trae已经成为国内第一的AI IDE工具 它的月活用户也突破了160万 扣子的月活的开发者也达到300万 也是国内最大的agent开发平台 那这些数据背后 我想不仅体现了我们 在技术创新上的坚持 也更展现了开发者朋友们 对我们产品的喜爱和信赖 那稍后呢
我的同事会为大家带来更详细的 关于Trae和COZE的一些最新的强大功能 同样 我们在昨天新发布了以大 模型为核心的AI云原生架构 那在这里面 火山引擎提供了丰富的 工具平台和解决方案 那这些工具和平台 它不仅是为企业服务的 它更重要的是为企业 中的开发者来服务的
那今天的大会也会针对这些工具和 产品提供很多的介绍讨论和动手的 实验 那希望呢能给大家带来启发 那我们一起探索agent技术 重塑我们和大模型的交互的新方式 开创全新的产品的迭代的范式 而随着大模型技术的不断发展 agent的开发也不断有了新的变化 首先
开发者的门槛有了大幅的降低 从专业的技术人员 扩展到了人人皆可编程 我记得我最开始学习编程的时候 对吧 要学数据结构 要学算法 啊 要了解操作系统数据库 有等非常多的这种专业的知识 而现在呢 借助Web CODING这样的新的方式 即使是没有太多编程基础的业务人员 也可以通过自然语言 轻松的实现自己的创意
解决自己工作上的问题 第二 开发模式已经从传统 的指令式的这种编码 变成了更目标导向的这种AI coding 那过去呢 我们自己程序员需要 理解这个业务逻辑 是吧 通过各种的if else 还有各种这种判断 啊 可能偶尔加一点这个算法来 指定这个程序应该怎么来执行 而现在写代码的方式完全变了 是吧 我们是通过prompt告诉agent 是吧
你是一个出色的销售 你是一个出色的HR 我们把这个目标告诉这个大模型 然后呢 通过模型本身的能力 它就可以进行规划 它进行这个思考 进行执行 调用工具 啊 而且呢 我们在通过评测 不断的对这个agent的效果进行调优 这是和以前编程非常 不一样的一种方式 第三呢 数据的处理的逻辑也发生了变化 那以前我们更多的是和
数据库和数仓来打交道 而现在我们很重要的 就是要做好上下文的管理 对吧 我们要通过更好的上下文的管理 充分的利用大模型的窗口 然后呢 让大模型能够处理好长期的任务 处理好这个企业的内部的知识 然后呢 完成这个任务 然后并且去把效果不断的去提升 那下面呢 我们就来看一段视频 啊 它是关于这个新的
时代一些开发者的故事 我们请看 我们做的是那个实时语音 精准捕捉到属于人背后的那个意图 其实还是蛮难的 把豆包模型接入进来 电话数字员工更加拟人 帮你解决问题 火山引擎有很多模型 我可以用一个key 然后就会调用不同的这样的模型 模型的调用方法的说明非常多 它极大的帮我缩小了这个开发时间 其实我已经做了大概有
五六款这样应用程序 火山引擎的智能创作云 即开即用的一个解决方案 很适用于电商营销场景 Seedream 4.0生图的效果是非常精准的 Pro prompt的话是可以进行提示词优化 视频再创作 可以快速进行风格迁移 当时客户就觉得非常的哇塞 希望看到越来越多 千行百业的这样的一些agent 实现在商业上的真正的赋能 期待 期待与火山引擎一起
探索AI的星辰大海 对 我想这些来自于一线的 开发者的声音是最打动人的 也很高兴看到这些 火山引擎开发者的故事 我们从他的故事中呢 也能看到技术带来的变革 因为这里面他有转型的高校的老师 有经验丰富的全栈开发者 也有勇于创新的创业者 也正是他们用自己的创意和代码 让AI技术真正实现了
在各个行业的落地 谢谢你们 那为了更好地帮助开发者 学习和掌握agent的技术 那今天呢 我也非常高兴能宣布三项火山 引擎在开发者上面的重要的举措 第一 火山引擎的开发者社区已经 全面升级为agent开发者社区 这也标明着我们更明确的战略 我们希望围绕着agent开发 为开发者来提供从学习到
实践的全方位的成长的路径 第二呢 我们也正式的启动全新 的agent核心开发者计划 我们诚邀社区中的技术布道师 和专家加入到这个计划之中 那入选的核心开发者可以获得 火山引擎的代金券以及全方位 的技术培训等多重的支持 我们希望通过核心开发者
让他们成为agent技术的布道师 从而影响更多的开发者 第三 我们也正式的启动了agent 开发者的城市社区项目 那么目前我们已经在北京上海 深圳和成都设立了本地的社区 同时我们计划在2026年把整个社区 计划扩展到全国十多个城市以上 这个计划呢
会由本地的志愿者自动的发起和参与 然后建设好本地的agent的兴趣社区 能够帮助更多的本地 开发者一起学习好agent的开发 同时 为了支持更高效的创新 火山引擎的AI原生架构也提供了完整 的面向agent的开发的组件平台和工具 首先在模型层 我们提供了强大的豆包大模型的家族
覆盖了从编程从创作从音视频的生成 对 到多模态的全方位的场景 而且呢 我们也支持业界主流的开源的模型 其次是火山方舟 它提供了高效的Maas的服务 可以用更低的成本 更易落地的方式 帮助大家用好大模型 也提供了更先进的强化学习的方案 推理代工 以及AI搜索等组合方案
把大帮大家进一步的降低编程的门槛 同时我们在agent的开发 在agent运营上也提供了大量的工具 包括agent Kit Hiagent等等 那这些工具呢 它可以满足不同层次开发者的需求 那基于这些工具 无论是刚接触到agent开发者的新手 还是经验丰富的专业人士 都能够在火山引擎找到 适合自己的开发方式 最后呢 我们也知道
就是agent它本身 它不仅仅是解决问题的工具 它更是突破创新边界 的这样的一个关键 所以呢 我们也和科研行业的人士一起携手 我们希望通过更好的AI的技术 帮助科研进一步的发展 那最后呢 我想给大家看一个视频 来了解火山引擎与 上海创智学院的一个深度的合作 同时视频之后 我的同事还会还会为
大家带来更加精彩的内容 谢谢大家 很荣幸能够分享我们与 火山引擎上的一些探索 在LF3S领域呢 火山引擎呢 它是一个在人工智能领域非常有背景 有资质的企业 上海川慈学院从去年 9月12号开学到今年来 我们讲到底还是一个人才培养单位 那么我们培养人才的一个非常 重要的出发点就是实战中培养人
我们构建了一个科研的前沿阵地 产业的前沿阵地 我们探索出来的信号 构成的这样一些前沿 那么围绕这些前沿 我们目前呢布局了一些 领域推理方面的认知智能 比如说多模态方面的叫情境智能 又比如说在具身智能方面 还有一个我们就是在科学 智能方面也做了深入的探索 对我们这一个人才培养单位来讲 第一个真正构建科研的闭环
从读文献数据分析干湿实验成果总结 科研人员能在一个平台上完成 极大的加速了创新发现 第二个是推动了AR FS生态繁荣 通过数据机工具链共享 促进了科研交流 对科研方式的改变 更关键的是以前实验试错 现在是靠AI 智能预测 研发周期缩短 成本降低 以前只有大实验室能够用超算
现在在小实验室也能够享受 呢同等的算力和AI的能力 科研更加普惠了 而且跨领域融合让科研从线性 线推进变成了指数级的创新 我想我们跟火山引擎一道来做呢 就是打造一个通用的 为科学家有用的这样一个统一的东西 现在做模型 每个单位都要做模型 每个单位都要都要做工具 都是低层次的重复 火山的优势 它在算力搭建 算力推动 Infra方面的优势
加上火山在AI for science本身 既定的一些呃优势和我们人才培养 我们学科方面的优势结合起来 所以这是一个互补的 优势相通的这样一个项目 火山引擎他们的AI云基础设施呢 提供智算超算通算一体化的融合算力 同时满足了大模型训练 和异构算力的调度等等 字节内部也在AR制药材料科学
领域沉淀了很多核心技术 他们服务过国家实验室 有论文解读综述撰写 科研假设生成的成熟经验 正好帮我们提升科研的效率 就是真正是把技术与市场相结合的 未来可能催生更多的像 Alphafold这样的颠覆性的成果 能够培养AF3院士的人才 形成生态 好 谢谢 感谢谭总带来的精彩的分享
让我们看到了agent时代 下开发者的无限可能 那么说到agent的开发呢 肯定是离不开平台和AI工具的支持 那么接下来呢 我们要请出的是 火山引擎智能算法负责人 吴迪给大家带来从工具到创新 火山方舟助力开发者 构建下一代agent的应用 让我们一起来看一下火山方舟 究竟为开发者能够带来哪些能力 有请吴迪
广大的开发者是这个AI 时代最宝贵的创造者 一切新颖的技术构想最终都 需要透过我们开发者的实践来 转化为真正能够改变世界的应用 火山方舟大模型服务平台 在帮助企业落地之外 也是我们每一位程序员 每一位开发者的好帮手 我们的使命 正是希望成为大家最
可靠最亲切的技术同行者 今天呢 大家都在谈论agent 下一代agent应用到底是怎么样的呢 我们认为它不仅是一个尝试和探索 而是最终真正要走进 企业生产和业务的需求中 为此呢 我们相信agent需要 具备长期记忆的能力 它也应该能够随着业务
数据的变化而自我进化 并且能够精确地执行 多步骤的复杂任务 今天 我们从技术落地的角度 和大家聊一聊火山方舟 相关的产品能力和技术 首先 我们再来看一看API 多模态模型API的统一是 当前业界重要的发展趋势 我们推出了response API 它有两个重要的特点 第一呢
具备原生的上下文管理能力 能够方便轻松的支持 多轮对话的链式管理 文本图像或者是混合 模态数据都能够无缝衔接 当response API和缓存的 能力结合起来之后呢 还能帮助开发者获得更 低的延迟和更好的成本 对于命中缓存的上文tokens
也能享受到更低的价格 在我们很多的实际企业应用场景中 整体的成本下降幅度可能高达80% 第二 response API能够自主选择要调用的工具 用户发起单次请求之后呢 则可以实现多个内置工具 或者自定义函数的组合式响应 来帮助开发者解决更为
复杂的互动的agent任务 b to b电商的商品信息管理工作 一般面临很大的数据量 以及一些重复率高和 合规风险突出等挑战 齐心集团基于response API 结合联网搜索知识库等工作 构建了优秀的商品智能运营平台 该平台依托豆包大模型 实现了自动化的审核
覆盖数据采集查重比价等关键环节 使得商品上架效率提高了80% 错漏率降至2%以下 在显著提升审核效率和准确性的同时 也大幅降低了运营成本 基于response API 高途教育正在多个业务 层面打造大模型应用 第二
在涉及多轮对话的教育练习的场景中 高途携手豆包大模型 通过response API实现了 上下文的自动管理 降低了开发难度 在节约计算量和成本的同时 还为学生和用户带来了 更流畅的多轮对话体验 在过去的一年中 我们看到有越来越多的开发者
创造了千千万万有价值的AI应用 除了高效易用的API之外 更为简单易用的工具调用链路 也正在被广大的开发者关注 为此呢 方舟平台也推出了 开发者模式的体验中心 在开发者模式下 我们的程序员不再需要完全手动去 编写复杂的全部的模型调用逻辑
方舟平台基于response API 提供了更好的可视化开发环境 开发者可以像使用IDE工具 一样来查看请求生成的参数 来串联多轮上下文 来调用多个工具等等 使得模型的基础编程更为简单 让我们看看这个视频 打开开发者模式 即可一键切换多种语言代码 工具调用方式一目了然
无需手动编排流程 即可自动调用多个MCP 自主完成复杂任务 构建agent从未如此简单 每一次请求 每一个模型的基础工具调用 每一段的流式输出 都可以被这个体验中心节点化的展示 来帮助程序员更快的调试和定位 开发者模式当前面向我们 的早期开发者进行测试 未来会逐渐开放给所有的客户
接下来呢 我们再谈一谈强化学习 在过去的几个月 我们看到RL的算力消耗正在快速增加 模型训练呢 正在从单纯的深度学习作业 变为把推理训练reward环境模拟等要素 综合起来的一个演化的分布式系统 从23年9月开始 字节跳动内部开发了 Verl的强化学习框架
并且在一段时间的 内部高强度打磨之后 在24年的10月左右正式开源 到目前为止 将近460个贡献者在Git Hub上活跃 也有另外40多个框架和 开源库基于VL衍生构建 并且他们也大都获得了 不错的star数和关注数 veil正在成为最有影响力的
强化学习开源框架之一 未来呢 我们将持续提升veil的能力 包括我们会支持更多的 模型和强化学习策略 兼容例如Openpi Openvla Groot等主流 的VLA和VLM模型的强化学习操作 并且呢 我们会加强对强化仿真 环境的支持和交互效率
会提供更为统一的仿真环境接口 兼容多种主流的不同的CPU 和AI芯片的一些仿真环境 并且支持在rollout过程中对仿真 环境进行更为实时的互动交互 除了Verl开源框架的持续建设之外 我们也在尝试把Verl变得更为友好 变得更为产品化 火山方舟为大家提供更低
门槛的serverless强化学习体验 我们的目标是让开发者更多 的把精力放在业务逻辑上 而无需过度关注繁琐的工程细节 就好像这座冰山在海面之上 我们的开发者应该更多的去 关注和业务紧密连接的reward 奖励函数数据闭环以及业务逻辑等 把更复杂的细节交给方舟
让我们来看一下这个Demo 为帮助agent更好满足应用需求 火山方舟推出serverless RL 通过强化学习支持多场景效果优化 以优化智能客服agent为例 用户只需定义好业务逻辑和评分标准 即可便捷发起强化学习 平台自动完成训练配置 资源调度并保存结果 全程无需人工干预
serverless完成强化学习 界面化管理 直观便捷 训练轨迹实时可见 助力效果持续优化 火山方舟强化学习平台 让强化学习更简单的服务真实业务 在火山方舟 非专业的用户也可以比较容易 的开启强化学习训练的尝试 只需要把注意力更多的放在奖励机制
和环境模拟的构建以及数据的闭环上 并且呢 我们还鼓励我们的开发者 为同一套业务逻辑去切换 尝试不同的强化学习算法 来快速摸索不同情况下的收益 同时 我们还为高阶开发者 保留了足够的灵活度 允许高阶开发者以更 复杂的代码插件的形式 把rollout函数和reward 函数插入整个系统中
对于模型训练的一些相对黑盒的问题 方舟也能提供轨迹级的可视化工具 帮助开发者更快的定位问题 来分析模型策略 为什么造成了这样的结果 最后呢 强化学习的落地需要 反复的调试和试错 方舟平台会对所有的由于 自身系统问题造成的错误免单 只对成功交付的checkpoint收费
在未来AI发展的版图中 我们也看到哈 就除了强化学习和agent的开发之外 还有两块工作是非常非常重要的 一个是为人和最终用户提供好的输入 通过搜索推荐问答的入口 让AI技术和企业之间形成更好的连接 另一个呢 则是为模型和agent提供好的输入
也就是要把上下文管理做好来 这是一个消耗量很大 并且接下来会加速 可能是指数增长的一个领域 并且也高度依赖云计算的一些工具 这两年大模型的发展啊 使得信息处理的能力被极大的增强 我们可以想象 如果模型再变快50倍 再变强50倍 那么它要吃入的数据 将是今天的数倍以上 我们相信
就是像知识库 然后语义检索的向量库 搜索引擎 并且海量的高质量的参考图库 高质量的参考视频库等等等等 将是未来各个企业的核心基础建设 他们能够更好地帮助模型 把它的能力充分释放出去 获得更大的产业价值 2026年的一个重要趋势呢 就是生图生视频等多模态
模型能力一定会有一个跃升 这也将带来庞大的参考 图片库和参考视频库的机会 这也对我们基础的召回和排序 的底层能力提出了更高的要求 开发者的需求可能 来自对多种模态的组合 也有可能是并且要基于 过去的一些业务需求 做一些呃自定义的更 语义化的更自然的指令 比如说哈 像 比如说向量库
向量检索库的过去的流程可能很直 很简单直接 先利用语义相似度 把指令中看起来最像的内容 通过embedding检索出来 对吧 但是在真实的世界里呢 我们的用户经常还要问 一些比较复杂的模糊的条件 例如哈 除了要什么 他们还会说我不要什么 我排除什么 我需要什么比什么更便宜
或者什么东西在某个条件之内 只依靠传统的embedding语义相似度 这类问题其实容易被召回 但是不容易被ranking准确 例如 不包含某某元素的图片 对吧 但是我们过去的很多基础模型 可能会反过来把包含某某元素 的更多的图片去优先召回 因为他们在语义上的距离更接近 因此呢
就是仅靠过去一两年传统的向量召回 里面经常混合了大量叫做 不符合人类真实意图的结果 为了解决这些问题 vikingdb向量数据库本次升级 了递进式的信息检索方案 向量相似度只负责第一步 把可能相关的结果尽量找全 也就是利用我们的系统优势和
更准确的embedding模型的优势 把召回率先做到极致 接下来呢 Viking的向量库会用 豆包大模型的ranking算法 对召回结果更 做更精细的语义化的判断和排序 把否定比较等复杂逻辑考虑到排序中 最终把最符合人类 要求的结果放到前面去 在整个vikingdb向量库和 Viking知识库的背后
就是豆包大模型embedding模型和 reranking模型的一个能力支撑的体现 第一阶段的向量召回要找全 对吧 就召回率很重要 豆包embedding模型持续升级 带来更好更强的全模态检索能力 在很多的一些多模态的评测榜单中 我们embedding模型的图片视频的向量化 任务还是能够达到一个比较sota的 状态 然后呢
他们能更好更准确的对图像 和视频素材进行理解和检索 第二阶段的Reranking模型呢 则承担了语义化的排序工作 模型能够更准确的理解 用户的复杂意图和复杂逻辑 例如前面谈到的否定 啊对比啊等等等等 然后呢 Reranking模型和embedding模型的完美合作 才能够让最终的大语言模型更
轻松准确的去做最终的理解和生成 二者相辅相成 共同支撑起了整个 Viking体系的领先能力 而记忆能力和个性化体验也 当然是每个AI应用创造长期 价值的一个非常非常重要的因素 我们透过Viking memory记忆库为 广大企业和开发者提供开箱 即用的记忆和个性化能力 例如
在儿童学习的场景 AI搜索啊 让我们的硬件体验变得更加有趣 元宇宙的小方机 接入Viking memory记忆库能力 就打造出了有记忆有温度的产品 为客户带来了更好的个性化体验 我们来看看视频 小方机是元宇宙对未来人机 交互和场景化学习的探索 我们的主要用户是 阿尔法时代的AI原住民 上一代的AI依赖文字输入技术
对于小朋友们来说 使用门槛太高了 它延时会很严重 它也很难真正的把一个好的 交互的长序列记忆做好表达 火山引擎waking长期记忆具备精细 捕捉事件与建模长期画像两大能力 能够快速的把孩子交流过程 当中互动的对话流里面的内容 存成一个向量知识库 把它的长序列记忆跟它的 大模型的对话内容去结合
来产生出更好的有记忆 能力的一个AI智能体 近期呢 我们也对Viking memory 记忆库做了进一步的升级 例如 在记忆的能力上 今天的Viking memory不仅 能够记住纯文本内容 还能记住图文等多模态的内容 在system的性能上 Viking记忆库呢 则透过抽取策略的改进 在保存关键记忆片段的基础上
再进一步加入了高度的压缩 也能在对话过程中针对性地进行召回 但这些技术改进呢 有能够有效节约模型输入的tokens消耗 以及离线进行切片就slicing 存储的一些离线消耗 从而大幅度的降低资源开销 我们来看一下这个Demo 用户交互数据持续高速增长 火山waking记忆库支持 超大规模处理吞吐
实现极致记忆压缩 能够根据业务需要灵活调整记忆规则 支持调整事件规则与画像规则 精准提取交互细节 沉淀长期用户画像 记忆抽取策略灵活 满足各行业记忆需求 支持多模态内容记忆 不止记住文字 更能定格视觉记忆 沉淀用户画像 提升个性化体验 拓展图文会话场景 记忆更全面
强大的记忆能力与非常 强大的知识库的融合 更能发挥1+1大于2的效果 为大模型的开发者们提供 高质量的上下文管理工具 我们的开发者在对话过程中 上传的图片视频文档等等 一方面可以被我们的 系统精确地解析为知识 解析为knowledge 让大模型来进行参考回答 另一方面呢
提炼出有价值的用户记忆 和准确的任务记忆之后 更能实现个性化的交互体验 让我们来看一个手机助手的例子 WIKI记忆库与知识库深度融合 助力企业打造更智能的手机助手 支持全模态数据上传 复杂文档精准切分 同步提炼用户个性化使用特征 视频画面深度理解
同步提取核心主体与关键事件 实现多维记忆积累 个性化知识检索与问答 基于历史记忆进行个性化问题改写 毫秒级精准检索 懂你所想 答你所需 记忆指导任务准确执行 输入航班行程任务 匹配历史经验 让每一次任务完成 更省心 更高效 让我们一起 为未来的人工智能发展 贡献力量 火山方舟期待与
各行各业的开发者们并肩前行 来共同探索AI技术的无限可能 我今天的演讲就到这里 感谢大家 好 谢谢吴迪带来的精彩分享 让我们看到了火山方舟给开发者 带来的诸多能力和良好的体验 也欢迎大家持续关注并体验responses API VRL火山waking等诸多产品和功能 让你的agent开发之旅更高效更便捷
在AI重塑生产力的今天呢 有一款大家熟知的产品COZE 已经让千万人用简单的拖拽 形式打破了软件创作的门槛 成为众多开发者首选的AI开发平台 而今天呢 这个陪伴我们在AI时代成长的产品 将会迎来一次颠覆性的进化 下面有请扣子负责人乔宇为 我们揭秘扣子的重磅更新 有请 嗯 大家好 我是扣子乔宇
非常开心今天能在force大会跟 大家做这样一次有趣的沟通 那在我的演讲正式开始之前呢 先跟大家道个歉 刚才啊 我在台下听到很多观众在窃窃私语 说 诶 一会演讲嘉宾的头像怎么是个机器人 肯定上台的是个agent 火山也太牛了 好期待 不好意思 我还是一个真人 不过今天我演讲的讲稿和 PPT都是我用COZE帮我写的 那么我先立一个flag
明年我们一定用COZE做一个agent来 帮我做这样一次公开的演讲 OK 那我言归正传 今天我演讲的标题呢 是告别拖拽 拥抱星流 正如标题所隐喻 COZE今天会有一个重大的更新 那么在我介绍我们的新功能之前呢 请允许我先花一点点时间 稍微讲一讲COZE的一些背景故事 以及COZE这个产品到底从何而来
cos诞生于2023年的年底 到今天呢 已接近刚好两周年了 在如今AI迅猛发展的当下 一个两周年的产品已经 快属于一个老产品了 虽然中间我们迭代和 发布了很多很多功能 但其实我们的初心一直都没有变化过 那我们的初心是什么呢 为什么我们要当时做扣子呢 其实我还记得在23年的某个日子 当我第一次发现大语言模型
具备逻辑理解能力的那种震撼 作为一个在软件行业 从事多年的创业者 你会意识到一件事情可能会发生了 这个事情就是如果能用 自然语言来表述逻辑 那么不写代码也可以编程了 那么软件工业的供给关系 可能会发生一个翻天覆地的变化 在这样的判断下 我们决定做一款产品
这款产品能让不会写代码的人也 可以做出真正有用的程序和APP 让每个有创意的人都能施展拳脚 让软件的生产力平权 这个就是扣子的初心和起点 彼时 大模型还有很多缺陷 比如逻辑理解能力不稳定 推理速度很慢 不会调工具等等的 那么我们围绕这些大模型的缺点 一步一步完善我们的产品
包括我们的agent IDE和workflow IDE 这些产品解决了成千上万希望利用AI 能力解决业务需求的不同的开发者 那时至今日 我相信大模型的进步 已经远超了每个人的预期 我们也没有预测到大模型 在短短的两年时间里面 居然能写出完整的代码了 这种进步速度 我相信会让在座的每 一个人都感到震撼
这种进步也能让我们有机会能给 开发者提供一个更好用的工具 过 这两年 COZE服务了超过数千万个 不同的真实的业务场景 有奶茶店的老板用 我们搭建门店服务系统 解决了高峰期排队的问题 也有很多公益组织用 我们开发了捐赠平台 让每一笔捐款都可以被追溯 也有很多很多的企业it团队 用我们搭建了数据处理工作流
把处理效率提升了70%以上 那我们呢 见过了太多太多用户的真实困境 小白用户学会了拖拽组件 但想要实现一个稍微复杂的业务逻辑 可能就会卡壳 那很多的专业开发者们会 觉得拖拽也许不够灵活 最后可能还是回到写代码的老路上 我们一直在思考一个问题 有没有一种方式 既能让用户的使用门槛变得更低
同时又能满足专业开发者对 灵活性和复杂度的需求呢 那么今天我们找到了这个答这个答案 从今天起 扣子开发平台正式更名为扣子编程 哎 很多朋友可能会问我 为什么要改名呢 其实啊 这个名字的变化 代表了我们整个产品的一次战略升级 过去呢 我们是一个帮你搭建AI应用的工具 今天我们要做一个赋能
开发者的创造力平台 我们不再是帮你解决怎么实现的问题 而是帮你聚焦想要什么的创意本身 接下来就是我们的一些新功能介绍 今天我们正式正式拥抱 全新的一个开发范式 就是Web CODING 那vibe这个词呢 直译为氛围和感觉 同时vibe coding这个词 我相信在2025年也是最热门的词语之一 那在这里呢
我们把它定义为用自然 语言描述你的业务需求 进入你创作的心流 过去 你要学习编程语言 或者你要学习拖拽组件 调整参数 今天 你只需要用日常语言 描述清楚你的需求 剩下的可以全部交给扣子编程 基于过去两年服务过 千万级业务场景的积累 我们打造了三大核心的功能矩阵 分别呢
是Web agent Web workflow以及Web APP 下面呢 我将逐一介绍这三个重要的功能 首先呢 是Web agent 也就是Web智能体 很多用户提到Coze 可能第一印象就是智能体平台 这呢 也是我们做的最早的一个功能 那今天呢 我们都知道 做好一个智能体 你需要去写出比较好的prompt
需要去做好知识库的搭建 当agent需要工具和插件的时候呢 可能你还需要找研发同学帮你 做出各种各样适合agent的工具 那当需要做一个很复杂的agent时候呢 可能你还需要Multi agent这样 复杂的多智能体架构等等等等 那么今天 你可能不需要再关注这些问题了 只需要把你的需求告诉扣子编程
agent会自己写提示词 自己装知识库 甚至自己给自己开发工具 那当这个agent不听话怎么办呢 你只需要告诉这个agent 那agent会在多轮对话过程中 实现自我迭代和自我进化 那下面呢 让我来演示两个Web agent的demo 首先呢 是一个数据分析agent 那数据分析一直是很多 企业内非常高频的需求
那做好一个数据分析的agent呢 却并不简单 你需要模型有较强的代码能力 需要它知道怎么样能做好 这样的一个可视化展现 同时 它需要处理好文件和 数据的解析能力等等等等 那今天 你只需要在Coze编程 里面描述清楚你的需求 10分钟后 这个agent就可以使用了 那我们看到上传一个Excel给他 他就能调用多个工具
进行一个自动化处理 同时帮你产出一份图文并茂 的可视化的数据分析结论 那接下来呢 是一个SEO专家agent 那我相信在座做过产品的都知道 写SEO的优化词很痛苦 那我相信也有很多人尝试过 用大模型来做SEO词语的拓写 也是很多企业内非常 高频且刚需的一个场景
但真的想做好一个Su agent也并不容易 它会要求去读取这个文章 得会分析这个文章的关键词密度 并且得会去调用一些Web的接口 来查询最新的一些搜索趋势 否则大模型给你的建议啊 可能会存在很多幻觉 那今天有了扣子编程这样的 一个非常完善的SEO助手
10分钟左右就可以使用了 把你写好的文章给它 它就会调用自己做的5-8个工具 进行多轮的一个分析和解读 最后告诉你一个比较严谨的结论 OK 那么下一个介绍的场景呢 是Web workflow 那workflow呢 一直是COZE上最受欢迎的功能 也是AI在企业里落地使用最多的功能 那因为呢
workflow的本质是人来编排整个的逻辑 然后利用大模型作为中间的一些节点 帮你实现一个稳定运行性能 高效效果准确的业务流程 这刚好完美的契合了企业内 很多复杂业务流程的需求 但同样 做好一个workflow对很多没有 软件工程基础的开发者来说呢 也并不容易 你需要去理解不同节点的作用
需要去适配不同节点的入参和出参 反复的来调整你的workflow的连线 那么今天 我们得益于大模型能力的进步 推出了Web workflow功能 你不再需要手动的去拖拽所有的节点 同样只需要去描述清楚你的需求即可 那最关键的是 Web workflow产物依然可以看到 整个工作流的一个可视化流程
并且可以分节点进行调试和修改 我看到很多用过Web CODING人呢 会有点惧怕 觉得Web CODING是一个黑盒 那我们的Web workflow有个很大的特征 它让Web coding变得更加可控 更加稳定 能更好地支撑你的复杂业务逻辑 那么接下来我来演示一个Web workflow Demo OK 这个Demo呢 是一个电商图片处理工作流
也是一个我们线上非常常见 也很高频的需求 很多电商商家每天会 有大量新的商品图片 需要做分类 需要去做打标 那通常这个工作流呢 需要有很高的稳定性和并发性 同时呢 也可能会很高频的来迭代这个工作流 来调整不同的一些分类策略 那今天你只需要描述清楚你的需求
很快我们看到一个可用的 工作流就能自动生成了 我们可以首先检查一下它的 业务逻辑是否符合你的预期 如果不符合没关系 可以选中你觉得不对的 节点进行一个对话式的修改 好的 那么接下来一个功能呢 是Webapp 那正如屏幕上的一个slogan 就是一个想法 一个跨端应用 过去呢 你需要学习很多不同的
一些终端的编程语言 才能同时开发出一个能 运行在Web ios和安卓的应用 那这当然很麻烦 今天呢 那跟刚才的两个功能一样 你还是把你的想法传达给扣子编程 扣子编程呢 就会自动的帮你生成适配 不同终端的界面和逻辑 完成这样的一个多端适配 并且呢 它还能帮你去集成所需要的组件
包括刚才吴悠说的我们 方舟上最新的一些AI能力 包括火山引擎的数据库等等的 一个跨端的全栈应用即可成型 那么接下来呢 让我来演示两个Webapp的Demo 第一个呢 是一个3D数据可视化仪表盘 这个也是我们企业内 经常看到的一些需求 我们看到很多企业 都会有很多很多数据 那我们有数据需要展示
我们有数据需要去回溯 我们都需要有一个统一的界面去呈现 那么过去呢 我们需要找一些开发人员 花费很多精力才能 做出这样的一个dashboard 甚至呢 我们还需要找设计师才能让这个 大屏的视觉效果显得更好看一点 那最后呢 开发出来这个dashboard也不 一定能很好的匹配你的需求 那这个案例呢 就是我们产品经理通过自然语言和
简单的两三轮对话完成的一个效果 我们告诉他 我们企业有如此这般 的一个可视化需求 并且呢 你可以把你需要展示的数据 通过工具或者通过Excel传给他 他就能在短期内完成 一个非常好看的数可 数据化可视 并且呢 扣子编程的用户还可以在 这个看板里面增加问答功能 啊 你的用户可以去问他怎么怎么 就是有什么数据 那所以呢 其实这也是扣子编程的一个特点
就它不但有很好的一个前端效果 也可以有不错的一个后端逻辑 那通过这个案例 我们可以看到 只要你有足够的逻辑思考能力 以及足够足够的想象力和和创造力 你可以把需求表述很清楚 那么呢 扣子编程往往就会给 你一个非常有意思 甚至超出预期的结果 那么接下来呢 是一个有趣的案例 我们这个整个扣子编程 其实是前天晚上刚刚上线
那上线后呢 我们的产品经理做了一个 很有意思的小创意游戏 那用户可以通过摄像头和手势控制来 调整这个拍照游戏里面不同的滤镜和 用手势来控制它给自己发张自拍 并且呢 能根据用户的真实照片生成 不同风格的一些照片和漫画等等 那这背后呢 第一呢 我们实时的调用了摄像头的画面 捕捉用户的手势 那第二呢
调用了AI图像处理接口 进行风格的转化 那并且呢 实现照片呢 我们自动的把它存在 了我们的服务器上去 然后你可以去分享给 你的朋友或者下载 那也欢迎大家呢 在扣子编程里面去发挥你的创意 找到更多一些有趣的玩法 OK 那说了刚才我们三个 比较重要的功能以后呢 还有一个非常非常重要的东西 那这呢 也是我们今天提出的一个新的概念
叫做Web Infra 那什么是Web Infra呢 那我们可以看到今天其实在市场里面 包括我们开发者里面 有了很多很多不同的 一些Web coding的产品 以及Web coding的作品 那帮助很多很多开发者从0到1 做出了不同的一些有意思的程序 但我发现还有一个很重要的问题 一直没有得到一个很好的解决 就是这些Web coding的产品
这些Web coding的产物并没有真正 的帮用户走完最后的一公里 因为把一个产品从0到1 开发完并没有真正的结束 如果希望它能为你产生商业化收益 产生价值 是需要进行部署迭代持续化运维的 那以往呢 这些工作你依然需要一个懂 部署懂运维的工程师来辅助你 那今天
扣子编程我们上线了Web Infra能力 结合火山引擎在云计算 领域强大的一些基础设施 我们提供了一套最适合 Web coding的基础设施服务 那这里面既包含了 服务器的资源自动化分配 应用的版本部署管理 域名的备案配置 甚至呢包括ios和安卓的版本打包 那我们在云端可以帮你
实现通通这样的一个流程 甚至你不需要下载不同的IDE 就可以实现一键把你的 应用发布到这个APP store 那我们做这个Web Infra的能力呢 核心还是要去实现一件事情 就是构建一套真正面向 所有开发者的编程生态 同时呢 这里呢 我也跟Coze老用户说一声 请放心 过去呢 我们用拖拽搭建的应用呢 依然在
我们也依然会投入精力 投入资源 去提供更好用的workflow 更好的编排 来帮助大家持续去做 更好的应用和更好的创造 今天的升级呢 我们的目标从来不是 淘汰某种开发方式 而是让每个开发者都能找到 最适合自己的一种创造方式 专注在真正的有价值的创造上 如果你是一个编程零基础的小白
你可以选择直接把你的需求 通过自然语言告诉扣子编程 那如果你是有一定基础基础的开发者 你也可以用扣子编程来解放双手 把时间花在对业务逻辑的深度理解上 那如果你是一个会写代码的 非常资深的程序员或者开发者 没关系 你也可以在别的地方去做这样的开发 也可以在别的产品上去做这样Web coding 那最后呢
你一样可以把产物发布到扣子 编程来享受我们在提供的非常 方便的Web Infra的便捷和能力 好的 那再回顾一下我今天分享 这个主题叫做告别拖拽 拥抱心流 那这里的告别拖拽并 不是否定过去的探索 那拥抱心流则是希望 大家能从机械的操作中呢 解放解放出来 回到我们编程最本质的乐趣
也就是创造本身 那最后呢 扣子编程也为大家带来一项福利 那扣子编程呢 于今天开启一个免费的公开测试 那用过Web coding的朋友应该都理解 这意味着多大的一个资源 那我们也希望大家能在这个 测试里面找到属于自己的心流 好的 谢谢大家 谢谢 让我们再次用热烈的掌声 感谢乔宇带来的精彩分享 好 谢谢
两年来呢 扣子始终坚守以软件 生产力平权的初心 让无数人通过低代码实现了创意落地 今天 扣子全面拥抱Web CODING 更是为开发者打开了 自然语言全链路编程的新大门 那期待在未来呢 也会有更多人通过扣子 编程进入属于自己的心流 那提到企业级的agent的开发呢 背后离不开安全便捷的
一站式agent的基础设施 agentkit是由火山引擎为AI agent的构建 部署运行提供支持的开发平台 能够帮助用户快速完成agent 的开发构建和生产上线 那接下来我们要请出的是火山 引擎云基础产品负责人田涛涛上台 给大家带来关于agent Kit精彩分享 掌声有请 大家上午好 我是火山引擎田涛涛 今天我为大家分享的
主题是think like agent build like a system 这个议题特别好玩 其实在北京的6月force大会结束的时候 我在我的最后一个session 的最后一页预告了 我说我一定要在下次的 force大会上来讲这个主题 那么今天呢 我就给大家来汇报一下这个主题 我我们这次force大会一个 非常重要的发布就是agentkit 我们可以看一下它有个 三个核心部分的构成 第一个就是agent层 Maas层以及右侧的agentkit框架层
在agent层我们提供了Vedkit 等多种的开发工架 可以让开发者快速的构建自己的agent 为了确保a的安全可靠性 我们设置了安全围栏 只要你开启安全围栏 所有的a的请求经过这一层的 时候的安全检查规则校验都会 只有通过之后才会进入我们的Maas层 而Maas这一层呢 是我们平台的智能核心 就不展开了 刚才吴迪已经介绍很多了 我们主要看一下agent这层
我们为agent的开发者构建了 完整的开发运行评估框架 从构建到最终部署的 全生命周期的管理 我们可以看到在run time层的 我们提供了四大核心能力 首先的话 最最最重要的还是我 昨天讲的身份管理 因为它可以处理身份 的认证和权限认证 然后就是网关 作为统一的API接入和流量管理 特别特别重要的就是我们的 build in TOOLS和Sandbox这一层 其实我们内置了工具和沙箱
同时提供了代码安全的运行环境 很多人特别喜欢skills 我们待会也会发布 然后就是memory层了 昨天我发布了一系列的m memory产品 总之是让agent能够很好的 记住上下文和历史进行交互 在平台的底部呢 我们构建了非常强的可观测体系 而基于可观测体系 我们又构建了构建了更强的 评估体系以及我们的护栏体系 而这一套形成一个完整的闭环
从agent开发到模型服务 再到运行时的支持和持续的监控 为企业级的agent提供 了坚实的基础设施 我们一直说agent特特别简单 在火山引擎内部 我特别卷 我让我们的市场人力还有财务 包括销售 都需要用高代码来SOLO AI agent 就是 我们今天呢 把这个答案交给豆包 看一下如果开发一个AI应该需要多久
熟练开发者用现成工具API快速搭建 约90-120分钟 1.5到2小时 含开发测试打包云端部署加观测配置 新手或自研模型 3-6小时 要不要我帮你整理 一份最简步骤速查表 仅8分钟 完全不可能 核心瓶颈在于流程无法压缩 即使是极致熟练的 开发者加最优工具链 单云端部署加镜像拉 取这一步的网络传输 实例启动耗时就会超过8分钟
更别提开发测试观测配置等关键环节 结论8分钟连部署一个现成 的agent镜像到云端都不够 从零开发加部署完全不现实 太好了 豆包说做不了 我觉得特别好玩 那我们今天就挑战一下 一行代码也没有 大家看到现在我什么也没有 一行代码没有 我们就高代码编程 然后把这些开发一个agent 这个agent非常好玩 它首先的话能帮你创建图片 也可以帮你生成视频
更能根据你前两人的图片来生成视频 那么这样的话就是 一个特别典型的case 我们呢 今天就挑战一下 用8分钟从0开始完成 这个生图和生视频的agent 就是我先检查检查下我的环境 然后待会我给导台发一个指令 你们就开始倒计时 我看一下这时间 perfect 啊 行 开始倒计时 首先的话 我们我们的VTK提供了很好的命令create 我们首先的话通过VEDK
给它创建了一个应用 这个应用呢 我叫force Demo1219 大家看到这个应用已经出来了 但是刚才我选择了我不输入AK 为什么 我我不想我这个把我的AK泄露了 所以我放在环境变量里边了 我们看一下这个int有什么 首先的话 int技术定义在这了 我说了我们要生成一个可以 创建视频和图片的这个int 那我们就要修改提示词了 看 you can use tools to generate image and videos
那么这样的话我们看一下 如果他需要的话 他就需要tools了 包括我们用TOOLS来构建 哎 不错 它能够大概给我编出来这个 那我们就看一下我们 导入的这个工具类 啊 也非常智能 我太喜欢Trae了 真的 我就是Trae的重度开发者 然后我我每 我现在作为一个云技术产品负责人 我每天的编码量也还是可以的 然后呢 我们做完了这个应用之后 我们看一下它怎么能够运行
我看一下ADB run for Demo 当我们执行ADB run的时候呢 它就会去把这个pass类呃呃装载起来 然后它稍微有点慢 因为它需要一个装载的过程 然后这里边的话 我们这时候也介绍一 下一个agent剧本的基本元素 大家其实在agent开发过程中呢 其实都知道一个agent 有一个简单的名称 一个描述 还有个提示词 还有一个你最喜欢的模型 你看我今天最喜欢的 模型就是豆包系的1.8
然后我的模型内模名称呢 也是1.8 还有一个最重要的概念就是toes 然后一个合适的toes呢 是所有agent的基础 我刚才说了 我们要生成一个那个生图 生图生视频的复杂级的企业级agent 那我来让它生成一个 啊 中文 生成一个上 海东方明珠的视频 好的
我们让它生成一个上海东方明珠视频 我们来看一下 看一下什么工作 因为这时候的话 他就会去跟模型进行交互 然后执行模型的一些工作 我们也看到这里边的话 因为我们的日志也比较详细 OK 他开始 已经开始工作了 然后这时候的话 我们就进入下一步 我说了我今天一个主题就是int的一个 用int code Kit来去构建工作 哦 诶 哦 意思 先不先不管他了
那那个 我们那个 一个很重要的工作就是 让他来去部署和构建 那我们看看怎么实现这件事情 首先的话 我们到刚才这个项目里边 然后的话我们有一个 很重要的命令就是agent Kit 然后我们init这个项目杠f 然后因为这里边它有我 的一个int技术定义 我们看一下它有多么简单 然后的话大家可以看到说 int Kate 我int之后的话 它就会去帮我去生成一些 你看它帮我生成了一系列的配文件 我先不展开
然后我们看一下这块 我继续执行我的 哦 至于config config的话 这里边就需要配置 比如说int名称 包括描述 包括一些描述信息 这里边我们选的是Python 然后还有Python的版本我3.12 然后我的配置项我就不用管了 变量我可以不用管 因为我们这次要选择部署在云端 所以我选择了3 然后北京 我的容器仓库 容器镜像 然后我这里边选的授权是key OS 我待会会讲一下这部分
然后我们看一下 我就去执行 执行了launch 然后我们看一下 这时候他会做什么事情 OK 等launch工作之后 我们发现他做了几件事情 一件事情是他去构建 了一个本地的TOS对 TOS对象 另外的话他开始给我就云间云端进行 CR和CD 就是我们 我之前昨天讲到了 我们会构建一个云端的runtime环境 然后的话 这边开始构建了 我们刚才也看一下 我们在这过程中生成的文件都是什么
我的config里边主要非常非常简单 大部分可以通过默认的命令 就生成一个整个配置文件 当然你也可以 高级开发者可以手来改 然后嘞这件事情 然后同时的话 我提到说我们的agent Kit是 支持多种开发框架的 不只是VEDK 如果其实浪线的话 我们也可以帮你包装 直接快速的生成一个浪线版本的配置 因为我我我因为 我自己是a VAD的开发者 所以我优先推荐VEDK 待会我会讲一下为什么
我们的VEDK是更好的开发框架 我们可以看到这边已经开始构构建了 然后构建完之后呢 哎 他构建完之后你发现他做了几件事情 第一件事情他创建了一个角色 这个非常非常关键 我们每一个 这就是我们说到的身份和权限 另外的话它帮我生成了一个apikey 好的 那这时候也就是非常顺利 我们的runtime已经开始启动了 我看一下 我们的控制台 OK 我已经看到这个agent Kit已经在启动了
然后在启动过程中大概需要1分20秒 我们顺便来看一下其他的内容 在agent里边我们有些应用广场 我们内运广场其实给 了6个非常复杂的agent 它里边包含MCP 包含a to a 包含context压缩 其实把企业级agent开发里边非常 典型的复杂场景都包含来了 我们再看一下我们叫入门模板 这里边的话有好几个int 所有代码都是我来写的 包括说智能点餐啊什么的 因为我一定要给大家提
大家可以点开这个这个地方 大家看一下代码以及说如何部署 包括它核心能力在哪 就是呃我觉得我们现在给 了大概有16个这样的case 在月底的时候 我们会把这case做30个 到明年的时候我们做到100个 把核心的场景都给覆盖出来 大家可以通过高代码来实现这个编程 我们看看一下这个部署过程 好 一分10秒钟了 呃 大家也可以看一下 这里边我们有一些工具
比如说我我们昨天的话发了很多case 说我们有all in one的工具 然后作为一个更神秘的工具 我们也发布了skill sand Sandbox 这也是我们昨天才发布的 我们希望所有的人都可以 很好的使用skills的能力 因为skills基本上已经会是 我们我们做一个高高高代码开发者 我预言skills是会是下一代 非常非常关键的能力 我们现在也要求我们自己的 解决方案和产品都在做skills 好了
这个智能体应该是已经运行成功了 OK 它运行成功了 成功了之后呢 你看 这时候它会就会启动一个沙箱 然后我们看一下这刚才 说安全非常非常重要 在火山引擎我们认为所有的agent的开 在部署的过程中 即便是你自己的agent也不 可以随便被公网访问 这就是我们的一个原则 要么你通过Apik访问 要么通过Auth访问 然后我们看一下你是谁 能用什么工具 对 这就发起了个远程调用
我们看一下这个远远端部署的效果 它可能又需要点时间 整体来说 我们的indicator给 把这刚才我们说的原来定义的agent的 agent的八大套件全部的呃部署在云端 可以方便你的管管 OK 我们看一下这里边他已经告诉了你 你有哪些哪哪哪些工具了 对 以上呢 就是我们演示的全部过程 然后更详细内容大家可以去直接 登录我们的控制台来进行操作好了 好吧
还好还有5秒钟 没有尴尬 哎 我这时候特别想cue一下严海伦 海伦特别担心我给搞砸了 其实让海伦失望了 下次呢 我本来想demo18分钟呢 我说我我原来想的做法是 我要做一个复杂的agent 多复杂呢 我我选了一个JSP的应用 我说我把存量的应用现场 通过18分钟转成一个AI in的 但海伦跟我说这样的话太boring了 所有的观众可能就看不下去 一直让我敲代码 但是不要遗憾
下午我们有一个AI in的闭门会 我们就会给大家Demo一下 不是Demo一下 创作一下如何把一个 古老的应用转成一个AI in 其实通过刚才的Demo过程里边 大家可看到 其实我们研发的范式在 发生巨大无比的变化 首先的话 在AI时代 能够决定开发效率的是什么 我觉得有几个最重要元素 因为我自己就是个重度开发者 第一个就是要有AIDP 大家看到了TRAE
它其实不只是能够写代码 它更好的能理解你的上下文 你的工程结构以及意图 它把你的写代码这件事 变成了和系统一起思考 大家想想 我是如何让我们的财务啊 然后市场呀 还有包括HR人力来写代码呢 我肯定不是让他来硬敲代码 因为我们提供了skills 和我们的速录编程 待会我的同事会详细介绍 他们是如何让所有的人都可以
通过高代码的方式来开发代码的 就跟那个扣子不太一样 用高代码来做 第二的话就是强大的模型 因为豆包1.8呢 在agent开发里边 我们自己其实已经测了我一个 测过一个多月了 它它不光参数更大 能力更强 它还能够稳定的去理解复杂任务 拆解多步流程 让agent呢 不会只 不是简单的回答问题 而是真正的执执行任务 最后一个很重要的事情 就是IDK和构建工具
我们的VEDK和Indy Kit 能够把Indy的 刚才我给大家演示了 我们Indy的身份 就不管你怎么部署 我都让你选择 要么你是通过apikey做 要么就是基于更复杂的 企业级的Oauth来2.0来做 包括说我们也刚才演示了一个工具 我为为什么说我们 那个报名int那么简单呢 就是我们开发了非常非常好的工具 只要有好的工具的话 就非常容易做开发 还有我刚才提供了运行时 运行时我昨天也讲到 它是serverless的
它也不需要你管理计算网络 安全存储以及说观测和评测环境 我们把它变成一套可以直接 在生产落地的工程化能力 而不再是Demo 是一个可以规模化运行的系统 当把这三件事情组合到一起的时候 我认为它带来的不是简单的效率提升 而是一次开发范式的跃迁 前面呢 就是我在演示的过程中一直说 开发好的agent tools特别重要 在我们自己内部过程中 开发的时候
我们也开发了大量的tools 我给大家总结一下反模式 这些反模式实际上就是我们自己在 开发过程中碰到一些典型的问题 比如说很多人呢 他就把他自己的Openapi或 传统API当成agent的图来使用 但是这是有问题的 因为传统API它是给机器调用的 是个m to m的结构 而agent的API它是人类意图 为什么呢 你想一下 a能做的最重要的一件事情
就是调用TOOLS的时候把参数传对 如果你的结构非常非常复杂 不不 不太能根据自然语言和语义去理解 大模型很难一次就把参数传对 怎么做这件事情的话 我们内部的强调就是语义优先 只暴露必要的参数 而逐步扩展 因为我们认为一个好的agent tools 首先封装的封装的是 一个人能理解的完整任务 然后就是LLM的幻觉了
大家其实对幻觉这个事情 非常非常的那个觉得难受 但我觉得这是模型 这不是模型的问题 因为所有的人都可能都有幻觉 他可能上下文不理解了 可能有各种的问题 所以呢 我们很多核心的任务 比如说风险比较高的 高风险的任务 对所有不确定的风险操作 都需要有后面一个loop 来介入 我们认为后面Loop 根本不是一个可选项 而是你在开发intents里边
你的安全底线 这条是不可或缺的 当然我在这边和列的非常多其他的能 这些问题 包括说LLM的可解释性啊 以及我们日常所犯的错误 比如说特别大巨型的接口 它不是一个圆形的东西 它就非常让a难a做 还有像context一一出啊 就是当你的context很多之后 模型就变傻 还有一些叫慢的一些case呀 我们的SDK都给了非常好的解法 我们刚才demo那些例子里边
其实都把这些常见的 一些错误模式都给了演示 但我有一个事情是一定要highlight的 那就是一个特别大的反模式 就是没有那个错误恢复能力 我们知道我们传统写API的时候 我们一般报一个接口4XX错误 或者而message 但是对agent开 tool的开发不应该这么做 因为除了告诉这些信息之外 你还要告诉他正确的做法是什么 最好给他个recommendation
因为agent最重要的能力就是react 他可以重新的理解和修复错误 自己修这件事情 甚至我们一个最佳实践 就是在Android开发过程中 我们要引入专门的error handler 可以自动地重试调参和回退 很多时候呢 我们认为一个好的就是int 首先一定会调非常多的push 但是如何开发一个好 的agent非常非常关键 我们自己在
我刚才demo那那两个agent 那个tools 其实我们花了非常长时间来做的 大家可以作为一个参考来看一下 我就总结一句话 我认为AI的失败可能不 只是模型单点问题 它可能是接口和工具 上下文和控制机制的系统性工程问题 你只有这么做才能做的更好 刚才演示的时候 我一直在讲 我我是用从VED ADK开始的 我们没有一行代码 没有一行代码 然后的话
大家可以看到这张图上 我们为EDK提供了完整的开发能力 包括我刚才使用的CLI以及我的runtime 评估器我们做的非常全 我们除了ADK内内置的评估器之外 我们还集成了deep eval 包括方舟的评估器 除了刚才的部署上线那那之外的话 我们还给了一站式的工具链 这些工具链其实不只是我列出这些 包括TTS语音 还有更复杂的一些
但我们大概有15组内置的工具 可以就像刚才大家使用 这个图片啊和视频一样 可以快速的去 嗯 集成 我们这次forfor大会里边说 大家参会完之后呢 明天我们就给大家推送这个 就是大家参会记录 也是调用VEDK的Lark这个模块来给大家 我说错了 就是飞书模块来给大家生成的 同时的话 我们原生的对接了方舟 Toast code Loop
APM plus等这些平台 我们提供了非常丰富的内置工具 刚才吴迪讲到的 而且很多高阶能力 像response API 其实绝大部分的框架都是不支持的 而作为火山引擎的官方SDK 我们已经支持了response API 大家看到我特意 highlight一个能力叫skills 我刚才在演示的时候 因为这个时间太短了 如果再给我10分钟 我可以继续演示skills 甚至给我一个小时的话 我可以给大家一直演示编编码 我们自己的Python版本 内部使用量也非常大了 超过数万 我们今天呢
也正式发布了Golang和Java版本 但是呢 很多人可能会concern说我们 是不是会绑架这个用户 不是的 我们的这个 首先第一个是跟谷歌SDK重度兼容 其次的话就是你如果不使用 方舟的那个框架也是可以的 即便你只想使用字节的这个c dance stream也是可以的 因为我们是不绑架的 对所有的框架都是支持的 对所有的开发工具也都是支持的 所以啊 我认为我们的VEDK真的是
上手就是企业级的it能力 昨天的话我我我们在讲一个话题 就是刚才我我其实原来想 原来想那个演示的一个demo 就是如何把一个存量的应用智能化 我们认为 其实过去的十年 我们很多的企业完成了 应用的信息化和云化 当前的这个应用主体呢 更多的还是人在操作 通过鼠标鼠标点击啊 键盘输入啊 而未来的十年 我们要完成的更多是应用的智能化 不再是人去操作 而让智能体去理解你的意图
直接调用你的应用 让交互变得更自然和高效 在传统模式下 我们是对人操作 我们依赖人工操作 点对点集成 这样的包括工作流是固定的 而静态的 它成本很高 在智能它模式下 我们就要对int 对应用实现自动化编排 构建工具 做动态的决策 呃 关键的是一点是呢 我们不希望所有的那个 应用智能化的时候重写 那怎么做呢 我们昨天有很大的卖点叫做智能焕新
就通过agent 我们让存量的智能 应用快速的去智能化 首先的话 我们的agent存量唤醒能力也给 了一个简单的这个路径图 第一个就是我们定了 五个最关键的事情 第一个就是你对API资产调用问题 大家知道 我们存量的应用已经大量的API 这些API或者是非常古老的这种API 或者说我们做的比较好的团队 已经有一些end API和open API了 这就比较比较好做 因为我们的end Gateway
我们在依托字节内部超过5,000 我们可以通过零零代码或少量代码 就可以把现在的API和内部 服务转成end可用工具 同时的话 让传统的API变生成API工具集 我们Gitlab里边一个 非常非常重要的卖点 就是我们的自动搜索能力 刚才吴迪也讲了 我们Viking有非常好的匹配和reranking能力 这就是我们Gitlab里边内置能力 就是我们可以快速的帮你去找寻到
虽然你企业里边的API很多啊 模型有幻觉啊 但通过我们的GOKV可以大大 的提升这个API的准确度 存量的数据和知识的利用 我们提供的ailykit的 昨天我们讲到memory和knowledge 其实我们提供的是头条抖音和 豆包同源的这个向量和检索能力 我们把分散的资源整合成 Aily能够调用的知识底座 完成数据知识到Aily的体系的转化 在用户用户和权限方面
我刚才其实也给大家简单demo了一下 因为我们认为身份和权限管理 在任何地方都是不可逾越的 所以一定要做好这件事情 我们agent editing可以跟已有的 用户界面和原有的企业ID等融合 然后无缝地融入了火山 的统一权限框架里边 让传统的这个体验直接为agent所用 实现agent的零信任和身份控制体系 我们今天下午在那个 因为这个比较复杂
其实身份管理我认为是 一个企业里边最难的事情 所以下午的时候 我们专门会花一个小时的时间给我们 的同同学展示一下如何做这件事情 在执行的环节 我们非常非常重要 我们刚才提到了a 我们有unique的runtime Sandbox Gateway 我们可以分钟级的构建数十万的实例 再结合我刚才提到说我每个 启动的时候都有鉴权和管控 包括说我们今今天也发布了 我们的security产品计划能力
我们可以让传统的工具执行 升级为AINT运行的安全运营体系 最后呢 就非常非常重要的一点呢 就是agent持续运营 因为agent Kit的 我们非常重要的一个卖点就是 我们的evaluation和可观测能力 它可以帮助客户实现 开箱即用的快速agent评测 因为我们在这次的评估体系里边 我们内置了超过50套的这个评测体系 这些的话 开箱即用 不需要你去做 我们总之来实现
不断让用户实现自己 的agent优化和迭代 前面我其实讲的更多的一个 理念就是渐进式的应用改造 渐进呢 它是把AI接入现有的Android体系 而Android native呢 就是围绕围绕AI而生的 前者其实解决的比较务实 就很多企业跟我们沟通的怎么做呢 我觉得比较务实的好 就是我们先通过渐进式的改造 它解决当前我怎么用好AI 但后者应该回答 未来的应用应该是什么样的
渐进其实是一个比较务实的选择 但并不是终态 我们认为真正的Internet应用 它不以流程为中心 也不以界面为中心 而是以目标为驱动 通过能力组合 就刚才我给的一个非常好的例子 in the tools来做 模型是大脑 而工程体系决定了它 能不能成为一个长期可以工作 可以信赖的体系 所以比较务实的做法就是我们从 渐进式的改造走向a native的重构 build like a system
我们回到归成能力的持续化 这也是我们为什么要发布agent Kit 因为它帮助我们持续构建了一套agent native的开发工具和套件的根本原因 因为我们还是 坚信开发者绝大部分绝大部分的 开发者还是用高代码来解决问题的 就跟上次force大会一样 哦 在火山引擎我们是有比较好的规划的 我也提前再次预告一下 下次force大会的主题 因为我相信未来属于
智能化的黄金年代 比之前我经历过的Web和移动 互联网带来的影响更为 更强更大 下次主题就是from one to multiple 拥抱智能化开发的黄金年代 好吧 以上就是我分享的全部所有内容 下次Devoxx大会再见 谢谢大家 好 谢谢 感谢田涛涛带来的精彩分享 让我们看到了如何通过 agentkit加速企业级AI agent的落地 也欢迎大家持续关注并 体验agentkit更多功能 好
那前面我们说到了AI CODING呢 这里就不得不提到TRAE了 作为一个能理解需求调动工具独立 完成各类开发任务的超级AI开发 工程师 它非常好的体现了人 和AI之间的高效协作 那么企业又该如何拥抱AI CODING呢 好 接下来我们有请TRAE 企业版产品负责人王涛 给大家带来精彩分享 我们一起来看一下TRAE是如何提供
效能领先的企业级AI开发解决方案的 有请 火山的朋友们大家好 很高兴能够在火山大会 能跟大家再次见面啊 啊 Trae的个人版呢 其实在25年的1月份的时候 我们进行了一个发布 那么在12月份的当下 我们想在这里给大家 带来Trae的企业版 一个面向AI驱动开发的企业级IDE 在这里啊 首先还是想跟大家先分享一些数据 截止到11月底
Trae的个人版注册用户已经突破了600万 其中有70%的用户我们发现是 非常专业的开发者群体 在这些开发者群体之中呢 他们在有90%以上的 场景在处理日常工作 可以看到TRAE和企业开发 场景的关联是非常紧密的 所以我们发现在TRAE个人版发布之后啊 我们的团队一直在收到 来自各方的一些诉求 这一直在问什么时候
TRAE能够推出企业版本 来帮助他们去解决 一些企业级的开发痛点 那我们会觉得整个企业级的开发 会比个人的开发场景更加的复杂 比如说在企业里边会有 更加复杂的仓库规模 会有更加复杂的语言环境 会有更加多端的这样的 一个开发场景和情况 所以呢 我们先在字节的内部团队进行了这样 的一个企业版的一样的软件的试点
比如说我们的抖音头条 飞书和汽水音乐等团队 也非常感谢这些团队的帮忙啊 在我们得到切实的这些 内部团队的认可之后 我们希望决定将TRAE的写板带给大家 希望能够将字节内部的 最佳实践也一同带给大家 那在整个企业级的开发场景里呢 我们觉得有四个核心要素非常重要
其实分别是安全性能管理和集成能力 我们先来聊一聊安全 对于TRAE的企业版来说 客户的安全永远是我们的第一优先级 因此TRAE企业版在开发的过程中就 提供了非常多方面的安全保障 首先就是项目级的安全管控 我们可以帮助企业开发者 和企业用户去管理哪些 核心仓库不可以被AI去所touch 确保核心项目不泄露
同时呢 我们也会提供安 严格的安全访问这样的一个控制机制 来去在使用的过程中去进行 严格的权限控制和访问机制 并且在传输的过程中进行严格的加密 来降低使用的安全风险 那对于企业最重要的代码资产 数据安全这类的情况 用户 企业用户的数据只会留 存在开发者的本地的电脑上
当一些需要在云端去传输给 大模型的这样的一些数据 我们也会去做到用后即焚 我们向企业的客户去保证 所有流经大模型的这样的一些数据 绝不会去用作模型的训练 同时呢 在此基础之上 我们也为不同的企业 可能提供不同的模式 一个是Saas模式 一个是我们的VPC专属模式 对于Saas模式的这样的用户来说
能够让企业去更快速地去使用 到AI上面的最新的能力和体验 它能够避免本地部署在 升级和扩展上面一些的局限 那对于安全合规有 非常严苛的企业来说 我们也提供了VPC的 这样的一个部署模式 它能够去满足严苛的合规性的要求 又同时能够做到高可用和弹性扩展 对于TRAE来说 我们企业版的目的 不仅仅是安全合规啊
其实我们是想让企业在 稳定可靠的环境之中 没有后顾之忧的去使用 业界最先进的AI能力 在安全之外 性能我们觉得是在企业里 场景里使用起来最根本的保障 你在企业的开发场景里 我用的卡不卡顿 顺不顺手 流不流畅 非常的影响企业开发的效率和协作 那TRAE在这里联手火山引擎 希望能够给企业用户 带来极致的性能体验
基于火山引擎超大规模的GPU集群 我们去保证企业用户在使用的 过程中享受到的低延迟和高并发 同时 我们也会给企业版提供更加 高效的企业级的索引能力 能够轻松的应对上亿行代码 大规模企业文档这样 的检索和更新能力 同时 我们也支持多地多活的架构 来确保我们的服务拥有着 呃稳定性和多和可用性
整个的性能不仅仅是 在呃这个基建之上啊 同时我们也在整个的高性能 在Trued企业版里 我们也针对了主流的开发语言 开发框架做了深度的性能优化 一方面我们去改进了这些 语言和框架代码索引解析 优化了静态分析和内存管理机制 我们希望企业级的开发用户在 使用的过程中能够占用更少的性能 更更少的CPU 更少的内存
能够让用户使用的 过程中去更加的流畅 不卡顿 那 不仅仅是在性能和速度方面 那对于效果方面 我们也针对这些语言和 框架进行了单独的调优 在我们的内部的团队反馈的过程中 在经过调优后的这些版本 整个的代码生成的采纳率提升了有30% 在这里可以再提一句 众所周知的是 整个字节本身有着非常 大量的go语言的开发者 这让我们在go语言的
积累上有了深厚的经验 同时这些都反哺到了TRAE上 让我们在go语上 go语言上得以去做更加深层次的优化 在性能效果上可以说是更进了一步 所以我们在这里也非常欢迎 go语言的开发者来使用Trae 可能在这里可以收获 到一些额外的惊喜 ok 下一个话题可能是管理 我们发现企业在真正 落地AI CODING的过程中 会非常关心一个点 就我如何去管理和管控
这样的一个AI的软件和产品 我们觉得优秀的管理能力是 企业级软件良好运行的基础 所以TRAE的企业版在这方面 提供了完整的解决方案 首先就是我们去支持TRAE的企业版 接入企业级的统一的权限管理 我们能够快速的接入 企业内部现有的SSO体系 权限体系 能够去实现单点登录和统一鉴权 希望企业内部在使用的过程中
边界权限边界清晰 它的合规会更有保障 再者就是面对企业级的使用方式 成员组织的用量成本和 成本管理会非常重要 因为我们发现在企业来说 相比于个人开发者 企业的调用量非常的庞大 成本非常的高昂 所以TRAE企业版支持实时的用量监控 统一的账单管理 去帮助企业去清晰的了解用量
去更加简单的控制成本 最后其实就是在使用 AI软件的一个比较大的场景 就是我如何去衡量我的ROI 在TRAE的在这个场景里 我们也提供了ROI的可视化能力 我们去提供多维度的数据分析能力 可以让企业管理者更加直观的 去看到AI CODING所带来的价值 比如说我在使用AI CODING的过程 我提升了多少编码的效率
我节省了多少的时间和成本 我们希望让AI投入是否值得这个 问题可以有清晰的量化的答案 作为企业级的开发工具 我们觉得最后一个能力集成这个话题 是决定企业内部的用户 能否真正用起来的关键因素 我们觉得 一个企业级的开发工具 它不应该是一个独立的软件孤岛 它应该能够深入的集成到 企业内部的开发流程中去
去使用它现有的流程规范 现有的工具软件去深入的整合进来 这样能够帮助企业 用户更加顺利的用起来 那TRAE的企业版在这里首先 做到的就是模型的开放集成 首先TRAE的企业版里已经内置了 一些国内的一些合规的模型 比如说 豆包模型Deepseek Kimi等等等等 同时呢 我们发现很多企业用户也 采购了自己的一些模型资源 那TRAE也非常能够欢迎呃企业用户能够
把自己的模型资源接入到TRAE里去使用 因为TRAE已经服务了数百万 的这样的一个个人开发者 这个让我们在模型的对接 经验和能力上有着丰富的积淀 我们让企业版用户无论选择什么模型 都能够在TRAE这款软件 上得到良好的适配 再其次是 那我们也在流程上做 了一定的开放和集成 帮助TRAE企业版在企业开发的过程中
能够融入企业不同团队的各自的场景 这就是我们的自定义的agent 开发者可以基于我们自己的agent框架 按照自己的场景 自己的规范进行更深层次的调教 比如说企业开发者可以 接入自己团队里面的知识库 让这个AI去理解企业内部不同 场景的业务语境和代码规范 我们觉得只有充分的了解业务的 一线的这样的一个真实的情况
这样AI生成的代码才能够更加 贴合企业内部的真实需求 才会更加的准确可控 同时我们也支持企业开发者把 自己团队内部的一些开发的规范 MCP的工具等等接入TRAE的agent 这个时候能够让TRAE不仅仅 能够哦去自己去生产代码 还能够使用企业内部 现存的一些工具链条 给企业支持企业会更 更方便的去开发
让企业开发者更加的灵活顺手 在这里啊 我们也已经覆盖了非常主流的MCP生态 同时我们也预集成了火山的MCP市场 让企业开发者能够在工具的 选择上更加的便捷和多样 同时 我们之后也会提供 更加深层次的开发能力 开放能力啊 能够让企业把更多的研发的上 下游的链路的工具给集成进来 比如说 在我们内部 我们企业已经可以把现有的
工具啊流水线啊数据源啊 直接接入到TRAE里 这样在整个的企业开发场景里 TRAE不仅仅能够帮助 开发者去编写代码 还能在CICD Devops等体系里 去发挥更多的一个作用 那讲到了呃讲完了 刚才的这样的一些要点 我们接下来去聊聊整个 TRAE的企业版的产品矩阵 我们发现在企业的真实的开发场景里 有不同的开发语言 不同的开发框架 不同的开发场景
每个开发者的使用 习惯也是截然不同的 我们发现开发者对于开发 工具的需求它是多样且不同的 在这里Trae 我们不太希望去约束用户的使用方式 而是希望去给到用户在不同 场景下更多的选择的可能性 所以我们TRAE的企业版给用户 带来了三种不同的产品形态 分别是TRAE IDE TRAE插件和全新的TRAE CLI 我们先来聊一聊Trae IDE 这是一个一体化的开发环境
得益于我们自己自建的IDE 的这样的一个能力啊 让我们能够在这个IDE里 更加不受框架的约束 能够提供给用户更加极致的交互体验 更加创新的功能 同时 基于这个自建的IDE 我们呢 也能够在IDE里采集更多 种类更完整的上下文给到AI 比如说 用户在IDE里面的代码编辑历史啊 Git提交记录啊 然后运行时的一些报错等等等等 这一切的上下文都是能够
去帮助AI提升效果表现 让它的产出更加的稳定可用 那在IDE里 智能补全是我们提供的核心场景之一 我们在我们跟企业 开发者接触的过程中啊 发现对于企业开发者来说 这是一个专业严肃的开发场景 代码补全仍然是一个 非常被高频使用的场景 我们的智能补全能够根据代码 的上下文去实时理解代码语义 去理解项目结构和依赖关系
从而去生成高准确度 可直接采纳的代码建议 同时在功能上 我们在基础的代码续写的基础上 也带来了像智能改写多点编辑 吓一跳的光标预测等更加强大的能力 我们希望实现从代码优化到 意图预判的这样的一个升级 让开发者的体验更加的行云流水 其次 我们可以看到 从补全能力上来说 我们觉得目前世界的标杆依然是CURSOR
但是从评测数数据上来看 我们在核心场景上的体验已经 十分接近了CURSOR的表现水平 同时 补全是一个对时延性能 非常敏感的这样的一个场景 补全速度过慢会非常 影响用户的编码体验 会非常的卡顿 可以看到TRAE在国内版的时候 补全速度已经领先了CURSOR 同时我们下个版本将会追齐 CURSOR在海外版的性能水平 将整个补全的延迟降低到300毫秒以内
给到用户更丝滑更灵敏的补全体验 其次 整个的coding agent是IDE 提供的另一个核心能力 在这里 TRAE的企业版提供了更符合 企业需求的复杂的coding agent能力 比如说在这里 它可以去支持更大仓库 类似于10万文件 上亿行代码这个级别的仓大 超大仓库的索引 同时 我们也为企业级开发者提供 了更加庞大的上下文窗口和
更多轮的AI工具调用能力 去帮助企业开发者 解决复杂的企业级问题 当然 更大的窗口和更多的工具调用 会带来更多的TOKEN消耗和呃会比 个人版的使用会更加贵一些 那在coding agent的场景里 我们可以参考一个业界 比较通用的一个评估的榜单 three bench 可以看到TRAE的分数已经名列前排 和全球一线的团队站在了同一的梯队
我们觉得这不仅是模型能力的表现啊 也是我们TRAE在工具链 上下文管理agent调度上 已经有着足够先进的认知沉淀 除了Trae的IDE这个形态 我们也为企业里的开发者去提供插件 因为我们发现很多企业的开发者 希望依旧保留原有的编程工具 我们为这类开发者在保留 原有的编程工具的同时 能够让他去体验到TRAE 最新的AI的完整的能力
那我们现在已经适配了Vscode和 Jetbrains一系列的这样的一个主流的IDE 让开发者能够非常方便的在Vscode和 Jetbrains插件商店里能够一键安装 轻松启用 除了IDE和插件这两个产品形态之外 在这里我们也正式推出Trae企业 版产品矩阵的第三块拼图Trae CLI 那Trae CLI它是一个 轻量化的命令行的形态 这样的一个形态非常呃独立的
使用的时候比较适用于偏向 后端的批量执行的企业级任务 比如说大规模的测试补齐 批量生成批量重构代码 迁移等自动化的场景 那同时 得益于这个轻量化的形态 CLI可以非常便捷地集成 在其他的软件的流程里 比如说 COI形态可以在CI CD的流程里 与企业的脚本流水线更加无缝的连接 让AI的能力能够拓展到团队的
自动化体系和生产环境中去 这个形态也希望呃大家感兴趣 的可以前往tryd官网来体验试用 那说完了这我们的产品形态 接下来想跟大家聊一聊呃 Trae的企业版在呃字节内部 的一些落地的实际案例 那第一个可能我们来 聊一聊抖音的生活服务团队 他们是非常早期就在 使用Trae的团队之一 在这里 他们将TRAE的使用的广度非常深
不仅仅是代码coding的一个场景 而是覆盖了整个Devops的全链路 从需求到开发到测试到发布 他们的每一个环节都接入了TRAE的能力 在需求阶段 开发者可以通过TRAE把飞书 文档里的产品需求直接丢进去 会转化为一个还原度非常高 的一个一个产品代码原型 那 在这之后 在开发阶段 开发者们又借助TRAE的自定义agent能力 呃
例如它会生成code review agent来 辅助进行一些代码审查code review 通过UT agent来去执行和生成单元测试 到了测试阶段 开发者们又会使用TRAE 来自动生成测试用例 来结合他自己团队的知识库 比如说产品需求文档 他自己的单测规范 服务端的技术文档等来对 这个单测进行一个校验 到了发布阶段 他们可以通过TRAE去集成内部的平台 去实现无人化的快速发布 这样一来
TRAE不只是一个写代码的助手 而是真正的把上下游的 工具和流程全部打通了 融入到团队企业里的Devops的体系中去 这一套完成之后 它具体带来的数据也非常的直观啊 在生活服务的团队里 整个AI代码的贡献率已经超过了40% 覆盖了将近一半的代码研发产出 在测试用例这个case上 平均每周帮助团队节省
的人天超过了40人天 显著降低了测试环节的人力投入 在发布环节 无人发布每次发布将会节省25分钟 让发布环节更快更稳 下一个例子想跟大家分享一下抖 音质量团队的这样的一个例子 如果说刚才那个team是把整个 的TRAE用到的用到的非常广泛 那么抖音的质量团队会 把TRAE用的非常的深入 他们面临的最大的痛点 就是遇到的业务复杂 代码量非常庞大
在这个基础上如果 你需要靠人工去写单 测用例会耗时非常长 且难 非常难以避免去出现 遗漏的这样的一些case 于是他们基于TRAE和MCP的一个生态去 搭建了一整套的自动单测的工作流 首先 他们会通过TRAE agent先生成测试用例 接着把这个测试用例通过MCP连入到呃 团队内部的这样的一个执行环境 直接去运行这些这些用例
在运行这些用例的过程中 如果出现了这样的一个执行失败 agent会结合失败的信息和 上下文去修复这个用例 然后再次运行 在这个反复的过程中 最终当用例执行完毕之后 却会帮助他们去输出 完整的测试报告报告 来方便整个团队去追踪和管理 那在这套链路下 整个的提升也是非常明显的 整个的单测平均生成用时 已经压缩到了18分钟以内
相比于人工去写测试用例 整个的效率提升了数倍 那同时测试用例的首次 编译通过率已经超过了70% 这意味着即使在企业场景里 复杂的业务环境下 基本上测试用例一生成就能 大部分一生成就能直接通过编译 这其实大大减少了重复调试的工作量 我们也希望通过TRAE的企业版将 这些实现带给更多的企业客户
那其实今天呃我们想 分享的内容就这么多 那最后可能再补充一些 视角跟大家分享一下 在TRAE发布的不到一年以来 从25年1月份以来 我们接触到了从 数百万c端用户的反馈 到字节内部团队的真实使用 我们真切地发现 AI CODING现在已经跨过了只能 做玩具的这样的一个拐点 成为了真正能够解决 企业级任务的生产力工具
能够给企业给团队带来 非常真实的效率提升 正因如此 我们希望在当下推出TRAE的企业版 让更多的企业能够 通过TRAE来提升研发效率 激发创造 那感谢大家的时间 欢迎大家前往TRAE点cn 体验企业版的完整能力 谢谢大家 好 谢谢 感谢王涛带来的精彩分享 让我们看到了AI提升企业 研发生产力的无限可能 也欢迎大家持续关注 并体验TRAE的更多功能
用好你身边的这个the real AI engineer 感受TRAE带给你的工作提效 好 那在这里呢 我们上午开发者主论坛 的分享就告一段落了 感谢今天所有讲师的精彩分享 大模型时代 开发者有着无限可能 火山引擎和开发者的故事还在继续 那希望呢 也更能够和广大的 开发者朋友携手同行 共创未来 再会
Loading video analysis...