死磕一年热门AI赛道,发现并不卷?|Aha创始人Kay访谈_下
By 课代表立正
Summary
Topics Covered
- 大模型主导达人匹配取代人工
- 动态定价基于历史商单数据
- 平台担保机制重建信任
- 坚持一年无正反馈熬出PMF
Full Transcript
那我们接下来就聊Head AI(现已更名为Aha)这个公司吧 我的第一反应就是为什么别人没有做 我猜应该有很多这样的公司 想要去解决这个问题 嗯 我们可以先说就是对于老公司来讲 当初为什么没办法去做这件事情 因为其实达人营销这个行业 它是一个就是严重缺乏数据的行业 本身 它其实在就是比如选达人这件事情上 它其实是一个匹配问题
本质上它也是一个搜广推的问题嘛 但搜广推的问题是非常需要有数据的 你需要有特征 能够做一些CTR预测之类的 但是达人营销是没有这样的数据的 那过去其实只有人能够去判断 说谁更合适 它其实靠的是这种语义的理解 然后去做推理 推理它的受众 那其实在过去没有大模型之前的话 就这件事情是没办法做的
一没有数据 二没有就是能够去判断谁更合适的 这样的模型 那你其实就是没办法从这个 比如说我们说几千万的达人当中 找到适合这个产品的这样的达人 那这个效果 之前过去 其实在行业里一直都是比较差的状态 所以当一个匹配问题 没办法被很高效匹配的时候 其实你去做一个平台是不成立的嘛 其实就很难想象 比如说滴滴
如果没办法很好的把这个 就乘客在打车的时候 能够打到合适的车的 这个问题能够解决掉的话 其实是没办法做的 所以 其实当我们就是从可能一年半之前吧 我们那个时间点开始做这件事情的时候 其实也是大模型开始在应用层 相对比较成熟的一个时间点 然后我们可以开始去探索说 不再依赖于说
这种传统的这个搜广推的方式 而是说我们真的让大模型去主导决策 就是在这种 比如说我们说可能从召回 粗排跟精排环节里面 都真的让大模型在里面去 起到这种决定性的决策的作用 等等 你们还是把它分成了粗排精排召回 对 其实在框架上面还是用了过去的框架 因为其实这个框架它是一个
对于这个问题来讲 它是一个稳定的框架 因为我们需要的规模也是比较大 从一大堆的 所谓的达人的这些数据里面去找到最后就是比较少量的 然后有排序的这样的一个问题 几千万的人数 它的框架是这样子 但是从里面真的去判断 比如说我们在召回环节过去的话 其实可能用的方式 可能本身是通过一些数据之类
但我们现在其实通过大模型 先去进行这种画像的判断 就我们先把 这些达人的数据 以及大量的产品的数据 先把他们的画像先通过 就是大模型 把一个这种画像库先推理出来 我很好奇我的画像库是什么样子 比如说在这个偏知识类 它就是比如说一个很相似的标签 比如说它都是这种
对于就是tech savvy(懂前沿技术)的这种innovator 这个画像 他其实往里去细看的时候 又每个都不太一样 比如说他的这些消费能力 或者一些他的这种相对的偏好 也有一些变化 所以就是每个博主的话 他背后其实可能至少会有 可能七八个相关的画像 然后在这个画像就是有了之后的话 其实比如说一个产品进来的时候
我们就可以立刻从画像库里 找到跟他相似的画像 那通过这些画像的话 就能找到对应的这样一大批的博主 然后这些人呢 就会可能进入到粗排里面 粗排的时候其实去筛选他的这些 比如国家地区语言 因为市场的campaign的话 他一般都会有些条件限制嘛 就比如说我推YouTube还是推Twitter 那我在这一步的时候 把这些筛选给做出来
然后以及做一些这种比如反作弊 有一些就是质量非常差的 可能他就是一个这种营销号群体的 这样的账号 我们就把他排除掉 然后可能到精排的环节的时候 再去进行这个内容上面的判断 就是根据这些达人 过往的可能30条以上的内容 那这些内容 和这个产品的这些详细的信息 让他们能去判断说 他从这个内容上
是不是可以去很好的去讲 这个产品呢 能不能给用户在内容上带来价值 然后另外是说他从画像上面来讲 产品和这个人的画像 到底是不是一致的 再去做一次这种双重的判断 最后去排出来这样的一个匹配的顺序 这里边的判断大多数是靠(大语言言模型的对吗) 对的 它的这个整个的 比如精排环节的这个判断
它其实是完全依靠大语言言模型的 因为其实大语言言模型 我们就是对他的理解吧 他其实本身是一个语文非常好的人 到后面其实逻辑能力提升了之后 他对于这种因果的推断 其实也是相对来讲 就是比起 就我们行业里过去做这件事的人来讲 其实他的发挥是比人甚至要更稳定的 我们行业里过去比如说我培训一个人
每个人的理解力不同的话 他在这件事情上的表现就是不一样的 那你们对模型的调教 你觉得需要你们提供的专业知识多吗 你们对大于模型的调教 集中体现在prompt上 还是除了prompt你们还要做其他的事情 首先是说从就是上下文角度吧 首先prompt跟上下文工程 肯定都是做了非常多的 因为其实我们这是一个说
你需要给模型提供的内容的质量是高的 你才能将它推理出来的结果(正确率)是高的 所以其实从内容质量上是比较重要的 你给他看什么 然后另外从提示词角度上来讲 它其实对于专家经验要求也非常高 因为我们最早 比如说即使像我自己 过去做了非常多这些事情 但是我们对这个事情的那个抽象程度 或者SOP程度 达不到说就是很稳定的
能够让大语言言模型去判断的程度 那这里面就是要调非常多的版本 可能一年里面 我们就是一直一直一直在调 然后不断去对比之前的结果 真的调到说每个环节都调了非常多遍 之后才达到 就是我们说AI跟人的这个判断 在我们的测试集上面的一致度 能达到说我们满意的程度 刚刚这个是回答了那个问题其中一点
就是传统的算法不好用 现在有了大语言言模型以后好用 但是again市场上有这么多竞争对手 你们怎么样子跑到了别人前面 从我们自己这一年半以来吧 其实最早就是 我们想做这件事情的时候 其实也有听到过 就是其他公司想做或者到开始做 但是可能从执行速度上面
或者说本身团队的这个在AI的实践 和同时有这个行业的专业知识的储备的 这个两个条件上面吧 可能都会相对有点欠缺 包括其实当时我们融资也比较顺利 有足够的就是这个资本 能够开始去做这件事情 因为其实前期还是挺烧钱的 第一年差不多可能花了将近200万美金 在研发上面
因为其实你对于各种数据的要求 其实都会很高 整个这个成本其实是不低的 如果有些公司 最早可能一开始没有拿到funding的话 其实很难开启这件事情 是自己抓数据还是买数据 自己从就是相对来讲 一方的API去直接去买数据 因为我们当时发现 可能市面上 大部分的卖这种达人的数据库 包括一些SaaS
他们的数据质量是非常差的 当时判断之后觉得就是基本不可用的 我们就必须可能花更高的成本 直接去抓我们需要的数据 simple things hard to do 你可不可以分享一下你的真实客户 他的good case和bad case 好的我先讲一些比较好的案例吧 比如说我们有客户 它是一个这种 就是AI的一个安全与编排的平台
相对它的客户也是ToB的 然后呢他在我们上面 其实周消耗 可能能达到10万美金以上 那过去可能要达到这个效果的话 他差不多可能需要10个人的执行团队 或者你找agency的话 agency那边成本也是这个样子的 那这个产品 其实最初 也是他们创始人自己亲自来试用 然后并且推动团队去落地的 因为他们规模 其实已经不是特别小的一个公司了
就是历史融资已经超过1亿美金 其实在我们上面就创始人用完之后 很快的pass到他们的执行团队 的一个人 然后那个人他可能每周会花半天时间 在我们上面去做这些审核 审批的操作 在这个14天之内 总共就是发出去了356条内容 那这里面 其实就是一定会踩中一些爆款 然后很快的 他们知道了爆款的方向之后
会去建新的campaign 然后新campaign的这个就是CPM 其实就会有效的下降下来 第二个case的话是MetaGPT 它是一个相对 可能就是比那个中型公司 可能再小一点的创业公司 然后他们是AI的这种开发工具 coding工具 他们其实是一个相对 就是过去对达人营销有一定认知 但对于效率其实很敏感 他们不希望说
团队就是花很多时间只在这些执行 然后整理这些事情上面 然后希望说 就是这个事情是更能给他们结果的 所以其实从差不多五六月份开始使用 然后他们一直在 我们上面是有这种always-on的campaign的预算 就是我每个月 都会放几万美元在上面去做 然后通过这里面出现爆款
然后去优化我campaign的效果 然后他们的CPM大概是从132美金 降到了90美金 在YouTube上面 就在几个月的过程当中 包括其实CPC的话 一直是差不多低于1美金的 刚才你说的两个good case 可以介绍一个bad case吗 就是比如说对于一些目前来讲 对审美要求比较高的 比如说这种服装品牌是做这种
说相对偏Y2K 然后很年轻 比如说什么辣妹风之类的 那这些概念上面 就如果想要识别出 效果特别好的达人的话 它其实是需要有视觉模型的 但目前其实Head AI(现已更名为Aha)的这个匹配系统 它还是更多是基于文本内容 比如说字幕 丰富的content的信息去做判断的 那它其实没有办法去在这种产品上面
去做到很好的这种审美判断 它的调性的判断是不够准的 所以其实今天我们就是做的更好的领域 是在这种 就是AI Sass 或者偏标品的这种电子消费品上面 我的感觉是 在这里边如果把它平台化流程化 并且很透明很自动的去做 是可以达到10倍的提效的 但是我不知道我的理解是不是正确
本身从就这个行业来讲 它是一个双端的一个事情嘛 就是你要想让这件事情提效的话 其实你对于广告主和达人其实都是需要提效的 而且 它本身是一个需要撮合的一个事情 那它里面就一定会有这种 比如说跟信任相关的 本身的结算相关的一些问题 所以其实过去的话 就是真正在双端平台上做的好的公司 其实都是把这个东西
真正完整的去解决掉的 你刚刚说过去做的好的公司 你心中的例子是谁 就是Uber Airbnb这样子的公司 虽然跟达人这个业务听起来毫无关系 但是我觉得还是挺像的问题 本质上还是解决一个人 要找到另外一个人 然后你这个交易过去他在没有这样的平台前 他都是这种打黑车一样的一个问题
就是比如说我碰到一个这样的司机 然后我可能就要先跟他就是讨价还价 因为他说把你从机场拉回家要给他80 你觉得只要10块 所以你们就要在那讨价还价半天 包括这过程当中 他有没有把你安全送到之类的 这个都会是有一些就是信任问题的 那达人营销其实跟这个很像 就是过去的话我们找到一个博主 大家都是陌生人 然后海外也不像国内
说你有这样丰富的MCN生态吧 大部分博主其实都是个人 所以大家其实之间是没有信任的 我要跟你去签合同 跟你去讨价还价 那这些事情其实毫无标准 就是行业也没有可以给你参考的标准 包括很多博主自己也是没那么知道 说怎么给自己定价的 他们可能还会用一些报价calculator 因为我们之前跟一些博主交流 他们也给我们发个网址 说他们在这就是给自己定的价
然后我们可能去看一下那个公式 也是非常草率的 可能就基于播放量 很粗暴的就给了一个价格 但其实本身就是从从这些角度上面 能解决的问题其实很多 就比如说从定价角度来讲的话 本身这个市场的价格它一定是动态的 它不太可能是说你的播放量是这么多 价格就永远是这样子 或者有些人可能更简单 他觉得就是我的粉丝量多少 我的价格就一定是多少
那其实就是对于广告主的视角来讲 这样肯定是不对的嘛 因为大家其实最后看的是 就当下这个时间点 在市场上什么价格是合理的 所以其实我们的定价是基于 比如说它的预测的本身的播放量 那这个播放量里面 其实我们会更多去参考 就是历史的商单数据 而不是说所有的数据 都可以拿来直接去参考 因为其实一个博主 他本身在商单上面 能做成什么样的水平
跟他日常的那些爆款 不一定是能够直接去画这个等号的 第二是说本身每个平台 包括你的内容形式 其实都会对应着有不同的本身的CPM 比如YouTube的长视频 跟一个Instagram的Reels 或者它的Carousel 价格其实都是不一样的 以及就是比如说你的国家地区 就你的受众 它真正是什么地区组成的 比如说你账号写的是在美国 但实际上你的受众
全部都是在印度的话 那我们其实最后还是以你的受众 在的这个地区为准的 然后包括你的这个受众的购买力 就是他的这个画像 本身的购买能力是什么样的 价值是什么样的 然后通过这些维度的话 你会有一个基础的定价 但是呢市场本身是动态的 如果说这段时间 比如说AI工具的竞争非常非常激烈 很多博主 他其实是可以去挑deal的程度的话
那这个时候你的价格就一定要去上涨 但如果说这段时间 其实市场非常冷淡的话 那你其实可能能通过更低的价格 拿到这个 所以其实本身背后 对应的是一套这种动态的定价 我想请你再double click一下那个定价的事情 因为我确实看到你们的定价 觉得非常的make sense 就我心中对我的这个频道的定价 也是这个样子的 但是在那之前我其实是不接商单
因为我觉得大多数来reach out的人 他的报价都是乱报 可能是因为你说的 有agent在中间抽成 或者说他们其实没有真的看我的内容等等 那你们是怎么样子做到这一点的 我们其实最早的时候 其实能够使用的这种 比如说真实的成交数据的量 其实是没有那么大的 即使说我们自己花了很多精力 去攒这些数据 那可能这个攒的规模
也就是1,000条左右 那通过1,000条 去把这个定价的这些公式里的因子 把它全部确定下来 其实一开始的时候一定是会不准的 但是在我们去调的这个过程当中 它在一些本身的我们数据集上面表现 它会变得越来越好 然后我们能够找到说这个因子是什么样的 再加上后来 其实真正的就是更多用户进来 用了之后的话 随着你的数据变多
它这个准确度就会越高 而且其实会有博主接不接的这个问题嘛 我们能拿到这个所谓的接受的接受率 然后通过接受率是可以 去调这些东西的 就是我们其实内部是知道说 大概在一个什么样的接受率下面 这个campaign是正常的 然后它是偏高的还是偏低的 比如说从信任层面的话 我们现在其实平台的中间 是一个担保的作用 当广告主去选择了一个达人
去开始合作的时候 这个钱的话会被锁在平台这边 这样能保证说达人做完了之后的话 这个钱能够真的就是给到他 品牌也不会跑掉 对于品牌来讲的话 达人只有在完成内容并且十天后 真正就是我们说确认收货之后 才会把这个钱真正给出去 这样子避免中途他这个合作不进行了 或者说人不见了之类的 那这个钱是能收的回来的
包括说比如说你内容上传上去之后 有一些这种CTA的链接有没有挂对 这些点的话 我们也会自动的去检查 这些其实能够帮助说 我们能够及时的立刻发现这种问题 而不至于说就是他可能很后置的发现 那这个内容已经发出去了 很多检查的地方没有做到位 然后导致两方都有这种损失 所以其实我们更希望Head AI(现已更名为Aha)
不只是说一个这种帮大家提效 而是说我们希望就是这个行业本身 能够建立起一个更好的生态 就大家的这个信任标准 它是通过两方的一个平衡 然后去建立的 你们是一个非常典型的 有这种network effect的平台公司哎 你们会未来做一些 比如说创作者工具吗 听起来你们也可以做一些事情 帮助创作者
做一个更好的商单视频出来 将来它确实是能做的 本身其实围绕着这个生态 其实能做的事情我觉得还挺多的 就是不管是帮创作者还是帮品牌 很多地方其实是有功能可以做 但是我们可能不会那么的激进的 特别快的开始去做 可能还是会觉得说 如果当产品在一个部分有PMF的话 那我们可能希望就是能够迅速的
先scale这个最痛的点 当这个点scale到一个 我们觉得 市场相对就渗透率是OK的状态下的话 我们再去做下一个功能点 你接下来要focus的事情 你想的也非常清楚 就是你的产品现在已经有PMF了 你想要把它做大 那很多同学也会关心 你怎么样子去做大 一个已经有PMF的产品呢 我们其实接下来会在 就是go to market的角度上面
去把产品从这种我们说最早期的 可能early adopter的用户 去推向更大众的这种早期用户 那这个方式 其实本身 我们觉得 是需要去建立对于AI的信任的 因为其实最早尝试的这一部分用户 他们是比较敢于去开始去尝试新产品 那你对于另外一部分公司来讲 他一定是要能够看到 就是AI能做出更靠谱的事情
他是真的能够在这件事情上交付结果 才会去选择去做 那我们其实自己的话 直接从我们就上线以来吧 我们其实记录了 就是我们这个过程当中 产品上面以及用户 如果说他当时自己去找了一些agency 或者说找了一些专家 自己去做的时候的一些数据 然后我们根据这个过程 去做了一支就是比较特别的短片
里面就是关于我们AI 如果真的跟五个人类专家 大家一起去做一个 这种密闭的一个实验 然后去做达人营销 到底这个过程里面是什么样的 我们会把每个环节 都就是还原在这短片里面 然后到时候我们会在10月29号的时候 在这个TechCrunch Disrupt的现场 包括线上上面去同步的去发布
希望其实让大家真正去看到 说今天可能AI在达人营销里面 到底能做到什么程度 哇听起来很有趣 然后很期待 我觉得你们其实在宣传上 天然有一个优势 因为你们有一个现成的 要被disrupt的行业 你们有现成的一个敌人 然后这个敌人大家都很讨厌 所以说你们只要对着这个敌人打 然后不断的展示你们比他们好在哪里
我觉得就很容易 是的是的 你做的所有的这些事情 听起来都很make sense 而且你们还在赚钱对吧 你们应该是已经盈亏平衡 可是其他的人体感是AI赛道这么卷 就是我做任何一个东西 所有人就会跑过来抄 那为什么没有人抄你们 你刚刚说了几个点 就比如说你们融资顺利 然后你们既懂达人营销 然后又懂AI的 但是我觉得 这些元素似乎不是那么难以集齐
你觉得除此以外还有什么点呢 因为其实这件事情本身的难度 或者复杂度还是挺高的 明确就是一个挺脏活累活的事情的 虽然今天可能我们做出来的一部分 就是感觉好像有一个东西在这了 但是这个过程里面它是很脏活累活的 那其实我们中间碰到过的一些 就是可能别人想做这个事情 他可能做一段时间其实就放弃了
因为中间一定会碰到 就是可能有一种 觉得让你完全解决不了的 这种程度的困难 那我们其实经历过很多次这种状态 比如说做定价 就是我们可能当时在那一个月里面吧 就是定价这个方案当时的效果 每次的测试结果都不让人那么满意 然后中间还甚至放弃过 说我们是不是没办法
真的去把定价这件事做出来 但到后来就是你可能熬着 就是最后把东西又做出来了 其实很多次 就是我觉得可能换别人 就应该是会把这件事情 可能就放弃掉了 因为你其实早期会在那一年里面 你的客户反馈各方面都是非常不好的 几乎是没有正反馈的 如果一个人在一年的时间里面 都没有任何正反馈的话
我觉得大部分人不太能熬得下去 那为什么你能熬得下去 我觉得我是一个 就是本身就不太给自己正反馈的人 说实话就是自己比较习惯的状态 反而就是我得碰到问题一直得有困难 可是你自己可以不用正反馈 你的团队呢 你怎么样子把这个公司给维持下来的 因为可能大家其他的人 需要这个正反馈 团队的话
我觉得其实也是更多时候是在筛选 本质上 我们其实很需要这种非常长期主义 然后能够在各种问题当中 还能够就是保持能够稳定输出的人 这样的人其实非常少 所以其实我们过程当中 也肯定碰到了很多没那么合适的人选 因为我们对于这个价值观 是比较坚定的 所以我们只选择这样的人
除了就是坚持和能解决问题 而且对这件事情有足够的conviction以外 我似乎感觉到你还有一个怎么说呢 是真的去读一些东西 的这样一个特质 听你说就是在Dora的时候 你就开始去做很多工作 包括你去看其他的人的blog 去学习一些方法 然后在这儿你又去把链条 给非常清楚的拆(开) 我觉得自己是一个
就是对于一些问题吧 特别其实从 比如说有一些技术角度的问题 我本身是不了解的 但我一旦知道这件事情的话 我就是一定要就是刨根问底的 就我一定会通过各种方式 哪怕去读论文 就是我非常难读懂 但我就是要把它就是死磕到底 就是我要把它读到我能理解的程度为止 也是一种就是跟自己很较这个真 我觉得这东西对我有用
那我就一定要掌握它 一天工作就是可能从早上10点到晚上 可能十一二点 一周的话五天 但是我有时候周末其实自己会工作 比如说我要写一些东西 或者学一些新东西的话 还是在工作 那你玩吗 也会玩 但我的娱乐活动其实也是输入型的 比如说很喜欢看话剧之类的 还在看内容 对
创业这段时间你的成长是非常快的 然后你看到了 我们很多没有看到的事情 体验过很多人没有的体验 基于这些体验 不要说给观众吧 给平行世界的你提一些建议的话 你会提什么建议 我觉得 要多做真的对用户有价值的事情 因为其实能选择去做的事情会有很多 然后你在这一路里面 会碰到很多的分岔口 但是其实真正对的事情
还是要真的对用户本身真的有价值 即使这条路可能他更难 或者其他人不认为这个东西有价值 那你就是得坚持做下去 让自己就是能够去犯错 一定要能犯错 如果说你不犯错的话 你没办法去迭代 然后你在 这迭代的过程当中 就是会变得越来越好 一直去坚定你的初心
就是做对用户有价值的事情 你一上来就知道 什么是对用户有价值的东西 哪怕很多其他的人不这么认为 你怎么知道的 我觉得对于Head AI(现已更名为Aha)来讲 因为我本身自己 过去就是市场负责人嘛 我其实也是这个产品的用户 所以我确实是很容易去理解说如果对于我自己来讲 如果还是当初的我的话 就是这件事情对我是不是有价值的
就是只有我自己 真的会为这件事情买单 我才会觉得这件事情有价值 但是这过程当中 不可能说完全不会有所动摇 就你会看到所谓的 大家觉得风口上面更大的机会 然后你可能也会动摇说自己当初认为的 就是什么事情是有价值的 这样的想法 你可能会犯错 然后你会走一条 可能就是相对可能更激进
但其实它对用户来讲 本身就没有那么有价值的 这样的选择 但是当你尝试完之后 你会发现说OK 真正对的事情还是在那里 然后你还是要去坚定那件事情 就有些认知 它其实是从一开始的时候 你知道这个事情的道理 但是如果你没有去实践 去犯过一次错的话 这个道理是没办法真正变成真理的 感谢感谢
我觉得这两个建议都非常好 希望大家是有学到 那我们这期访谈就到这 那我也希望大家follow Head AI(现已更名为Aha)的发展 你会接下来做很多scale up go to market的事情 然后我们也拭目以待你接下来一两年的成长 希望以后还会回到频道来 再跟我们大家分享你的体验
Loading video analysis...