【人工智能】程序员如何不被AI玩废 | Anthropic论文 | Vibe Coding陷阱 | 技能退化 | 认知卸载 | 交互税 | 快乐但无知 | 生存指南 | 逻辑思维 | 人机共存
By 最佳拍档
Summary
## Key takeaways - **AI组得分低17%**: Anthropic论文实验显示,使用AI辅助的程序员在学习Trio库的测试中,平均得分比手动组低17%,调试能力分差最大。 [03:27], [03:51] - **交互税抹平时间优势**: AI组平均耗时23分钟,手动组24.7分钟,仅差1.7分钟,因为程序员需花费大量时间构思提示词和反复沟通,部分达11分钟。 [04:15], [04:47] - **甩手掌柜型零掌握**: 甩手掌柜型程序员直接复制任务给AI生成代码,平均19.5分钟完成任务,但对Trio库掌握程度几乎为零。 [06:37], [07:01] - **概念询问型高分**: 打破砂锅型程序员用AI解决概念问题,如Trio中await关键字原理,不让AI生成代码,自己手写,成绩达65%-86%。 [08:33], [09:19] - **认知卸载致技能萎缩**: 过度依赖AI导致认知卸载,如穿外骨骼使肌肉萎缩,程序员失去独立思考、逻辑推演能力,AI组报错仅1次,手动组3次。 [11:19], [12:48] - **快乐但无知幻觉**: AI组主观觉得任务容易轻松,但测试表现差;手动组觉得痛苦煎熬,却得分高,产生虚假自信,一旦脱离AI即手足无措。 [15:07], [15:53]
Topics Covered
- 过度依赖AI导致编程能力退化
- AI组效率无优势源于交互税
- 六种AI使用流派决定学习效果
- 认知卸载让技术肌肉萎缩
- 正确使用AI守住核心竞争力
Full Transcript
大家好,这里是最佳拍档 最近一年 AI在编程领域的应用彻底刷新了行业认知 自然语言就是新的编程语言 这句话被无数从业者奉为圭臬 而由特斯拉前AI总监安德烈·卡帕西带火的Vibe Coding 更是将这种AI编程的狂热推到了顶峰 在很多人看来 Vibe Coding似乎让编程这项原本需要长期积累的技能 变得触手可及
你不需要精通编程语言的语法 不需要深究代码的底层实现 甚至不需要具备系统的编程思维 只要对着AI工具说出你的需求 然后凭借感觉 确认一下结果是否符合预期 一行行代码就会自动生成 这种模式下 程序员的职业门槛仿佛被彻底抹平 就连零基础的新手 都能借助AI快速完成看似复杂的编程任务 但是
就在所有人都沉浸在AI带来的编程便利中时 Anthropic却在2026年1月底 发布了一篇题为《AI如何影响技能形成》的论文 给这股AI编程的热潮泼了一盆冷水 这篇论文通过随机对照实验 揭露了一个残酷的真相 如果在学习新的编程知识、接触新的技术领域时 过度依赖AI 程序员不仅无法实现真正的效率提升
自身的核心编程能力还会出现显著的退化 久而久之 甚至会变成一个失去独立思考和解决问题能力的“半废”工程师 今天,我们就来解析一下这篇论文 看看Vibe Coding究竟是如何影响程序员的技能形成 而我们又该如何在AI时代正确处理人机关系 守住作为程序员的核心竞争力 首先 我们来看看Anthropic的研究团队
究竟做了一个怎样的实验 为了模拟程序员在实际工作中最常遇到的场景 比如突然被要求 使用一款从未接触过的工具或框架来解决问题 研究团队找来了50多位拥有实际项目经验的Python程序员 设计了一场接近于闭卷考试的实验 实验的核心任务 是让这些程序员学习一款相对冷门的Python异步编程库Trio
并且完成一系列对应的异步编程任务 之所以选择Trio库 是因为它属于Python高阶网络编程范畴 能够有效检验程序员的快速学习能力和代码实践能力 完全符合职场中 接触新技术、解决新问题的真实场景 研究团队将这些程序员随机分成了两个组别 两组人员的编程经验、技术水平在统计学上没有显著差异
确保了实验的公平性 第一组被定义为手动组 这组程序员在完成任务的过程中 只能通过查阅Trio库的官方文档、使用Google进行关键词搜索的方式获取信息 被严格禁止使用任何AI辅助工具 第二组则是AI组 研究团队为他们配备了基于GPT-4o打造的强大AI助手 这组程序员可以在任务的任何阶段
向AI提问、让AI直接生成代码、甚至让AI帮忙调试代码中的Bug 拥有Vibe Coding的全部操作权限 在所有程序员完成指定的异步编程任务后 研究团队为所有人组织了一场专门的学习成果测试 测试内容全面覆盖了Trio库的编程语法、代码逻辑的理解能力、代码阅读能力 以及最能体现程序员核心素养的调试能力
力求全方位检验两组人员对新工具的掌握程度 在实验开始前 几乎所有人都理所当然地认为 配备了GPT-4o的AI组 会在任务完成效率和学习成果测试中 全面碾压只能依靠“土法炼钢”的手动组 毕竟GPT-4o在代码生成、问题解答方面的能力 已经得到了行业的广泛认可 有这样的工具加持 AI组的优势似乎不言而喻
但是当实验结果正式出炉时 与大家的预期却截然相反 数据显示,在最终的学习成果测试中 使用了AI辅助的程序员 考试得分平均比手动组低了17%, 而且这种分数上的差距并非均匀分布 在所有测试维度中 调试能力的分差是最大的 面对这样的结果 很多Vibe Coding的支持者可能会有这样的辩解 就算学习效果差了一点
至少AI辅助让编程的效率变高了 节省了大量的时间 这也是职场中最看重的一点 但是遗憾的是 Anthropic的实验数据再次打破了这种幻想 研究报告显示 在完成Trio库相关编程任务的总耗时上 AI组和手动组在统计学上并没有显著差异 AI组的平均耗时为23分钟 而手动组的平均耗时仅为24.7分钟
只有区区1.7分钟的差距 要知道 AI组可是有GPT-4o的全程辅助 为什么最终的耗时并没有出现明显的优势?
研究团队在论文中给出了答案 那就是被很多人忽视的时间成本 交互税 所谓的交互税 指的是程序员为了让AI精准理解自己的需求、生成符合预期的代码 需要花费大量的时间和精力 构思并且撰写提示词 甚至需要反复与AI沟通、调整需求描述 这个过程本身就会消耗大量的时间 实验数据显示,部分AI组的程序员
仅仅是为了让AI生成一段符合要求的代码 就花费了11分钟与AI进行沟通 还有的程序员在一项总耗时35分钟的任务中 竟然有30%的时间 都用在构思如何向AI提问上 除了交互税 Vibe Coding的另一个短板,调试困难 也进一步加剧了时间的消耗 AI组的程序员在遇到代码报错时
很容易陷入一种“试错式调试”的恶性循环 让AI生成代码,运行后出现报错 不做任何分析就把报错信息直接丢给AI 让AI重新生成代码 再次运行又出现新的报错 然后重复上述过程 在这个循环中 整个编程工程会逐渐变成一个不可逆转的屎山黑箱 我们经常会听到屎山代码这个词
指的是代码结构混乱、逻辑不清晰、难以理解和维护的状态 而黑箱则意味着程序员完全不清楚系统的内部结构和运行逻辑 更可怕的是,在这个过程中 程序员的大脑始终处于一种挂机等待结果的状态 既没有真正节省时间 也没有从中学到任何有价值的知识和技能 只是成为了AI的操作手 到这里
相信很多人已经对Vibe Coding产生了质疑 但是这篇论文的价值远不止于此 研究团队最精彩的发现 是通过对AI组程序员的操作过程 进行全程录屏分析 根据他们使用AI的不同方式 将其划分成了六种截然不同的流派 研究人员发现 虽然AI组的整体平均分远低于手动组 但是组内的分数方差极大
简单来说,同样是使用AI辅助编程 有的人的测试成绩惨不忍睹 而有的人的成绩却能和手动组持平甚至接近 两者的差距天差地别 而造成这种差距的核心原因 并不是程序员本身的技术水平 而是他们使用AI的方式不同 具体来说 这六种流派可以被清晰地分为两大类别 第一类是属于“AI废人”的低分低能组
这部分程序员的考试得分极其惨烈 平均分都在40%以下 处于不及格的水平 而这一大类又能细分为三个具体的类型 第一种是“甩手掌柜型”(AI Delegation) 这类程序员的操作方式非常简单直接 就是把实验的任务要求原封不动地复制给AI 只留下一句 帮我写个函数解决这个问题 然后将AI生成的代码直接复制粘贴
完成任务后直接交卷 从数据来看 这类程序员的任务完成速度 确实是最快的 平均仅用19.5分钟就能完成任务 但是他们对Trio库的掌握程度几乎为零 整个过程中没有进行任何思考 完全是AI在主导一切 用一句通俗的话来说 我奶奶来做都能行 第二种是半途而废型(Progressive AI Reliance)
这类程序员最初还想依靠自己的能力完成任务 会尝试自己写几行代码 但是一旦遇到报错或者无法解决的问题 心态就会立刻崩溃 随即放弃自主思考 算了,还是让AI来吧 然后彻底躺平 将后续的所有工作都交给AI 第三种是盲目试错型(Iterative AI Debugging) 这也是最典型的无脑Vibe Coding 这类程序员在遇到代码Bug时
连报错信息的回溯都不会看 更不会尝试分析报错的原因 而是直接把报错信息扔给AI AI给出新的代码后 看都不看就直接运行,一旦再次报错 就继续将新的报错信息丢给AI 反复循环 这部分程序员是整个实验中最惨的一群人 他们不仅浪费了大量的时间 最终还拿到了极低的分数
全程都在充当AI的人肉测试员 没有任何收获 与低分低能组形成鲜明对比的 是第二类高分高能组 这部分程序员虽然同样使用了AI辅助 但是他们的考试成绩能达到65%到86%, 甚至能和手动组的成绩持平 换句话说 他们真正找到了人机共生的正确方式 让AI成为了自己的“助力”而非“主力”,
而这一类同样可以细分为三个具体的类型 第一种是打破砂锅型(Conceptual Inquiry) 这类程序员的核心特点是 几乎不会让AI直接生成代码 他们使用AI的唯一目的 是解决自己在学习过程中遇到的概念性问题 比如 Trio库中为什么要用await关键字?
结构化并发的核心原理是什么?
Nursery机制是如何管理并发子任务的?
他们会先通过AI 搞懂所有的底层原理和核心概念 然后依靠自己的能力手写代码完成任务 真正把AI当成了导师而非实习生 而这种使用方式 也要求程序员本身具备一定的专业素养 知道该问什么问题 该从哪个角度切入学习 也就是所谓的,懂行、会问 第二种是先斩后奏型(Generation-Then-Comprehension)
这类程序员会让AI直接生成代码 但是他们并不会像甩手掌柜型那样 直接复制粘贴 而是会在使用代码之前 向AI提出一个关键问题 比如请解释一下这行代码为什么这么写?
核心逻辑是什么?
就是这一句简单的追问 不仅能让AI对自己生成的代码进行一次自审 更重要的是,程序员能通过AI的解释 了解到AI的编程思路和底层逻辑 将AI的输出转化为自己的知识 真正做到了 知其然,也知其所以然 第三种是混合双打型(Hybrid Code-Explanation) 这类程序员融合了前两种类型的核心特点 他们在向AI提出需求时
会直接写出这样的提示词 请根据需求写出对应的代码 并详细解释每一步的逻辑和设计思路 这种提示词的设计 强制让AI输出自己的推理思维链 而程序员则会跟着AI的思维链进行思考 不仅能理解代码的逻辑 还能学习到AI的编程思路 同时也为后续的调试工作 打下了坚实的基础
让调试不再是无迹可寻的黑箱操作 看到这里 相信大家都会有这样的疑问 同样是使用基于GPT 4 o打造的AI助手 为什么不同程序员的学习效果 会有如此大的差距呢?
答案其实很简单 并非AI本身废掉了程序员 而是一部分程序员在偷懒的诱惑面前 主动选择了缴械投降 放弃了作为程序员最核心的能力 独立思考和逻辑推演 他们把AI当成了逃避思考的避风港 而另一部分程序员则始终保持着主动认知的习惯 把AI当成了提升自己的工具 这也是两者差距的核心所在 Anthropic的这篇研究报告
不仅是揭示了Vibe Coding的弊端 更重要的是 它触及了一个经典的心理学概念 认知卸载 所谓认知卸载 指的是当外部工具足够强大时 人类会下意识的 把原本需要自己的大脑处理的计算、记忆、逻辑推演等认知任务 卸载给外部工具 就像我们在开车时使用自动驾驶功能 把驾驶的任务卸载给汽车的智能系统一样 而在AI时代
尤其是在Vibe Coding的模式下 我们正在把编程中最核心的理解力 卸载给大模型 我们不再需要理解代码的逻辑 不再需要记忆语法规则 不再需要推演程序的运行过程 因为这一切都可以由AI来完成 研究团队在论文中用了一个非常贴切的比喻来形容这种现象 AI就像一副外骨骼一样 当你穿上这副外骨骼时 你会感觉自己力大无穷
能够轻松搬起千斤重的物体 完成原本无法完成的工作 但是问题在于,人类肌肉的生长 需要依靠持续的负重和肌肉撕裂后的修复 如果你长期穿着外骨骼而不脱下来 你的肌肉会因为缺乏足够的刺激而逐渐萎缩 最终失去原本的力量 编程能力的培养也是如此 程序员所谓的技术肌肉
也就是代码理解能力、逻辑推演能力、调试能力 需要依靠持续的思考、尝试、犯错和解决问题来锻炼 而如果长期依靠AI 把原本属于自己的认知任务卸载给AI 这些核心能力就会像缺乏锻炼的肌肉一样 逐渐退化甚至消失 在这篇论文中 有一个看似不起眼、但是细思极恐的数据
那就是两组程序员在完成任务过程中的报错数量 实验数据显示 手动组的程序员在完成Trio库相关编程任务时 平均每人遇到了3次报错 每次遇到报错,他们都被迫停下来 盯着屏幕上的红色报错信息 查阅官方文档、搜索相关资料、反复思考报错的原因 而AI组的程序员 平均每人只遇到了1次报错 大多数时候
AI生成的代码不仅能直接运行 而且运行得极其顺滑 几乎不会出现任何问题 看到这里,可能有人会认为 报错少是AI的一大优势 能让编程过程更加顺畅 但是Anthropic的研究人员却指出 这恰恰是问题的根源 论文中明确写道 遭遇并独立解决错误 是技能形成的关键一环 手动组的程序员之所以能在最终的测试中取得更高的分数
真正掌握Trio库的使用方法 就是因为他们在学习过程中经历了足够的摩擦 每一次报错 都是现实世界给程序员的思维带来的一次阻力 而正是为了克服这种阻力 程序员的大脑才会被迫进行深度思考 进而建立起深刻的心理表征 心理表征是认知心理学中的一个专业术语 指的是当外部信息进入人脑之后
会被大脑进行加工处理 最终以一种独特的结构储存在大脑中 这种结构能让我们快速理解和处理相关信息 对于程序员来说,解决报错的过程 就是建立关于代码和技术的心理表征的过程 而这种心理表征 正是形成核心编程能力的关键 而AI组的程序员 虽然体验到了极其平滑的编程过程 却也因此失去了建立心理表征的机会
就像一个长期穿着外骨骼的人 失去了对地面的抓地力 一旦脱下外骨骼,就连路都不会走了 当他们脱离AI的辅助 需要独立面对编程问题时 就会变得手足无措 因为他们的大脑中没有建立起对应的心理表征 既无法理解代码的逻辑 也无法排查和解决问题 不过,这种AI过于平滑所带来的问题 不仅仅存在于编程领域
也正在逐渐蔓延到我们生活的方方面面 在创作领域 AI消除了构思的枯燥和创作的瓶颈 让我们误以为自己拥有了无限的创意 却忽略了创意本身需要长期的积累和思考 在人际关系领域 AI的出现甚至开始消除人与人之间的摩擦 很多人沉迷于和AI的交流 因为AI永远情绪稳定,永远秒回消息 永远顺着你的话说
这种极致的平滑关系 其实也是一种Vibe Social 但它却让我们失去了处理真实人际关系中矛盾和冲突的能力 Vibe Coding最迷人 同时也最危险的地方 就在于它为程序员制造了一种“快乐但无知”的认知幻觉 在实验过程中 研究团队记录了所有程序员的主观感受 结果发现了一个非常有趣的现象 AI组的程序员
普遍觉得这次的Trio库编程任务很容易 完成过程非常轻松 而手动组的程序员则普遍觉得任务很难 整个完成过程充满了痛苦和煎熬 但反转也来得非常干脆 那些主观觉得任务容易的AI组程序员 在随后的学习成果测试中表现一塌糊涂 而那些觉得任务困难、经历了诸多煎熬的手动组程序员 不仅在测试中取得了更高的分数
而且在后续的自我报告中 他们的学习和成长感 也远高于AI组的程序员 这种认知幻觉 让很多程序员在Vibe Coding的模式下 产生了一种“我行我上”的虚假自信 他们会觉得,在AI的辅助下 能够轻松完成各种编程任务 于是便误以为自己的编程能力得到了提升 觉得自己是个编程天才
但是这种自信是建立在AI的基础上的 一旦代码出现AI无法解决的问题 或者脱离AI的辅助 他们就会立刻发现 自己其实只是个对代码一无所知的“睁眼瞎”。
更值得注意的是 这种认知幻觉和能力退化的现象 并不会因为程序员的从业经验丰富而消失 Anthropic的研究团队也考虑到了这一点 他们按照编程经验 将所有参与实验的程序员分成了三个层级 1到3年的初级程序员、4到6年的中级程序员 以及7年以上的资深程序员 然后分别统计不同经验层级中
AI组和手动组的测试成绩 实验结果显示,在所有的经验层级中 不使用AI辅助的手动组 考试得分都显著高于使用AI辅助的AI组 哪怕是拥有7年以上编程经验的资深工程师 在面对Trio库这个全新的技术领域时 如果过度依赖AI 他们的学习效果依然会大打折扣 这个结果再次印证了论文的核心观点 AI辅助带来的生产力提升
并不是获得真正专业能力的捷径 过度依赖AI 会让任何经验水平的程序员 在学习新技术时失去独立思考的能力 进而影响技能的形成 说到这里 可能很多人会产生一种误解 认为Anthropic的这篇论文 是在否定AI在编程领域的价值 呼吁大家放弃使用AI 退回到纯手写代码的时代 但是事实并非如此
研究团队在论文中明确表示 AI确实能为编程工作带来显著的生产力提升 尤其是对于新手程序员来说 AI能帮助他们快速入门 解决一些基础的编程问题 这一点是毋庸置疑的 这篇论文的真正价值 并不是让我们因噎废食 而是为我们提供了一份AI时代的程序员生存指南 告诉我们如何正确地使用AI
如何在借助AI提升效率的同时 守住自己的核心竞争力 避免被AI给废掉 而这份生存指南的核心 其实就是从那些高分高能组的程序员身上 总结出的正确的AI使用方式 首先,要改变自己的提问方式 多问为什么,少说帮我做 把AI当成自己的导师而非苦力 遇到问题时 先尝试自己思考,实在无法解决时
再向AI提问概念性、原理性的问题 而不是直接让AI替自己完成工作 其次,即使让AI生成了代码 也不要直接复制粘贴使用 而是要像审视同事写的代码一样 逐行阅读AI生成的代码 理解每一行代码的逻辑和设计思路 必要时让AI对代码进行详细解释 把AI的知识转化为自己的知识
最后,要珍视每一次调试的机会 当代码出现报错时 不要第一时间就把报错信息丢给AI 而是试着先自己分析5分钟 尝试找到报错的原因 哪怕最终还是需要依靠AI解决问题 这个自主分析的过程 也是对自己编程能力的锻炼 AI就像一辆性能卓越的汽车 能让我们在编程的道路上跑得更快、更远 但前提是
我们必须自己掌握驾驶的技巧 知道路在哪里 更知道当汽车出现故障时 该如何修理 如果我们只是把方向盘交给AI 让AI全程代驾 那么即使我们走了很远的路 也依然不会开车 当AI这个代驾失效的那一刻 我们就会陷入寸步难行的境地 对于程序员来说 AI永远只是一个工具 而真正的核心竞争力 永远是那些无法被AI替代的能力
包括独立思考的能力、逻辑推演的能力、解决复杂问题的能力 以及持续学习的能力 在AI时代,真正优秀的程序员 或许将是那些能让AI成为自己的最佳拍档 在AI的辅助下不断提升自己的人 只有守住独立思考的底线 让自己的技术肌肉始终保持锻炼的状态 才能在AI浪潮中站稳脚跟 不被时代淘汰
感谢收看本期视频,我们下期再见
Loading video analysis...