【人工智能】程序员如何不被AI玩废 | Anthropic论文 | Vibe Coding陷阱 | 技能退化 | 认知卸载 | 交互税 | 快乐但无知 | 生存指南 | 逻辑思维 | 人机共存

By 最佳拍档

Summary

## Key takeaways - **AI组得分低17%**: Anthropic论文实验显示，使用AI辅助的程序员在学习Trio库的测试中，平均得分比手动组低17%，调试能力分差最大。 [03:27], [03:51] - **交互税抹平时间优势**: AI组平均耗时23分钟，手动组24.7分钟，仅差1.7分钟，因为程序员需花费大量时间构思提示词和反复沟通，部分达11分钟。 [04:15], [04:47] - **甩手掌柜型零掌握**: 甩手掌柜型程序员直接复制任务给AI生成代码，平均19.5分钟完成任务，但对Trio库掌握程度几乎为零。 [06:37], [07:01] - **概念询问型高分**: 打破砂锅型程序员用AI解决概念问题，如Trio中await关键字原理，不让AI生成代码，自己手写，成绩达65%-86%。 [08:33], [09:19] - **认知卸载致技能萎缩**: 过度依赖AI导致认知卸载，如穿外骨骼使肌肉萎缩，程序员失去独立思考、逻辑推演能力，AI组报错仅1次，手动组3次。 [11:19], [12:48] - **快乐但无知幻觉**: AI组主观觉得任务容易轻松，但测试表现差；手动组觉得痛苦煎熬，却得分高，产生虚假自信，一旦脱离AI即手足无措。 [15:07], [15:53]

Topics Covered

过度依赖AI导致编程能力退化
AI组效率无优势源于交互税
六种AI使用流派决定学习效果
认知卸载让技术肌肉萎缩
正确使用AI守住核心竞争力

Full Transcript

大家好，这里是最佳拍档最近一年 AI在编程领域的应用彻底刷新了行业认知自然语言就是新的编程语言这句话被无数从业者奉为圭臬而由特斯拉前AI总监安德烈·卡帕西带火的Vibe Coding 更是将这种AI编程的狂热推到了顶峰在很多人看来 Vibe Coding似乎让编程这项原本需要长期积累的技能变得触手可及

你不需要精通编程语言的语法不需要深究代码的底层实现甚至不需要具备系统的编程思维只要对着AI工具说出你的需求然后凭借感觉确认一下结果是否符合预期一行行代码就会自动生成这种模式下程序员的职业门槛仿佛被彻底抹平就连零基础的新手都能借助AI快速完成看似复杂的编程任务但是

就在所有人都沉浸在AI带来的编程便利中时 Anthropic却在2026年1月底发布了一篇题为《AI如何影响技能形成》的论文给这股AI编程的热潮泼了一盆冷水这篇论文通过随机对照实验揭露了一个残酷的真相如果在学习新的编程知识、接触新的技术领域时过度依赖AI 程序员不仅无法实现真正的效率提升

自身的核心编程能力还会出现显著的退化久而久之甚至会变成一个失去独立思考和解决问题能力的“半废”工程师今天，我们就来解析一下这篇论文看看Vibe Coding究竟是如何影响程序员的技能形成而我们又该如何在AI时代正确处理人机关系守住作为程序员的核心竞争力首先我们来看看Anthropic的研究团队

究竟做了一个怎样的实验为了模拟程序员在实际工作中最常遇到的场景比如突然被要求使用一款从未接触过的工具或框架来解决问题研究团队找来了50多位拥有实际项目经验的Python程序员设计了一场接近于闭卷考试的实验实验的核心任务是让这些程序员学习一款相对冷门的Python异步编程库Trio

并且完成一系列对应的异步编程任务之所以选择Trio库是因为它属于Python高阶网络编程范畴能够有效检验程序员的快速学习能力和代码实践能力完全符合职场中接触新技术、解决新问题的真实场景研究团队将这些程序员随机分成了两个组别两组人员的编程经验、技术水平在统计学上没有显著差异

确保了实验的公平性第一组被定义为手动组这组程序员在完成任务的过程中只能通过查阅Trio库的官方文档、使用Google进行关键词搜索的方式获取信息被严格禁止使用任何AI辅助工具第二组则是AI组研究团队为他们配备了基于GPT-4o打造的强大AI助手这组程序员可以在任务的任何阶段

向AI提问、让AI直接生成代码、甚至让AI帮忙调试代码中的Bug 拥有Vibe Coding的全部操作权限在所有程序员完成指定的异步编程任务后研究团队为所有人组织了一场专门的学习成果测试测试内容全面覆盖了Trio库的编程语法、代码逻辑的理解能力、代码阅读能力以及最能体现程序员核心素养的调试能力

力求全方位检验两组人员对新工具的掌握程度在实验开始前几乎所有人都理所当然地认为配备了GPT-4o的AI组会在任务完成效率和学习成果测试中全面碾压只能依靠“土法炼钢”的手动组毕竟GPT-4o在代码生成、问题解答方面的能力已经得到了行业的广泛认可有这样的工具加持 AI组的优势似乎不言而喻

但是当实验结果正式出炉时与大家的预期却截然相反数据显示，在最终的学习成果测试中使用了AI辅助的程序员考试得分平均比手动组低了17%，而且这种分数上的差距并非均匀分布在所有测试维度中调试能力的分差是最大的面对这样的结果很多Vibe Coding的支持者可能会有这样的辩解就算学习效果差了一点

至少AI辅助让编程的效率变高了节省了大量的时间这也是职场中最看重的一点但是遗憾的是 Anthropic的实验数据再次打破了这种幻想研究报告显示在完成Trio库相关编程任务的总耗时上 AI组和手动组在统计学上并没有显著差异 AI组的平均耗时为23分钟而手动组的平均耗时仅为24.7分钟

只有区区1.7分钟的差距要知道 AI组可是有GPT-4o的全程辅助为什么最终的耗时并没有出现明显的优势？

研究团队在论文中给出了答案那就是被很多人忽视的时间成本交互税所谓的交互税指的是程序员为了让AI精准理解自己的需求、生成符合预期的代码需要花费大量的时间和精力构思并且撰写提示词甚至需要反复与AI沟通、调整需求描述这个过程本身就会消耗大量的时间实验数据显示，部分AI组的程序员

仅仅是为了让AI生成一段符合要求的代码就花费了11分钟与AI进行沟通还有的程序员在一项总耗时35分钟的任务中竟然有30%的时间都用在构思如何向AI提问上除了交互税 Vibe Coding的另一个短板，调试困难也进一步加剧了时间的消耗 AI组的程序员在遇到代码报错时

很容易陷入一种“试错式调试”的恶性循环让AI生成代码，运行后出现报错不做任何分析就把报错信息直接丢给AI 让AI重新生成代码再次运行又出现新的报错然后重复上述过程在这个循环中整个编程工程会逐渐变成一个不可逆转的屎山黑箱我们经常会听到屎山代码这个词

指的是代码结构混乱、逻辑不清晰、难以理解和维护的状态而黑箱则意味着程序员完全不清楚系统的内部结构和运行逻辑更可怕的是，在这个过程中程序员的大脑始终处于一种挂机等待结果的状态既没有真正节省时间也没有从中学到任何有价值的知识和技能只是成为了AI的操作手到这里

相信很多人已经对Vibe Coding产生了质疑但是这篇论文的价值远不止于此研究团队最精彩的发现是通过对AI组程序员的操作过程进行全程录屏分析根据他们使用AI的不同方式将其划分成了六种截然不同的流派研究人员发现虽然AI组的整体平均分远低于手动组但是组内的分数方差极大

简单来说，同样是使用AI辅助编程有的人的测试成绩惨不忍睹而有的人的成绩却能和手动组持平甚至接近两者的差距天差地别而造成这种差距的核心原因并不是程序员本身的技术水平而是他们使用AI的方式不同具体来说这六种流派可以被清晰地分为两大类别第一类是属于“AI废人”的低分低能组

这部分程序员的考试得分极其惨烈平均分都在40%以下处于不及格的水平而这一大类又能细分为三个具体的类型第一种是“甩手掌柜型”（AI Delegation）这类程序员的操作方式非常简单直接就是把实验的任务要求原封不动地复制给AI 只留下一句帮我写个函数解决这个问题然后将AI生成的代码直接复制粘贴

完成任务后直接交卷从数据来看这类程序员的任务完成速度确实是最快的平均仅用19.5分钟就能完成任务但是他们对Trio库的掌握程度几乎为零整个过程中没有进行任何思考完全是AI在主导一切用一句通俗的话来说我奶奶来做都能行第二种是半途而废型（Progressive AI Reliance）

这类程序员最初还想依靠自己的能力完成任务会尝试自己写几行代码但是一旦遇到报错或者无法解决的问题心态就会立刻崩溃随即放弃自主思考算了，还是让AI来吧然后彻底躺平将后续的所有工作都交给AI 第三种是盲目试错型（Iterative AI Debugging）这也是最典型的无脑Vibe Coding 这类程序员在遇到代码Bug时

连报错信息的回溯都不会看更不会尝试分析报错的原因而是直接把报错信息扔给AI AI给出新的代码后看都不看就直接运行，一旦再次报错就继续将新的报错信息丢给AI 反复循环这部分程序员是整个实验中最惨的一群人他们不仅浪费了大量的时间最终还拿到了极低的分数

全程都在充当AI的人肉测试员没有任何收获与低分低能组形成鲜明对比的是第二类高分高能组这部分程序员虽然同样使用了AI辅助但是他们的考试成绩能达到65%到86%，甚至能和手动组的成绩持平换句话说他们真正找到了人机共生的正确方式让AI成为了自己的“助力”而非“主力”，

而这一类同样可以细分为三个具体的类型第一种是打破砂锅型（Conceptual Inquiry）这类程序员的核心特点是几乎不会让AI直接生成代码他们使用AI的唯一目的是解决自己在学习过程中遇到的概念性问题比如 Trio库中为什么要用await关键字？

结构化并发的核心原理是什么？

Nursery机制是如何管理并发子任务的？

他们会先通过AI 搞懂所有的底层原理和核心概念然后依靠自己的能力手写代码完成任务真正把AI当成了导师而非实习生而这种使用方式也要求程序员本身具备一定的专业素养知道该问什么问题该从哪个角度切入学习也就是所谓的，懂行、会问第二种是先斩后奏型（Generation-Then-Comprehension）

这类程序员会让AI直接生成代码但是他们并不会像甩手掌柜型那样直接复制粘贴而是会在使用代码之前向AI提出一个关键问题比如请解释一下这行代码为什么这么写？

核心逻辑是什么？

就是这一句简单的追问不仅能让AI对自己生成的代码进行一次自审更重要的是，程序员能通过AI的解释了解到AI的编程思路和底层逻辑将AI的输出转化为自己的知识真正做到了知其然，也知其所以然第三种是混合双打型（Hybrid Code-Explanation）这类程序员融合了前两种类型的核心特点他们在向AI提出需求时

会直接写出这样的提示词请根据需求写出对应的代码并详细解释每一步的逻辑和设计思路这种提示词的设计强制让AI输出自己的推理思维链而程序员则会跟着AI的思维链进行思考不仅能理解代码的逻辑还能学习到AI的编程思路同时也为后续的调试工作打下了坚实的基础

让调试不再是无迹可寻的黑箱操作看到这里相信大家都会有这样的疑问同样是使用基于GPT 4 o打造的AI助手为什么不同程序员的学习效果会有如此大的差距呢？

答案其实很简单并非AI本身废掉了程序员而是一部分程序员在偷懒的诱惑面前主动选择了缴械投降放弃了作为程序员最核心的能力独立思考和逻辑推演他们把AI当成了逃避思考的避风港而另一部分程序员则始终保持着主动认知的习惯把AI当成了提升自己的工具这也是两者差距的核心所在 Anthropic的这篇研究报告

不仅是揭示了Vibe Coding的弊端更重要的是它触及了一个经典的心理学概念认知卸载所谓认知卸载指的是当外部工具足够强大时人类会下意识的把原本需要自己的大脑处理的计算、记忆、逻辑推演等认知任务卸载给外部工具就像我们在开车时使用自动驾驶功能把驾驶的任务卸载给汽车的智能系统一样而在AI时代

尤其是在Vibe Coding的模式下我们正在把编程中最核心的理解力卸载给大模型我们不再需要理解代码的逻辑不再需要记忆语法规则不再需要推演程序的运行过程因为这一切都可以由AI来完成研究团队在论文中用了一个非常贴切的比喻来形容这种现象 AI就像一副外骨骼一样当你穿上这副外骨骼时你会感觉自己力大无穷

能够轻松搬起千斤重的物体完成原本无法完成的工作但是问题在于，人类肌肉的生长需要依靠持续的负重和肌肉撕裂后的修复如果你长期穿着外骨骼而不脱下来你的肌肉会因为缺乏足够的刺激而逐渐萎缩最终失去原本的力量编程能力的培养也是如此程序员所谓的技术肌肉

也就是代码理解能力、逻辑推演能力、调试能力需要依靠持续的思考、尝试、犯错和解决问题来锻炼而如果长期依靠AI 把原本属于自己的认知任务卸载给AI 这些核心能力就会像缺乏锻炼的肌肉一样逐渐退化甚至消失在这篇论文中有一个看似不起眼、但是细思极恐的数据

那就是两组程序员在完成任务过程中的报错数量实验数据显示手动组的程序员在完成Trio库相关编程任务时平均每人遇到了3次报错每次遇到报错，他们都被迫停下来盯着屏幕上的红色报错信息查阅官方文档、搜索相关资料、反复思考报错的原因而AI组的程序员平均每人只遇到了1次报错大多数时候

AI生成的代码不仅能直接运行而且运行得极其顺滑几乎不会出现任何问题看到这里，可能有人会认为报错少是AI的一大优势能让编程过程更加顺畅但是Anthropic的研究人员却指出这恰恰是问题的根源论文中明确写道遭遇并独立解决错误是技能形成的关键一环手动组的程序员之所以能在最终的测试中取得更高的分数

真正掌握Trio库的使用方法就是因为他们在学习过程中经历了足够的摩擦每一次报错都是现实世界给程序员的思维带来的一次阻力而正是为了克服这种阻力程序员的大脑才会被迫进行深度思考进而建立起深刻的心理表征心理表征是认知心理学中的一个专业术语指的是当外部信息进入人脑之后

会被大脑进行加工处理最终以一种独特的结构储存在大脑中这种结构能让我们快速理解和处理相关信息对于程序员来说，解决报错的过程就是建立关于代码和技术的心理表征的过程而这种心理表征正是形成核心编程能力的关键而AI组的程序员虽然体验到了极其平滑的编程过程却也因此失去了建立心理表征的机会

就像一个长期穿着外骨骼的人失去了对地面的抓地力一旦脱下外骨骼，就连路都不会走了当他们脱离AI的辅助需要独立面对编程问题时就会变得手足无措因为他们的大脑中没有建立起对应的心理表征既无法理解代码的逻辑也无法排查和解决问题不过，这种AI过于平滑所带来的问题不仅仅存在于编程领域

也正在逐渐蔓延到我们生活的方方面面在创作领域 AI消除了构思的枯燥和创作的瓶颈让我们误以为自己拥有了无限的创意却忽略了创意本身需要长期的积累和思考在人际关系领域 AI的出现甚至开始消除人与人之间的摩擦很多人沉迷于和AI的交流因为AI永远情绪稳定，永远秒回消息永远顺着你的话说

这种极致的平滑关系其实也是一种Vibe Social 但它却让我们失去了处理真实人际关系中矛盾和冲突的能力 Vibe Coding最迷人同时也最危险的地方就在于它为程序员制造了一种“快乐但无知”的认知幻觉在实验过程中研究团队记录了所有程序员的主观感受结果发现了一个非常有趣的现象 AI组的程序员

普遍觉得这次的Trio库编程任务很容易完成过程非常轻松而手动组的程序员则普遍觉得任务很难整个完成过程充满了痛苦和煎熬但反转也来得非常干脆那些主观觉得任务容易的AI组程序员在随后的学习成果测试中表现一塌糊涂而那些觉得任务困难、经历了诸多煎熬的手动组程序员不仅在测试中取得了更高的分数

而且在后续的自我报告中他们的学习和成长感也远高于AI组的程序员这种认知幻觉让很多程序员在Vibe Coding的模式下产生了一种“我行我上”的虚假自信他们会觉得，在AI的辅助下能够轻松完成各种编程任务于是便误以为自己的编程能力得到了提升觉得自己是个编程天才

但是这种自信是建立在AI的基础上的一旦代码出现AI无法解决的问题或者脱离AI的辅助他们就会立刻发现自己其实只是个对代码一无所知的“睁眼瞎”。

更值得注意的是这种认知幻觉和能力退化的现象并不会因为程序员的从业经验丰富而消失 Anthropic的研究团队也考虑到了这一点他们按照编程经验将所有参与实验的程序员分成了三个层级 1到3年的初级程序员、4到6年的中级程序员以及7年以上的资深程序员然后分别统计不同经验层级中

AI组和手动组的测试成绩实验结果显示，在所有的经验层级中不使用AI辅助的手动组考试得分都显著高于使用AI辅助的AI组哪怕是拥有7年以上编程经验的资深工程师在面对Trio库这个全新的技术领域时如果过度依赖AI 他们的学习效果依然会大打折扣这个结果再次印证了论文的核心观点 AI辅助带来的生产力提升

并不是获得真正专业能力的捷径过度依赖AI 会让任何经验水平的程序员在学习新技术时失去独立思考的能力进而影响技能的形成说到这里可能很多人会产生一种误解认为Anthropic的这篇论文是在否定AI在编程领域的价值呼吁大家放弃使用AI 退回到纯手写代码的时代但是事实并非如此

研究团队在论文中明确表示 AI确实能为编程工作带来显著的生产力提升尤其是对于新手程序员来说 AI能帮助他们快速入门解决一些基础的编程问题这一点是毋庸置疑的这篇论文的真正价值并不是让我们因噎废食而是为我们提供了一份AI时代的程序员生存指南告诉我们如何正确地使用AI

如何在借助AI提升效率的同时守住自己的核心竞争力避免被AI给废掉而这份生存指南的核心其实就是从那些高分高能组的程序员身上总结出的正确的AI使用方式首先，要改变自己的提问方式多问为什么，少说帮我做把AI当成自己的导师而非苦力遇到问题时先尝试自己思考，实在无法解决时

再向AI提问概念性、原理性的问题而不是直接让AI替自己完成工作其次，即使让AI生成了代码也不要直接复制粘贴使用而是要像审视同事写的代码一样逐行阅读AI生成的代码理解每一行代码的逻辑和设计思路必要时让AI对代码进行详细解释把AI的知识转化为自己的知识

最后，要珍视每一次调试的机会当代码出现报错时不要第一时间就把报错信息丢给AI 而是试着先自己分析5分钟尝试找到报错的原因哪怕最终还是需要依靠AI解决问题这个自主分析的过程也是对自己编程能力的锻炼 AI就像一辆性能卓越的汽车能让我们在编程的道路上跑得更快、更远但前提是

我们必须自己掌握驾驶的技巧知道路在哪里更知道当汽车出现故障时该如何修理如果我们只是把方向盘交给AI 让AI全程代驾那么即使我们走了很远的路也依然不会开车当AI这个代驾失效的那一刻我们就会陷入寸步难行的境地对于程序员来说 AI永远只是一个工具而真正的核心竞争力永远是那些无法被AI替代的能力

包括独立思考的能力、逻辑推演的能力、解决复杂问题的能力以及持续学习的能力在AI时代，真正优秀的程序员或许将是那些能让AI成为自己的最佳拍档在AI的辅助下不断提升自己的人只有守住独立思考的底线让自己的技术肌肉始终保持锻炼的状态才能在AI浪潮中站稳脚跟不被时代淘汰

感谢收看本期视频，我们下期再见

Loading...

Loading video analysis...