
AI 提速了原型却没有解决收尾、验证和维护大组织往往会先被低质量代码反噬。原文链接AI 小老六如果一个团队的提交量在三个月里翻了一倍PR 描述写得更像样了样例项目也铺得更快这到底说明了什么很多人会本能地把它理解成效率革命已经落地。我没这么乐观。现在最常见的错觉是把前半程顺滑当成 整件事都变简单了。模型在起手阶段确实很猛。找资料、搭脚手架、写一个能跑的原型、把想法摁进一个可见的界面这些事它做得又快又便宜。问题出在后面。真正贵的部分从来不是把第一版凑出来而是把边界补齐、把异常路径走通、把接口收紧、把别人的旧代码接上再让半年后的自己还能看懂。图模型能显著压缩起手时间却无法替团队免掉后段收尾成本原型阶段很爽收尾阶段最贵很多人第一次用智能体写代码都会有同一种兴奋感它几分钟就能铺开一大坨东西像是把原本几小时的活一下子掰平了。可软件工程的成本结构不是平均分布的。真正吃时间的是最后那一截也是最需要判断力的那一截。最糟的是模型生成的代码常常不是明显错误而是 **“差一点” 的答案**。测试也许能过命名也许没问题分层甚至看起来挺讲究可一旦你开始继续迭代前面的松散假设、偷懒的抽象和没有讲透的边界就会一起反噬。你会发现自己不是少干了活而是把工作换成了另一种更烦的活审代码猜意图补约束收残局真正昂贵的不是把第一版写出来而是把它变成一个能长期维护的系统。高手能纠错组织未必能个人开发者和大组织使用这类工具结果很可能完全不同。高手通常有很强的 自校验能力知道哪些地方可以借力哪些地方必须亲手收。模型给他的价值更像 增压器而不是方向盘。大组织则容易把这件事做反。链路长、责任散、评审时间被压缩、交付节奏又快最容易出现的不是“没人会用”而是“会一点的人大量在用”。结果就是低质量内容以极高速度流入主干局部看都像在进展整体看却在透支未来的维护成本。图同样的 AI 工具在高手手里像增压器在大组织里却可能变成放大器场景智能体带来的短期收益真实风险搜索资料、搭 demo很高风险可控返工成本低写生产代码的第一版中等如果没人严审技术债会被提前埋进去复杂重构、跨模块改动表面很高误改、误解上下文、破坏隐含约束最严重长期维护的业务系统不稳定产能上去了平均质量未必守得住语法正确不再等于工程正确过去大家会凭一些外观线索判断东西靠不靠谱。代码格式整齐、命名规整、文档像模像样至少说明作者花过心思。现在这些线索正在失效。模型特别擅长把东西写得 像那么回事而人又天然容易被这种表面完成度麻痹。这不是说生成结果一无是处而是说旧的质量代理指标正在失灵。今天最需要重新训练的能力不是“怎么把提示词写得更花”而是“怎么更早识别那些结构上不对、但局部句子全都没毛病的产物”。这件事很难也很花精力。先决定哪些工作可以放心外包更务实的办法是先划清边界而不是笼统问“模型能不能写代码”。这个问题太大也太容易把讨论带偏。真正有用的是把任务拆开看哪些工作出错成本低。哪些工作一旦出错会把团队拖进泥里。适合放手给模型的通常是 信息检索、样板搭建、一次性脚本、局部试验。不能轻易放手的是 定义边界条件、修改核心约束、清理历史包袱、做长期维护的架构决策。后一类工作真正值钱的地方不在于写出第一版代码而在于知道什么绝对不能碰坏。产能崇拜是这轮工具热最危险的副作用真正让我警惕的不是某个模型今天又多会写几门语言而是很多团队已经开始把输出变多当成唯一捷报。代码量、PR 数、原型数量这些指标天然好看也天然容易诱导管理层做错决策。图当团队只奖励输出变多时真正被累积起来的往往是维护负担软件工程从来不是桶越多越好。桶多了垃圾也会更多。真正稀缺的东西一直没变能辨认什么是好设计能在局部诱惑面前守住整体约束能把一套系统几年之后还维持在可控状态智能体没有把这部分稀缺性抹平它只是把低质量产出的放大器做得更便宜了。所以问题不该是 “AI 会不会取代工程师”而该是 “团队有没有能力抵挡一大堆看起来像成果的半成品”。如果这个问题答不上来最先被放大的不会是生产力而是组织里本来就存在的低质量部分。推荐阅读Claude Code 如何压缩上下文Microcompact、Prompt Cache 与 cache_edits 工程拆解前端别再乱接管浏览器了! 自定义滚动、密码框、日期控件这些为什么总把体验做坏平台智能化到了分水岭为什么配置代码化才是 AI Coding 的下一代接口技术沟通为什么总在返工你写的是文档产品听到的却不是同一种语言为什么 AI Coding 难进生产环境深入了解 Everything-Claude-Code