Prompt Engineering已死,Loop Engineering接棒,
@karpathy 的做法我感觉最有画面感,晚上设好研究循环,自动改脚本,跑测试,留对的,扔错的,自己去睡觉,早上起来直接看结果,全程几乎不插手。
这就是现在圈里聊的Loop Engineering,从指挥AI一步步走,变成设计一个能自己跑完的系统。
四个支柱,每一个都是生产环境踩出来的血泪坑。
1️⃣知道什么时候停,别信它自己说搞定了,代码跑不通,逻辑有漏洞的情况比比皆是,要加硬性退出条件和独立验证,无数项目从demo到落地就死在这一步。
2️⃣保持上下文干净,循环跑久了旧错误,死胡同,冗余思考堆在一起,决策质量直线下滑,要把上下文当有限预算管,定期压缩,用子Agent隔离子任务。
3️⃣给真正能用的工具,不是堆一百个凑数量,要少而精不重叠,可安全重试,错误信息能被看懂,这是生产环境最容易翻车的地方。
4️⃣有能说不的机制,Agent不会挑自己的毛病,自己改作业永远满分,必须把干活的和检查的分开,也就是Maker-Checker模式,Claude Code团队早就在用了。
@bcherny 说得最直白,我已经不prompt Claude了,我写loops,然后让它们跑。
模型正在慢慢变成标准件,
同一个模型,配上更好的循环设计,效果能从中等拉到顶级。
真正的工程价值,早就从单次对话转移到了长期自治系统的设计上。
做Agent的朋友可以对照着查一遍,什么时候你从写提示词的人,变成了设计系统的人,什么时候才算摸到了下一阶段的门槛。