注册并分享邀请链接,可获得视频播放与邀请奖励。

Berryxia.AI (@berryxia) “睡前来一发,这个视频还是挺完美的。 Anthropic的应用AI工程师Margot Van Laar在Code” — TopicDigg

Berryxia.AI 的个人资料封面
Berryxia.AI 的头像
Berryxia.AI
@berryxia
Building AI tools AI System Prompt Love Design & Coding & Share Prompt! 📮:Andyhuo@me.com
加入 December 2011
655 正在关注    44.7K 粉丝
睡前来一发,这个视频还是挺完美的。 Anthropic的应用AI工程师Margot Van Laar在Code with Claude分享了提示词工程的实战手册。 核心观点是:我们很少从零写提示词,大部分时间都在调试和维护已有的生产提示词。 最好的起点永远是评估(Eval),而不是直接改提示词。 她用两个真实场景演示了最佳实践: 1. 维护已有提示词(客服机器人) - 先做通用清理:用XML标签结构化(角色/政策/语气/指南分开)、移除冗余补丁、明确输出格式。 - 常见陷阱:以前为旧模型加的“禁止列表”指令,在新模型上会过度拟合,导致模型隐瞒它其实能提供的信息。 - 当模型需要做精确计算时,指令没用,要给它工具。 - 升级/转人工的决策,要把代价和收益两面都说清楚,否则模型会过度优化某一边。 2. 从零构建新Agent(零售排班) - 单一复杂提示词容易失败。 - 更好的方式是拆成生成-评估-修复循环,让三个简单提示词各司其职。 - 模型选择很重要:更强的推理模型(Opus)+ 自适应思考,往往比小模型+复杂提示词更高效。 她反复强调:评估是唯一能告诉你改动是否真正有效的严谨方式。 没有评估,就只是在碰运气。
显示更多