Cursor 还是有两下子的,危机感非常强,训 Composer 2.5 的做法:
1. 把全部权重押在一个任务上。不做通用编程,只做"Cursor 里的软件工程"。模型就像一块存储盘,容量有限,那就把所有权重都喂给这一个任务 —— Composer 比 Opus 便宜一个数量级
2. 基座用 Kimi(1T MoE,30B active),先做接近预训练规模的 mid-training 灌代码 token,把分布铺宽;再上大规模 RL 把分布削尖。mid-training 让它会写代码,RL 让它写"对"的代码
3. 让模型直接在自己的 harness 里 RL。工具怎么调、环境怎么导航,全部烤进权重,不靠 prompt 描述 —— "prompt engineering 有上限,想做好产品就得改模型本身"。连上下文压缩都塞进 RL loop(self-summarization):200K 窗口的模型,实际能连续跑到百万 token
4. 不用第三方 RL 环境厂商,直接拿生产环境(隔离副本)训;再加 real-time RL —— 从用户 happy/sad 的信号里,每几小时更新一次模型
Cursor × Fireworks · Sequoia Podcast 2026.05
显示更多