Bohu (@BohuTANG) “Cursor 还是有两下子的，危机感非常强，训 Composer 2.5 的做法： 1. 把全部权重押在”

2026.06.04 08:48

Cursor 还是有两下子的，危机感非常强，训 Composer 2.5 的做法： 1. 把全部权重押在一个任务上。不做通用编程，只做"Cursor 里的软件工程"。模型就像一块存储盘，容量有限，那就把所有权重都喂给这一个任务 —— Composer 比 Opus 便宜一个数量级 2. 基座用 Kimi（1T MoE，30B active），先做接近预训练规模的 mid-training 灌代码 token，把分布铺宽；再上大规模 RL 把分布削尖。mid-training 让它会写代码，RL 让它写"对"的代码 3. 让模型直接在自己的 harness 里 RL。工具怎么调、环境怎么导航，全部烤进权重，不靠 prompt 描述 —— "prompt engineering 有上限，想做好产品就得改模型本身"。连上下文压缩都塞进 RL loop（self-summarization）：200K 窗口的模型，实际能连续跑到百万 token 4. 不用第三方 RL 环境厂商，直接拿生产环境（隔离副本）训；再加 real-time RL —— 从用户 happy/sad 的信号里，每几小时更新一次模型 Cursor × Fireworks · Sequoia Podcast 2026.05

显示更多

104

转发到社区

热门用户