注册并分享邀请链接,可获得视频播放与邀请奖励。

Bohu (@BohuTANG) “Cursor 还是有两下子的,危机感非常强,训 Composer 2.5 的做法: 1. 把全部权重押在” — TopicDigg

Bohu 的个人资料封面
Bohu 的头像
Bohu
@BohuTANG
Founder, | (Model + Harness) × Data
加入 May 2008
122 正在关注    3.2K 粉丝
Cursor 还是有两下子的,危机感非常强,训 Composer 2.5 的做法: 1. 把全部权重押在一个任务上。不做通用编程,只做"Cursor 里的软件工程"。模型就像一块存储盘,容量有限,那就把所有权重都喂给这一个任务 —— Composer 比 Opus 便宜一个数量级 2. 基座用 Kimi(1T MoE,30B active),先做接近预训练规模的 mid-training 灌代码 token,把分布铺宽;再上大规模 RL 把分布削尖。mid-training 让它会写代码,RL 让它写"对"的代码 3. 让模型直接在自己的 harness 里 RL。工具怎么调、环境怎么导航,全部烤进权重,不靠 prompt 描述 —— "prompt engineering 有上限,想做好产品就得改模型本身"。连上下文压缩都塞进 RL loop(self-summarization):200K 窗口的模型,实际能连续跑到百万 token 4. 不用第三方 RL 环境厂商,直接拿生产环境(隔离副本)训;再加 real-time RL —— 从用户 happy/sad 的信号里,每几小时更新一次模型 Cursor × Fireworks · Sequoia Podcast 2026.05
显示更多
0
8
104
12
转发到社区