注册并分享邀请链接,可获得视频播放与邀请奖励。

anonymous (@youyouAllen) “在何恺明的ELF模型上做proposer训练,分别在最新的qwen3.6,gemma4,DeepSeek v4上带” — TopicDigg

anonymous 的个人资料封面
anonymous 的头像
anonymous
@youyouAllen
Nothing
加入 August 2014
1.1K 正在关注    3.1K 粉丝
在何恺明的ELF模型上做proposer训练,分别在最新的qwen3.6,gemma4,DeepSeek v4上带来的kv cache存储节省的净收益14-60倍。何恺明会不会在AI存储上再次搞出当年AI ResNet的效应? 😂
显示更多