注册并分享邀请链接,可获得视频播放与邀请奖励。

lifcc (@mylifcc) “Google再次发力,昨天Google 丢出了Gemma4 系列的QAT模型,直接让16GB MAC可以跑256k” — TopicDigg

lifcc 的个人资料封面
lifcc 的头像
lifcc
@mylifcc
每天用 AI 写代码的工程师 Claude Code | Codex深度用户 |Agentic engineering 在这里分享 AI 工具实测和开发者工作流
加入 January 2022
248 正在关注    3.7K 粉丝
Google再次发力,昨天Google 丢出了Gemma4 系列的QAT模型,直接让16GB MAC可以跑256k上下文的agent了。 之前有人说Gemma 4 12B 本地部署30k上下文没啥用,我用 Google QAT 尝试了一下,只要增加1.5GB内存就能打开256k上下文! 左边:常规 Q4_K_M @ 32K 右边:Google QAT Q4_0 @ 256K 同一台 Mac、同一 prompt、两个 llama-server 同时跑,实时对比内存、CPU、tok/s。
显示更多
0
13
103
10
转发到社区