TopicDigg
最新
社区
登录
注册
注册并分享邀请链接,可获得视频播放与邀请奖励。
立即注册
Berryxia.AI (@berryxia) “这下让真的可以让很多人都闭嘴了! Unsloth把GLM-5.2压缩到1-bit后。 本地跑起来居然” — TopicDigg
Berryxia.AI
@berryxia
Building AI tools AI System Prompt Love Design & Coding & Share Prompt! 📮:Andyhuo
@me
.com
加入 December 2011
655
正在关注
44.7K
粉丝
Berryxia.AI
@berryxia
2026.06.25 09:18
这下让真的可以让很多人都闭嘴了! Unsloth把GLM-5.2压缩到1-bit后。 本地跑起来居然还能和Claude Opus、GPT-5.5正面比创意输出。 他们用Mac Studio M3 Ultra 256GB RAM跑1-bit版本,速度还能到21 tok/s左右。 在同一个prompt下生成的HTML/设计效果,看起来甚至比闭源模型更丰富、更“有想法”。 这已经不是简单的量化了,而是把一个原本需要海量显存的超大模型,硬生生塞进了消费级硬件还能打。 GLM-5.2本身就以创意和长上下文见长,现在连极致量化后都还能保持较强的表现,确实有点超出预期。 这也再次验证了一个趋势:开源模型在极端优化后,正在快速缩小和闭源前沿模型在实际可用性上的差距,尤其是在本地部署和特定任务上。 大内存的本子这下真的太香了,Qwen 3.7 这些模型又该迭代版了。
显示更多
Unsloth AI
@UnslothAI
2026.06.23 13:53
1-bit GLM-5.2 GGUF vs. Claude 4.8 Opus vs. GPT-5.5 We gave 3 models the same prompt and compared one-shot outputs. The 1-bit GLM-5.2 GGUF ran locally on a Mac Studio M3 Ultra with 256GB RAM at ~21.6 tok/s. Which output do you like best? GGUF:
显示更多
0
0
1
3
0
转发到社区
热门用户
Serenity
@aleabitoreddit
898.2K 粉丝
sunny
@77sunnyx
1.1M 粉丝
Reuters
@Reuters
26M 粉丝
BTS_official
@bts_bighit
45.1M 粉丝
NBA
@NBA
46.7M 粉丝
BABYMONSTER
@YGBABYMONSTER_
858.8K 粉丝
BTS JAPAN OFFICIAL
@BTS_jp_official
13.7M 粉丝
ITZY
@ITZYofficial
6.3M 粉丝
菌烨tako
@Takomayuyi
2.7M 粉丝
2PM
@follow_2PM
1.2M 粉丝
Miu_Cosplayer
@smilecutty
731.1K 粉丝
TWICE
@JYPETWICE
12.6M 粉丝
TWICE JAPAN OFFICIAL
@JYPETWICE_JAPAN
3.5M 粉丝
ポケモン公式
@Pokemon_cojp
3M 粉丝
小空Sora
@konkon6927
427.9K 粉丝