TopicDigg
最新
社区
登录
注册
注册并分享邀请链接,可获得视频播放与邀请奖励。
立即注册
axiaisacat (@axiaisacat) “4GB 显卡跑 70B 大模型,听起来像标题党。 但 AirLLM 这个 21.4k Star 项目,README” — TopicDigg
axiaisacat
@axiaisacat
Independent developer building AI-powered web products. Creating APIs, tools, and applications that solve real problems. MCN Founder
加入 September 2025
253
正在关注
4.9K
粉丝
axiaisacat
@axiaisacat
2026.06.25 01:38
4GB 显卡跑 70B 大模型,听起来像标题党。 但 AirLLM 这个 21.4k Star 项目,README 第一屏就写得很直: 70B 模型,单张 4GB GPU 推理。 Llama 3.1 405B,8GB VRAM 也能跑。 它不是把模型砍小。 也不是靠蒸馏、剪枝糊弄过去。 核心思路是把推理时的内存占用压下来: 模型按层拆开,需要哪层加载哪层,再配合预取和压缩,把“显存不够”这件事往后推。 这对本地大模型玩家很要命。 因为过去很多所谓“本地部署”,真正的门槛不是会不会写代码,而是你有没有足够贵的显卡。
显示更多
0
0
0
3
0
转发到社区
热门用户
Serenity
@aleabitoreddit
898.2K 粉丝
sunny
@77sunnyx
1.1M 粉丝
Reuters
@Reuters
26M 粉丝
BTS_official
@bts_bighit
45.1M 粉丝
NBA
@NBA
46.7M 粉丝
BABYMONSTER
@YGBABYMONSTER_
858.8K 粉丝
BTS JAPAN OFFICIAL
@BTS_jp_official
13.7M 粉丝
ITZY
@ITZYofficial
6.3M 粉丝
菌烨tako
@Takomayuyi
2.7M 粉丝
2PM
@follow_2PM
1.2M 粉丝
Miu_Cosplayer
@smilecutty
731.1K 粉丝
TWICE
@JYPETWICE
12.6M 粉丝
TWICE JAPAN OFFICIAL
@JYPETWICE_JAPAN
3.5M 粉丝
ポケモン公式
@Pokemon_cojp
3M 粉丝
小空Sora
@konkon6927
427.9K 粉丝