TopicDigg
最新
社区
登录
注册
注册并分享邀请链接,可获得视频播放与邀请奖励。
立即注册
耳朵
(@RookieRicardoR)
@RookieRicardoR
👂 倾听世界,萃取本质,分享洞见 | 👨💻 软件工程师 | 🤖 AI深度应用 | 深度思考 / AI / 人文 / 技术
408
正在关注
10.5K
粉丝
耳朵
@RookieRicardoR
2026.05.26 10:17
同样的 DeepSeek V4 Pro,不同平台成本相差太多了。 在 DeepSeek 官方平台,我用了 1500W Token 只花了 2.43 元,但是在阿里百炼等云平台,同样打了 2.5 折,同样的输入输出,账单大概在 25-35 元,十倍的价格。 这么大价差的原因就出在缓存上,DeepSeek 官方平台的缓存读取价格是 0.025/M,而阿里腾讯云平台,打完 2.5 折后,价格还在 0.25/M,这也是十倍的差价。 1️⃣ 为什么 DeepSeek 官方平台成本这么低? 根据 DeepSeek 的官方文档,它用硬盘实现了前缀缓存。 在一般的大模型推理中,KV Cache 几乎全部放在 HBM 中,而把缓存放在硬盘的做法,能大幅降低硬件成本。 由于用了硬盘,所以 DeepSeek 的缓存不光便宜,时间还长,它的缓存时间是几个小时到几天不等。 2️⃣ 为什么云厂商没做到硬盘缓存? 云厂商一般都是有多级缓存机制的,但是他们都是通用架构,目的是为了适配多种模型,再上下文缓存方面一定比不过 DeepSeek 官方平台的专属配套。 DeepSeek 系列模型在 V2 做了 MLA,V4 又做了 Token 维度压缩 + DSA 稀疏注意力,大幅降低长上下文计算和显存需求。 通过把 KV Cache 大幅压缩,使得传输带宽和存储容量下降,才能把缓存放到低成本硬盘上。 而且 DeepSeek 官方 API 的速度也普遍更快一点,用 DeepSeek 的话真没必要选第三方平台。 缓存文档:
显示更多
0
0
29
334
25
转发到社区
耳朵
@RookieRicardoR
2026.03.26 04:31
@dotey
是个好办法 唯一的问题就是很多人电脑上有 npm node 但是没有 bun
0
0
0
0
0
转发到社区
耳朵
@RookieRicardoR
2025.12.07 03:35
现代人不需要去干体力活,但是仍然需要去健身房。 宝玉老师这个解释说的太好了。 后端描述不清还有个上下文的问题,因为后端微服务居多,经常一个需求操作 3-4 个仓库,这样的话在一个 Task 里去写操作 3-4 个仓库代码效果有点不稳定。 不过听了宝玉老师的说法,我觉得还是要把更多的后端代码也尝试交给 AI,因为我现在觉得麻烦至极的事,过几个月可能就因为模型能力升级而轻松解决了。
显示更多
0
0
0
5
0
转发到社区
加载中...
热门用户
Serenity
@aleabitoreddit
491.2K 粉丝
BTS_official
@bts_bighit
45.1M 粉丝
ITZY
@ITZYofficial
6.3M 粉丝
BABYMONSTER
@YGBABYMONSTER_
858.8K 粉丝
BTS JAPAN OFFICIAL
@BTS_jp_official
13.7M 粉丝
2PM
@follow_2PM
1.2M 粉丝
ポケモン公式
@Pokemon_cojp
2.9M 粉丝
22/7(ナナブンノニジュウニ)
@227_staff
64.2K 粉丝
TWICE JAPAN OFFICIAL
@JYPETWICE_JAPAN
3.5M 粉丝
BABYMONSTER JAPAN OFFICIAL
@_BABYMONSTER_JP
191.9K 粉丝
TWICE
@JYPETWICE
12.4M 粉丝
ENHYPEN
@ENHYPEN_members
13.8M 粉丝
GOT7
@GOT7Official
8.8M 粉丝
フレッシュ撮影会【公式】
@fresh_akiba
74.7K 粉丝
Pop Crave
@PopCrave
3.9M 粉丝