注册并分享邀请链接,可获得视频播放与邀请奖励。

qinbafrank (@qinbafrank) “10、供应链 / 规模化优势 vs GPU 瓶颈 当前供应链核心紧缺环节为内存、HBM、CoWoS,我” — TopicDigg

qinbafrank 的个人资料封面
qinbafrank 的头像
qinbafrank
@qinbafrank
Investor in AI、Crypto、TMT,跟踪最前沿科技趋势、野生宏观政经观察、研究全球资本流动性、周期趋势投资。记录个人学习和思考,经常出错常态掉坑爬坑。Runner🏃
加入 December 2020
1.1K 正在关注    121.5K 粉丝
10、供应链 / 规模化优势 vs GPU 瓶颈
当前供应链核心紧缺环节为内存、HBM、CoWoS,我方均无需使用;台积电3纳米产能也极度紧缺,我方采用5纳米工艺。台积电是Cerebras投资方,可满足我方产能增长需求,包括2025年底提出的2026年大幅扩产需求,以保障OpenAI合作履约。硬件制造受物理光速极限限制,制造、运输需遵循物理规律。我方将成硬件行业史上最快实现10亿、20亿、50亿、100亿美元营收的企业,有望创造行业增速纪录,但产能扩张仍受供应链周期制约,预计未来几年制造能力年增幅约10倍,该增速为行业上限。

11. 台积电产能 / 前端分配
我方已获得2026、2027年充足产能分配,未来若调整产能需求,台积电将积极配合。台积电战略层面注重客户多元化,不愿将产能集中于少数大客户,避免生态单一化,这一战略让我方充分受益。去年我方未进入台积电前150大客户,今年将跻身前15名,产能保障充足。高速增长过程中,虽给供应链及合作伙伴带来压力,但供应商均积极响应,我方对供应链的响应速度十分认可,发展过程中或有波折,但整体产能保障无忧。

12. Groq / LPU 竞争
市场表现已明确竞争格局:Groq2025年营收约5000万美元,毛利率为负;我方营收约5亿美元,毛利率40%左右,速度比Groq快12倍。LPU虽采用SRAM架构,部分设计思路与我方一致,但芯片面积仅800平方毫米,承载中等模型需数千颗芯片,超大模型需芯片数量更多,片外通信次数极多,效率低下,速度提升存在根本性瓶颈,即便被英伟达收购,该短板也无法解决。

13. 解耦推理 / 超大规模云服务商 vs 新型云服务商
专业化布局存在市场机会,可通过专业化实现速度提升,需在专业化、速度与灵活性之间权衡。行业热议解耦方案,但目前尚无企业实现规模化落地。解耦方案可提升吞吐量、降低token成本,但需为预填充、解码阶段分配不同算力,若工作负载或流量特性变化,算力配比失衡会导致算力闲置,闲置算力成本极高。AWS等超大规模云服务商优势显著,可合作搭建解耦方案,流量变化时可依托庞大算力集群分流;新型云厂商劣势明显,多部署单一功能、单一客户的专用算力,无冗余集群分流低效流量。长期来看,行业将形成解耦与非解耦并存的异构算力集
显示更多