Cerebras最新路演纪要,官方说法作为参考。
1. OpenAI交易 / 生产验证 / 收入可见性
OpenAI已与多家企业达成硬件合作,目前仅英伟达、Cerebras将其模型投入生产运行。我方与OpenAI签有约束力“照付不议”合同,涉及750兆瓦电力,合同总金额超200亿美元,预付款10亿美元。协议分三期执行:2026、2027、2028年各部署250兆瓦。2026年250兆瓦通过Cerebras云平台交付,租赁三年,OpenAI享有第四、五年续租权;2027-2028年,OpenAI可选择买断设备或继续通过云平台接收。此外,OpenAI拥有额外1.25吉瓦容量选择权,这是硅谷史上规模最大的交易之一。财务核算及券商模型均采用最保守假设:三期容量全部通过云平台交付,收入分摊周期最长,资本支出最高。
2. 为什么 OpenAI 需要 Cerebras / 延迟作为产品问题
OpenAI通过与Cerebras合作解决该问题,这笔交易未来几年价值超200亿美元。山姆·奥特曼总结速度价值:AI响应迅速时,用户使用频次、停留时长提升,且会将其应用于更重要场景。
3. 推理 / 智能体计算爆发
当前处于推理时代,推理是通过算力生成更优答案的技术,也是AI推理计算量庞大的核心原因,这对算力速度占优的Cerebras极为有利。全球顶尖模型,包括Gemini、Claude、OpenAI GPT、中美各类模型,均采用推理技术。单次推理仅需基础算力生成答案,而思考式推理需消耗约100倍算力,通过拆解问题、分步解决、校验整合、起草审查后输出方案,答案质量更高,但耗时与算力消耗大幅增加。从推理迈向“智能体+推理”阶段,单条查询会启动多条推理流,计算量将呈指数级增长。
4. 核心速度主张 / 跨模型广度
Cerebras打造了全球最快的推理基础设施,速度比最快GPU快约15倍,该优势并非特例,覆盖美国、中国各类模型,大模型、小模型,万亿级、十亿级参数模型全场景,全场景均实现15倍速度提升。行业已普遍认可我方为全球最快解决方案,这源于我们攻克了晶圆级处理器技术,该技术曾被认为75年无法实现。我方处理器尺寸如餐盘,传统处理器仅邮票大小,芯片面积比最大GPU大58倍,内存带宽超GPU2500倍,是高速推理的核心基础。
5. 架构 / 为何晶圆级技术对推理至关重要
推理的核心逻辑是:生成下一个词,需将所有模型权重从内存传输至计算单元,逐词顺序执行。700亿参数模型属小模型,其权重数据量约等于100部高清电影,生成每个词都需传输该规模数据。演示中1000词的回答,相当于传输10万部高清电影的数据。GPU的HBM内存至计算单元传输速度约8TB/秒,Cerebras晶圆级处理器该传输速度达21000TB/秒,比GPU快2600多倍。我方采用大芯片设计,搭载高速SRAM存储器,通过扩大芯片面积,解决了SRAM存储密度低的传统短板。
6. 扩展至大规模 / 万亿参数模型
GPU面临模型规模扩容的行业难题,结合服务OpenAI及其他客户的实践,分享超大模型承载方案:针对1.1万亿参数模型,我方软件会拆分模型,分配至不同处理器,以流水线方式运行推理,可支撑全球最大规模开源、闭源模型。我方不单独销售芯片,主打销售系统及云平台使用时长。
7. 高速运行时的成本 / 功耗与GPU对比
行业常误解GPU有统一定价,GB200 NVL72在35token/秒低速下,可输出约500万token/秒,支撑数万用户同时使用,低速运行时GPU效率极高;但在270token/秒高速下,仅能支撑1名用户,成本极高。性能对比需明确运行速度,GPU低速运行时效率占优,100-150token/秒区间后,GPU成本飙升、能效骤降,我方成本与功耗仅为GPU极小部分。若将我方性能纳入英伟达性能图表,需大幅调整横轴刻度,我方性能已超出图表范围,再多GPU也无法达到我方速度,该高速区间内我方无竞争对手。
8. 毛利率 / 定价 / 成本杠杆
我方已实现满产良率,第三代产品良率优于B200,供应链成本仍有压缩空间,定价策略可进一步优化。去年营收约5亿美元,毛利率约50%,供应链投入2.5亿美元,运营效率有待提升。供应链投入规模扩大后,成本将持续改善;定价方面,过去四个月我方已提价30%,Anthropic推出速度提升2倍的服务,收费提高6倍,而我方速度比其快15倍,定价上限仍有较大探索空间。鲍勃补充:定价与成本端均有利润率提升空间,中期潜力或超预期。
9. 2026年毛利率下滑 / 产能限制是问题所在,而非产品经济性
2026年毛利率将下滑,主因是2025年下半年AI推理需求下,自有数据中心利润率偏低,导致2025年毛利率下降4个百分点,2026年将进一步下滑。随着自有数据中心产能扩张,逐步退出租赁模式,毛利率将快速反弹,回归60%出头的长期目标。当前积压订单对应的毛利率已达该长期水平,待自有数据中心产能充足,无需租赁外部产能后,毛利率将快速提升至长期目标值。
本条由
@bitget_zh赞助,「Bitget 买美股:秒级入场,丝滑交易 」