注册并分享邀请链接,可获得视频播放与邀请奖励。

rick awsb ($people, $people) 的个人资料封面
rick awsb ($people, $people) 的头像

rick awsb ($people, $people) (@rickawsb)

@rickawsb
瞎读书,乱解释,买啥亏啥,宏观小学生,政经评论外卖员,正在ai中慢慢迷失自我,crypto holder, defi farmer, not financial advice 非投资建议
12.3K 正在关注    148.5K 粉丝
预判正确让我感到更多是恐惧,而不是兴奋 如果你记得预测链条的下一个是什么的话
@rickawsb 老板又一次封神. 提前买
本月最好的存储的产业分析! 满满的财富密码
AI半导体终局推演2026(II) 当半导体结构性演进到AI推理主线,内存和存储成为了最大瓶颈,市场对内存和存储最大的怀疑就是: HBM/DRAM/SSD会不会摆脱传统周期性? 依赖HBM指数增长的GPU架构路线进化路线,会不会停止?什么时候停止? 长鑫扩产的影响有多大?会不会把这个市场重新带入周期泥潭? 本篇尝试去建立一个框架来梳理这几个问题 —---------—--------- 万物皆周期,而内存的周期性又特别强,最大的来源在于扩产周期过长,无法快速扩产和需求短缺时期错配 摆脱传统周期性几种可能的方式 1. 定制化:产品不可互换,产能不能随便转移,需要签长约。 2. 结构性的指数级需求增长:需求曲线本身很陡峭,而且供给一直追不上。 3. 技术迭代快速升级:每一代产品都快速淘汰上一代。 满足任何一条,就能部分摆脱传统周期;满足两到三条,就能摆脱大部分传统周期 根据这个框架, HBM在三条里,大概占了两条半 1. 定制化,需要签长约(较弱,算半条) HBM 确实有定制化和Nvidia codesign的成分,但并不是很强。真正定制的部分只在封装和 base die,上面那十几层 DRAM die 仍然是完全 JEDEC 标准化的。 比如当 Samsung 的 HBM3E 在 NVIDIA 的 qualification 上没过、份额从大约 60% 一路跌到 20% 的时候,它并没有把这批产能砸在手里报废,而是转手就供给了 Google 的 TPU、AMD. 物理上,给 NVIDIA 的 HBM3E 和给 AMD 的 HBM3E,是同一个东西。 所以产能仍然是部分可以自由转移的。 HBM4之后的定制化更多一些,包括在 base die 上集成定制逻辑和/或缓存。更复杂的方式是将 HBM4E 内存控制器和定制 die-to-die 接口直接放入逻辑 base die SemiAnalysis 提到 OpenAI、NVIDIA 和 AMD 各自都在做定制 HBM 的工作,但这指的是 base die 的定制,上面的 DRAM 层仍然是标准的。 部分定制化的特性,HBM主要在封装上需要合作,这也导致了客户必须签长约,但产能也确实可以转移,所以HBM 能勉强算半条。 2. 结构性的指数需求增长(满足) 最直观的原因,就是Nvidia token factory token throughput的硬件升级需求,导致了HBM带宽的升级换代极快,以及HBM size需求的指数增长 这一条其实就是上一篇AI半导体终局推演2026(I)的结论: token throughput = HBM size × HBM 带宽,每一代翻倍。 HBM size per GPU大概每年增长40%以上 这条需求曲线的陡峭程度,是DRAM供给端 14% 的 wafer 增长,乘以 9% 的 density 提升,很难追上的 在硬件领域,因为attn阶段KV cahce的极高带宽和极高memory size的要求,也导致了HBM独特的地位。即便是HBM涨价三五倍,把钱花在HBM上带来的边际token throughput提升,仍然比花在其他地方要划算的多。 其他几个Memory路线,SRAM,HBF,CXL,PIM,目前都无法在HBM的主力赛道kv cache/attention上正面竞争,起码未来5年甚至更长时间,不太可能找到替代路线 3. 技术迭代快速升级(满足) DDR3时代过了15年,仍然只是DDR5时代,而HBM的升级换代的速度基本上是两年一代,比传统DDR要快很多很多,而且近来还有加速的趋势,HBM size x HBM BW每一代翻倍,目前是完全符合这个规律的 每两年一代HBM升级,NV GPU速度基本是指数型上升:2TB/s ->3.5TB/s->4.8TB/s ->8TB/s->22TB/s,而且HBM的速度和推理token throughput是完全线性正比的,上一代HBM的边际使用成本会不划算,大家都有动机去尽量用最新的产品,虽然更贵,但是带来的收益(token throughput)是更多的 Token factory时代的逻辑是,技术升级(HBM带宽)的越多,赚的越多 这个速度差,造成了一个和 CPU 类似的局面:旧产品快速贬值,于是囤货的价值在变低,比如说,HBM3的价值贬值的非常快,今天基本上主流产品不会用了 所以HBM 厂商的理性选择,从拼当前的产能去占市场(quantity competition),变成了在稳定性和HBM速度上拼技术,拼下一代在 NVIDIA 平台上的 qualification 份额(quality competition),从而避免了在传统周期的下行波段,大家都不愿减产掉市场份额的囚徒困境。 —--------------—-------------- HBM和传统DRAM比较,三个条件里满足了两个半,那么HBM能摆脱传统周期性吗? 内存周期性的来源,主流叙事是,DRAM 有Commodity属性(无差异化 → 价格战 →库存可囤积),所以有周期性。 而Commodity属性本身并不产生周期,它只是一个振幅放大器 特别是DRAM领域里,曾经产生过囚徒困境,在下行周期三星曾经扩产抢市场份额,谁先减产谁吃亏,导致谁也不敢轻易减产,最后大家都亏损惨烈 实际上周期性的主要结构性来源是供给周期太长,很容易和需求周期错位。建一座 fab 要 3 年,投资上百亿美元,一旦决策就不可逆,而需求增长会有不稳定性,每次出现新范式增长,比如云服务,移动互联网手机,疫情线上需求,会有爆发式增长,而过了两年增长会放缓,供给高于需求,降价过猛,就变成了亏钱周期 万物皆周期,HBM这一条同样是无法避免,但只要token需求仍然是指数型增长,结构性的指数增长会减弱周期性,因为需求可预测度更好,而且一旦降价,客户就有增大HBM size的需求(从而增大token throughput),加上HBM有一点定制化要求导致都是长约,从而从周期性转化成成长周期性,而且这一轮周期会特别长 周期性:上行周期赚的多,下行周期亏的多 成长周期性:上行周期赚的多,下行周期赚的少 另外,HBM/DRAM在这三条摆脱传统周期的条件的基础上,还有一条重要优势: 4. 因为DRAM密度增长scaling越来越慢,以及HBM升级换代导致DRAM堆叠倍数的增加,供给端的扩产难度持续增加 2000年附近,DRAM每片wafer上DRAM bit密度每年增长大概45%,也就是说,就算晶圆wafer数量不扩产,每年的供给端DRAM bit仍然可以增长45% 十年前,DRAM bit每年密度增长降到了20%,而现在,DRAM bit每年密度增长降到了9%。以前DRAM扩产甚至不怎么需要新建厂房就能得到每年20~30%的bit volume上升,现在DRAM要扩产,更多的是靠wafer数量的增长,也就是新建厂房和clean room。 另外一个HBM快速扩产难度在于,HBM3e大概需要3倍的DRAM wafer晶圆,而HBM4由于堆叠密度的增加,大概需要4倍的DRAM wafer晶圆数量,相当于HBM bit相对于DRAM bit一直变得更难制造,单位DRAM wafer数量制造的HBM bit越来越少,相当于在通缩 ---------------------------------- HBM未来有一天,会不会从成长周期性,变回传统周期性?最重要的因素是结构性指数增长,那么 AI推理时代,这个依赖HBM指数增长的GPU架构路线进化路线,会不会停止?什么时候停止? token throughput = HBM size × HBM 带宽,这个HBM指数增长的第一性原理里的HBM size的增长原因正是KV cache的增长。KVCache的特性以及Attention的特性,也是非常契合HBM的。甚至让HBM领先于其他的技术路线, 能够最大化地让KVCache和Attention 阶段的利用率。 换言之, 如果KV cache从架构上不存在了,那么HBM size指数增长逻辑也会受到挑战 所以这个问题的本质其实是,这一轮以 Transformer 为代表的 attention 机制、以及由它衍生的 KV cache 机制,会不会消失?退潮之后会不会被取代? 从历史规律来看:每一次AI模型架构革命,真正被保留下来的,是那些在数学上具有某种普适性的 primitive 操作 举个例子:FFN(前馈网络,也就是模型里大量的 MLP 层)是 2012 年深度学习时代的产物,但它一路活到了今天的大语言模型里,并且仍然占据着模型相当大的参数量。它为什么能活下来?因为这也是一种universal approximation theorem(通用逼近定理):任何足够宽的 MLP 都能逼近任意连续函数 Attention 大概率也是这样一个会被保留的 primitive。因为它解决的是一个同样 基础的问题:序列sequence 中任意两个位置之间的 dynamic routing(动态路由),让一个序列里任意两个位置都能按需建立联系。这个能力一旦被验证有效,就很难被丢弃 所以即便未来架构从纯 Transformer 向混合架构演进,或者向世界模型演进,但attention 层依然会存在,KV cache(或者它经过 latent compression 之后的等价物)依然需要,HBM依然会作为推理核心之一,这个依赖HBM指数增长的GPU KV cache架构路线进化路线,不会停止 —---------------—--------------- 那么DRAM呢?在未来有没有摆脱传统周期性的可能? HBM摆脱周期性在市场上有一定共识,但DRAM摆脱周期性,市场目前基本没有共识 还是回到刚才的框架,三个摆脱传统周期的条件里,DRAM是没有定制化的,所以就只能看技术迭代速度,最关键的还是要看,有没有结构性的指数增长,答案是有的 在 AI token factory 这个概念里,结构性指数增长的确实主要是 HBM。但事情在 2025 年年底之后起了变化:随着 agentic CPU开始释放潜力,CPU 附带的那部分 DRAM 需求,正在成为 DRAM 新的结构性指数增长来源 —------ 这部分的增长逻辑分两层:第一层是CPU 服务器TAM的快速增长,第二层是每个服务器CPU core配备的DRAM用量的因为agentic flow快速增长 服务器CPU TAM的快速增长的4个逻辑在4月的CPU专篇详细写过,简单的说: 1. AI 加速器集群里CPU和GPU配比从传统的1:4变成1:2,甚至可能往1:1迈进 2. Agentic flow里CPU处理的延迟占比很高,50~90%成为重要瓶颈,需要同步扩容 3. AI coding让SDE的效率大幅提升,代码量数量级增长,软件API调用指数级增长,直接转化为这部分CPU hours指数级上升 4. Sandbox为保障数据安全与隔离,如Analytical Agent 需为每个任务复制大量数据库和用户上下文,导致内存(DRAM)和CPU核心的严重浪费,而且这个浪费问题五年甚至更久无法解决。另外CPU hours 在技术上很难通过优化的方法来通缩 这也就是为什么,上上个季度,AMD的财报说CPU TAM到2030年会到60B,两个月前,AMD/ARM把CPU TAM的2030年预测翻倍到120B,一个月前,Nvidia再次把CPU TAM的2030年预测翻倍到200B 而上个星期,Bernstein再次提升2030 CPU TAM指引到223B。在我看来,2031 CPU TAM未来上修到400B是没有太大悬念的事情,唯一的悬念是几个巨头会什么时候宣布上修这个指引 再说说第二层,为什么每个服务器CPU core配备的DRAM用量在agentic时代快速增长? 1. Agent 是带状态的长驻进程,不是无状态的请求-响应 传统 web/SaaS 是 stateless 的:请求进来,分配内存,处理完内存立刻回收。而一个 Agent 任务可以跑 一分钟到一个小时,这整段时间里,它的 message history、system prompt、工作记忆、长期记忆、工具结果 buffer 全部常驻 DRAM 和 CPU hours 一样,每个任务的内存足迹因为 stateful 和 sandbox 隔离(每个任务复制数据库和上下文)的要求,技术上很难压缩 2. 上下文窗口在指数级变长,每个会话的工作集随之膨胀,并发度 × 单会话memory footprint,乘数放大 context window 从 32K → 256K → 1M,reasoning / test-time compute 的序列长度爆炸,未来还会继续增大。每个活跃会话常驻的 messages 随 context 长度线性增长 现在把两层乘起来。 第一层,CPU server 的 TAM,朝 2030~2031 看大概是 5–7 倍的量级(60B → 120B → 200B → 223B,我认为还会到 400B) 第二层,每颗 CPU 的 DRAM 配比,大概 3–4 倍(4~8GB → 16~32 GB/core),但这个增长可能大部分是一次性红利 两个独立变量相乘,server 侧的 DRAM 需求是数量级的增长 2030年,即便按保守的300B CPU TAM,一个CPU core按$50来算,agent时代最保守按16GB/core,这算出来新增量最少都是96EB,而今年的DRAM总产量只有47EB,明年勉强60EB,这是非常惊人的增量 虽然这个agentic CPU带来的DRAM指数级增长,在第二层很大程度上是一次性红利,但持续时间会持续很久很久,因为这个短缺的缺口实在是太大了 —-------- 回到文章开头那个框架。三个摆脱传统周期的条件里,第一条DRAM 定制化,基本可以忽略 而第二条:一个结构性指数级、而且很难逆转的需求来源是成立的。commodity DRAM 现在也具备了部分摆脱传统周期性的资格。没有 HBM(两条半)那么彻底,但已经是实质性的变化 第三条,技术迭代速度,DRAM的节奏也跟以前不一样了 因为以前的DRAM技术迭代速度是严重依赖消费电子的,DDR的进步对于performance用处并不大,但可预见的未来里,碳基消费的传统DRAM,会远远小于硅基消费(CPU服务器)DRAM的用量 以前DRAM的速度升级带来的边际效用是很低的,但现在因为CPU服务器对memory的需求增大,以及端侧AI对DDR速度的要求也增大,比如苹果为了跑本地大模型,LPDDR速度越来越快 速度升级的边际效用高了不少,所以DDR6和LPDDR6的速度迭代需求比以前提升了太大了,这在图里也可以看到,LPDDR6/DDR6的迭代时间缩短了,而且速度斜率,重新开始抬头 以前新一代DDR/LPDDR技术出来,大家的反应都很冷淡,等降价了才会用 而现在LPDDR6出来,各家恨不得都在抢着能尽量早上就尽量早,因为速度的提升带来的performance提升是触手可及的 ------ 另外,DDR 的供给还要被 HBM 额外抽一道税。HBM 每年的扩产速度太快,导致每年都有一批原本可以做 commodity DDR 的 wafer 被拉去做 HBM,而 HBM 的转换比极低,HBM3E 大约要 3 片 DDR wafer 的产能才能做出等量的 bit,HBM4 是4 片。所以每年大约有 3% 到 5% 的 DDR bit 增长,是被这个 HBM bit tax直接吃掉的 所以DRAM bit volume虽然未来每年能增长24%左右(14%来自wafer增长,9%来自每个wafer的DRAM密度增长),但算上HBM bit tax之后,传统的、非 HBM 的 commodity DDR,每年的 bit growth 大概只有 20%(约 10% 的 wafer 增长 × 约 9% 的 node density 提升) —--------------------- 中国长鑫扩产的影响有多大?如果不讲武德拼命扩产,会不会把这个市场重新带入周期泥潭? 长鑫这几年的扩产速度还是很快的,2025年还是每个月20万晶圆,2026年北京晶圆厂及新增生产线的贡献就能到32~35万。 正在建设中的上海工厂一期和二期,一期预计到2027年每月新增10万片晶圆产能,二期预计到2028年每月新增10万片晶圆产能,也就是说,2027年每个月42万晶圆,2028年能到每个月50万晶圆。 但需要注意的是,长鑫的dram bit 密度大概只有御三家的一半左右,所以长鑫的每个月50万晶圆wafer能产出的dram bit volume只有其他家的一半,这里计算wafer per month的时候,就按等效一半来算 把这个折扣打上之后,长鑫对整个DRAM行业的冲击还是小了很多,从2025年年底到2028年年底,长鑫对DRAM bit产能CAGR的影响大概只有1.5%,全行业的DRAM产能CAGR大概从12.7%升到14.2% DRAM月产能(kwspm) 2025E → 2028E CAGR Samsung 685K → 920K 10.3% SK Hynix 519K → 725K 11.8% Micron 340K → 560K 18.1% 非中国其他 150K → 218K 13.3% 中国(密度折半) 117K → 274K 32.8% ————————————————— 含中国总计 1811K → 2697K 14.2% 无中国总计 1694K → 2423K 12.7% 就算是长鑫未来还能保持增产速度,2030年对全行业等效产能每年DRAM bit volume增产CAGR的影响,大概也不到3%,从20% CAGR变成23% CAGR,仅此而已 另外,长鑫被光刻机所限制,而DDR6 需要更高速率(14400 MT/s 起步)和更高密度,御三家做 DDR6 大概率会用 1c 或更先进节点(~12nm 以下),已经全面用 EUV。长鑫可能会在DDR6上速率受限,密度也只有一半。 —---------------- 即便是成长性周期,为什么DRAM的这轮超级周期会持续很长时间,起码五年看不到头? 第一个原因是,刚才谈到的CPU服务器需求端的巨量增长带来的结构性DRAM需求指数增长,这里结合DRAM供给端的bit volume CAGR大概稳定20%增长,就可以很清晰的看到,DRAM未来几年的缺口为什么越来越大: 非HBM的传统DRAM供给端大概是每年增长20%,而需求端,按2026年60B CPU TAM,每个CPU消耗DRAM平均8GB/core,每个core $30~35来算,需求是16EB 2030年按400B CPU TAM,每个CPU消耗DRAM平均16GB/core,每个core $80来算(CPU涨价超过一倍),需求是80EB,这部分DRAM的增长CAGR大概是50%,远远超过目前的估算 不同于HBM是直接和token throughput挂钩,从而和GPU赚钱效率直接挂钩,DRAM不够对于agent flow的影响主要是速度,比如说,8GB/core和16GB/core比起来,部分workload速度可能降低30%,部分低价值task实在要等等也能忍,结构性指数增长的动机很强,但需求不如GPU那么刚性 Semianalysis说今年的DRAM缺口式个位数百分数,明年是超过10%。从agent CPU数量激增导致的DRAM结构性来看,这个缺口每年都会继续加大,在2030年之前看不到降低的可能 —---- 另外一个DRAM能延续强势很久的逻辑是,因为DRAM涨价之后,被涨价消灭的那部分需求,不是真的消失了,只是延迟了,需求蓄水池太多了。 所谓蓄水池,是指那些"内存一旦降价就会立刻被释放出来的潜在需求"。它们的存在,意味着即便供给阶段性跟上了,价格也很难崩,因为总有新的需求从蓄水池里涌出来接盘: 内存换算力/速度是一个蓄水池: 有大量本来需要靠额外内存来优化速度和算力的需求,在内存太贵时被压着,一旦内存降价就会被释放出来。 比如 Nvidia的CPX prefill 加速,本来的设计初衷是用额外的低成本GDDR7,来做一个专门的prefill加速器,结果LPDDR/GDDR都太贵了,比涨价前的HBM还贵,这个方案的ROI就不划算了,但等到普通内存降价,这样类似CPX的优化方案就还会回来 低价值task是一个蓄水池:内存涨价导致token价格居高不下时,高价值的 task 被优先保留,低价值的 task 被延后;内存一降价,这些被延迟的需求就回来了。 端侧 AI 是一个蓄水池:AI PC 的内存配置可能从 24GB 一路涨到 128GB。苹果已经明确要求最新的端侧AI满血版需要从8GB升级到12GB内存 常规消费电子、Agent PC、低端手机,因为内存涨价而减少的需求,全都是蓄水池。 这么多蓄水池叠在一起,构成了一个极厚的需求缓冲垫。这就是为什么 DDR 这轮的结构性增长,后劲会比市场想象的要强。 —----- 还有一个DRAM价格很难大幅下降的原因在于,HBM和DRAM产能可以互相转换,所以整个DRAM complex是一起re-rate的 在上行期DRAM的利润率远超HBM,HBM的涨价幅度甚至变成了由DRAM去推动。今年新签约的HBM4的价格,就是当期DRAM的价格 x 4,也就是正常堆叠倍数对应HBM4的价格 一旦DRAM降价毛利下滑,因为HBM的长约透明性,利润率都是有保障的,HBM就会间接抽走更多的DRAM产能,HBM的降价也会让GPU厂商更有动力尽可能的升级HBM size,这样也间接保障了DRAM的价格地板 DRAM的结构性指数增长的需求有了,density scaling放缓扩产难度在增加,厂商扩产计划都很谨慎,长鑫这几年带来的影响也是有限的,再加上需求的蓄水池非常庞大,这四个原因导致了,在可预见的至少五年甚至更长时间内,DRAM是很难进入周期低谷的。 —-------------- NAND SSD有希望摆脱传统周期性吗? NAND 的结构性增长动力没有 DDR 那么强,今年的缺货主要原因是几个主要玩家的生产纪律保持的很好,并没有大规模扩产,每年的产能增加主要来源于技术改进:NAND堆叠层数的增加 第一个结构性增长来自AI,主要来自 KV cache 的 offloading,把HBM溢出的warm/cold KV cache 卸载到 NAND SSD上。 但神奇的事情是,这个kv cache offloading的增长甚至还没有大规模发生,SSD就已经缺的比DRAM还严重了,涨价也比DRAM要更多。等到明年Rubin CMX放量,加上KV cache offloading大规模应用,SSD的缺货也会因为这个结构性增长而增长 第二个,另一个去年年度总结里说到的未来可期的AI视频带来的结构性增量,今年已经有出圈的态势了 Seedance体量在以一年十倍到四十倍的速度增长。目前它还卡在缺卡算力不足的阶段,需求被算力压着没完全释放。但等到缺卡阶段过去,AI 视频对NAND存储的结构性需求增长,会持续相当长的一段时间。 第三个结构性增长也同样来自于agent flow带来的Sandbox使用量的指数级增长,Sandbox为保障数据安全与隔离,如Analytical Agent 需为每个任务复制大量数据库和用户上下文,导致内存(DRAM)和CPU核心的严重浪费,同样会带来大量的SSD的浪费(需求) 第四个也许在2030年之后发挥作用的结构性增长,来自于HBF路线需要用到SSD,在不少投行分析中被寄予厚望,但这个技术路线还有些遥远,主要角色定位只能作为存放大模型的weights,写一次权重然后做只读,而且必须要和GPU/HBM封装在一起(48TBps/96TBps),否则靠PCIE7/8速度太慢完全无法用,只能说未来可期,下一篇AI半导体终局推演2026(III)会有更详细的分析 总之,NAND SSD的结构性增长没有HBM那么强,但是胜在便宜,价格到2027年也只有$0.8/GB,是同期DRAM的四十分之一,所以也算是多级缓存里的万金油属性,结构性增长来源太广泛了 也就是说,不存在DRAM/HBM单独涨价繁荣,而SSD不涨价的情况,因为如果这样的情况发生,那么大家就会想办法用SSD去承载DRAM/HBM的部分功能,用更低的成本实现类似的效果。HBM、DRAM、NAND 不是三个独立故事,而是同一 AI memory hierarchy 在不同温度层的结构性增长 结构性指数增长的需求有了,NAND SSD摆脱周期了吗? 那么就要看NAND SSD厂家的生产纪律了,唯一可能不遵守生产纪律的,只有长存。毕竟这是一个囚徒困境,一旦有一家不讲武德拼命扩产,整个NAND产业要扩产的难度比DRAM简单的多。 但最起码的,这一轮NAND同样是超级周期,几个结构性指数增长带来的需求,下行期推迟到2030年问题不大
显示更多
拿着金刚钻,只做瓷器活 这就是绝大部分目前ai用户和投资者的情况 所以大部分人既用不好ai,也因为缺乏对ai的理解而投不好ai 但ai前进的速度不依赖于大多数用户,ai需求的增长,也不依赖于大多数用户
显示更多
我是真有点纳闷,你们普通人平时到底都拿 Codex 干什么? 我充 Plus 都快两个月了,Codex 只认真用过一次,做了个桌宠,之后再打开就完全不知道该让它干什么。 有问题直接问 GPT 基本就够了,我又不是程序员,也没有一堆机械化、重复性的工作需要它帮我自动处理。 每次看到别人说 Codex 多强、多方便,我都觉得它确实厉害,但这种厉害好像跟我没什么关系。 第二个月 Plus 都快到期了,我甚至还没找到第二个真正需要用 Codex 的场景。 所以我很好奇,你们这么多人都说用codex,但不说用来做什么,不写代码的普通人,到底都是怎么用 Codex 的?还是你们就单纯写个帖子发出来蹭个流量?
显示更多
之所以上周减仓还是自己的仓位控制没做好,所以影响了持有心情,也影响了交易节奏 以后还是要严格控制仓位平衡
这波操作完全做反 看来我的确不适合交易
这波操作完全做反 看来我的确不适合交易
0
29
15
0
转发到社区
这一天来的比我预期的还快 作为开始主动交易美股一年的新人 能做到这样的收益,只能说,这是时代的红利
今天大幅降低了存储的杠杆,这波持续大半年的交易告一段落 从9月至今,一个板块带来了超乎想象的收益 本来如果不是瞎操作,战绩应该更好 半年多来最大的教训就是,认知永远需要跑在仓位前面,不懂不做 接下来ai这波大周期,类存储从去年9月到现在10倍的板块的机会还很多,就连存储这个板块内,都还会出现不少10倍的机会 需要做的就是找到这些机会,在合适的时间,合适的价钱,买入,然后持有 在加速正在被加速的ai产业革命周期里,这个持有的时间往往都不需要很长 这是一个10x is easier than 2x的大时代 祝大家好运 另:目前存储我仍持有mu和dram较多的现货和期权。 本文非投资建议,投资有风险,请dyor
显示更多
0
65
268
8
转发到社区
机架内武藏精密(Musashi Seimitsu),机架外flnc
重构 AI 工厂的电力地基:拆解 NVIDIA Vera Rubin 的储能与集成密码(兼谈flnc为什么暴涨) 昨天Fluence Energy (FLNC)、西门子(Siemens)与英伟达(NVIDIA)联合发布了 136MW 级数据中心基础设施参考设计。 这是面向 NVIDIA Vera Rubin 平台 极限物理指标的深度协同设计(Co-Design)。 一、 物理极限的逼近:为什么通用设计在 Rubin 时代失效? 传统的通用电力设计在旧代服务器(如 10kW-20kW 机架)中行之有效,但在面对未来的 Vera Rubin 平台时则彻底卡壳。 Rubin 带来了三大颠覆性的物理改变: 从 54V 到 800V DC 的跳跃: 随着单芯片功耗冲向 2000W+,传统 54V 机架配电的电流强度将直逼物理极限,铜缆面临熔断风险。Vera Rubin 彻底转向 800V 高压直流母线供电,要求电力与储能设备必须在源头上进行高压适配。 恐怖的瞬态负载(脉冲功耗): 代理 AI 在高频推理时,算力负载会在微秒到毫秒间产生断崖式的暴涨或暴跌。这种极端的功率跳变会形成高频电网冲击,极易击穿数据中心的配电系统。 全液冷与超高密度: 普通机架功耗仅十余千瓦,而 Vera Rubin NVL72 机架直接飙升至 120kW-130kW,未来甚至将直奔 600kW。该平台彻底告别风冷,100% 绑定全液冷设计,这要求基础设施重组所有配电单元空间。 二、 混合储能协同:微观拆弹与宏观大坝 为了应对 Rubin 平台的脉冲功耗,一套由“超级电容 + 锂电池储能”构成的混合储能系统(HESS)成为了新架构的核心。 1. 武藏精密 HSC 贴身拆弹 在算力机架内部,武藏精密(Musashi Seimitsu)的混合超级电容(HSC)充当了微秒级的电力缓冲垫。 毫秒响应: 传统锂电池响应速度在秒级,而 HSC 具备超级电容的电荷快速释放特性,能在毫秒内对 Rubin 芯片的爆发式功耗进行高功率充放电。 百万次寿命: AI 高频推理意味着脉冲波动每天发生数万次。HSC 支持超过 100 万次的完全循环寿命,避免了电池频繁充放电带来的快速衰减。 800V 高压契合: 相比传统电容,HSC 具备更高的单体电压,在搭建 800V 直流储能模组时所需的串联单元更少,能够以极小的体积塞入寸土寸金的算力机柜中。 2. Fluence Smartstack 稳住后方 在算力园区外围,Fluence 的 Smartstack 储能平台则负责秒级到小时级的大规模能量平衡。 削峰填谷: 平滑长周期的电网变动,在 peak 阶段(GPU 满载需求突增时)提供兆瓦级的容量支撑。 并网缓冲: 充当 136MW AI 工厂与外部公共电网之间的缓冲隔离带,防止 AI 工厂的剧烈波动导致外部公共电网频率失稳。 三、 角色演变:FLNC 如何定义“能源系统集成商”? 在这场三方合作中,Fluence (FLNC) 的核心角色是系统集成商(System Integrator)。它的商业壁垒和价值,早已不再是售卖底层的电芯资产,而是提供“软硬件一体化的能源大脑”:(拆解见插图) 物理与高压直流集成: FLNC 将上游西门子的中低压配电柜、自身的电池模块以及冷却系统打包,在物理和电气层面整合成标准化的集装箱舱体,实现 Tier III 级别的在线可维护性。 核心软件控电(Fluence OS):FLNC 依靠其 Fluence OS 操作系统,打通了 NVIDIA 的 DSX 动态功率调配协议。Fluence OS 会在百毫秒内做出频率响应,并向下对接机架内武藏精密(通过代工巨头伟创力 Flex 整合)的电容数据。 避免级联冲突: 软件的集成确保了“机架内的电容”与“园区外的大电池”在充放电逻辑上保持步调一致,防止两者在剧烈波动时因响应延迟而发生功率互卷或控制死锁。 四、 商业底层逻辑:从定制时代走向“乐高式”交付 将大储能引入基础架构蓝图,预示着数据中心供应链的底层商业逻辑发生了巨变。 对于 Hyperscaler(超大规模云厂商)而言,以往新建一座 100MW+ 级别的 mission-critical AI 工厂,仅供电与电气系统的定制化设计和审批就需要耗费 18 个月以上。 而 FLNC、西门子与 NVIDIA 推出的这种预工程化参考设计,将原本需要单独设计的强电变电、高压直流母线、液冷 CDU、机架电容以及园区大储能,打包成了一套“即插即用”的标准化全栈方案。厂商可以像搭乐高积木一样直接复制部署,将交付周期缩短数倍。 在这场算力狂飙的军备竞赛中,能源不再只是 IT 的被动配套,而是决定 AI 算力能否落地、能否稳定运行的直接生产力。FLNC 与武藏精密在微观和宏观层面的合围,恰恰掐中了未来 gigawatt 级 AI 时代最核心的物理命门。 免责声明:本人持有文章中提及资产,观点充满偏见,非投资建议,dyor
显示更多
建仓美光到现在,正股已经10倍 但forward pe,仍然很低。。。
回调就加仓 不光是美光,存储板块,sandisk,wdc都加 高确定性的高增长 nfa dyor
0
22
140
4
转发到社区
推特第一股神喊单mlcc材料供应商nippon chemical 股价应声大涨!竞争对手sakai chemical也同日涨停 这俩是市场上唯二的专做高端mlcc材料的供应商(并不意味着mlcc厂商一定要从他们采购,因为村田和太阳诱电tdk等很多会自己做材料) 但这两股的市值只有3-4亿美元。。。 免责声明:本人持有文章中提及资产,观点充满偏见,非投资建议,dyor
显示更多
私の(4092)赤リンの投資シナリオ、誰か覚えてる? ほぼ100%上がってるよ!
“高盛分析师高山大树表示,AI服务器用MLCC市场预计从2025年至2030年将增长超过4倍,从约2150亿日元扩张至约9200亿日元,年均增长率达34%。 分析师纳尔逊·阿姆布拉斯特也表示,MLCC(多层陶瓷电容器)已成为继GPU和存储之后的AI服务器组件构成中第三大组件。”
显示更多
員数、高周波、容量、DC特性 まだまだ始まったばかり ゴールドマン・サックスは次世代メモリチップを求めてMLCC(積層セラミックコンデンサ)に注目している。そのサイクルはまだ始まったばかりだ。 AI開発競争はGPU、CPU、メモリといった上位技術にまで広がり、それらすべてが市場ファンドの注目を集めている。投資銀行ゴールドマン・サックスの最近のレポートによると、次に爆発的な成長を遂げるのは積層セラミックコンデンサ(MLCC)であり、現在、生産量と価格が同時に上昇するサイクルの初期段階にあるという。 モルガン・スタンレーがNvidiaの次世代Vera Rubin AIラックを分解した最新の分析によると、最新の部品表においてMLCCの価値が182%増加していることが明らかになり、ゴールドマン・サックスのMLCCに関するレポートと一致した。 ウォール・ストリート・ニュースの報道によると、ゴールドマン・サックスのアナリスト、高山大樹氏は、AIサーバー向けMLCC市場が2025年から2030年にかけて4倍以上に成長し、約2150億円から約9200億円に拡大すると予測しており、年平均成長率は34%となる。ゴールドマン・サックスは、現在のAI主導型MLCCサイクルは史上最大かつ最長のサイクルであり、まだ初期段階にあると述べている。 アナリストのネルソン・アームブラスト氏も、MLCC(積層セラミックコンデンサ)はGPUとメモリに次いで、AIサーバーの部品構成において3番目に大きな部品になったと述べている。MLCC市場全体の規模は約150億ドルで、サーバー市場は約13億ドルを占め、年平均成長率(CAGR)は80%で拡大している一方、自動車や携帯電話などの他の用途分野における需要の伸びは鈍化している。 別のアナリストであるアレン・チャン氏は、MLCC業界の構造的な矛盾を指摘した。生産能力の年間成長率は10%をわずかに上回る程度にとどまっているが、これは設備や材料が社内生産に依存しているためである。拡張の進捗は社内のエンジニアリングリソースによって制限されており、生産量を大幅に拡大することが困難で、AIサーバーの需要に大きく遅れをとっている。 ゴールドマン・サックスは、AIサーバー向けMLCCの需要が2025年から2030年にかけて約4.3倍に増加すると予測している。同時に、自動車の電動化分野における高電圧・大容量MLCCの需要も引き続き堅調で、電気自動車1台あたりのMLCC使用数は増加の一途をたどる。これら2つの主要な需要は、既に限られている新規生産能力を吸収しており、家電業界の顧客は、自社の需要が減少傾向にあるにもかかわらず、将来の供給不足リスクに備えるため、長期供給契約の締結を積極的に模索している。 ゴールドマン・サックスの分析によると、MLCC(積層セラミックコンデンサ)の価格上昇は、DRAM、NANDメモリ、ABF基板、銅箔基板(CCL)といった他の主要なAI(人工知能)コンポーネントの価格上昇よりもかなり遅れて始まった。このことから、ゴールドマン・サックスは、MLCCをABFやCCLと並んで、すべてのAIコンポーネントおよび材料の中で最も長期的な価格上昇の可能性を秘めていると評価している。 ゴールドマン・サックスは、村田製作所を訪問した後、AIを活用した最先端の積層セラミックコンデンサ(MLCC)の需要サイクルを、当初の予測である2028年から2030年頃に延長した。 モルガン・スタンレーは、NVIDIA Vera Rubin AIラックを分解した結果、PCB、MLCC、ABF基板、メモリなどの周辺部品の重要性が急速に高まっており、サプライチェーンの価値が「GPU優位」からシステム全体のアーキテクチャへと徐々に広がっていることを発見した。中でもMLCCの価値は182%増加し、VR200ラックあたりのMLCCの価値は約4,320米ドルで、GB300時代の約1,530米ドルをはるかに上回っている。使用されるボード数の増加に加え、新たに導入されたBlueField DPUとConnectX Orchidモジュールが、ハイエンドMLCCの需要をさらに高めている。
显示更多
0
50
100
13
转发到社区
推特上的美股专业信息浓度是真的高!
@rickawsb 私も本業で村田の設計サポートツール使っていますが、いい感じです。あと、MLCCの品質ははっきり言って他社の追随を許さないレベルと認識しています。(技術者の質やデータシートや信頼性データを深く読めばわかります)
显示更多
0
21
95
1
转发到社区
最近,风华高科因RC/RS系列0402、0603晶片电阻订单激增,暂停部分新订单。 虽然只是是贴片电阻吗,但重要的,这是,高端、小尺寸、高一致性被动器件,的供需失衡信号。 0402 / 0603是封装尺寸。它既可以是MLCC,也可以是贴片电阻、电感、EMI滤波器。AI服务器真正需要的,是“小尺寸下还能维持高频、高一致性和长期可靠性”的器件。 AI的VRM复杂度提升、PDN越来越复杂。于是系统开始大量消耗:高频MLCC、小尺寸电阻、高频电感、钽电容、HSC。 这些器件单价不高,但属于“缺一个,整机就无法出货”的东西。 AI服务器里的需求本身是分层的。最核心的位置,比如GPU核心供电、HBM附近、ASIC substrate附近,仍然高度依赖:Murata Manufacturing、TDK Corporation、Taiyo Yuden。因为这里要求极低ESL、极低ESR、高频响应和长期可靠性。 但AI服务器并不只有核心位置。PSU、BBU、NIC、SSD、光模块、交换机,同样会消耗海量0402/0603。重要的是,AI正在先抽紧最顶级MLCC产能,然后压力开始向中高端0402/0603扩散。 最近大火的MLCC和0402电阻看起来是不同器件,但背后共享的是“小尺寸精密制造能力”。包括精密印刷、烧结、AOI检测、高频测试、超小尺寸良率控制、精密材料处理。 这和HBM产业链很像。最开始缺的是HBM,后来CoWoS、ABF、substrate、电源、散热、测试一起开始紧张。MLCC现在也开始出现类似现象。 真正最容易缺货的,往往不是最顶级料号,而是“能量产、能过验证、还能部分替代”的中高端规格。 2018年被动器件超级周期就是典型案例。当时车规MLCC先缺,高频小尺寸规格先涨,随后0402/0603全面涨价。因为一旦高端规格开始缺货,客户就会提前备货、长单锁产能、替代采购、超额下单,最后整个产业链一起紧张。 现在AI行业,可能正在重复这个过程。 更重要的是,这种紧缺会向二线供应商传导。当Murata Manufacturing、TDK Corporation、Taiyo Yuden 优先保障AI服务器和车规客户后,订单开始向:Vishay Intertechnology、Yageo Corporation、Bel Fuse Inc.、Fenghua Advanced Technology 溢出。 AI数据中心,正在把整个电子产业重新拉回“工业品逻辑”。从GPU,到HBM,到光模块,到电源,再到0402电阻,整个链条都在同时变紧。 这可能意味着,被动器件行业,正在进入新一轮量价周期。甚至可能是超级周期。 免责声明:本人持有文章中提及资产,观点充满偏见,非投资建议,dyor
显示更多
麦田老师能在暴涨30%的amd上做空赚钱,这种过人的能力岂是你们这些有一点点消息的专家能比的? 🤣
麦田老师您还好么?估计您买了些其他option早就赚回来了 不要无脑跟我作对手盘,我肯定知道点啥的 AMD都check多少渠道花了多少时间了
不光存储,还有芯片,pcb,电容。。。 不光电脑,还有消费电子,电动车,家电。。。
基于美光这个走势,有换电脑需求的小伙伴,建议趁早行动,预计3年内都会是高价周期… 摩尔定律的棺材板……
往死里炒power semi & MLCCs😁 挑了一只P/B低,产能扩张快、电容、电压、ESL、可靠性高的MLCC股🤔 谢谢大家
Example: CPO testing or HBM - bottleneck huge future demand - power semis & MLCCs Supply crunch - raw materials for CCL
0
42
98
11
转发到社区
越来越觉得这轮 MLCC 周期, 大概率会比 2017-2018 更大。 因为需求逻辑已经彻底变了。 上一轮, 核心还是智能手机升级。 而这一轮, MLCC 同时绑定了: • AI 服务器 • 新能源汽车 • AI 终端化 本质上是整个电子系统复杂度在提升。 尤其 AI 服务器。 很多人只盯着 GPU, 但高端 GPU 最大的问题之一其实是供电。 功耗越高, 对高可靠性 MLCC 的需求越大。 算力往上卷, 电源系统复杂度也跟着指数级提升。 汽车电子也是一样。 新能源智能车的 MLCC 用量, 相比燃油车是倍数级增长。 而真正关键的是: 这一轮供给端远比 2018 年克制。 经历过上一轮行业大扩产之后, 日韩龙头明显开始控制资本开支, 新增产能也基本集中在高端领域。 所以这轮可能不是简单补库存。 而是: AI + 汽车电子驱动下, 电子工业底层元件的一次重新定价。 重点关注: $6981 村田 $6976 太阳诱电
显示更多