注册并分享邀请链接,可获得视频播放与邀请奖励。

与「小高和剛」相关的搜索结果

小高和剛 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 小高和剛 的内容
华为τ scaling定律营销策略,无非是more than moore的广义摩尔定律的另一种说法而已 作为芯片架构师,我更感兴趣的,还是芯片密度提升,ppt上41%能耗提升和12.7%性能提升,到底是怎么实现的 看完了论文,感觉华为这次创新,本质上是用设计复杂度高 + 高制造成本 + 超前散热,一定程度弥补了工艺差距 ----------------- 1. 华为芯片堆叠带来的等效密度提升,是虚假宣传还是真的,是不是工艺突破?有没有实打实的好处? 等效密度提升的来源,是两片芯片用hybrid bonding技术绑在一起,投影面积理论上能减小一半,但第一代不是全芯片双层折叠,而是选择性折叠关键logic,所以只有大概53%的芯片面积实现了折叠(密度155->238),等到后面几代折叠面积会逐渐增大,到2030年接近全折叠(密度155->292) 这2026第一代等效密度从 2025 年 155 MTr/mm² 跳到 2026 年 238 MTr/mm²,时钟频率也提升了12.7%,功耗比提升41%,表面上看似乎和工艺突破没有什么区别,但有一点重要区别就是leakage power华为从头到尾没有提,只要工艺节点不变,gate leakage、junction leakage 不会因为 3D stacking 自动改善 2030年到2031年的等效密度突变,大概率是来自于2层堆叠到3层堆叠,正如2025到2026年的等效密度突变,时钟频率突变,来自单层到2层折叠 所以从leakage没提这个事来看,这个2031年等效1.4nm,和工艺节点上的突破没有联系。 本质上是用设计复杂度高 + 高成本 + 超前散热 + 超前部署advanced packaging,一定程度弥补了工艺差距 ----------- 那么这样看起来虚假的等效密度提升,有用处吗?好处在哪里? 有的,设计上topology折叠,原来要跑几毫米的水平走线,折叠后变成了几十微米。降低了super buffer/bus的长度,降低了clock tree的深度(clock depth -42%、clock wire -28%),clock skew也带来了改良(-25%),这对动态功耗的改善是实实在在的。部分critical path的缩短,也让时钟频率的上升更容易 所以ppt roadmap上performance的提升,从2025年到2026年上升了12.7%,大部分都是来自于时钟频率的上升(12.7%) 所以好处基本上是topology拆分电路逻辑设计上带来的提升 既然没有实质上的工艺提升,华为芯片堆叠带来等效密度提升的trade off代价在哪里? 三个代价:散热超前发展,设计复杂度高,制造成本变高 最大的代价就是热密度的同步上升,理论上logic on logic都是CPU execution发热最严重的区域,这部分折叠起来相当于功耗密度直接翻倍,但算上41% power efficiency改善,功耗密度仍只比非堆叠方案高40%左右。所以第一代只能对最关键的部分做折叠,大概只占全芯片面积的53%。 所以散热技术也被逼的超前发展,直接上毫米级的MEMS风扇,做micro-cooling fan。 另外的代价就是设计复杂度的变高,critical path的折叠,哪个部分的logic能折叠,折叠之后又会带来从前端到后端的巨大变化要推翻重来 现有的所有EDA工具也不可能支持3D topology,论文自己也承认,full-scale LogicFolding需要全新的3D-native EDA toolchain,把多层stacked dies当作单一连续设计实体处理。哪些logic能折叠、折叠后的inter-die timing closure怎么做,Physical Design(PD)也是难点 制造成本也会更高,被迫超前部署advanced packaging封装,1.5~2um的hybrid bonding + logic on logic都是很有挑战需要显著更高的成本 以前一层wafer做一次光刻;现在两层wafer分别做光刻再bonding,加上hybrid bonding的overlay控制(论文要求<0.5μm)、TSV、KOZ keep-out zone、冗余修复、良率乘法损失,每颗芯片的制造成本和测试成本都要显著上升 -------------------------- 2. Tau scaling这个说法,scaling的到底是什么,这个scaling技术路线是不是一次性的design topology红利?潜力如何?持续进步的空间在哪里? τ Scaling的核心主张是:用时间常数τ替代几何线宽作为全栈优化目标,在器件、电路、芯片、系统四个层级分别压缩特征延迟 公式本身没有任何新物理。"关注瓶颈延迟"是所有架构师都在做的事情。整个行业都知道互联RC是延迟瓶颈,TSMC每一代工艺都在用low-k dielectrics/semi-damascene等手段降RC。把一个众所周知的优化方向包装成"定律"是显然的营销宣传手段,本质是More than Moore的广义摩尔定律的另一种说法 抛开marketing,华为目前所谓RC delay的改善,本质上是芯片堆叠之后,topology距离缩短,让匹配的effective RC都变小,不是RC工艺常数 至于scaling的意思,是能持续发展的一条roadmap。这里的持续改善路径指的是,全芯片堆叠的层数越来越多,从25~30年的2层堆叠,到31年开始的3层堆叠,以后甚至会考虑4层堆叠 第一代折叠技术甚至不是全芯片双层折叠,而是选择性折叠关键logic,所以只有大概53%的芯片面积实现了折叠(密度155->238),等到后面几代折叠面积会逐渐增大,到2030年接近全折叠(密度155->292)。2031年的roadmap之所以会出现一个阶跃,就是因为那是从2层折叠到3层折叠的时间点。 但需要注意的是,这个scaling方法的边际效应是逐渐缩小的,折叠成双层的收益是100%,2->3层的收益就只有50%,如果2035年再从3->4层堆叠,收益就只有33%了 另外随着堆叠层数变高,上面说到的三个挑战,散热,设计复杂度,成本,都是越来越大 --------------------- 3. 华为的芯片堆叠,是不是TSMC/AMD已经有的hybrid bonding技术?华为做到的是cache on logic,cache on cache,还是logic on logic,logic on logic最大的散热问题是怎么解决的? 是已经有的技术没错,但同时也是把现有技术指标做到了领先也是真的,3D堆叠本身不是新技术,TSMC的hybrid bonding量产还是6um,华为论文给出Kirin 2026的hybrid bonding pitch是1.5μm 我在刚刚看到华为的堆叠消息之后,第一反应也是怀疑和AMD的3D V cache类似,它主要把 SRAM cache 叠在 已经有的L3 cache 区域上,通常会避免直接堆在最热的 CPU execution logic 上,就是避免散热问题,毕竟SRAM 的功耗密度和热点特性与high-activity logic 不一样,如果最热的logic on logic堆叠,散热恐怕会碰到困难 但看了更多数据之后,clock buffer -56%、clock depth -42%、clock wire -28%,这些只有在core内部的clock distribution被重构时才可能发生。纯SRAM stacking不会碰core内部的clock tree。另外如果只是cache on cache,大概率是不需要单独MEMS微型风扇额外散热的,证据普遍都指向logic on logic方式 华为这个技术的精妙之处在于,logic on logic 折叠之后热密度并没有翻倍,而是因为topology的好处,能耗下降了30%,这样热密度只上升了40~50% 而第一代没有完全把整个最热的execution logic 100%堆叠起来,论文也明确说selectively applied along key critical paths,只是大概53%有选择性关键路径会堆叠起来,可能颗粒度都没有那么好,只是IP堆叠在IP上,那么热密度上升也许能维持在20%以内 但这条道路继续前行,超前发展的散热就成了必然,现在是MEMS微型毫米级的主动散热风扇,紧贴处理器传导效率高,和华为手机一样,散热堆料特别足,而且技术领先同行。 以后怕是要把HBM7/8的微流道散热技术提前用起来了,毕竟HBM7/8要上24+层堆叠,华为很可能要在提前用上下个世代的散热技术了 ------------------------- 4. 从架构角度来说,最重要的问题,华为41%的power efficiency(能耗比)提升,到底是怎么实现的?为什么AMD的3D V cache没有这么大的提升? 首先确定41%的定义。论文只说"SoC performance-core power efficiency improved by 41%",没有给出benchmark名称、Voltage/Freq点、温度条件、功耗边界。但PPT roadmap上有一个关键线索:ISO-Power Performance的数字,2025年是2.75,2026年是3.1,提升12.7% 这个时钟频率提升12.7%完全一致,可以理解为,同功耗的性能提升是12.7%,绝大部分是时钟频率提升带来的 至于能耗比上优化的猜测是,LogicFolding缩短critical path → 在固定Vdd下Fmax从2.75GHz提升到3.1GHz → 这意味着在原来的2.75GHz频率下,有了约12.7%的timing headroom → 这个空间在iso-performance模式下可以换成更低的Vdd 另外的能耗比的提升,可能也来自于电路折叠之后,cache hit latency的下降。从业界经验来看,一般L2/L3 cache hit latency下降10%,CPU整体性能会有至少5%的提升 ppt里显示SRAM latency下降30%,估计会有一部分转化为cache hit latency的下降 AMD的3D V cache没有这么大的提升,主要是因为AMD的底层logic die并没有重新设计,3D cache的延迟latency不仅没有减小反而加大,只是增加了cache大小,收益不如latency下降那么明显。 另一方面,clock skew的下降,critical路径变短,造成电路timing变好,意味着华为可以使用更低的vdd(猜测甚至能低7~8%),以及路径缩短所带来的RC的下降(考虑到clock buffer -56%、wire -28%、SRAM pJ/bit -24%这些数字,比如C_eff下降10~15%合理),再加上clock tree的整体缩短和下降,确实是有可能在部分Voltage/Freq点做到同性能下,做到30%的功耗下降的,而30%的功耗下降换算过来就是41%的power efficiency 对比苹果和高通,每一代手机芯片在iso-power下单核性能一般提升10-20%,iso-performance下功耗一般降30-40%,这是V/F曲线的特性决定的,所以从经验上来说,数字是对的上的。 所以这个power efficiency(能耗比)的提升,从现有的数字上来说可以从topology推导出来是合理的,可能真的和工艺节点没有太大关系 ---------------------------- 5. 这个技术路线有没有可复制性,其他家会不会效仿? 短期内不会大规模效仿,因为性价比和风险收益比来说不好。长期来看,这个方向所有人都在走,只是名字不一样 华为做LogicFolding的根本驱动力是制裁,工艺节点被卡在7nm,只能在封装,散热,和设计层面想办法弥补。华为也为此付出了不小的代价:散热成本,设计复杂度,以及制造成本更高(包括良率)。这是一个被逼出来的路线,不是一个自然选择 其他玩家在用TSMC就能做到正常的经济迭代,是没有必要冒着这个风险,去超前迭代散热技术和设计复杂度的 长期来看,Intel的Foveros、TSMC的SoIC、AMD的MI300的3D stacking都在朝同一个方向走。如果继续追最先进节点的经济性持续恶化,那么"固定一个成熟节点+3D topology optimization"的路线会越来越有吸引力 散热方面,MEMS微型风扇和微流道也会成为未来HBM散热的主流 ------------------- 总结一下,华为这次的创新,绝对是值得尊重的,在制裁环境下,用极高的设计复杂度和成本,在一个被锁定的工艺节点上大胆重新设计,榨出了一次大的topology红利,虽然它有天花板。每多加一层的边际收益递减(堆叠1->2层, 2->3层, 3->4层,提升百分比变小),leakage无法解决,散热越来越难,3D EDA工具链更是全新的挑战。 但这个Tau scaling不是一条可以走十年的指数增长路径,每次爬完一个台阶,下一个台阶更难爬,而且台阶更矮收益更小,华为以后想缩小差距,还得再想想靠什么其他的路线
显示更多
0
175
1.8K
486
转发到社区
最近很多朋友跟我说,💰越来越难赚,实体不好干,投资也没方向投啥亏啥!就连现在市面上普通理财收益也越来越低,大家都在找“更赚💰”的渠道!! 但现在明白人都知道,高收益一定伴随着高认知和高风险,下面我就从收益对比、安全稳定、适用人群这几个方面,实实在在跟大家分析一下,当然这只是我个人观点分享,不代表任何投资建议。 1️⃣来吧先说说咱们普通人最熟悉的传统米生米收益现状。现在国有银行一年期定期存款年化大概就在1.1%-1.5%,就算是利率偏高的地方银行,三年期定存年化也很难超过2%;五年期储蓄国债,票面年化也就 2.0%-2.3%,就算有额外补贴,撑死也到不了 2.5%。还有大家常用的米生米工具,日常7日年化基本就在1.5%-1.8%,跟早些年比收益缩水了一大截。 就算是高净值人群专属的私人银行中等风险理财,年化大多也只在3%-4%之间,而且还有资金锁定时间限制,底层资产情况也不够透明。简单说,现在传统米生米能给到普通人的收益,整体都处在偏低水平,可选的高性价比渠道特别少。 再看目前挺火的加密市场(当然因为合规问题和认知问题也一直饱受争议),咱们以HTX @HuobiGlobal 为例(没别的,目前市面靠谱的大平台只有HTX、OKX 、和BN,因为HTX年头最久,当年也挺火的我用习惯了),我查了平台公开的常规数据:普通用户小额额度内,主流币活期年化能到10%, 另一类主流币小额活期年化更是能达到15%;就算是大额资金,专属大额活期产品年化也能维持在 6%-9%,这个收益水平,是传统大额米生米完全比不了的。 另外听说体量够大的客户是可以跟他们谈收益的,据说年化最高能给到12%,不过只是听说,我要努力成为火币大客户吃上高年华。 当然我还得客观说一句,两类钱生钱的风险属性完全不一样,不能单纯只看收益高低,任何投资标的行业背景、知识还是需要大量去研究的。 2️⃣我们说完收益再说一个更重要的,资金安全金融行业暴雷的信息从未间断过,所以我们说本金的安全最重要,如果本金都没了,我们还谈什么收益。 现在做这类理财的头部不少,鱼龙混杂,我基本只用刚才提到的3个主流平台(BN \OK\HTX,共性都是老平台,老板很有💰,真有问题的真解决),我也横向对比了一下三家的理财收益数据,横向对比下来,HTX整体稍微高一些,但也不是所有币种收益都领跑同行。 回到我最初的问题上,做理财收益是其次,资金安全和平台靠谱才是重中之重,尤其是大额资金,我一直觉得安全性比多几个点收益更重要。所以我必须理性提醒大家:不管是哪家中心化平台的理财产品,都不存在绝对无风险。 资金都是由平台统一托管,平台的运营偿付能力、合规经营情况、资金流动性管理,都是需要考虑的潜在风险。我建议第一次尝试的朋友,先放小额资金试试提现、到账、赎回流程,确认流程顺畅之后,再根据自己情况慢慢调整资金配置,不要一次性投入大额资金。 综合上面所有分析,加密理财比较适合这几类人群: 1.手里有闲置稳定数字资产,暂时不确定市场行情、不想盲目交易,想放活期拿稳健现金流收益的人; 2.风险承受能力中等,看重平台老牌口碑,不敢随便入驻小众小平台追求高收益的稳健型用户; 3.资金体量较大,想要专属理财通道、享受梯度高收益的资深用户。 同时也要实话实说它的不足:部分币种的高收益能不能长期稳住还不确定,大额资金的阶梯收益规则还有优化空间;整体来说,在传统米生米收益持续走低、同类米生米平台竞争激烈的当下,HTX 靠着十年老牌资质、整体偏高的米生米收益,算得上是可以纳入参考范围的一个选择。 但最终适不适合自己,一定要结合自身风险承受能力,先小额实测体验,再做决定。 我还在持续的出港币慢慢把u转进去火币, 里面的 $usdd 还是很香的! ⚠️本文所有信息都来自公开渠道,仅为第三方客观信息梳理和个人视角分析,不构成任何投资建议。加密资产市场行情波动大,理财收益也可能随时调整,大家实际操作前一定要自行核实最新规则和收益,理性看待收益,谨慎做好资金安排。
显示更多
0
59
95
26
转发到社区
旧瓜,新瓜 给昨天的瓜补个后续: 所以昨晚那个号称要自首的罪犯是真的。他是蓝战非的粉丝,自称炒股负债,12月就要逾期,临时决定买票去南非堵蓝战非要钱。他尝试找南非当地的黑车司机参与行动,最终黑哥们有没有进房间两边说法不一。 索要钱财的过程双方说法差异很大,一个说刀抵在脖子上,另一个说没带刀,全程无肢体接触,但结果是确定的,就是蓝战非最后分两笔转了108.8万。 我看自首男事后的行为,他可能把这事定义成求大v借钱脱困,完全没意识到自己已经是犯罪。结果看到蓝战非把事情捅开后着急了,拼命私信留言,说愿意退钱私了,求蓝战非放他一条生路。蓝战非没理他,还把他屏蔽了,没有办法于是昨晚到蓝战非的粉丝群里把事情都说了出来,被人截图扩散发酵。 互联网上不要轻信一面之词,尤其还是一个走投无路的罪犯的辩词,不过他的自白倒是揭开了我之前的一些困惑,这瓜吃的有点意思。 …… 昨晚3点美联储宣布降息0.25%,这个决定符合市场的一致预期,但随后美联储释放了鹰派信息,令市场信心受挫。 先看利率点阵图吧,给新读者简介一下,美联储每年3、6、9、12月更新一次,点阵图的横轴是时间,竖轴是利率,一共19个委员,所以有19个点。(可点击放大看) 这次会议最终把利率定在了3.5-3.75%区间,同时通过点阵图能看出2026年的利率预期中值是3.4%,2027年利率预期中值是3.1%,这就意味着未来两年可能各有一次0.25%的降息。 但是呢,这只能代表现在的预期,未来预期也随时会变的,其实美联储现在的分歧就不小,19个委员里有7人认为明年不应该降息,有4人认为明年应该降两次0.25%。 从发展趋势看,市场认为明年美联储只降一次息,甚至一次都不降的概率在变大,这是鹰派信号。美元长期利率大概会维持在3%左右,这比人民币现在的利率要高了将近一倍,所以人民币兑美元的升值预期也被打压了。 …… 今天a股成交1.85万亿,全市场中位数下跌1.75%,这个跌幅在浑浑噩噩混时间的震荡行情里已经算是跌停多的,之前有过表现的板块全面熄火。之前有几个大盘指数已经涨到趋势线临界边缘,经过这两天一跌又翻回弱侧。 这大盘真有意思,跌到要破位了,空军集体消失不砸了。等涨到要起势了,突然抛盘就来了,砸的多头买不上去了。真有种感觉被做局了,就是想要在目前的位置继续震荡调整,消耗节奏也拖延时间。 我是无所谓的,我不怕a股墨迹,我就这么耗着也有时间补偿,我是替那些持仓股票的股民着急。不过话说回来,现在股民可能也不那么着急了,因为整个社会的资金成本都下来了,这钱不炒股的话拿去买理财一年也就1-2%,这也是降息的一个副作用。 今天场内勉强还有些资金在炒的就三个板块,风力发电受益于订单回暖+卖方喊单,可控核聚变回锅炒冷饭,另外就是持续性比较好的商业航天,今天依然有人气股在连板。马斯克已经确认明年spaceX上市ipo,市场预期估值接近8000亿,国内从上个月就开始预热炒作对标的票。 今天跌幅榜上全是传统行业,老登资产,房地产今天大跌3%,把昨天反弹的都跌回去了还不够。昨天有不少人留言问贴息政策会不会刺激房价反弹,想着手里的房是不是先不卖了。我觉得目前比较现实的情况是降低跌速至企稳,短期内(半年)不用想反弹的事。 …… 1、甲骨文发了第二财季业绩,营收、云业务收入都不及市场预期,今晚盘前交易下跌12%。为了抢占云市场,甲骨文的云基础设施业务毛利率(约14%)远低于竞争对手和公司整体的平均水平,这让市场开始怀疑甲骨文在ai上的巨额投入能否快速转化为相应的收入增长。 今天日本软银的股价也大跌7%,这哥两都已经深度绑定openai,一旦openai的业务发展不及预期,目前的估值泡沫就有被挤破的风险。 2、今天次新股摩尔股价暴涨28%,是场内最大的亮点。这股目前还没盈利,2025年预计亏损7.3-11.7亿,所以你没发用财务模型去判断它的价值。它的总市值虽然已经高达4400亿,但目前流通的只有270亿,所以短期内价格完全是情绪主导,胆子有多大价格就涨多高。 我之前在互动时分享过炒次新股的经验,就是股价看起来便宜的风险大,股价一上来涨到离谱的往往会更离谱,这是勇敢者的游戏。 3、瑞银预计明年港股ipo规模超过3000亿,继续高居全球榜首。中国这两股市,回报率就没全球领先过,倒是融资数据轮流夺冠,服了。 4、中兴通讯跌停,路透社报道称美国司法部正在调查中兴通讯涉嫌腐败行贿行为,如果这件事被查实,中兴通讯可能需要向美国政府支付超过10亿美元的巨额罚款。10亿美元差不多相当于中兴通讯一年的扣非利润,又要被捏软柿子了。 差不多就这些吧,今天还吃了范曾的瓜,他是目前中国最有商业价值的画家,作品拍卖总额超过40亿。一共有4段婚姻,和第二个老婆生了一个女儿,另外第三个老婆带过来两个继子。最新一段婚姻是娶了比自己小50岁的徐萌,据说87岁的范曾老来得子,佩服。 他今天的公开声明宣布和亲生女儿、继子都断绝关系,以后所有作品和授权都归现任妻子徐萌和刚出生的独子所有。 这事反映了一类社会问题,就是有钱老人晚年再婚,往往会涉及复杂的利益关系,原有子女和新配偶之间往往会产生矛盾。你们看到这里可能会想,那应该在再婚之前把财产先分给子女。但这不符合老人自身的利益,财产都分出去了还怎么娶称心如意的老婆呢,人家图你老,图你不洗澡吗? 要知道范曾现在的老婆比女儿、继子还要年轻20岁。 舅酱~
显示更多
0
11
15
0
转发到社区
巴菲特卖光了 今晚去参加一对朋友的婚礼了,我已经很久没参加朋友的婚礼,毕竟40多岁的人,同龄的要么已经结了,要么离了,要么不打算婚了。 这次的新郎新娘都是内容行业的大v,男方是公众号平台的小声比比梓泉,女方是微博平台的闪光少女斯斯,各自都有几百万粉丝,两人都开了媒体公司,都很能挣,这样的组合在年轻人里大概是top0.1%级别的。 去之前我就被告知本次婚礼将进行线上直播,初听消息的时候我还愣了一下,但旋即释然,这大概就是年轻人的玩法。他们说这是一场人生并购的发布会,现场还挺有那种范的,前台签到,专人引导,拍照打卡墙,草坪布置了嘉宾发言环节,有专业的转播团队,架了五六个机位拍摄。 你们别看我线上每天对着几十万人逼逼赖赖,到了线下手里没有键盘就是个废物,老老实实领了一个社恐牌,避开镜头默默去墙角边站着。 现场到的嘉宾大都也是各个平台的主播大v,那些出镜的脸熟好认,往来寒暄社交颇为热闹,像我这样写博文的就低调多了,只要不说话站那边就是小透明。现场和我相熟能打上招呼的也就ayawawa,她和我是同龄人,聊天的时候随口提到mop,我笑着说不小心暴露年纪了 北京这边的习俗是早上结婚,中午吃饭,只有二婚才放晚上。但是比比(西安)和斯斯(徐州)都不是本地人,不讲究这个,另外我猜测可能是下午和晚上直播看的人会多一些,哈哈。现场能看出来,斯斯是那种对一个隆重的婚礼有很高期待的女生,比比则是尽力满足和取悦自己的新娘。 我注意到一个情况,就是这次的婚礼男女双方的家人似乎都没有来,来的都是内容行业的朋友,包括斯斯婚纱进场,通常都应该是父亲牵的,但这次现场牵她的是刘润。我寻思他两的婚礼可能有好几场,去老家和亲友们一场,在北京的这一场主要面向媒体。 这也是新时代网红大v的觉悟,愿意和网友分享自己人生的重要时刻,其实我也是,我虽然不拍视频不出镜,但我每天在生活里的喜怒哀乐也习惯在晚上的文章里和你们分享。 我问过梓泉,我现场拍的照片方便发吗,他说没问题,随便发。 话说今天路上坐车的时候,我妹妹也给我发了他和男友刚拍的结婚证件照,整挺好,两人打算年底领证。他两不是公众人物我就不发了哈。 今天真是个好日子,喜庆。 …… 简单捋一捋周末发生的事情。 1、根据CNBC的报道,巴菲特在上半年已经清仓比亚迪,全卖完了。巴菲特最早是在2008年以18亿港币抄底比亚迪,然后过去几年全部卖出累计套现600多亿港币,赚了超过35倍,年化收益超过20%。他对比亚迪的投资主要是好伙计芒格推荐的,不过在芒格去世之前就已经开始减仓比亚迪,至此巴菲特已经不再含有来自中国的仓位。 他历史上还在2002年买过中石油港股,2007年清仓,把分红算上的话赚了6倍。中石油第二年在a股上市,后面的事情你们都知道的。 巴菲特从来没买过a股,之前有人给他推荐茅台,他说自己考虑过,但最终没买。 2、我看了一些券商对国庆中秋假期的白酒销售分析,降速已有改善,下滑预期已经包含在股价里,进一步下修的空间小。说句你们能听懂的就是值博率在快速上升,但要注意牛市行情多半是跑不过科技板块的,比较适合不愿追高且有耐心的股民。 3、苹果17销售大超预期,是近几年来最受市场欢迎的机型,我一开始还以为有什么重大创新,结果看了一下产品介绍,这次受欢迎的原因就是“加量不加价”,配置升级了价格没涨,这不就是内卷嘛,好家伙苹果也放低身段了。 苹果要求代工厂立讯精密将日产量提高约40%,接下来果链可以乐观看高一线。另外立讯精密还有别的好消息,他们搭上了openAI,目前已经获得了至少一款openAI的产品组装合同。 4、始祖鸟(安踏旗下)一波反向营销上了热搜,联合蔡国强在喜马拉雅山搞了一波烟花表演,这几天被骂烂了。他们解释说材料环保并且有审批手续,但这种在神峰头上放烟花的行为就很迷,我说像市场公关和媒体品宣部门一定要找有网感的年轻人,不要让老登瞎胡闹,西贝贾国龙就是惨痛教训。老登们最好有自知之明,不要直接面对互联网,你们的思维已经锈了。 5、韩国核电站发生事故,我昨晚有分析,简单总结就是问题不大,影响可控,对a股核电板块应无大碍。 6、周五多只大盘股尾盘异动,新易盛、中际旭创、药明康德、百济神州拉升,中国核电、中国联通、万花化学大跌。这个是因为富时罗素50指数成分股调整造成的,但不是每一次调整都会有相同的波动,否则就很容易被套利。我盲猜可能就是一些被动基金工作疏忽忘记提前调整,最后卡点调仓,这个世界到处都是草台班子。 7、彭博社一篇报道说中国储户坐拥23万亿美元储蓄,正在小心翼翼重返a股,因为除了股票几乎没有更好的投资选择。这话有一定道理,房地产目前比a股还要磕碜,低利率正把储蓄资金往a股挤,但很多韭菜之前几波行情被伤的太深,轻易也不愿意回来,这是本轮行情一直热度起不来的原因。 我周五ic交割的时候减了3手ic,到目前为止一共减仓4手,还剩27手,后面接着涨就接着减。 就这些,发射。
显示更多
AI半导体终局推演2026(II) 当半导体结构性演进到AI推理主线,内存和存储成为了最大瓶颈,市场对内存和存储最大的怀疑就是: HBM/DRAM/SSD会不会摆脱传统周期性? 依赖HBM指数增长的GPU架构路线进化路线,会不会停止?什么时候停止? 长鑫扩产的影响有多大?会不会把这个市场重新带入周期泥潭? 本篇尝试去建立一个框架来梳理这几个问题 —---------—--------- 万物皆周期,而内存的周期性又特别强,最大的来源在于扩产周期过长,无法快速扩产和需求短缺时期错配 摆脱传统周期性几种可能的方式 1. 定制化:产品不可互换,产能不能随便转移,需要签长约。 2. 结构性的指数级需求增长:需求曲线本身很陡峭,而且供给一直追不上。 3. 技术迭代快速升级:每一代产品都快速淘汰上一代。 满足任何一条,就能部分摆脱传统周期;满足两到三条,就能摆脱大部分传统周期 根据这个框架, HBM在三条里,大概占了两条半 1. 定制化,需要签长约(较弱,算半条) HBM 确实有定制化和Nvidia codesign的成分,但并不是很强。真正定制的部分只在封装和 base die,上面那十几层 DRAM die 仍然是完全 JEDEC 标准化的。 比如当 Samsung 的 HBM3E 在 NVIDIA 的 qualification 上没过、份额从大约 60% 一路跌到 20% 的时候,它并没有把这批产能砸在手里报废,而是转手就供给了 Google 的 TPU、AMD. 物理上,给 NVIDIA 的 HBM3E 和给 AMD 的 HBM3E,是同一个东西。 所以产能仍然是部分可以自由转移的。 HBM4之后的定制化更多一些,包括在 base die 上集成定制逻辑和/或缓存。更复杂的方式是将 HBM4E 内存控制器和定制 die-to-die 接口直接放入逻辑 base die SemiAnalysis 提到 OpenAI、NVIDIA 和 AMD 各自都在做定制 HBM 的工作,但这指的是 base die 的定制,上面的 DRAM 层仍然是标准的。 部分定制化的特性,HBM主要在封装上需要合作,这也导致了客户必须签长约,但产能也确实可以转移,所以HBM 能勉强算半条。 2. 结构性的指数需求增长(满足) 最直观的原因,就是Nvidia token factory token throughput的硬件升级需求,导致了HBM带宽的升级换代极快,以及HBM size需求的指数增长 这一条其实就是上一篇AI半导体终局推演2026(I)的结论: token throughput = HBM size × HBM 带宽,每一代翻倍。 HBM size per GPU大概每年增长40%以上 这条需求曲线的陡峭程度,是DRAM供给端 14% 的 wafer 增长,乘以 9% 的 density 提升,很难追上的 在硬件领域,因为attn阶段KV cahce的极高带宽和极高memory size的要求,也导致了HBM独特的地位。即便是HBM涨价三五倍,把钱花在HBM上带来的边际token throughput提升,仍然比花在其他地方要划算的多。 其他几个Memory路线,SRAM,HBF,CXL,PIM,目前都无法在HBM的主力赛道kv cache/attention上正面竞争,起码未来5年甚至更长时间,不太可能找到替代路线 3. 技术迭代快速升级(满足) DDR3时代过了15年,仍然只是DDR5时代,而HBM的升级换代的速度基本上是两年一代,比传统DDR要快很多很多,而且近来还有加速的趋势,HBM size x HBM BW每一代翻倍,目前是完全符合这个规律的 每两年一代HBM升级,NV GPU速度基本是指数型上升:2TB/s ->3.5TB/s->4.8TB/s ->8TB/s->22TB/s,而且HBM的速度和推理token throughput是完全线性正比的,上一代HBM的边际使用成本会不划算,大家都有动机去尽量用最新的产品,虽然更贵,但是带来的收益(token throughput)是更多的 Token factory时代的逻辑是,技术升级(HBM带宽)的越多,赚的越多 这个速度差,造成了一个和 CPU 类似的局面:旧产品快速贬值,于是囤货的价值在变低,比如说,HBM3的价值贬值的非常快,今天基本上主流产品不会用了 所以HBM 厂商的理性选择,从拼当前的产能去占市场(quantity competition),变成了在稳定性和HBM速度上拼技术,拼下一代在 NVIDIA 平台上的 qualification 份额(quality competition),从而避免了在传统周期的下行波段,大家都不愿减产掉市场份额的囚徒困境。 —--------------—-------------- HBM和传统DRAM比较,三个条件里满足了两个半,那么HBM能摆脱传统周期性吗? 内存周期性的来源,主流叙事是,DRAM 有Commodity属性(无差异化 → 价格战 →库存可囤积),所以有周期性。 而Commodity属性本身并不产生周期,它只是一个振幅放大器 特别是DRAM领域里,曾经产生过囚徒困境,在下行周期三星曾经扩产抢市场份额,谁先减产谁吃亏,导致谁也不敢轻易减产,最后大家都亏损惨烈 实际上周期性的主要结构性来源是供给周期太长,很容易和需求周期错位。建一座 fab 要 3 年,投资上百亿美元,一旦决策就不可逆,而需求增长会有不稳定性,每次出现新范式增长,比如云服务,移动互联网手机,疫情线上需求,会有爆发式增长,而过了两年增长会放缓,供给高于需求,降价过猛,就变成了亏钱周期 万物皆周期,HBM这一条同样是无法避免,但只要token需求仍然是指数型增长,结构性的指数增长会减弱周期性,因为需求可预测度更好,而且一旦降价,客户就有增大HBM size的需求(从而增大token throughput),加上HBM有一点定制化要求导致都是长约,从而从周期性转化成成长周期性,而且这一轮周期会特别长 周期性:上行周期赚的多,下行周期亏的多 成长周期性:上行周期赚的多,下行周期赚的少 另外,HBM/DRAM在这三条摆脱传统周期的条件的基础上,还有一条重要优势: 4. 因为DRAM密度增长scaling越来越慢,以及HBM升级换代导致DRAM堆叠倍数的增加,供给端的扩产难度持续增加 2000年附近,DRAM每片wafer上DRAM bit密度每年增长大概45%,也就是说,就算晶圆wafer数量不扩产,每年的供给端DRAM bit仍然可以增长45% 十年前,DRAM bit每年密度增长降到了20%,而现在,DRAM bit每年密度增长降到了9%。以前DRAM扩产甚至不怎么需要新建厂房就能得到每年20~30%的bit volume上升,现在DRAM要扩产,更多的是靠wafer数量的增长,也就是新建厂房和clean room。 另外一个HBM快速扩产难度在于,HBM3e大概需要3倍的DRAM wafer晶圆,而HBM4由于堆叠密度的增加,大概需要4倍的DRAM wafer晶圆数量,相当于HBM bit相对于DRAM bit一直变得更难制造,单位DRAM wafer数量制造的HBM bit越来越少,相当于在通缩 ---------------------------------- HBM未来有一天,会不会从成长周期性,变回传统周期性?最重要的因素是结构性指数增长,那么 AI推理时代,这个依赖HBM指数增长的GPU架构路线进化路线,会不会停止?什么时候停止? token throughput = HBM size × HBM 带宽,这个HBM指数增长的第一性原理里的HBM size的增长原因正是KV cache的增长。KVCache的特性以及Attention的特性,也是非常契合HBM的。甚至让HBM领先于其他的技术路线, 能够最大化地让KVCache和Attention 阶段的利用率。 换言之, 如果KV cache从架构上不存在了,那么HBM size指数增长逻辑也会受到挑战 所以这个问题的本质其实是,这一轮以 Transformer 为代表的 attention 机制、以及由它衍生的 KV cache 机制,会不会消失?退潮之后会不会被取代? 从历史规律来看:每一次AI模型架构革命,真正被保留下来的,是那些在数学上具有某种普适性的 primitive 操作 举个例子:FFN(前馈网络,也就是模型里大量的 MLP 层)是 2012 年深度学习时代的产物,但它一路活到了今天的大语言模型里,并且仍然占据着模型相当大的参数量。它为什么能活下来?因为这也是一种universal approximation theorem(通用逼近定理):任何足够宽的 MLP 都能逼近任意连续函数 Attention 大概率也是这样一个会被保留的 primitive。因为它解决的是一个同样 基础的问题:序列sequence 中任意两个位置之间的 dynamic routing(动态路由),让一个序列里任意两个位置都能按需建立联系。这个能力一旦被验证有效,就很难被丢弃 所以即便未来架构从纯 Transformer 向混合架构演进,或者向世界模型演进,但attention 层依然会存在,KV cache(或者它经过 latent compression 之后的等价物)依然需要,HBM依然会作为推理核心之一,这个依赖HBM指数增长的GPU KV cache架构路线进化路线,不会停止 —---------------—--------------- 那么DRAM呢?在未来有没有摆脱传统周期性的可能? HBM摆脱周期性在市场上有一定共识,但DRAM摆脱周期性,市场目前基本没有共识 还是回到刚才的框架,三个摆脱传统周期的条件里,DRAM是没有定制化的,所以就只能看技术迭代速度,最关键的还是要看,有没有结构性的指数增长,答案是有的 在 AI token factory 这个概念里,结构性指数增长的确实主要是 HBM。但事情在 2025 年年底之后起了变化:随着 agentic CPU开始释放潜力,CPU 附带的那部分 DRAM 需求,正在成为 DRAM 新的结构性指数增长来源 —------ 这部分的增长逻辑分两层:第一层是CPU 服务器TAM的快速增长,第二层是每个服务器CPU core配备的DRAM用量的因为agentic flow快速增长 服务器CPU TAM的快速增长的4个逻辑在4月的CPU专篇详细写过,简单的说: 1. AI 加速器集群里CPU和GPU配比从传统的1:4变成1:2,甚至可能往1:1迈进 2. Agentic flow里CPU处理的延迟占比很高,50~90%成为重要瓶颈,需要同步扩容 3. AI coding让SDE的效率大幅提升,代码量数量级增长,软件API调用指数级增长,直接转化为这部分CPU hours指数级上升 4. Sandbox为保障数据安全与隔离,如Analytical Agent 需为每个任务复制大量数据库和用户上下文,导致内存(DRAM)和CPU核心的严重浪费,而且这个浪费问题五年甚至更久无法解决。另外CPU hours 在技术上很难通过优化的方法来通缩 这也就是为什么,上上个季度,AMD的财报说CPU TAM到2030年会到60B,两个月前,AMD/ARM把CPU TAM的2030年预测翻倍到120B,一个月前,Nvidia再次把CPU TAM的2030年预测翻倍到200B 而上个星期,Bernstein再次提升2030 CPU TAM指引到223B。在我看来,2031 CPU TAM未来上修到400B是没有太大悬念的事情,唯一的悬念是几个巨头会什么时候宣布上修这个指引 再说说第二层,为什么每个服务器CPU core配备的DRAM用量在agentic时代快速增长? 1. Agent 是带状态的长驻进程,不是无状态的请求-响应 传统 web/SaaS 是 stateless 的:请求进来,分配内存,处理完内存立刻回收。而一个 Agent 任务可以跑 一分钟到一个小时,这整段时间里,它的 message history、system prompt、工作记忆、长期记忆、工具结果 buffer 全部常驻 DRAM 和 CPU hours 一样,每个任务的内存足迹因为 stateful 和 sandbox 隔离(每个任务复制数据库和上下文)的要求,技术上很难压缩 2. 上下文窗口在指数级变长,每个会话的工作集随之膨胀,并发度 × 单会话memory footprint,乘数放大 context window 从 32K → 256K → 1M,reasoning / test-time compute 的序列长度爆炸,未来还会继续增大。每个活跃会话常驻的 messages 随 context 长度线性增长 现在把两层乘起来。 第一层,CPU server 的 TAM,朝 2030~2031 看大概是 5–7 倍的量级(60B → 120B → 200B → 223B,我认为还会到 400B) 第二层,每颗 CPU 的 DRAM 配比,大概 3–4 倍(4~8GB → 16~32 GB/core),但这个增长可能大部分是一次性红利 两个独立变量相乘,server 侧的 DRAM 需求是数量级的增长 2030年,即便按保守的300B CPU TAM,一个CPU core按$50来算,agent时代最保守按16GB/core,这算出来新增量最少都是96EB,而今年的DRAM总产量只有47EB,明年勉强60EB,这是非常惊人的增量 虽然这个agentic CPU带来的DRAM指数级增长,在第二层很大程度上是一次性红利,但持续时间会持续很久很久,因为这个短缺的缺口实在是太大了 —-------- 回到文章开头那个框架。三个摆脱传统周期的条件里,第一条DRAM 定制化,基本可以忽略 而第二条:一个结构性指数级、而且很难逆转的需求来源是成立的。commodity DRAM 现在也具备了部分摆脱传统周期性的资格。没有 HBM(两条半)那么彻底,但已经是实质性的变化 第三条,技术迭代速度,DRAM的节奏也跟以前不一样了 因为以前的DRAM技术迭代速度是严重依赖消费电子的,DDR的进步对于performance用处并不大,但可预见的未来里,碳基消费的传统DRAM,会远远小于硅基消费(CPU服务器)DRAM的用量 以前DRAM的速度升级带来的边际效用是很低的,但现在因为CPU服务器对memory的需求增大,以及端侧AI对DDR速度的要求也增大,比如苹果为了跑本地大模型,LPDDR速度越来越快 速度升级的边际效用高了不少,所以DDR6和LPDDR6的速度迭代需求比以前提升了太大了,这在图里也可以看到,LPDDR6/DDR6的迭代时间缩短了,而且速度斜率,重新开始抬头 以前新一代DDR/LPDDR技术出来,大家的反应都很冷淡,等降价了才会用 而现在LPDDR6出来,各家恨不得都在抢着能尽量早上就尽量早,因为速度的提升带来的performance提升是触手可及的 ------ 另外,DDR 的供给还要被 HBM 额外抽一道税。HBM 每年的扩产速度太快,导致每年都有一批原本可以做 commodity DDR 的 wafer 被拉去做 HBM,而 HBM 的转换比极低,HBM3E 大约要 3 片 DDR wafer 的产能才能做出等量的 bit,HBM4 是4 片。所以每年大约有 3% 到 5% 的 DDR bit 增长,是被这个 HBM bit tax直接吃掉的 所以DRAM bit volume虽然未来每年能增长24%左右(14%来自wafer增长,9%来自每个wafer的DRAM密度增长),但算上HBM bit tax之后,传统的、非 HBM 的 commodity DDR,每年的 bit growth 大概只有 20%(约 10% 的 wafer 增长 × 约 9% 的 node density 提升) —--------------------- 中国长鑫扩产的影响有多大?如果不讲武德拼命扩产,会不会把这个市场重新带入周期泥潭? 长鑫这几年的扩产速度还是很快的,2025年还是每个月20万晶圆,2026年北京晶圆厂及新增生产线的贡献就能到32~35万。 正在建设中的上海工厂一期和二期,一期预计到2027年每月新增10万片晶圆产能,二期预计到2028年每月新增10万片晶圆产能,也就是说,2027年每个月42万晶圆,2028年能到每个月50万晶圆。 但需要注意的是,长鑫的dram bit 密度大概只有御三家的一半左右,所以长鑫的每个月50万晶圆wafer能产出的dram bit volume只有其他家的一半,这里计算wafer per month的时候,就按等效一半来算 把这个折扣打上之后,长鑫对整个DRAM行业的冲击还是小了很多,从2025年年底到2028年年底,长鑫对DRAM bit产能CAGR的影响大概只有1.5%,全行业的DRAM产能CAGR大概从12.7%升到14.2% DRAM月产能(kwspm) 2025E → 2028E CAGR Samsung 685K → 920K 10.3% SK Hynix 519K → 725K 11.8% Micron 340K → 560K 18.1% 非中国其他 150K → 218K 13.3% 中国(密度折半) 117K → 274K 32.8% ————————————————— 含中国总计 1811K → 2697K 14.2% 无中国总计 1694K → 2423K 12.7% 就算是长鑫未来还能保持增产速度,2030年对全行业等效产能每年DRAM bit volume增产CAGR的影响,大概也不到3%,从20% CAGR变成23% CAGR,仅此而已 另外,长鑫被光刻机所限制,而DDR6 需要更高速率(14400 MT/s 起步)和更高密度,御三家做 DDR6 大概率会用 1c 或更先进节点(~12nm 以下),已经全面用 EUV。长鑫可能会在DDR6上速率受限,密度也只有一半。 —---------------- 即便是成长性周期,为什么DRAM的这轮超级周期会持续很长时间,起码五年看不到头? 第一个原因是,刚才谈到的CPU服务器需求端的巨量增长带来的结构性DRAM需求指数增长,这里结合DRAM供给端的bit volume CAGR大概稳定20%增长,就可以很清晰的看到,DRAM未来几年的缺口为什么越来越大: 非HBM的传统DRAM供给端大概是每年增长20%,而需求端,按2026年60B CPU TAM,每个CPU消耗DRAM平均8GB/core,每个core $30~35来算,需求是16EB 2030年按400B CPU TAM,每个CPU消耗DRAM平均16GB/core,每个core $80来算(CPU涨价超过一倍),需求是80EB,这部分DRAM的增长CAGR大概是50%,远远超过目前的估算 不同于HBM是直接和token throughput挂钩,从而和GPU赚钱效率直接挂钩,DRAM不够对于agent flow的影响主要是速度,比如说,8GB/core和16GB/core比起来,部分workload速度可能降低30%,部分低价值task实在要等等也能忍,结构性指数增长的动机很强,但需求不如GPU那么刚性 Semianalysis说今年的DRAM缺口式个位数百分数,明年是超过10%。从agent CPU数量激增导致的DRAM结构性来看,这个缺口每年都会继续加大,在2030年之前看不到降低的可能 —---- 另外一个DRAM能延续强势很久的逻辑是,因为DRAM涨价之后,被涨价消灭的那部分需求,不是真的消失了,只是延迟了,需求蓄水池太多了。 所谓蓄水池,是指那些"内存一旦降价就会立刻被释放出来的潜在需求"。它们的存在,意味着即便供给阶段性跟上了,价格也很难崩,因为总有新的需求从蓄水池里涌出来接盘: 内存换算力/速度是一个蓄水池: 有大量本来需要靠额外内存来优化速度和算力的需求,在内存太贵时被压着,一旦内存降价就会被释放出来。 比如 Nvidia的CPX prefill 加速,本来的设计初衷是用额外的低成本GDDR7,来做一个专门的prefill加速器,结果LPDDR/GDDR都太贵了,比涨价前的HBM还贵,这个方案的ROI就不划算了,但等到普通内存降价,这样类似CPX的优化方案就还会回来 低价值task是一个蓄水池:内存涨价导致token价格居高不下时,高价值的 task 被优先保留,低价值的 task 被延后;内存一降价,这些被延迟的需求就回来了。 端侧 AI 是一个蓄水池:AI PC 的内存配置可能从 24GB 一路涨到 128GB。苹果已经明确要求最新的端侧AI满血版需要从8GB升级到12GB内存 常规消费电子、Agent PC、低端手机,因为内存涨价而减少的需求,全都是蓄水池。 这么多蓄水池叠在一起,构成了一个极厚的需求缓冲垫。这就是为什么 DDR 这轮的结构性增长,后劲会比市场想象的要强。 —----- 还有一个DRAM价格很难大幅下降的原因在于,HBM和DRAM产能可以互相转换,所以整个DRAM complex是一起re-rate的 在上行期DRAM的利润率远超HBM,HBM的涨价幅度甚至变成了由DRAM去推动。今年新签约的HBM4的价格,就是当期DRAM的价格 x 4,也就是正常堆叠倍数对应HBM4的价格 一旦DRAM降价毛利下滑,因为HBM的长约透明性,利润率都是有保障的,HBM就会间接抽走更多的DRAM产能,HBM的降价也会让GPU厂商更有动力尽可能的升级HBM size,这样也间接保障了DRAM的价格地板 DRAM的结构性指数增长的需求有了,density scaling放缓扩产难度在增加,厂商扩产计划都很谨慎,长鑫这几年带来的影响也是有限的,再加上需求的蓄水池非常庞大,这四个原因导致了,在可预见的至少五年甚至更长时间内,DRAM是很难进入周期低谷的。 —-------------- NAND SSD有希望摆脱传统周期性吗? NAND 的结构性增长动力没有 DDR 那么强,今年的缺货主要原因是几个主要玩家的生产纪律保持的很好,并没有大规模扩产,每年的产能增加主要来源于技术改进:NAND堆叠层数的增加 第一个结构性增长来自AI,主要来自 KV cache 的 offloading,把HBM溢出的warm/cold KV cache 卸载到 NAND SSD上。 但神奇的事情是,这个kv cache offloading的增长甚至还没有大规模发生,SSD就已经缺的比DRAM还严重了,涨价也比DRAM要更多。等到明年Rubin CMX放量,加上KV cache offloading大规模应用,SSD的缺货也会因为这个结构性增长而增长 第二个,另一个去年年度总结里说到的未来可期的AI视频带来的结构性增量,今年已经有出圈的态势了 Seedance体量在以一年十倍到四十倍的速度增长。目前它还卡在缺卡算力不足的阶段,需求被算力压着没完全释放。但等到缺卡阶段过去,AI 视频对NAND存储的结构性需求增长,会持续相当长的一段时间。 第三个结构性增长也同样来自于agent flow带来的Sandbox使用量的指数级增长,Sandbox为保障数据安全与隔离,如Analytical Agent 需为每个任务复制大量数据库和用户上下文,导致内存(DRAM)和CPU核心的严重浪费,同样会带来大量的SSD的浪费(需求) 第四个也许在2030年之后发挥作用的结构性增长,来自于HBF路线需要用到SSD,在不少投行分析中被寄予厚望,但这个技术路线还有些遥远,主要角色定位只能作为存放大模型的weights,写一次权重然后做只读,而且必须要和GPU/HBM封装在一起(48TBps/96TBps),否则靠PCIE7/8速度太慢完全无法用,只能说未来可期,下一篇AI半导体终局推演2026(III)会有更详细的分析 总之,NAND SSD的结构性增长没有HBM那么强,但是胜在便宜,价格到2027年也只有$0.8/GB,是同期DRAM的四十分之一,所以也算是多级缓存里的万金油属性,结构性增长来源太广泛了 也就是说,不存在DRAM/HBM单独涨价繁荣,而SSD不涨价的情况,因为如果这样的情况发生,那么大家就会想办法用SSD去承载DRAM/HBM的部分功能,用更低的成本实现类似的效果。HBM、DRAM、NAND 不是三个独立故事,而是同一 AI memory hierarchy 在不同温度层的结构性增长 结构性指数增长的需求有了,NAND SSD摆脱周期了吗? 那么就要看NAND SSD厂家的生产纪律了,唯一可能不遵守生产纪律的,只有长存。毕竟这是一个囚徒困境,一旦有一家不讲武德拼命扩产,整个NAND产业要扩产的难度比DRAM简单的多。 但最起码的,这一轮NAND同样是超级周期,几个结构性指数增长带来的需求,下行期推迟到2030年问题不大
显示更多
0
193
2.2K
638
转发到社区
人老了难免有一种人生若只如初见的情节 22 年底、23 年初那个时间点多好 GPT 和 Stable Diffusion 刚出来 TASUKU2023 还没有下架 ChilloutMix 852 话还是一个天天发布惊艳图片的天才家庭主妇 你们现在叫的上名号的 AI Kol 都还只有几千粉,有一些甚至都没注册账号 那时候大家发的东西都是纯手工 很简洁很有趣,我很喜欢看 有一点点小发现、小技巧,大家都会认真讨论 Anti 老师会私信我一起研究 descript 这玩意儿到底行不行 宝玉老师可能算是那时候 AI + 科技里面粉丝最多的 当时我拿女推友的的 ins 照片练了一个 LoRA 效果还不错 宝玉老师帮我分享到了微博上 我没有微博账号,还是朋友告诉我 结果点进去一看 宝玉在提醒女性朋友们不要随意分享,谁知道 Passluo 这个 b 私底下拿这些 LoRA 画什么黄图 😂😂😂 后来 AI KOL 这个赛道含「金」量越来越高 X 的创造者奖励机制也吸引了很多人来 X 上淘金 中推圈浅浅热闹起来,内容也丰富了起来 大家再也不用为信用卡好还是二维码支付好连吵几个星期 人多热热闹闹当然是好事啦 但咱们大部分人当初从墙内搬家逃出来 不都是为了自由分享创作、以及发现一些第一手的信息吗? 现在大家把 x 当成当年的微商私域玩 一点也没有当年赛博网络邻居的味道了 劣币们,咱们努力做个良币不好吗?
显示更多
0
44
67
4
转发到社区
所有人都在买GPU和存储。没有人告诉你光模块公司的总市值比美光还低 我想从一个反常识的问题开始:GPU是AI的大脑,存储是AI的记忆。那光是什么?光是AI的神经系统。但神经系统从来不是最先被注意到的。存储已经涨了10倍,GPU更不用说。光的时代,刚刚开始。 1. 先说一个结构性的错误定价 在Nvidia的NVL72机架里,光模块的采购金额占到整个机架的20%。2026年全球AI光收发器市场规模预计从2025年的$165亿增长到$260亿,同比增速超过57%——这是半导体赛道里增速最快的子领域之一。 但所有光模块公司的总市值,比美光一家还低。这个错误会被纠正。问题只是什么时候。 2. 光和存储不一样的地方 存储的接力是季度级别的事件——供需拐点,财报超预期,市场重新定价,SNDK从$200涨到$900,这个过程很快。光的接力是年级别的结构性变迁,因为光的技术路线本身正在发生一次范式转移: 第一阶段(现在):可插拔光模块 800G → 1.6T → 3.2T 线性增长,随数据中心扩张 第二阶段(2026下半年):近封装光学NPO 光模块移向芯片旁边 需求非线性跳升 第三阶段(2027-2028):共封装光学CPO 光引擎直接封装进芯片 这是终局,也是最大的价值重构 Meta在OFC 2026分享了大量数据,证明CPO比可插拔光收发器更可靠,成本更低,功耗更少。Nvidia在GTC展示了CPO将在2027/28年用于Scale-Up互连。5年内所有AI数据中心互连都将是光。 这不是预测,是物理定律。铜在高速率下信号损耗太大,功耗太高,距离太短。光没有这些问题。 3. 光在吃铜,不只是光吃光 生成式AI集群需要比传统云服务多10到100倍的光纤,正在把现有铜互连逼到物理极限。 这是大多数人没想到的逻辑——光的增长不只来自数据中心规模的扩大,还来自光替代铜的渗透率提升。每一代迭代,光吃掉更多铜的市场。这是双重驱动,不是单一驱动。 4. 产业链七个卡位,从上游到下游 现在我来把整条产业链拆清楚。 七个公司,覆盖从最上游的衬底到最下游的网络设备。 🔬 最上游:硅光衬底 $SOI 做的是硅光PIC的衬底材料——整个产业链最上游的原材料。没有SOI的衬底,硅光芯片就没有基础。护城河极高,几乎没有竞争对手能短期内介入。和TSEM形成上下游绑定:SOI提供衬底,TSEM代工成芯片。 🏭 代工层:硅光晶圆厂 $TSEM(Tower Semiconductor)硅光版本的台积电。 今天刚刚发生的重大事件: TSEM宣布签署$13亿的2027年硅光合同,收到$2.9亿产能预付款,2028年还有更大合同在谈判中。计划资本支出$9.2亿专门用于硅光扩产,Q2营收指引$4.55亿同比增22%。 TSEM最聪明的地方在于:它不赌哪条技术路线赢。 可插拔、NPO、CPO,三条路线都用TSEM代工。就算市场对技术路线判断错了,TSEM依然受益。这是光通讯产业链里确定性最高的picks-and-shovels。 💡 激光器层:光的心脏 光模块的核心是激光器。没有激光器,光模块什么都不是。 激光器分两条技术路线: 磷化铟(InP)路线——$LITE(Lumentum) LITE是目前唯一能量产200G每lane EML激光器的供应商,是1.6T收发器的关键零件。Nvidia预先锁定了LITE的EML产能,推迟交货期超过2027年。 Nvidia向LITE投资$20亿,用于加速AI基础设施光学技术。LITE CEO称2026年是激光器芯片销售的"突破年",刚收到历史上最大的CPO超高功率激光器采购承诺。 LITE的护城河是时间积累的——InP激光器的制造需要极其精密的工艺,20年积累的经验是任何竞争对手短期无法复制的。而且LITE不只押注现在:EML是可插拔时代的命门,ELS外置激光器是CPO时代的命门,OCS光路交换机是未来AI集群的光学路由器。 三个产品线覆盖了光通讯从现在到2030年的完整需求。 硅光(SiPho)激光器路线——$SIVE(Sivers Semiconductors) Sivers专注于CPO系统的高性能InP激光阵列,Jabil合作是第一个商业验证信号,证明技术正在从研究走向真实超大规模部署。 SIVE不是要打败LITE,而是作为CPO时代激光器供应链里的补充供应商——当LITE和COHR产能不足时,SIVE是下一个选项。整个CPO产业的激光器供应严重短缺,补充供应商的价值会被重新定价。 🔭 光学系统层:从组件到整合 $COHR(Coherent Corp) COHR最新Q3财报:营收$18.1亿同比增21%,数据中心和通信板块$14亿,同比增40%。Nvidia同样投资$20亿入股COHR。COHR是整个光通讯赛道里垂直整合程度最高的公司。从InP晶圆到激光器到光模块到系统,全部自己做。COHR正在扩大6英寸InP晶圆产能,这是推动毛利率持续提升的核心驱动力——规模越大,每片晶圆的成本越低,利润越高。 LITE和COHR的关系是竞争者也是互补者: LITE:激光器专家,EML垄断,聚焦 COHR:光学系统整合商,体量更大,更全面 🏗️ 物理基础设施层:光纤和连接 $GLW(Corning) Corning是光通讯产业链里最让人意外的标的——一家成立于1851年的玻璃公司,正在成为AI基础设施的核心受益者。 Q1 2026光学通信业务增长36%,分部净利润增长93%。2028年营收目标$300亿,2030年$400亿,内含年化增速19%。两个额外的超大规模云厂商签署了长期协议。 Nvidia命名Corning为下一代AI基础设施光连接合作伙伴,投资$5亿+最高$32亿股权,在美国建三座专属光学工厂。 Corning做的是光纤、线缆和连接器——不是最性感的产品,但是不可或缺的基础设施。 城市要运转,不只需要主干道,还需要所有的小路、接头、路牌。 Corning做的就是光通讯世界里的所有"小路和接头"。 而且这些"小路和接头"是消耗品——每建一个数据中心都需要,每升级一个机架都需要。 📡 网络层:AI时代的网络基础设施 $NOK(Nokia) Nokia是这七个标的里最被市场误解的。大多数人还在用"翻盖手机公司"的眼光看Nokia。 Nokia 2026营收预期同比增长7.5%,EPS增长21.2%,光网络业务增速20%,AI和云业务增速49%,单季度新增€10亿AI和云订单。 Nokia做的是什么? 光传输网络(OTN)——把数据中心之间用光连接起来的骨干网络。这是Scale-Across的核心基础设施。 Nokia的第六代超相干光学技术PSE-6s,是目前全球少数能实现800G甚至1.2T长距离光传输的技术之一。 Nokia收购Infinera之后,从"转卖别人芯片的公司"升级为"拥有自己光芯片工厂的公司"——同样的技术路线,市场给LITE估值66.5倍,给COHR估值35倍,Nokia只有30.8倍Forward PE。 这个估值差距是最大的错误定价之一。 七个标的的完整产业链图 最上游 SOI(硅光衬底) ↓ TSEM(硅光代工) ↓ 激光器层 LITE(InP EML,可插拔+CPO) COHR(垂直整合,光学系统) SIVE(CPO激光阵列,高赔率) ↓ 物理基础设施 GLW(光纤、线缆、连接器) ↓ 网络层 NOK(光传输网络,骨干连接) 每一层都有自己不可替代的护城河。 每一层都在受益于同一个趋势。 6. 为什么是现在? 2026到2027年是在1.6T供应链建立立足点的关键时期,在一线客户的设计导入将决定长期赢家。现在是design-in阶段——产品正在被超大规模客户选中和锁定。等量产阶段到来,市场才会充分定价这些公司的价值。 在design-in阶段买入,等量产阶段收获——这是光通讯投资最好的时机。 7. 仓位逻辑 高确定性(重仓): TSEM → 今天$13亿合同,产业链里最硬的催化剂 LITE → EML垄断+Nvidia锁定,现在到2028年都受益 COHR → 垂直整合,体量最大,Nvidia $20亿入股 中等确定性(配置): GLW → Nvidia直接合作,物理基建不可或缺 NOK → 最被低估的估值,但故事兑现需要更多时间 高赔率(小仓位): SOI → 和TSEM绑定,护城河高但流动性低 SIVE → CPO时代的纯粹赌注 8. 光会接力存储吗? 会。但不一样的方式。存储的接力是一次性的价格重估——供需拐点到来,几个季度内完成定价。 光的接力是分阶段的持续重估—— 2026年:可插拔1.6T带来第一波 2027年:CPO开始量产带来第二波 2028年:Scale-Up全面光化带来第三波 三波叠加,才是光通讯超级周期的全貌。存储让你在一年内赚了10倍。光可能让你在三年内赚同样多,但过程更平稳,确定性更高。 最后一句话 光通讯不是一个新故事,是一个被重新发现的旧故事。 光纤已经存在几十年了,但AI让这个故事的量级发生了质变。每当数据中心需要更高密度、更低功耗、更远距离的连接时,答案永远是光。 #光通讯# #TSEM# #LITE# #COHR# #GLW# #NOK# #SOI# #SIVE# #CPO# #硅光# #光模块# #AI基建# #数据中心# #存储接力# #Nvidia# #美股# #USStocks# #SiliconPhotonics# #CoPackagedOptics# #EML# #光互连# #AIInfrastructure# #光纤# #Nokia# #Corning# #Coherent# #Lumentum#
显示更多
0
57
1.4K
391
转发到社区
刚完成和CNBC的访问,不藏私分享我上周刚到美国纽约迈阿密出差后的一线行业洞察和故事。 首先我们聊了一下大家都很关心的美国的《清晰法案》,正好明天5月14日会是一个关键的参议院投票节点。从商业影响看,CLARITY Act 的主线不是单纯“利好”或“利空”,而是把美国加密现货市场从执法驱动的不确定状态,推向SEC/CFTC 分工、交易平台注册、托管与客户资产隔离、反欺诈、反洗钱和利益冲突治理并存的制度化状态。 同时我在和美方监管、律师深入交流后,也看懂加密全球化合规的关键窗口期。 另一个很多人好奇的话题是:RWA现实资产代币化到底走到了哪一步,值不值得长期布局。 我的判断很明确:我们仍处在超级早期红利阶段。 目前各类金融资产,代币化最高的private credit和t-bill money market fund占比0.5%–1%,代币化股票更是低至0.1%。 因此我分享了一个“10%愿景”:到2030年,全球可代币化资产规模会迎来10倍扩张。(背后的小故事是,我在纽约跟贝莱德COO开会时他问我怎么看2030年的RWA市场,我灵机一动凑整说了这么个"10%愿景") 虽然是这么抖的“小机灵”,但我真心觉得这个目标是很有可能实现的。背后三大硬核逻辑早已成型,包括: 1. 稳定币快速普及,交易更快、成本更低; 2. 贝莱德、富兰克林等传统金融巨头扎堆入局基金、ETF代币化; 3. 纽交所、纳斯达克带头推动股票代币化,赛道格局逐渐打开。 完整版专访干货满满,拆解行业趋势、巨头布局和未来风口,建议认真看完视频,读懂下一个十年的机遇👇 ⚠️ 本文仅为行业观点及趋势分享,不构成任何投资建议。虚拟资产、RWA 代币化产品市场波动大、政策及投资风险偏高,请保持理性认知,量力而行,谨慎决策。 #CNBC专访# #RWA# #现实资产代币化# #行业前瞻# #金融趋势#
显示更多
0
27
193
12
转发到社区
踏入币圈,谁不是一路踩坑、遍体鳞伤,交够了学费才读懂市场。 我亲身经历312史诗级暴跌,单日爆仓500万,一夜之间从豪车代步跌入谷底,回归平凡生活。 好在天无绝人之路,凭着仅剩的5000本金绝地重启,用8年时间稳健滚仓做到2000万。 带出的学员也有人3个月轻松翻4倍,今天毫无保留,把我牛熊穿越、既能保命又能吃肉的整套交易体系全部分享给大家。 1. 仓位风控是生存底线 总本金均分5份,单次只动用1成仓位;单笔严格设8%硬性止损,单次做错仅回撤总资金1.6%,就算连续错5次,依旧留存92%本金留有翻身余地。盈利后同步设置10%移动止盈,坚决不把盈利拿成亏损,更不被套死扛成被动长线。 2. 趋势为王,不做逆势博弈 熊市每一次反弹,大多都是诱多洗盘;牛市每一次急跌,都是良性回调接机会。只顺势跟随行情,绝不和盘面硬刚对着干。 3. 远离高风险妖币陷阱 连续三日暴力拉升的币种,直接移出观察池。真正的主升浪都是慢慢蓄力上涨,短期疯涨都是透支行情;一旦高位放量滞涨,就是主力悄悄出货,坚决不做最后接盘侠。 4. MACD把控买卖攻防 零轴下方金叉,小仓试错;双线站稳零轴,大胆进场布局。零轴上方出现死叉先行减仓,有效跌破零轴直接清仓离场。记住铁律:亏损绝不补仓摊成本,盈利才顺势加仓放大利润。 5. 量价永远不会说谎 底部长期横盘三个月以上,突然放量突破,就是主力低位建仓完毕,可稳健跟进;高位持续放量却不上涨,就是机构对倒出货,一定要果断离场规避风险。 6. 均线筛选强势标的 3日线把握短线进出节奏,30日线守住中线趋势,84日线锁定主升浪大行情,趋势没破就坚定持有,不随意频繁操作。 7. 坚持每日15分钟复盘 每天自查三件事:持币逻辑还在不在、周线是否保持多头、量能是否健康。趋势一旦反转,立刻调整仓位策略,不扛单、不侥幸、不执念。 这套体系我历经牛熊实战打磨,不靠赌、不梭哈、不追高,只凭纪律和逻辑稳稳吃肉。 愿意沉下心照做的人,都能慢慢摆脱亏损,在市场里长久活下去、稳稳赚下去。
显示更多
0
30
43
4
转发到社区
花了大半天把张小珺访谈姚顺宇的4小时长访听了一遍。这位去年刚从Anthropic跳到Google DeepMind的哥们,参与过Claude 3.7/4.5和Gemini 3。他给了很多实诚的头部大模型一线研究员的视角。访谈信息密度相当高。说几条我觉得最有意思的: 1. Google禁止员工用Claude Code,但姚顺宇保守估计自己90%代码是AI生成的。不保守估计99%甚至100%。一个清华加斯坦福的物理博士、顶级大模型研究员都靠AI写代码,再有人说自己不能用AI写代码,别特么给自己脸上贴金了。但反过来想,Google连内部都不让用CC和Codex,员工效率得受多大影响啊,这家公司真挺神奇的。 2. 他离开Anthropic的原因里,反对Dario反华占40%。他自己说这不是首要但确实是大原因。他很烦Dario那套「我们必须拥有最强模型才能推AI安全」的逻辑。圈里敢直接喷半年前老东家的人确实不多。 3. Claude 3.5/3.6/3.7的命名是个草台班子般的乌龙。Anthropic早期产品力极弱,「居然管两个模型叫一个名字」,外界为了区分自发叫3.6,Anthropic后来跟随社区习惯把下一个叫3.7。我之前一直以为3.6是个跳过的版本号。 4. Claude Code是「个人英雄主义的开端」。一个叫Boris的研究员自己想做提效工具,后来变成Anthropic最重要的产品之一。完全是bottom-up长出来的,不是规划出来的。 5. Anthropic创始团队一个人都没离开。来自OpenAI的那批核心是一起打过仗的,这才是top-down文化能跑通的根。对比OpenAI高管走光,姚顺宇似乎挺鄙视OpenAI的企业文化和部分高管。 6. OpenAI救了Google一命。逻辑挺反共识:如果ChatGPT一鼓作气把search吃了,Google就完了;正因为做出可能性又没做到极致,反而留了Google反击时间。 7. AI行业最重要的特质不是脑子,是靠谱。原话「那些东西多多脑子,本科生就能干」。一个物理博士说这话,算降维打击,也算给所有想转AI的人吃颗定心丸。 8. 他觉得程序员的未来是1/1000拿100倍工资。不是「程序员消失」,是「极度中心化」。绝大多数失去独特价值,少数顶级爆赚。 9. 他觉得现在很多人说的Scaling Law撞墙,多数是自己代码Bug。原话「修一个Bug带来的进展,远大于一些很神奇的技巧」。预训练在过去几个月还在变强,跟外界「预训练已死」的叙事完全相反。 10. 绝大多数New Lab都会死。 听完最大的感受是:这哥们说话真的没在留情面,又喷Anthropic又喷OpenAI又喷各种「老登」。但他敢喷的底气挺清楚,既不在SSI那条路上,也不靠LP吃饭。他自己原话说的是:「我这个行业又没什么导师又没什么旧友,我当然想喷谁喷谁。」 以及,他在说估计自己也不会在Google待太久,把这话在播客里说出来,我觉得国内头部大模型公司可以去抢一波人了。
显示更多
0
91
483
61
转发到社区