注册并分享邀请链接,可获得视频播放与邀请奖励。

与「深度小动保」相关的搜索结果

深度小动保 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 深度小动保 的内容
6月10号 缩量修复次日果然挨打 盘面只剩三个字:没法看 聊几句实在的 先说盘面 昨晚出了两条小作文 一条国内AI建设 一条电源设备 结果资金根本不认账 物理AR熄火 昨天强的题材今天全灭 算力修复也是一日游 这根本不是板块轮动 是整体行情太垃圾 大盘今天这个深度回调 其实不意外 昨天缩量修复就是最明显的警告 目前看情绪拐点大概率在周五 所以明天还有可能继续挨打或弱修复 操作上 我认同一个观点 这个月任何时候离场都不晚 但不是劝你空仓 而是建议先减到能睡安稳的仓位 想练手的拿极小仓位试做T 别信小作文 现在消息反应普遍很差
显示更多
0
34
30
0
转发到社区
OKB应该是没有庄家的。 或者说庄只能是交易所自己。 看每次的k线走势,是一点老鼠仓没有的,当然,也是没有护盘的。 谁敢做庄?百分之80以上都在交易所手里。 虽然他们不动。 但是你敢操作,交易所就可以封控账号。 因为okb主要的交易深度是在okx交易所里的。 okx更不敢弄了,因为接下来面临着上市,需要谨小慎微,操作币价是最不合规的行为。 所以这样上串下跳,都是散户行为。 每一次都是利好消息带来的fomo,形成的一根针。 任何事情都是双刃剑。 有没有庄这件事也是。 本文由 @bcgame 赞助
显示更多
韩国半导体产业链刚刚爆出一个重磅消息,但国内媒体基本没报,让我对美股AI板块的警惕性拉到了最高级别。🧐 英伟达下一代产品Rubin CPX,前景不明朗! 首先要提示一下的是,Rubin CPX虽然与Rubin GPU VR200虽然都属于 NVIDIA 的 Rubin 架构世代,但它们扮演的角色不太一样。 Rubin CPX主要负责推理,有极高的吞吐量,非常适合用来啃长上下文这种硬骨头,所以不需要昂贵的HBM4,仅依靠GDDR7即可,成本降低了很多。相较与专注训练的旗舰Rubin GPU VR200来说,无论是存储芯片还是晶片封装,还是NVLink 6互联方案,都相对低廉一些,所以成本也会降低很多(如图2)。 但如今随着AI 发展向推理方向大迈进,这一块蛋糕其实也极其重要,英伟达假如在推理市场推出的产品出现跳票现象。这也会对英伟达股价,造成一定的冲击! 讲讲这次韩国媒体从供应链端推理的路径,还是蛮有意思,毕竟现在韩国全民炒股,大家都热火朝天,也难怪今天没太多人理会这个新闻! 📌 供应链传来的信号 • 内存行业相关人士表示:虽然说Rubin CPX要搭载GDDR7,但目前连订单影子都没见着,性能指标也不明确,根本不知道怎么开发配套方案。 • 基板行业人士更直接:Rubin CPX方面毫无动静,业界普遍认为可能目前都还没取得实质性进展。原本可期的GDDR7的应用规模可能也不大了。 • 存储器业界普遍持观望CPX态度,GDDR7的供应也不太可能大规模启动。目前GDDR7主要应用还是GeForce RTX 5090、5080等游戏显卡,连超级算力基板都不会用到GDDR7,而是用更高端的HBM。 📌 更诡异的是英伟达的战略调整 在今年3月的GTC 2026大会上,英伟达把CPX从第2代中移除了,这动作就很耐人寻味了。 取而代之的是,英伟达开始跟Groq公司深度合作,甚至去年直接签了200亿美元的限量协议,把Groq的核心推理技术和工程师团队都收了。 业界普遍认为实际上英伟达已经上架了Groq的方案。 也就是说,英伟达可能在推理市场这块,战略方向发生了重大转变。原本为推理市场准备的Rubin CPX,现在前途未卜。 我个人的一些思考,首先供应链是最诚实的。 当内存厂商和基板厂商都说没订单的时候,这不是小问题。你要知道,芯片这玩意儿,供应链得提前半年甚至一年开始准备。现在都下半年了,连订单都没有,这产品能按时出来吗? 其次是英伟达当前股价反映的是什么预期? 市场给英伟达的估值,是基于它在AI算力市场的绝对垄断地位,以及持续推出革命性产品的能力。但现在Rubin CPX这条产品线出了问题,Blackwell系列和未来的Vera Rubin系列虽然强大,但下一代产品如果跟不上,这个预期就会动摇。 最后就是如今AI板块,FOMO情绪比较严重,持续的逼空行情,大量空头回补,但基金仓位已经十分拥挤,这种持续的拉涨,还是需要留个心眼,注意市场的风吹草动!🧐 同时这个推理市场大蛋糕,也会利好于 #AMD# 和 #INTC。🧐#
显示更多
0
127
328
42
转发到社区
$LISTA:币安下个周期倍数最高的弹性 beta 一、FDV 极低,分母小 Aster FDV: ~$5.4B(同为 YZi Labs portfolio) PancakeSwap 流通市值: ~$470M THENA FDV: ~$380M Lista FDV: $70M 同样一笔买盘推动 FDV $70M 的标的和 $7 亿的标的,价格反应差一个数量级。 当资金回流时,小盘永远先动、动得猛。 二、BSC 上很难再有新的借贷和质押协议 BNB Chain 的借贷和质押赛道已经事实上完成了集中化——slisBNB 在 BNB liquid staking 接近垄断市占,Lista Lending 是 BSC 上唯一一家做 Morpho 式 curator vault 的,加上 Venus 占据传统借贷——位置已经被坐满。 新协议进不来的原因不是技术,是分发。Binance Megadrop、Launchpool、HODLer airdrop 这套 BSC 一线流量入口,已经和 Lista、Cake 这些"老人"深度绑定。 YZi Labs 也不会再扶持竞品冲击自己已经投资的位置。再叠加 Lista 是 USD1(WLFI / 川普家族稳定币)的链上最大流动性枢纽——这种政治背书的稀缺组合更不可复制。 也就是说,下个周期 BSC DeFi 资金回流时,没有新协议能截走 Lista 的流量。这是它和 ETH 上 LST 赛道(Lido、Rocket Pool、 互相蚕食)最大的结构差异。 ---------- FDV $70M、BSC 头部最小盘(同生态 Aster 的 1/77)、TVL/FDV ~21x(同类极端值)、TVL 历史最高 $3.5B、BSC 借贷质押位置已锁定、距 ATH 跌 90%。 这不是估值交易,是周期交易。如果你相信币安生态还有下一次崛起的话。 @cz_binance @lista_dao
显示更多
🚀OKB定投指南:100 刀/天,冲刺 300/500 USD 永恒巅峰!☀️ 嘿,Crypto 永恒游侠!每天 100 刀砸进 OKB,桥接到 X Layer 的低费宇宙,staking 躺赢,销毁机制永动推波。不是时间表,是你的 Web3 自由之路!我们把OKB炼成“定投永动机”。当前OKB价约168 USD,X Layer zkEVM L2 已升级,TPS 爆表 5000,USDT 桥接顺滑,1 亿基金狂撒生态种子。目标?短期 300 USD,长期 500 USD。准备好无限续航了吗?Buckle up, legend!🎉 🌟起飞宣言:为什么这是你的终身伙伴? 🔲OKB 的不朽之力:OKX 帝国的“永动机豆”——手续费 slash、Jumpstart 猎新、销毁机制(8 月一举烧毁 6526 万枚,价值超 76 亿美元!),总供应永恒固定 2100 万枚(流通全覆盖,无稀释风险)。OKX 交易量永超 1.3 万亿(衍生品月度峰值),OKB 就是那永不熄火的引擎。 🔲X Layer 的无限buff:Ethereum L2 狂欢场(Polygon CDK 掌舵),gas 费趋零,200+ dApps 任你驰骋(DeFi 刷分、NFT 铸魂、Wallet 一键征服)。OKB 化身 gas 王 + staking 心脏,90% 供应永驻,通缩永循环! 🔲你的永恒野心:年化 40%+,无限定投雪球滚大,乐观下 ROI 无限放大。风险?摊平它,X Layer 护航它——这是马拉松,不是短跑。徐明星的“XX人生”,提醒我们:笑对波动,定投笑到最后! 💡前提:每天 100 USD 定投OKB,从 10/27/2025 起,(OKX App “现货定投”一键设置)。 ⚡️作战蓝图:阶段冲锋,无限迭代热血路线 🔲扔掉年限枷锁,这是你的“升级无限循环”!平均价假设 250 USD,staking 10% APY 奖励(memecoin 空投永不缺席),每年投 36,500 USD,累积如滚雪球。 🧭阶段 里程碑 投钱/年 (USD) OKB 战利品/年 价格冲刺 (USD) X Layer 秘籍 🔲热身营 2025 Q4 启动 6,700 (首季) 35-45 枚 180-220 桥接 staking,升级狂欢测试 🔲爆发冲刺 2026 全速(短期 300!) 36,500 120-150 枚 300 dApps 深度潜航,TPS 实时追踪,空投狂捞 🔲稳健帝国 2027+ 循环 36,500/年 120-150 枚/年 350-400 销毁盛宴永续,生态基金无限撸金 🔲巅峰永恒 (长期 500!) 无限后期 36,500/年 120-150 枚/年 500 全球征服评估,Wallet 宇宙梦无止境 🚀通缩 + 低费 = 永恒王冠 🪄情景剧本(无限分支,永不谢幕): 🔲神级永续:X Layer 点燃星辰(stablecoins + DeFi 协议全开),2026 300+,长期 500+,ROI 无限叠加。Staking 化身永动机! 🔲中规中矩循环:震荡中永生,复利滚雪。纪律铸就传奇。 🔲硬核永战:熊潮来袭?低点加仓永翻盘——回想 2024,它从 38 刀永飙 300%! 🛡️防坑手册:熊市也挡不住你的永恒派对 🔲市场风暴:OKB 抖 30%+?X Layer staking 永稳,定投如心跳。 🔲技术迷宫:桥接小 glitch?小额永练,备份主网铁律。 🔲脑内永剧:贪婪/恐惧永循环?月日志 + X #OKB# 战队,永互怼永励志。 最大回撤 40%——X Layer 的 1 亿基金,就是你的无限护盾! 🎮启动仪式:从此刻起,无限行动! 🔲每日 routine 超级简单:App 定投永开(现货 > 定投 > 每日 100 USD) 🔲循环仪式别忘:每周复投生态空投 + memecoin 奖励,每月 ROI 永打卡,每季大复盘。 🎊尾声:你的 Crypto 史诗,从无限起航 🔲OKB不是计划,是你的 Web3 不朽传说。每日 100 刀,短期 300,长期 500——通缩、低费、生态三永剑,携你翱翔!牛市永在,敲门?直接踹开。 🔲定投,从无聊变永恒狂欢 @okx @okxchinese @XLayerOfficial @star_okx #XLayer# #定投# #OKB#
显示更多
0
46
122
6
转发到社区
假如当年 昨天点赞最多的评论互动,是一个四川农村家庭在杭州读普本的女大学生,问留杭还是回老家,我给出了倾向于留杭的建议,绝大部分网友都是支持的。 评论席即时互动的时间和篇幅都有限,我今天想再展开讲一讲。 大城市的核心优势是什么?主要是就业资源。以杭州为例,电商、直播、自媒体、游戏、互联网、数字营销、机器人这些新兴产业都是国内顶级水平,很多岗位你真就只能在杭州找到工作,要回了四川小县城你连简历都投不出去。 而且因为是新兴行业,行业结构不成熟,既得利益群体小,变数大,机会多,即便你的学历不是很高,普本也有很大的发展空间。说白了整个浙江只有一所985/211大学,剩下最好的也不过双非,没有必要还去搞学历歧视,浙江的氛围是很务实的,只要你有能力,肯努力,就一定有机会向上走。 我大学最铁的那几个哥们,有毕业后持续经商的,有大厂干了几年辞职创业做直播公司的,有在外贸公司任职20多年的,下限一年也有三四十万兜底,上限很高随缘。这不完全是他们几个能力强,很重要的一点是杭州这座城市太给机会了。 最近几年最火的公司,研发了deepseek的深度求索、制作了《黑神话》的游戏科学、中国机器人龙头宇树科技,都是杭州孵化的,这不是偶然。 内地的农村家庭好不容易把孩子送到杭州上大学,毕业后怎都要留下来试试看吧。尤其是那种性格较为独立,能抗压,有持续学习能力,善处人际关系的孩子,在大城市发展才能彻底挖掘自己的潜力,回县城真就埋没了。 女生在大城市发展还有另一种机遇,就是有更高的概率找到潜力股男生结婚。我老婆当年毕业后如果回老家上班,要在当地县城找一个综合条件比我更好的可不容易呢,你们同意嘛 退一万步,孩子在杭州闯了几年不顺利,觉得累了想回老家也不晚,在杭州这几年锻炼的工作能力和眼界,回去县城也是优势经验,怎都不亏的。 …… 其实最近些年,我一直有个问题在反复的问自己,如果当初我没有来北京,选择在台州老家发展,我最终会选择做职业投资人吗?我会写公众号吗,我会成为大v吗?我能赚到钱吗? 一个一个来分析。首先我大概率会一直在互联网上输出内容,因为中学、大学时期的我就一直是论坛活跃分子,来北京之前就已经是这样。但小城市接触新事物新文化有延迟,我可能会推迟几年才开始写微博、写公众号,错过早期红利和先发优势,但最后的最后我还是会成为博主,可能不如现在,但依然会有自己的读者人群。 其次我肯定还是会炒股,因为我入市不是偶然,是受我妈的影响,她是95年开户的老股民,我和她相依为命的那些年头,股市的涨跌直接影响母子两的生活,所以我从初中就知道并关注股市。作为韭二代,我入市是99%会发生的必然事件。 那不来北京就没有影响吗?不,有些重要的事还是改变了。 比如我一直在台州的话,我可能没那么宅,老家朋友多,县城夜生活丰富,我很可能无法坚持那么自律的日更。以及我若一直在县城自主炒股,我很可能不会接触那么多金融工具和其它金融市场,我这方面的视野是在北京和同事以及同行的交流中学习成长的。 那样的我可能就不懂期指、不懂分级基金,不玩可转债、qd、黄金,不会开户离岸的港美股,更不会投资虚拟币。台州当地炒股的氛围就是互相打听本地上市公司的内幕消息,有啥风吹草动就人传人,一窝蜂往里冲。我若一直生活在台州,大概也是这种交易风格。 那个版本的我能赚到钱吗,大概可以吧,但估计数量和现在有差距。 每个人的人生只有一次,除了这一世拿到的剧本,剩下的都是平行宇宙的千万种可能。我不知道“他们”过得好不好,我只知道珍惜当下,过好眼前的这辈子。 …… 前几天评论席里提到handsome boy的梗,是高中时和一个外省的女笔友通信时她对我的称呼,当时我说要找找当年的照片,找到了。高三毕业那年我妈和我去华山旅游的时候拍的,当时我177cm 60kg。 我不发现在的照片,是怕平时出门在外被人认出来尴尬,我无所谓发年轻时的照片,是因为我变老了变胖了,你们只靠以前的照片不可能认出现在的我 时光荏苒,20多年一眨眼就过去了,突然很想再带我妈去一次华山,去找找当年拍照的位置,想看看身后的山的样子有没有变。 就聊这些吧,3/8提醒,玩得开心~
显示更多
《优先级判断维度》 RICE 模型(Reach, Impact, Confidence, Effort) - Reach 能触达多少用户? - Impact 对单个用户的影响有多大? - Confidence 我们对上述判断有多大把握? - Effort 实现需要多少投入? RICE 模型是比较公认的一种判断优先级的方法,但是有两个问题,一个是创新的功能优先级比较难排上面去。另外一个是有一些不得不做的安全合规的需求也排不到前面,于是我发展了下面的 4H 优先级判断法: 4H - 高感知 大部分用户高频使用,产品使用主路径,预期渗透率在 5% or 10% or 20% 以上的功能。关注广度 —— 覆盖大多数用户,主路径,高频。 - 高价值 部分用户/客户非常需要,重度使用,甚至愿意付费让我们做的功能。关注深度 —— 小部分人,但强烈刚需,付费意愿强。 - 高创新 直接竞争对手没有,我们可以有的创新(人无我有且对方不可能有>人无我有>人有我优>人优我廉=人优我精)。关注 差异化 —— 形成竞争壁垒和市场区隔。 - 高风险 不做对我们风险非常大的功能,legal 合规、安全等等基础性功能。关注底线 —— 不做就会出事,必须兜底。
显示更多
今晚三场世界杯淘汰赛正式开打,强弱对话暗藏冷门 兄弟们,我每天都是实单推荐,看情况补单场! 结合各队真实战力、战术风格的深度分析,直接为大家送上最纯粹的方向,建议收藏: ⚽️ 巴西 VS 日本 预测结果:让 (-1) 平 战意简析:巴西阵容豪华纸面优势拉满,全力争胜冲击下一轮;日本整体性极强,防守韧性拉满,过往曾爆冷击败巴西,绝非鱼腩。巴西赢球是大概率事件,但日本收缩防线很难被打穿,大概率仅一球小胜,让球平是最优解。 ⚽️ 德国 VS 巴拉圭 预测结果:让 (-1) 主胜 战意简析:德国进攻火力全开,高压传控体系成熟,淘汰赛全力抢胜稳住状态;巴拉圭靠极致防守惊险晋级,进攻端严重乏力,面对德国持续压制很难组织有效反击。两队硬实力差距悬殊,德国净胜两球及以上悬念不大,稳稳拿下让球主胜。 ⚽️ 荷兰 VS 摩洛哥 预测结果:主负(摩洛哥胜) 战意简析:荷兰主打高位传控,边后卫压上后身后空档巨大;摩洛哥是足坛顶级防反强队,上届世界杯力克强队杀入四强,战术上完美克制荷兰的打法。荷兰纸面占优却处处受制,摩洛哥防守稳固、反击犀利,本场直接爆冷赢球概率极高。 💡 老铁们理性参考,今晚一起见证淘汰赛的精彩对决,祝大家一路红单! #世界杯#
显示更多
0
22
24
0
转发到社区
AI半导体终局推演2026(II) 当半导体结构性演进到AI推理主线,内存和存储成为了最大瓶颈,市场对内存和存储最大的怀疑就是: HBM/DRAM/SSD会不会摆脱传统周期性? 依赖HBM指数增长的GPU架构路线进化路线,会不会停止?什么时候停止? 长鑫扩产的影响有多大?会不会把这个市场重新带入周期泥潭? 本篇尝试去建立一个框架来梳理这几个问题 —---------—--------- 万物皆周期,而内存的周期性又特别强,最大的来源在于扩产周期过长,无法快速扩产和需求短缺时期错配 摆脱传统周期性几种可能的方式 1. 定制化:产品不可互换,产能不能随便转移,需要签长约。 2. 结构性的指数级需求增长:需求曲线本身很陡峭,而且供给一直追不上。 3. 技术迭代快速升级:每一代产品都快速淘汰上一代。 满足任何一条,就能部分摆脱传统周期;满足两到三条,就能摆脱大部分传统周期 根据这个框架, HBM在三条里,大概占了两条半 1. 定制化,需要签长约(较弱,算半条) HBM 确实有定制化和Nvidia codesign的成分,但并不是很强。真正定制的部分只在封装和 base die,上面那十几层 DRAM die 仍然是完全 JEDEC 标准化的。 比如当 Samsung 的 HBM3E 在 NVIDIA 的 qualification 上没过、份额从大约 60% 一路跌到 20% 的时候,它并没有把这批产能砸在手里报废,而是转手就供给了 Google 的 TPU、AMD. 物理上,给 NVIDIA 的 HBM3E 和给 AMD 的 HBM3E,是同一个东西。 所以产能仍然是部分可以自由转移的。 HBM4之后的定制化更多一些,包括在 base die 上集成定制逻辑和/或缓存。更复杂的方式是将 HBM4E 内存控制器和定制 die-to-die 接口直接放入逻辑 base die SemiAnalysis 提到 OpenAI、NVIDIA 和 AMD 各自都在做定制 HBM 的工作,但这指的是 base die 的定制,上面的 DRAM 层仍然是标准的。 部分定制化的特性,HBM主要在封装上需要合作,这也导致了客户必须签长约,但产能也确实可以转移,所以HBM 能勉强算半条。 2. 结构性的指数需求增长(满足) 最直观的原因,就是Nvidia token factory token throughput的硬件升级需求,导致了HBM带宽的升级换代极快,以及HBM size需求的指数增长 这一条其实就是上一篇AI半导体终局推演2026(I)的结论: token throughput = HBM size × HBM 带宽,每一代翻倍。 HBM size per GPU大概每年增长40%以上 这条需求曲线的陡峭程度,是DRAM供给端 14% 的 wafer 增长,乘以 9% 的 density 提升,很难追上的 在硬件领域,因为attn阶段KV cahce的极高带宽和极高memory size的要求,也导致了HBM独特的地位。即便是HBM涨价三五倍,把钱花在HBM上带来的边际token throughput提升,仍然比花在其他地方要划算的多。 其他几个Memory路线,SRAM,HBF,CXL,PIM,目前都无法在HBM的主力赛道kv cache/attention上正面竞争,起码未来5年甚至更长时间,不太可能找到替代路线 3. 技术迭代快速升级(满足) DDR3时代过了15年,仍然只是DDR5时代,而HBM的升级换代的速度基本上是两年一代,比传统DDR要快很多很多,而且近来还有加速的趋势,HBM size x HBM BW每一代翻倍,目前是完全符合这个规律的 每两年一代HBM升级,NV GPU速度基本是指数型上升:2TB/s ->3.5TB/s->4.8TB/s ->8TB/s->22TB/s,而且HBM的速度和推理token throughput是完全线性正比的,上一代HBM的边际使用成本会不划算,大家都有动机去尽量用最新的产品,虽然更贵,但是带来的收益(token throughput)是更多的 Token factory时代的逻辑是,技术升级(HBM带宽)的越多,赚的越多 这个速度差,造成了一个和 CPU 类似的局面:旧产品快速贬值,于是囤货的价值在变低,比如说,HBM3的价值贬值的非常快,今天基本上主流产品不会用了 所以HBM 厂商的理性选择,从拼当前的产能去占市场(quantity competition),变成了在稳定性和HBM速度上拼技术,拼下一代在 NVIDIA 平台上的 qualification 份额(quality competition),从而避免了在传统周期的下行波段,大家都不愿减产掉市场份额的囚徒困境。 —--------------—-------------- HBM和传统DRAM比较,三个条件里满足了两个半,那么HBM能摆脱传统周期性吗? 内存周期性的来源,主流叙事是,DRAM 有Commodity属性(无差异化 → 价格战 →库存可囤积),所以有周期性。 而Commodity属性本身并不产生周期,它只是一个振幅放大器 特别是DRAM领域里,曾经产生过囚徒困境,在下行周期三星曾经扩产抢市场份额,谁先减产谁吃亏,导致谁也不敢轻易减产,最后大家都亏损惨烈 实际上周期性的主要结构性来源是供给周期太长,很容易和需求周期错位。建一座 fab 要 3 年,投资上百亿美元,一旦决策就不可逆,而需求增长会有不稳定性,每次出现新范式增长,比如云服务,移动互联网手机,疫情线上需求,会有爆发式增长,而过了两年增长会放缓,供给高于需求,降价过猛,就变成了亏钱周期 万物皆周期,HBM这一条同样是无法避免,但只要token需求仍然是指数型增长,结构性的指数增长会减弱周期性,因为需求可预测度更好,而且一旦降价,客户就有增大HBM size的需求(从而增大token throughput),加上HBM有一点定制化要求导致都是长约,从而从周期性转化成成长周期性,而且这一轮周期会特别长 周期性:上行周期赚的多,下行周期亏的多 成长周期性:上行周期赚的多,下行周期赚的少 另外,HBM/DRAM在这三条摆脱传统周期的条件的基础上,还有一条重要优势: 4. 因为DRAM密度增长scaling越来越慢,以及HBM升级换代导致DRAM堆叠倍数的增加,供给端的扩产难度持续增加 2000年附近,DRAM每片wafer上DRAM bit密度每年增长大概45%,也就是说,就算晶圆wafer数量不扩产,每年的供给端DRAM bit仍然可以增长45% 十年前,DRAM bit每年密度增长降到了20%,而现在,DRAM bit每年密度增长降到了9%。以前DRAM扩产甚至不怎么需要新建厂房就能得到每年20~30%的bit volume上升,现在DRAM要扩产,更多的是靠wafer数量的增长,也就是新建厂房和clean room。 另外一个HBM快速扩产难度在于,HBM3e大概需要3倍的DRAM wafer晶圆,而HBM4由于堆叠密度的增加,大概需要4倍的DRAM wafer晶圆数量,相当于HBM bit相对于DRAM bit一直变得更难制造,单位DRAM wafer数量制造的HBM bit越来越少,相当于在通缩 ---------------------------------- HBM未来有一天,会不会从成长周期性,变回传统周期性?最重要的因素是结构性指数增长,那么 AI推理时代,这个依赖HBM指数增长的GPU架构路线进化路线,会不会停止?什么时候停止? token throughput = HBM size × HBM 带宽,这个HBM指数增长的第一性原理里的HBM size的增长原因正是KV cache的增长。KVCache的特性以及Attention的特性,也是非常契合HBM的。甚至让HBM领先于其他的技术路线, 能够最大化地让KVCache和Attention 阶段的利用率。 换言之, 如果KV cache从架构上不存在了,那么HBM size指数增长逻辑也会受到挑战 所以这个问题的本质其实是,这一轮以 Transformer 为代表的 attention 机制、以及由它衍生的 KV cache 机制,会不会消失?退潮之后会不会被取代? 从历史规律来看:每一次AI模型架构革命,真正被保留下来的,是那些在数学上具有某种普适性的 primitive 操作 举个例子:FFN(前馈网络,也就是模型里大量的 MLP 层)是 2012 年深度学习时代的产物,但它一路活到了今天的大语言模型里,并且仍然占据着模型相当大的参数量。它为什么能活下来?因为这也是一种universal approximation theorem(通用逼近定理):任何足够宽的 MLP 都能逼近任意连续函数 Attention 大概率也是这样一个会被保留的 primitive。因为它解决的是一个同样 基础的问题:序列sequence 中任意两个位置之间的 dynamic routing(动态路由),让一个序列里任意两个位置都能按需建立联系。这个能力一旦被验证有效,就很难被丢弃 所以即便未来架构从纯 Transformer 向混合架构演进,或者向世界模型演进,但attention 层依然会存在,KV cache(或者它经过 latent compression 之后的等价物)依然需要,HBM依然会作为推理核心之一,这个依赖HBM指数增长的GPU KV cache架构路线进化路线,不会停止 —---------------—--------------- 那么DRAM呢?在未来有没有摆脱传统周期性的可能? HBM摆脱周期性在市场上有一定共识,但DRAM摆脱周期性,市场目前基本没有共识 还是回到刚才的框架,三个摆脱传统周期的条件里,DRAM是没有定制化的,所以就只能看技术迭代速度,最关键的还是要看,有没有结构性的指数增长,答案是有的 在 AI token factory 这个概念里,结构性指数增长的确实主要是 HBM。但事情在 2025 年年底之后起了变化:随着 agentic CPU开始释放潜力,CPU 附带的那部分 DRAM 需求,正在成为 DRAM 新的结构性指数增长来源 —------ 这部分的增长逻辑分两层:第一层是CPU 服务器TAM的快速增长,第二层是每个服务器CPU core配备的DRAM用量的因为agentic flow快速增长 服务器CPU TAM的快速增长的4个逻辑在4月的CPU专篇详细写过,简单的说: 1. AI 加速器集群里CPU和GPU配比从传统的1:4变成1:2,甚至可能往1:1迈进 2. Agentic flow里CPU处理的延迟占比很高,50~90%成为重要瓶颈,需要同步扩容 3. AI coding让SDE的效率大幅提升,代码量数量级增长,软件API调用指数级增长,直接转化为这部分CPU hours指数级上升 4. Sandbox为保障数据安全与隔离,如Analytical Agent 需为每个任务复制大量数据库和用户上下文,导致内存(DRAM)和CPU核心的严重浪费,而且这个浪费问题五年甚至更久无法解决。另外CPU hours 在技术上很难通过优化的方法来通缩 这也就是为什么,上上个季度,AMD的财报说CPU TAM到2030年会到60B,两个月前,AMD/ARM把CPU TAM的2030年预测翻倍到120B,一个月前,Nvidia再次把CPU TAM的2030年预测翻倍到200B 而上个星期,Bernstein再次提升2030 CPU TAM指引到223B。在我看来,2031 CPU TAM未来上修到400B是没有太大悬念的事情,唯一的悬念是几个巨头会什么时候宣布上修这个指引 再说说第二层,为什么每个服务器CPU core配备的DRAM用量在agentic时代快速增长? 1. Agent 是带状态的长驻进程,不是无状态的请求-响应 传统 web/SaaS 是 stateless 的:请求进来,分配内存,处理完内存立刻回收。而一个 Agent 任务可以跑 一分钟到一个小时,这整段时间里,它的 message history、system prompt、工作记忆、长期记忆、工具结果 buffer 全部常驻 DRAM 和 CPU hours 一样,每个任务的内存足迹因为 stateful 和 sandbox 隔离(每个任务复制数据库和上下文)的要求,技术上很难压缩 2. 上下文窗口在指数级变长,每个会话的工作集随之膨胀,并发度 × 单会话memory footprint,乘数放大 context window 从 32K → 256K → 1M,reasoning / test-time compute 的序列长度爆炸,未来还会继续增大。每个活跃会话常驻的 messages 随 context 长度线性增长 现在把两层乘起来。 第一层,CPU server 的 TAM,朝 2030~2031 看大概是 5–7 倍的量级(60B → 120B → 200B → 223B,我认为还会到 400B) 第二层,每颗 CPU 的 DRAM 配比,大概 3–4 倍(4~8GB → 16~32 GB/core),但这个增长可能大部分是一次性红利 两个独立变量相乘,server 侧的 DRAM 需求是数量级的增长 2030年,即便按保守的300B CPU TAM,一个CPU core按$50来算,agent时代最保守按16GB/core,这算出来新增量最少都是96EB,而今年的DRAM总产量只有47EB,明年勉强60EB,这是非常惊人的增量 虽然这个agentic CPU带来的DRAM指数级增长,在第二层很大程度上是一次性红利,但持续时间会持续很久很久,因为这个短缺的缺口实在是太大了 —-------- 回到文章开头那个框架。三个摆脱传统周期的条件里,第一条DRAM 定制化,基本可以忽略 而第二条:一个结构性指数级、而且很难逆转的需求来源是成立的。commodity DRAM 现在也具备了部分摆脱传统周期性的资格。没有 HBM(两条半)那么彻底,但已经是实质性的变化 第三条,技术迭代速度,DRAM的节奏也跟以前不一样了 因为以前的DRAM技术迭代速度是严重依赖消费电子的,DDR的进步对于performance用处并不大,但可预见的未来里,碳基消费的传统DRAM,会远远小于硅基消费(CPU服务器)DRAM的用量 以前DRAM的速度升级带来的边际效用是很低的,但现在因为CPU服务器对memory的需求增大,以及端侧AI对DDR速度的要求也增大,比如苹果为了跑本地大模型,LPDDR速度越来越快 速度升级的边际效用高了不少,所以DDR6和LPDDR6的速度迭代需求比以前提升了太大了,这在图里也可以看到,LPDDR6/DDR6的迭代时间缩短了,而且速度斜率,重新开始抬头 以前新一代DDR/LPDDR技术出来,大家的反应都很冷淡,等降价了才会用 而现在LPDDR6出来,各家恨不得都在抢着能尽量早上就尽量早,因为速度的提升带来的performance提升是触手可及的 ------ 另外,DDR 的供给还要被 HBM 额外抽一道税。HBM 每年的扩产速度太快,导致每年都有一批原本可以做 commodity DDR 的 wafer 被拉去做 HBM,而 HBM 的转换比极低,HBM3E 大约要 3 片 DDR wafer 的产能才能做出等量的 bit,HBM4 是4 片。所以每年大约有 3% 到 5% 的 DDR bit 增长,是被这个 HBM bit tax直接吃掉的 所以DRAM bit volume虽然未来每年能增长24%左右(14%来自wafer增长,9%来自每个wafer的DRAM密度增长),但算上HBM bit tax之后,传统的、非 HBM 的 commodity DDR,每年的 bit growth 大概只有 20%(约 10% 的 wafer 增长 × 约 9% 的 node density 提升) —--------------------- 中国长鑫扩产的影响有多大?如果不讲武德拼命扩产,会不会把这个市场重新带入周期泥潭? 长鑫这几年的扩产速度还是很快的,2025年还是每个月20万晶圆,2026年北京晶圆厂及新增生产线的贡献就能到32~35万。 正在建设中的上海工厂一期和二期,一期预计到2027年每月新增10万片晶圆产能,二期预计到2028年每月新增10万片晶圆产能,也就是说,2027年每个月42万晶圆,2028年能到每个月50万晶圆。 但需要注意的是,长鑫的dram bit 密度大概只有御三家的一半左右,所以长鑫的每个月50万晶圆wafer能产出的dram bit volume只有其他家的一半,这里计算wafer per month的时候,就按等效一半来算 把这个折扣打上之后,长鑫对整个DRAM行业的冲击还是小了很多,从2025年年底到2028年年底,长鑫对DRAM bit产能CAGR的影响大概只有1.5%,全行业的DRAM产能CAGR大概从12.7%升到14.2% DRAM月产能(kwspm) 2025E → 2028E CAGR Samsung 685K → 920K 10.3% SK Hynix 519K → 725K 11.8% Micron 340K → 560K 18.1% 非中国其他 150K → 218K 13.3% 中国(密度折半) 117K → 274K 32.8% ————————————————— 含中国总计 1811K → 2697K 14.2% 无中国总计 1694K → 2423K 12.7% 就算是长鑫未来还能保持增产速度,2030年对全行业等效产能每年DRAM bit volume增产CAGR的影响,大概也不到3%,从20% CAGR变成23% CAGR,仅此而已 另外,长鑫被光刻机所限制,而DDR6 需要更高速率(14400 MT/s 起步)和更高密度,御三家做 DDR6 大概率会用 1c 或更先进节点(~12nm 以下),已经全面用 EUV。长鑫可能会在DDR6上速率受限,密度也只有一半。 —---------------- 即便是成长性周期,为什么DRAM的这轮超级周期会持续很长时间,起码五年看不到头? 第一个原因是,刚才谈到的CPU服务器需求端的巨量增长带来的结构性DRAM需求指数增长,这里结合DRAM供给端的bit volume CAGR大概稳定20%增长,就可以很清晰的看到,DRAM未来几年的缺口为什么越来越大: 非HBM的传统DRAM供给端大概是每年增长20%,而需求端,按2026年60B CPU TAM,每个CPU消耗DRAM平均8GB/core,每个core $30~35来算,需求是16EB 2030年按400B CPU TAM,每个CPU消耗DRAM平均16GB/core,每个core $80来算(CPU涨价超过一倍),需求是80EB,这部分DRAM的增长CAGR大概是50%,远远超过目前的估算 不同于HBM是直接和token throughput挂钩,从而和GPU赚钱效率直接挂钩,DRAM不够对于agent flow的影响主要是速度,比如说,8GB/core和16GB/core比起来,部分workload速度可能降低30%,部分低价值task实在要等等也能忍,结构性指数增长的动机很强,但需求不如GPU那么刚性 Semianalysis说今年的DRAM缺口式个位数百分数,明年是超过10%。从agent CPU数量激增导致的DRAM结构性来看,这个缺口每年都会继续加大,在2030年之前看不到降低的可能 —---- 另外一个DRAM能延续强势很久的逻辑是,因为DRAM涨价之后,被涨价消灭的那部分需求,不是真的消失了,只是延迟了,需求蓄水池太多了。 所谓蓄水池,是指那些"内存一旦降价就会立刻被释放出来的潜在需求"。它们的存在,意味着即便供给阶段性跟上了,价格也很难崩,因为总有新的需求从蓄水池里涌出来接盘: 内存换算力/速度是一个蓄水池: 有大量本来需要靠额外内存来优化速度和算力的需求,在内存太贵时被压着,一旦内存降价就会被释放出来。 比如 Nvidia的CPX prefill 加速,本来的设计初衷是用额外的低成本GDDR7,来做一个专门的prefill加速器,结果LPDDR/GDDR都太贵了,比涨价前的HBM还贵,这个方案的ROI就不划算了,但等到普通内存降价,这样类似CPX的优化方案就还会回来 低价值task是一个蓄水池:内存涨价导致token价格居高不下时,高价值的 task 被优先保留,低价值的 task 被延后;内存一降价,这些被延迟的需求就回来了。 端侧 AI 是一个蓄水池:AI PC 的内存配置可能从 24GB 一路涨到 128GB。苹果已经明确要求最新的端侧AI满血版需要从8GB升级到12GB内存 常规消费电子、Agent PC、低端手机,因为内存涨价而减少的需求,全都是蓄水池。 这么多蓄水池叠在一起,构成了一个极厚的需求缓冲垫。这就是为什么 DDR 这轮的结构性增长,后劲会比市场想象的要强。 —----- 还有一个DRAM价格很难大幅下降的原因在于,HBM和DRAM产能可以互相转换,所以整个DRAM complex是一起re-rate的 在上行期DRAM的利润率远超HBM,HBM的涨价幅度甚至变成了由DRAM去推动。今年新签约的HBM4的价格,就是当期DRAM的价格 x 4,也就是正常堆叠倍数对应HBM4的价格 一旦DRAM降价毛利下滑,因为HBM的长约透明性,利润率都是有保障的,HBM就会间接抽走更多的DRAM产能,HBM的降价也会让GPU厂商更有动力尽可能的升级HBM size,这样也间接保障了DRAM的价格地板 DRAM的结构性指数增长的需求有了,density scaling放缓扩产难度在增加,厂商扩产计划都很谨慎,长鑫这几年带来的影响也是有限的,再加上需求的蓄水池非常庞大,这四个原因导致了,在可预见的至少五年甚至更长时间内,DRAM是很难进入周期低谷的。 —-------------- NAND SSD有希望摆脱传统周期性吗? NAND 的结构性增长动力没有 DDR 那么强,今年的缺货主要原因是几个主要玩家的生产纪律保持的很好,并没有大规模扩产,每年的产能增加主要来源于技术改进:NAND堆叠层数的增加 第一个结构性增长来自AI,主要来自 KV cache 的 offloading,把HBM溢出的warm/cold KV cache 卸载到 NAND SSD上。 但神奇的事情是,这个kv cache offloading的增长甚至还没有大规模发生,SSD就已经缺的比DRAM还严重了,涨价也比DRAM要更多。等到明年Rubin CMX放量,加上KV cache offloading大规模应用,SSD的缺货也会因为这个结构性增长而增长 第二个,另一个去年年度总结里说到的未来可期的AI视频带来的结构性增量,今年已经有出圈的态势了 Seedance体量在以一年十倍到四十倍的速度增长。目前它还卡在缺卡算力不足的阶段,需求被算力压着没完全释放。但等到缺卡阶段过去,AI 视频对NAND存储的结构性需求增长,会持续相当长的一段时间。 第三个结构性增长也同样来自于agent flow带来的Sandbox使用量的指数级增长,Sandbox为保障数据安全与隔离,如Analytical Agent 需为每个任务复制大量数据库和用户上下文,导致内存(DRAM)和CPU核心的严重浪费,同样会带来大量的SSD的浪费(需求) 第四个也许在2030年之后发挥作用的结构性增长,来自于HBF路线需要用到SSD,在不少投行分析中被寄予厚望,但这个技术路线还有些遥远,主要角色定位只能作为存放大模型的weights,写一次权重然后做只读,而且必须要和GPU/HBM封装在一起(48TBps/96TBps),否则靠PCIE7/8速度太慢完全无法用,只能说未来可期,下一篇AI半导体终局推演2026(III)会有更详细的分析 总之,NAND SSD的结构性增长没有HBM那么强,但是胜在便宜,价格到2027年也只有$0.8/GB,是同期DRAM的四十分之一,所以也算是多级缓存里的万金油属性,结构性增长来源太广泛了 也就是说,不存在DRAM/HBM单独涨价繁荣,而SSD不涨价的情况,因为如果这样的情况发生,那么大家就会想办法用SSD去承载DRAM/HBM的部分功能,用更低的成本实现类似的效果。HBM、DRAM、NAND 不是三个独立故事,而是同一 AI memory hierarchy 在不同温度层的结构性增长 结构性指数增长的需求有了,NAND SSD摆脱周期了吗? 那么就要看NAND SSD厂家的生产纪律了,唯一可能不遵守生产纪律的,只有长存。毕竟这是一个囚徒困境,一旦有一家不讲武德拼命扩产,整个NAND产业要扩产的难度比DRAM简单的多。 但最起码的,这一轮NAND同样是超级周期,几个结构性指数增长带来的需求,下行期推迟到2030年问题不大
显示更多
0
193
2.2K
638
转发到社区
太夸张了,小某书和海鲜市场很快就会有人开始卖这个了。 再过半年,传统调研公司得倒一半,一份他们报价5-15万的消费者洞察报告,现在一个人用 AI,30分钟就能出 一个能让你月入过万的信息差生意:现在用 Atypica @atypica_AI 已经可以实现30分钟出一份专业级的消费者洞察报告了 大厂做调研一般都会找第三方调研公司 你知道传统调研公司做这事收多少钱??? 深度访谈:单次3000-10000元(含受访者礼金、访谈员、报告) 焦点小组:单场15000-40000元(8个人坐一起聊2小时) 一个完整的消费者洞察项目:5万-25万 大型定制化调研:25万-100万+ 周期:最快3-4周,通常1-2个月 这还只是国内价格,找海外调研公司直接翻3倍 一个定制化的定性调研项目,海外报价 $25,000-$65,000,周期6-8周,其中30-40%的费用是 overhead——说实话,这不是在帮你做洞察,是在养他们的团队 现在这个活,竟然一个人就能干了!! Atypica 做的事很直接: 用 AI 先澄清需求 & 生成研究计划,模拟真实消费者,自动做深度访谈,30分钟出洞察报告 绝对不是那种 AI 瞎编的问卷结果 是基于100w+真实用户数据构建的 AI Persona(官方数据),每个 Persona 都有完整的性格特征、认知偏差、决策框架 你输入一个研究问题,它自动: 自动做需求澄清&研究规划→ 生成目标人群的 AI Persona → 对这些 Persona 做深度访谈 → 分析行为模式和情绪触发点 → 输出结构化洞察报告 整个过程30分钟以内 85%的行为模拟准确度,根据官方数据,已经有品牌拿 Atypica 的结果和他们花了几十万做的传统调研做对比,结论高度吻合 我试了一个场景: 假设我在做一个 AI 写作助手,想了解海外内容创作者的需求和付费意愿 丢进去一个问题,接下来它干了几件事让我有点震: 1)先去 Persona 库搜索匹配的目标用户,发现覆盖不够,主动补充构建了新 Persona——营销文案工作者、自由撰稿人、YouTube 创作者,最终组了5个不同画像 和调研公司“招募受访者”一个逻辑,只是从两周变成了两分钟 2)访谈前先联网做了竞品调研——Jasper、 的定价和用户评价全搜好了,带着信息去追问 不是“你喜欢什么”,而是“你用 Jasper 觉得哪里不够好” 3)两轮访谈交叉验证,最后出了一份可执行报告:功能优先级(KANO 模型)、定价策略、MVP 规划、市场进入路径 不是废话总结,是能直接拿去写 PRD 的东西 这种报告找咨询公司做,10万起步,周期一个月 我花了30分钟这意味着什么? 轻松月入过万的几个变现场景: 1。帮新消费品牌做上市前用户测试,一份报告收费3000-8000元 你的成本是30分钟时间,传统调研公司同样的活收5-15万 2。帮跨境电商做海外市场消费者画像 品牌出海最头疼的就是不懂海外消费者 一份目标市场的消费者决策分析,收费5000-15000元 以前这活只有本地调研公司能接,帮创业者做产品方向验证 “你这个 idea 到底有没有人买单” 模拟50个目标用户做深度访谈,30分钟出结论 收费2000-5000元,比他们花三个月憋 MVP 便宜一百倍 3。帮 MCN/自媒体做内容方向验证 “这个选题我的目标受众到底吃不吃” 模拟目标粉丝画像做反馈测试 收费1000-3000元 4。再不济你去某鱼卖新兴行业报告都没问题,一份49.9,只要内容过硬,大把的人来买 以前这些活,是4A 公司和专业调研机构的饭碗,现在一个人+Atypica 就能干 成本几乎为0,利润全是你的 有个数据很有意思: 海外已经有 AI 调研平台公开了成本对比—— 200次 AI 访谈,成本$4,000,产出15个可追溯的洞察,单个洞察成本$267 20次传统人工访谈,成本$30,000,产出8个洞察,单个洞察成本$3,750 AI 调研的单位洞察成本是传统的1/14 这个效率差,就是你的利润空间 信息差的窗口期,通常只有3-6个月 现在知道这个工具的人还不多,等到烂大街的时候,价格就卷下来了 先上车的人,吃肉 链接:
显示更多
0
49
68
11
转发到社区