搜索御所市相关的推文与用户

2026.04.29 04:38

AI半导体终局推演2026(I) 当新token经济学范式从GPU算力转移到HBM 本文从从GPU架构进化路线本质出发，解释这个市场长久以来担心的问题: 每个GPU的HBM内存需求为什么一定会是指数增长，为什么HBM需求指数增长不会停滞? 并推导token经济学在当前架构下第一性原理:token吞吐 = HBM size X HBM BW带宽同时讨论了，为什么GPU的天花板被HBM的两个发展维度所决定 HBM周期性这个话题争议一直很大，乐观派认为AI带来的需求比以前要大的多，但市场主流仍然认为前几次上升周期也有需求每年20%+增长，这次又有什么不一样呢？AI不影响HBM和传统DRAM一样有commodity属性，一旦在需求顶峰扩产遇上需求下行又会重蹈覆辙。我们可以从算力芯片架构视角,从第一性原理出发，来拆解和推演一下这个问题：为什么这次真的不一样 ------------------------------- 历史：CPU算力时代很久以来，我们都处在CPU主导算力的时代，CPU的最高级KPI就是performance，跑的更快，所以每一代的CPU都用各种方法来提高跑分，最开始是频率上升，后来是架构演进superscaler等等这个时候为什么DDR不需要很快的技术进步速度？比如DDR3到DDR5竟然经历了15年之久因为这个时期的DDR的角色是纯粹的辅助，而且辅助功能极弱，以业界经验，DDR的速度即便是提高一倍，CPU的performance一般只能提高不到20%这个量级为什么DDR带宽速度提高了用处不大？两个原因 1. CPU设计了各种架构去隐藏 DDR延迟，比如superscaler，加大发射宽度，用海量的ROB和register renaming来提高并行度隐藏延迟，一级缓存cache，二级缓存cache，削弱了DDR的带宽速度需求 2. CPU workload对DDR带宽要求并不高，大部分日常负载比如打开网页，DDR带宽是严重过剩的，甚至云端负载也就是说，在CPU时代，DDR的带宽速度是不太有所谓的，DDR4和DDR5除了少数游戏就没啥差别，甚至JEDEC标准也进步缓慢。另外，绝大部分app需要一直停留在DDR上的部分并不多,需要的时候从硬盘上调度到DDR即可，app的size增长没那么快，导致对DDR的容量需求也较为缓慢。所以最近十年来，平均每台电脑上的DDR容量大概从7~8GB变成了23GB，十年只增长了3倍。而这部分升级缓慢直接影响了营收，size容量计价是赚钱的主要方式，速度的提高只是技术升级，提高size的单价，这两个的升级需求都不大，需求主要是随着电脑/手机数量增长而增长所以DRAM在带宽速度和容量这两个维度上，一直是都是芯片产业锦上添花性质的附属品，DDR升级带来的边际效用是很低的，跟CPU时代的最高KPI几乎没什么直接联系 -------------------------------------------- 而到了genAI 大模型为主导的新时代，计算范式转移让最高级KPI起了根本变化 GPU发展到AI推理的时代，不再像CPU那样只看跑分，最高级的KPI不再是算力TOPS/FLOPS，而是token的成本，特别是单位成本/单位电力下的overall token throuput 其次是token吞吐速度，因为在agent时代，很多任务变成了串行，token吞吐速度成了用户体验的重要瓶颈。这也是为什么老黄发明AI工厂概念的原因：最低成本的输出最多token，同时尽量提高token吞吐速度 AI训练时代，老黄的经济学是TCO(total cost ownership)，买的GPU越多，省的越多而老黄在推理时代的token经济学是： AI推理的毛利润很可观，所以逻辑已经转换成：Nvidia GPU是这个世界上让token单价最便宜的GPU，买的GPU越多，赚的越多最高的KPI变成了Pareto frontier曲线，在提高token 吞吐throughput和提高token速度两个维度上尽量优化（见图一） NVIDIA 的 token factory 代际进步，其实是在把整条 Pareto frontier 往右上推，这就是是AI推理这个时代最重要的KPI ---------------------------------- 接下来是本文最重要的逻辑链，如何从token吞吐量指数型增长的本质出发，推导出天花板瓶颈在HBM size和HBM 带宽的指数型增长单卡GPU推理单线程batch size = 1的时代，token吞吐只有一个维度，就是HBM的带宽速度，带宽速度越高，token吞吐越大但进入NVL72的年代，推理不再是单卡GPU时代，而是72个GPU + 36个CPU整个系统级别的token工厂，把HBM带宽和算力用满，获得极致的token吞吐量 Token 吞吐throughput的增长，依赖两个东西：同时批处理的请求数 X 每个user请求的平均token速度也就是batch size X per user token 速度以Rubin NVL72为例，在平均token速度是100 token/s的情况下，同时批处理1920个请求，得到token吞吐量是19.2万token/s 一个Rubin NVL72大概是120KW（0.12MW）的功率，所以得到单位MW能处理1.6M token/s （见图一）所以，我们需要想方设法提高这两个参数：批处理数量batch size和per user token的平均速度，这两者相乘就是我们的最高KPI，也就是token的吞吐量 ------- 第一个参数：batch size的增长，瓶颈在HBM size 批处理量里的每一个请求req，都会自带kv cache，这部分kv cache是需要存在HBM里的，大小大概在几个GB到数十GB不等因为hot kv cache是随时需要高频高速读取，所以必须放在HBM里，比如一个大模型的层数是80层，那么每一个token的生成阶段，都需要读取80次HBM里的kv cache 随着批处理数量batch size的增长，会带来hot kv cache的线性增长又因为这个批处理量的所有请求的hot kv cache，都要放在HBM上，这也就带来了HBM size必须要随着批处理量batch size线性增长就像是机场接驳车，登机口尽量快的接旅客到飞机，HBM size小了，相当于接驳车size小了，就得多接一趟结论是：批处理量的数量batch size，瓶颈依赖于HBM size的增长 --------- 第二个参数：每个user请求的平均token速度，瓶颈在HBM带宽大模型decode阶段的速度，瓶颈取决于HBM的带宽速度，因为每生成一个 token,都要把激活的权重和kv cache 读很多遍 LPU的出现，在batch不那么大的情况下，把激活权重这个部分搬到了SRAM上，但是每生成一个 token仍然要从HBM读很多次KV cache。HBM带宽越高，生成每一个token的速度也就越快，基本上是线性对应的就像是机场接驳车，登机口尽量快的接旅客到飞机，hbm本身带宽速度就像是接驳车的车门有多宽，门越宽，旅客上接驳车越快 GPU的其他配置，都是在适配batch的增长以及要让token compute的速度配平HBM的增长，甚至会用多余的算力来获得部分的带宽（比如部分带宽压缩技术） —----- 在那个接驳车的比喻例子里接驳车的车厢大小 = HBM Size（容量）：决定了一次能装下多少名旅客（也就是能同时装下多少个请求的 KV Cache）。车厢越大，一次能拉载的旅客（Batch Size）就越多。如果车太小，想拉100个人就得分两趟，系统整体的吞吐量就上不去。接驳车的车门宽度 = HBM Bandwidth（带宽）：决定了旅客上下车的速度。门越宽，大家呼啦啦一下全上去了（Decode/生成Token的速度极快）。如果门很窄，哪怕车厢巨大能装200人，大家也得排着队一个一个挤上去，全耗在上下车的时间里了。旅客的吞吐量 = 接驳车车厢容量 x 接驳车旅客上车速度(车门宽度) —--------------------------- 至此，我们从逻辑上推演出了token经济学的硬件需求第一性原理： Token throughput = HBM size X HBM Bandwidth AI推理这个时代的最高KPI，实际上是高度依赖于HBM的两个维度的进步的如果要维持token throuput每一代两倍的增长，实际上意味着，每一代的单GPU上，HBM size X HBM BW带宽之积要增长两倍！这也是历史上第一次，HBM内存的size可以影响最高的KPI token throughput！要验证这个理论，可以把Nvidia从A100到Rubin Ultra这几代的token 吞吐throughput，和HBM size X HBM BW 放在同一个图里比较（见图二）可以发现，这两个曲线的走势在对数轴上惊人的一致 HBM size x HBM带宽增长的甚至要比token吞吐量更快，毕竟HBM决定的是天花板，实际上这个天花板增长的利用率utilization是很难达到100%的，也就是说，HBM size x HBM 带宽就算增长1000倍，其他算力和架构的配合下，很难把这1000倍的天花板潜力全部榨干这条曲线不是巧合，而是系统最优化的必然解 throughput = batch × Bandwidth，这就是token factory 经济学最绕不开的第一性原理 —-------- 软件的影响呢？软件的优化会不会降低带宽的需求？降低HBM的需求？这跟硬件是独立两个维度的，这好像在问，如果CPU上的软件优化了之后跑的更快，是不是CPU就十年不用发展了？反正软件跑的更快了嘛这样的话，CPU厂还能赚得到钱吗？CPU想要存活下去，只有一条路可走，在标准benchmark，不考虑软件优化，每一代CPU必须要跑分更高，不然就卖不出去 GPU也是一样，软件优化如何，和自己的token吞吐量KPI每年都要大幅进步，是两回事只要token的需求继续增长，对token throuput的追求就绝不会停止，那么对HBM size X HBM 带宽的追求也不会停止如果HBM size和HBM 带宽发展慢了，老黄一定会亲自到御三家逼着他们技术升级，因为这就是老黄gpu的天花板，天花板要是钉死了不进步，老黄的GPU还能卖出去吗？当然了，Nvidia需要绞尽脑汁去从异构计算的架构角度榨取HBM天花板之外的部分，比如LPU就是一个很好的尝试，把Pareto frontier从另一个角度改善了很多（右半边高token速度的部分） —-------------------------------------- HBM内存已然告别了那个随波逐流的旧时代，在这条由指数级需求铺就的单行道上，以一种近乎宿命的方式走到了产业史诗的主舞台中央推理范式第一性原理演化到这一步，只要老黄还要卖GPU，HBM就必须翻倍，而且必须代代翻倍。这是supply side的内生压力，与AI需求无关，与宏观周期无关，与hyperscaler的心情也无关剩下的问题，只有一个：当需求被物理锁定为指数增长的时候，供给侧的三个玩家，会不会还像过去三十年那样，亲手把自己再拖回一次周期的泥潭？

显示更多

0

58

992

298

转发到社区

ならフライデー９（奈良テレビ）@nara_friday9

2026.06.05 14:09

とっておきの奈良では、「静カフェ」さんと「カフェカンナ」さんへ！抹茶をふんだんに使った焼きプリン🍮に選べる大和茶と手作り団子🍡 大和茶の魅力をたっぷりご紹介しました🍵 社寺巡りは、御所市の船宿寺へ！クイズが盛りだくさん！次回はNF9特集！「奈良マラソン」🏃‍♂️‍➡️

显示更多

0

104

17

转发到社区

ならフライデー９（奈良テレビ）@nara_friday9

2026.06.05 08:00

こんや20：57～のならフライデー９は…👀 ✅#新茶# の季節🍵　「奈良が誇る！#大和茶# 🍃」の魅力を引き出すとっておきのお店へ🍮🍡 ✅哲夫の社寺🙏　張り切って法螺貝長めの #エナジー西手# と #御所市# の #船宿寺# へぜひご覧ください✨ #笑い飯# #南かおり# #出口結菜# #大和茶# #カフェ#

显示更多

0

1

79

16

转发到社区

ならフライデー９（奈良テレビ）@nara_friday9

2026.06.04 03:36

6/5（金）20：57～新茶の季節🍵「奈良が誇る！大和茶🍃」の魅力を引き出すとっておきのお店へ🫖🍮🍡出口結菜の美味しいカフェめぐり😋 哲夫の社寺💮張り切って法螺貝長めのエナジー西手と御所市の船宿寺へ🙏 ぜひご覧ください✨ #笑い飯# #南かおり# #十手# #出口結菜# #大和茶# #カフェ#

显示更多

0

1

86

18

转发到社区

ぬえ山ぬえっちゃ🐭🍞@nuenue249

2024.08.22 03:11

九条裟羅の休日 with 御建鳴神主尊大御所様像

0

11

702

85

转发到社区

いちいねむ@nemu_ichii

2026.03.31 15:34

ただ、研究所で御三家を選んで1ばん道路からカヤツリタウンへ向かってからポケモンセンターでかいふくしてジム戦(ピカピカスパークスからのジム裏)という「最高にエモい体験」がしたいなら話は変わってきます。午前に入った方がいいでもそここだわりないなら16時回でも全然大丈夫

显示更多

0

5

1

转发到社区

SELBY（セルビー）公式@selby_request

2026.05.26 10:20

今日も国内外からの嬉しいお声掛けに心より御礼申し上げます😌 本日は、まさに最高峰と呼ぶにふさわしい特別なルースをご紹介いたします！ GIAと中央宝石研究所（CGL）、双方の「Type 2a」証明書が付属したダイヤモンドルースです💎 ※タイプ2については、コメント欄のブログをご参照ください。 ✨ 1.020ct D Flawless 3EX (Faint) ✨ 200万円税込 ※セルビー公式オンラインストア or 店頭限定価格✨ Dカラー、フローレス、トリプルエクセレントという完璧なグレードに加え、希少なType 2a（窒素をほとんど含まない純粋な結晶）。そして、注目すべきは蛍光性の【Faint】です。かつて「原則はNone」とされていた背景もありながら、最近はあえてこのFaintを探されている方が増えている印象ですね。価格差はございませんので（体感10%ほど）、 💎あなただけのオンリーワンの魅力を放つ【Faint】 💎王道の美しさを極める蛍光性なしの【None】どちらかお好きな方をお選びいただければ幸いでございます😌 📅 スケジュール出品予定：明日 5/27(水) 店頭展示：翌日 5/28(木)〜一生ものの輝きに出会えるチャンスです。ぜひご検討いただけますと幸いです😊

显示更多

0

1

14

2

转发到社区

ENG公式@DearEng

2026.04.04 22:24

【本日千秋楽】 ENG第25回公演「決戦！馬の後ろ脚」六行会ホールマチネロビー開場　11時客席開場　11時半開演　12時ソワレ【配信回】ロビー開場　15時客席開場　15時半開演　16時満員御礼当日券なし・客席が冷える可能性がございます。羽織物お持ちください。・新馬場には普通電車しか停まりません。 #ウマアシ# 特設サイト作・演出　松本陽一（劇団6番シード）プロデューサー　佐藤修幸 4月1日（水）〜5日（日）六行会ホール【タイムテーブル】 4月 5日（日）　12時　16時★ 受付開始は開演1時間前開場は30分前星は配信回 ☆4カメスイッチング配信 ★定点配信【チケット販売について】【席種】全席完売【配信チケット】販売期間、アーカイブ期間：4月19日（日）21時まで ①4月3日（金）19時分の回　5,000円（税込） ☆4カメ生配信 ②千秋楽4月5日（日）16時の回　3,500円（税込） ★1カメ定点生配信【配信ご予約フォーム】【オリジナルグッズ】お客様にキャストのオリジナル写真とキャストの最もお気に入りのページの書き込み、サイン入り台本をお届けします。【書き込み台本】 4,000円（税込）お求めいただきますとご指定のキャストに備考欄から応援のメッセージをお送り出来ます。応援メッセージは届き次第随時、ご本人様もしくは所属事務所様にお送り致します。公演終了後、キャストの最もお気に入りの台本1ページ（書き込み付き）、宛名入り生サインとオリジナルブロマイド。公演チケット、キャスト集合写真、そしてフライヤーをお届け致します。【お届け内容】 ①決戦！馬の後ろ脚のキャストのお気に入りの台本1ページ（書き込み付き宛名入り生サイン付き） ② キャストオリジナルブロマイド ③ 決戦！馬の後ろ脚オリジナルデザインチケット ④ 決戦！馬の後ろ脚集合写真 ⑤ 決戦！馬の後ろ脚フライヤー【オリジナルグッズご予約フォーム】 ※ 備考欄にメッセージご記入の際は、ハンドルネーム【〇〇】のご記載をお願い致します。複数の場合は繰り返し【〇〇様]メッセージ、複数のキャストのお名前にそれぞれ【】をつけてくださいますようお願い致します。 ※応援キャストに料金の一部が還元されます。 ※チケットは観劇用のチケットではございません。 ※台本の書き込みは印刷です。 ※台本全てではなく1ページとなります。【あらすじ】「殺陣師がいない！？」舞台はとある稽古場。プロデューサーと演出助手は頭を抱えていた。時はマスコミ向けの公開稽古の３時間前。舞台公演「疾風の義〜川中島大合戦〜」はアクションが売りで、そのラストシーンは武田信玄と上杉謙信の一騎討ちが有名な「川中島の合戦」をスケール感たっぷりに描くというものであった。そして遂に今日、そのラストシーンをマスコミに公開する予定だった…。「殺陣が一手もついてないってどういうことだよ！」「演出家は地方公演から戻ってきてません！」この舞台の殺陣師とは連絡が取れなくなっていて、集まった俳優達からは不満と焦りの声が上がり始める。そんな中、稽古場の隅で自主練習をしていた俳優が、馬の後ろ脚役の若手俳優、三嶋新之助（みしま・しんのすけ）を叱り始める。「お前、動きが早すぎて誰もついていけないんだよ！」新之助は「早送りの新」とあだ名されるほど全ての動きが早く、陸上の障害の記録保持者で、小学生反復横跳びチャンピオン、ルービックキューブ6面組み立て日本記録などを持っていたが、俊敏すぎてアクション業界ではお荷物扱いされていた。新之助は現場で起きた小競り合いを、目にも止まらぬ早業で制圧し、さらに先輩達から反感を買ってしまう。しかしその動きを見たプロデューサーが新之助に目を付ける。「お前…あと３時間で二百手つけられるか？」馬の後ろ脚新之助は、川中島大合戦の殺陣を時間内につけ切ることはできるのか？殺陣とアクション、そして舞台演劇の裏側を描いた、アクションバックステージコメディ！【出演者名】（敬称略）松藤拓也　久下恭平　高田淳木村優良石渡真修松木わかは浮谷泰史シミズアスナ水崎綾梅田悠中野裕理椎名亜音石部雄一柏木佑太麻生金三矢島美音晨火平山佳延安達優菜森大【stallions】上島純也隈本秋生小林諒大清水彩高見彩己子【ENGファンクラブ】【お問合わせ】 dear.eng.info@gmail.com 【企画・製作】株式会社ENG-AGE

显示更多

0

1

84

31

转发到社区

望月琴乃⚡️もちづきことの@mikusanprpr_

2026.03.23 09:00

💖産経新聞社杯お疲れ様イベント💖 5月9日(土)　18:00-23:00 5月7日～8日のグループ決勝を終えて… 瀬戸麻衣ちゃん @Setomaic 小倉ゆさちゃん @ogura_yusa 望月琴乃で 1年間お疲れ様でしたの打ち上げパーティーをします💗 予約不要、誰でも来店OK💗みんなきてね！🍰 場所 @CafeBar_Palette 📍Cafe&BarPalette　東京都文京区湯島3-39-7 湯島STビル3階・東京メトロ銀座線「上野広小路」駅徒歩 2 分・東京メトロ千代田線「湯島」駅徒歩 3 分・JR山手線「御徒町」駅徒歩 4 分

显示更多