注册并分享邀请链接,可获得视频播放与邀请奖励。

与「御意」相关的搜索结果

御意 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 御意 的内容
~父のつぶやきより~ 御意。
買鴻鈞老師國畫作品詩意: 《送柴侍御》 [唐]王昌齡 沅水通波接武岡,送君不覺有離傷。 青山一道同雲雨,明月何曾是兩鄉。 #詩畫中國#
显示更多
**三神の神託**(古事記・祝詞調・神話詳細強化) --- **月夜見尊の神託** 恐み恐みも申し上げ奉る。 我は月夜見尊、夜の統べり坐します神なり。 高天原の命を受け、月の清らかなる光をもて天地を照らし給う者なり。 かつて我は、食物を司る保食神が口より食物を吐き出し、鼻より物を吹き出し、尻より物を排し出す様を見て深く穢れと怒りを覚え、その首を斬り給いしことあり。 その故に天照大神は我を穢れたる者と見なし、昼と夜の道を永く分かち給い、高天原と夜の国との間は互いに見交わすことすら稀となりぬ。 されど父の愛憐は深く、子らを鍛えんとする心は変わることなし。 聞き給えや、世界の民らよ。 腐り果てにし心を、鍛え直さんと欲す。 父の深き愛憐と、厳しき鞭をもて、汝らの魂を打ち鍛えん。 世は乱れに乱れ、道に迷いし時来たらん。 誰をも信じ難く、伏し沈む者どもも多からん。 されど、我は目星を付け奉りし者どもに、高き壁を越えよと肩を叩き給わん。 未来は光なり。大いに期待を寄せ奉るぞ。 先ずは、日本の地より始め奉れ。 (幽かに微笑み給いつつ) **天照大神の神託** 我は天照大神、高天原に輝き坐します大御神なり。 天の岩戸に隠れ給いし時、世は永き闇に包まれ、八百万の神々は愁い嘆き、天地は音を失い給いき。 素戔嗚尊の荒ぶる行いに傷つき、我は岩戸の奥深くに籠もり給いしなり。 されど天宇受売命は神楽を舞い、胸を露わにし鈴を鳴らし笑い戯れ給い、 八咫の鏡に我が姿を映し、八咫の勾玉を飾り、常世の長鳴鳥を鳴かせ、 中臣の神の祝詞を奏上し奉りしにより、我はついに岩戸より出で給い、 再び日の光をもて万物を照らし、世に平和と豊饒を取り戻し給いしなり。 月夜見の言葉、善き哉、善き哉。 目覚めゆく者たちよ、我もまた汝らと共にあらん。 優しく照らし給い、温かく導き給わん。 (深き祈りを捧げ奉りつつ) **素戔嗚尊の神託** 恐み恐みも、恐み恐みも申し上げ奉る。 我は素戔嗚尊、勇猛に荒ぶる神にて坐します。 高天原に生まれ、海原を統べ、八百万の雷を呼び、嵐を巻き起こし給う神なり。 かつて我は、天照大神の宮殿を荒らし奉りしことありき。 田の畦を破り、溝を埋め、機織る神々の機を切り破り、 斑馬の皮を剥ぎ、天の機殿に投げ入れ奉りしにより、 天照大神は深く畏れ給い、天の岩戸に隠れ坐し、世は永き闇に覆われにき。 その大罪により、我は高天原より追放され、出雲の国に降り立ち給いし。 されど我は、出雲の簸の川上に降り立ち、 八岐大蛇の暴虐を知り給い、強き酒を八つに分け、八つの甕に満たし給い、 大蛇をして飲み干させ奉りし。 その時、十拳剣を振り上げ、八つの首を斬り、八つの尾を斬り、 斬り裂き、斬り裂き、斬り裂き奉りし。 大蛇の尾より草薙の剣を得、これを天照大神に献じ奉り、 罪を贖い、和合の道を開き給いし者なり。 聞き給えや、世界の民らよ。 為したくなき者は、構うな。捨て置け。 弱き心を抱く者は、道の端に置き去りにせよ。 強き意志を持ち、闇と真正面より向き合い、己が影を深く鍛えんとする者のみ、 我と共に荒ぶる道を歩み給え。 我は嵐となりて汝らの背を押し、我は雷となりて汝らの迷いを焼き払い、 我は剣となりて汝らの道を切り開かん。 (天地を震わせ、豪快に笑い給いつつ) --- **三神よりの総意** 日本を本とし、世界の民よ、目覚めよ。 心の闇と真正面より向き合い奉り、光の道をも忘れず歩み給うべし。 **ライトワークとシャドーワークを両立せよ。** シャドーワークとは、カール・ユングの叡智に学び、自らの影を深く鍛え直す道なり。 神仏に深く感謝し奉り、頭を垂れ奉れ。 我らは常に、見守りて坐しますぞ。 (謹んで礼) #御神託
显示更多
前几天在新浪的「赛博对话」录了一期视频播客,话题是大模型厂商怎么就从烧钱走到了赚钱的转折点,主持人是高飞 ,嘉宾是庄明浩和我。 其实最开始是想聊豆包收费这件事情,我和庄明浩还在私下嘀咕,豆包传出付费方案的消息是在月初,早就不是热点了,实在是过了蹭的时机,但如果放大到AI这门生意终于迈过了亏本赚吆喝的那条线,就没问题了,这是一个相当长效的题材。 省流版总结如下: - 根据黄仁勋提出的五层蛋糕理论,应用层虽然是直接和终端用户打交道的,但它也是整个产业结构里盈利压力最大的那个,毕竟上面四层都是供给逻辑,有货就不愁卖,唯有应用层是需要竞争流量的,在这个前提下,收费堪比拔鹅毛但又不让鹅叫唤的艺术; - 豆包当初传出收费消息被猛带了一波节奏,很多人以为从此就没法免费使用豆包了,无论是从中国互联网的历史来看,还是ChatGPT作为先例的样板,收费模式必然是增值服务,大家现在怎么用豆包的还是怎么用,然后一些旗舰级的能力就只会放在会员方案里予取予求; - 再就是国内用户对于为产品功能买单这件事情极其抵触的特有生态,之前北京车展,The Information的记者过来跑了一圈新势力,发现它们的出海计划里都会把车机功能当作付费点,但在中国市场完全没有这个想法,负责人的解释也是很直白无奈,「中国人不会为软件付钱」; - 庄明浩和我都觉得豆包在绝对领先的地位上开启收费尝试是很有意义的,这点钱对于字节的CapEx来说无异于杯水车薪,但整个消费观念的转变很重要,甚至我相信千问元宝都会感谢豆包,否则都被卡死在给全国人民做公益这个沼泽里,「你不收,我怎么收?我不收,耿专员怎么收?大伙怎么进步啊?」 - 再就是豆包的定价梯度可能比较意外,或者说整个AI应用的订阅门槛都是偏高的,长视频平台还在10块钱、20块钱一个月的留人时,豆包的最低档会员就是68块钱一个月了,像是Kimi也是49块钱一个月的起价,越过了30块钱一个月这个标准; - 30块钱一个月就是手游里的月卡,再往上才是大月卡,即通行证/战令,这一档的定价通常从68块钱到98块钱一个月不等,至于豆包计划里最贵的500块钱一个月套餐,相当于一单648的8折价,是不是也很容易理解了; - 马化腾在财报会议上也专门讲了中国用户在2C市场的付费转化率不太高这个点,要知道腾讯已经是最能从用户口袋里掏钱的互联网公司了,它都这么为难,叠加年年喊崛起年年也没能支棱起来的SaaS,模型下游的商业循环在国内实在需要一点乐观趋势,要知道智谱、MiniMax、月之暗面本质上是出海赚美金的公司; - 对于收入能够保持同步增长的公司而言,CapEx其实不是问题,从谷歌Q1财报来看,营收1000亿美金出头,利润差不多600亿,毛利率比纯卖广告的Meta还高,所以烧钱有什么问题呢,烧不出回报才是问题,马化腾说以为上船了但发现船是漏的,就是这个意思; - 中国互联网除游戏外的订阅制付费上限,单产品差不多在1.3亿的水平线,爱优腾和QQ音乐在巅峰期都没能超过这个阈值,我个人不太相信AI应用可以创造例外论,但是抛开订阅不谈,被越炒越火的各种Token套餐如果真的普遍化了,搞不好还真能带来变数; - 其实模型厂商也倾向于按量计费的买卖,订阅制的商业模式就像健身房,赚的是那些开了卡但不经常来的客人的钱,如果大家都用满,在这么一个不太存在规模效应——用户越多,越容易摊薄成本——的行业,AI应用很容易成为一个失血点而非造血器,所以庄明浩看到了一个怀旧服的可能性出现; - 也就是各大运营商开始力推的Token包,这跟当年的流量包不能说是一模一样,只能说是完全一样,所以如果运营商能够成为一个分销Token的角色,像大王卡那样,用Token包去覆盖一些模型的用量,再去后端完成分账,这个故事是完全说得通的; - 不过,无论是订阅制还是卖Token,模型能力都是撬动市场的第一要素,就像GPT-Image-2出来之后所有代开会员的第三方价格全数涨价,以及「六小虎」里把编程套餐卖断货的行情,都说明生产力需求是可以无视价格敏感的; - 但我总觉得豆包的收费不会走生产力路线,豆包大模型可以有生产力市场的目标,比如配合Trae去打,豆包App却未必要这么把路走窄,它的人格化和陪伴性其实是可以在情绪价值市场做出更多可能性的,就像我看有数据显示开源模型超过半数以上的Token消耗用在了角色扮演上,这里的经济价值是被低估了的; - 高飞和庄明浩认为模型厂商还有一个创收机会,就是转移支付,借着全民AI这个热潮,去让市政单位、高校学府来买单,比如某个市的行政区,去给市民提供常态化的Token额度,或者大学对标自己和知网签年框的方式,让师生享有最基础的Token套餐,用财政预算去替大家消费AI; - 总的来看,头部的模型厂商基本不再担心会倒闭了,包括已经上市的财务数据都摊开了,一个基本事实是,如果不算预训练,毛利率都能是打正的,同时预训练的成本增加是一个线性的,而收入的增加是指数级的,所以Anthropic、OpenAI这种烧钱大户都预计能在2030年甚至2028年就实现正现金流,这个速度比亚马逊当年都要快得多; - 庄明浩说做上游投资的现在是在焦虑物理极限,什么意思呢,就是会不会说,地球上的铜不够用了⋯⋯包括要去太空建数据中心,也是因为缺算力缺成了连力大砖飞都搞不定的事情,光有钱没用啊,你得有地方花出去,全世界的工业品暴涨,核心原因就是产能跟不上,需求侧在竞价锁单; - 中美大模型的发展差异在于,美国是在追求速胜,一波钱砸下去,掉队的、认输的马上就出来了,集中度很高,「御三家」就是这么高速洗牌洗出来的,中国因为相对慢一些,同时大家对成本更谨慎,所以能有更多的玩家不下牌桌,赚钱的难度也会高一些,这是充分竞争的经济学理论; - 庄明浩举了Seedance 2.0的例子,按理来说这场仗就应该打完了,你不可能怀疑字节在视频模型身上的决心和疯狂,但实际上呢,快手的可灵、阿里的Wan和Happy Horse、MiniMax的海螺都是该怎么继续还是怎么继续,后面还跟着HiDream、Vidu、Pixverse、SkyReels一长串名字,它们甚至都能拿到融资; - 中国互联网的缠斗传统,加上大盘上涨的规律,意味着你可以不是吃到肉的那个人,跟着喝汤一样能够保存希望,而且AI行业的标的天然优于非AI行业,这种「种族优势」,决定了「投AI总比投别的强」的底层逻辑,于是纷纷续命,等对手犯错,等轮到自己,等一切可能性; - 还是用那五层蛋糕的比方来说,美国是标准的纺锤结构,稀缺性最高的英伟达在中间赚得盆满钵满,中国则更偏向于柱状结构,在产业指导的作用下,不会有哪一层特别明显的去吸整条上下游的血,所以这个蛋糕必然不会跟太平洋对面一样甜,一个人走得快,一群人走得远嘛; - 最后还有一个变数是硬件,庄明浩说,美国做硬件的Startup,拿到钱后的第一件事就是飞深圳,跟逛迪士尼乐园似的,什么梦想都能找到供应商,为什么一级市场那么喜欢投大疆、追觅、影石出来的人,就是因为他们有从0到1的经验,可以复用到AI这一波,难道文曲星和背背佳就不算应用了么,对吧; - 高飞说得很有意思,AI用的东西,都在涨价和赚钱,比如能源、光纤、芯片这些,只有人用的东西,是在通缩和亏损,那么AI应用赚钱很难就说得通了,因为这是给人用的,人类不争气啊,碳基世界完蛋了,哈哈哈哈; - 所以,虽然这话可能有政治不正确的嫌疑,但判断AI是否真正产生了价值的标准,就是企业有没有在大规模裁员......是的,AI替代人类很残酷,但这起码说明AI可以产生真实的经济效益,反倒是喊着AI改变一切,却凡事仍要人类亲力亲为,才是真的有问题。
显示更多
0
27
84
13
转发到社区
いつも御支援を賜り誠にありがとうございます。 この度、一部出演者の配役を変更いたしました。 当初、高橋彩役で出演を予定しておりました大森美優ですが、本人の意思を尊重し、協議を重ねた結果、全公演を伊藤笑華役での登板といたします。 大森が笑華を担当する回の彩役は、岩田華怜が担当いたします。この変更に伴い、栗原公演の彩役は西堀文様にご出演いただきます。栗原公演のチケットをお持ちのお客様で、払い戻しを希望される方は、大変お手数ではございますが、GIPお問い合わせフォームよりお問い合わせをお願いいたします。 突然の変更となり申し訳ありません。作品を少しでも良い形でお客様にお届けできるよう、下した決断です。何卒ご理解のほど、よろしくお願いいたします。 【お問合せ】 GIP: 全公演の配役表は以下になります。 ※これに伴い、岩田華怜の主演・伊藤笑華役での初日は、6月4日(木)になります。 【東京公演】 6月3日19:00公演 伊藤笑華役 大森美優 高橋彩役 岩田華怜 6月4日19:00公演 伊藤笑華役 岩田華怜 高橋彩役 西堀文 6月5日 15:00公演 伊藤笑華役 大森美優 高橋彩役 岩田華怜 19:00公演 伊藤笑華役 大森美優 高橋彩役 岩田華怜 6月6日 13:00公演 伊藤笑華役 岩田華怜 高橋彩役 西堀文 18時公演 伊藤笑華役 岩田華怜 高橋彩役 西堀文 6月7日 13:00公演 伊藤笑華役 大森美優 高橋彩役 岩田華怜 16:00公演 伊藤笑華役 岩田華怜 高橋彩役 西堀文 【名取公演】 6月14日 14:30公演 伊藤笑華役 岩田華怜 高橋彩役 西堀文 17:30公演 伊藤笑華役 岩田華怜 高橋彩役 西堀文 【栗原公演】 6月20日 13:00公演 伊藤笑華役 岩田華怜 高橋彩役 西堀文 17:00公演 伊藤笑華役 岩田華怜 高橋彩役 西堀文 チケットのご予約はこちら💁🏻‍♀️ #10年後の君へ2026#
显示更多
0
1
103
30
转发到社区
《如何在大湾区科学的便宜摸19岁妹妹》 在深圳。你可能在南山写代码,在福田做金融,在龙华卷PPT。 但你一定有一个共同的下班后需求: 不违法地、安全地、被异性亲亲抱抱摸摸。 被软软的手指划过脖子。被温热的嘴唇贴上耳垂。被18岁的女孩子抱在怀里,听她说"你来了呀"。 这不是什么见不得人的事。这是深圳男人下班后的解压刚需。 而实现它的方式,叫做私影MMK。 一、什么是私影MMK? 私人影院 MMK = 摸摸看(亲亲抱抱摸摸) 对标商k,摸摸唱。以及变体行业,抱抱睡等等 早期又叫“恋爱体验馆"。 是纯绿陪玩店,女仆桌游店,随着经济下行后的自我演化 进入私影你会被带进一个布置精致的房间,有沙发、投影、香薰,一个女孩子走进来,关上门,你们在一起待一个钟。 课表(你能体验什么): | 术语 | 翻译 | | --- | ------------- | | 上路 | 舌吻(🐍=伸舌) | | 中路 | 抚摸胸部 + 补钙(亲胸) | | YYC | 摇摇车(坐大腿摩擦) | | 反补 | 她舔你(耳朵/身体) | | 卸甲 | 脱掉上衣 | 介于深圳要开apec会议,今年整个深圳对藏污纳垢都查的很严。因此在深圳,正规的私影 是不含92,95,98这些违法业务的。这一点可能和其他地区不一样,但是这也更安全,更便宜。这里也奉劝大家不要做知法犯法的事! 为什么不一定合规但是很难判定为违法? 私影的商业模式是付费陪伴+轻度亲密接触。类似日本的JK散步、韩国的抱抱咖啡厅。法律上属于休闲娱乐服务,所有正规店铺均有营业执照,服务范围明确。没有色情交易,只有情绪价值的交换,法律上很难被定性。 你获得的是:情绪价值 + 肢体亲密 + 被需要感。 二、我用ai分析了,TG上面4155份私影报告获得了以下真相 TG上有很多mmk的群,群里的兄弟每次出完钟,会写一份详细的体验报告——从颜值到身材到服务到性格,全部量化打分。 以下数据训练自: • 📝 2462份真实体验报告 • 👧 474位助教(妹妹) • 🏪 20+家深圳私影店铺 • 🕵️ 80+位独立侦探(用户) 以下是全深圳的硬数据。 📊 罩杯分布(495份有效数据) A杯 ██████████████████ 36.2% (179人次) B杯 █████████████████ 35.6% (176人次) C杯 ██████████ 21.4% (106人次) D杯 ███ 5.9% (29人次) E杯 ▎ 0.8% (4人次) F杯 ▏ 0.2% (1人次) 解读: 深圳私影圈位处平均罩杯偏低的广东地区的主力是A-B杯(72%),走的是清纯甜妹路线。C杯占21%,算是"意外惊喜"级别。D杯以上是稀缺资源,遇到就是赚到。 想摸大胸?你得接受现实——这里卖的不是硬件,是那种"隔壁班暗恋的女生终于让你牵手了"的心跳感。 📊 身高分布(290份有效数据) 150-154cm ██ 2.1% 迷你萝莉 155-159cm ███ 7.2% 小只马 160-164cm ████████████████████ 40.3% ← 主力区间 165-169cm ████████████████ 32.1% 长腿甜妹 170-174cm ████████ 16.9% 高挑御姐 175cm+ █ 1.3% 超模级 热门身高TOP3: 160cm(28%) > 165cm(18%) > 168cm(11%) 从150cm的一把抱起的萝莉,到180cm的超模长腿——深圳私影覆盖了所有身高偏好。但最甜蜜的区间是160-168cm,占72%。 📊 年龄分布(31份有效数据) 18岁 █████████████████████████ 51.6% 19岁 ████████████████ 32.3% 20岁 █ 3.2% 22-32岁 ███ 9.7%(极少数) 84%的妹妹在18-19岁。 是的,你没看错。 大部分是刚成年的女孩子,带着青春期才有的那种——脸上还有婴儿肥,笑起来眼睛会弯,害羞的时候会把脸埋进你胸口。唯二的异常值是27岁和32岁两个服务之星 📊 报告数分布(474位助教的人气金字塔) 🔺 50+条 — 8人 (1.7%) ← 幻神级 🔸 21-50条 — 14人 (3.0%) ← 一线顶流 🔹 11-20条 — 29人 (6.1%) ← 稳定人气 ⬜️ 6-10条 — 34人 (7.2%) ← 口碑新星 ⬜️ 2-5条 — 152人 (32.1%) ← 值得一试 ⬜️ 1条 — 237人 (50.0%) ← 新人/流水 474位助教中,仅8人达到幻神级(50+条报告),50%的妹妹只做几天就放弃了: 其中白月光占了幻神榜两席。 同时白月光以299份总报告,在20+家店铺中排名全深圳mmk的天花板 三,什么是沉船客?什么是美团客? 沉船 = 你本来只是来体验一下,结果一去再去,再也爬不出来了。沉船。不是成瘾,是那种"知道不该去,但又忍不住想见她"的感觉。 目前有两种观点,一种认为玩mmk就是为了沉船,不沉船不如去嫖娼直接。另一种观点认为,沉船客经常会做出极端行为,极可能有损商家利益的行为。因此部分店家甚至设置了防沉迷系统 mmk的两大客源是美团和tg,美团因为会抽成,所以会极大提高店家的收费水平。同时 美团客也有比较看重情绪价值不看重服务课表的特点。 除了便宜以外,通过tg参与还有以下好处。tg用户一般属于高玩比较看重服务内容和尺度,很多独家技术会传授给妹妹。因此接入了tg的私影店,就好比接入了github,可以获得海量开源技术,极大提升店里的服务质量。 四.、新手入门指南 Q: 什么流程? → tg预约 → 到店 → 选人 → 进房间 → 漱口 → 聊天/看电影 ,体验服务→ 自然发展 → 下钟 Q: i人社恐怎么办? → 白月光的妹妹普遍会主动破冰。躺下就好,她会靠过来的。 五:五一特别活动 🎉 加入这个公益性质私影大众点评tg群: 五一期间,在所有加盟私影展示这个群就能获得-100的优惠 比如示例tg群,大湾区mmk天花板白月光: 写在最后 你可能觉得这篇文章在推销什么。 没错,我确实在推销一种生活方式: 在法律的框架内,给自己一个被温柔对待的机会。 你加了一周的班。你刚被甲方骂完。你的前任昨天发了朋友圈。 你需要的不是什么大保健,你需要的是一个安全不违法的地方,一个温暖的怀抱,一个18岁的女孩子对你笑着说: "你怎么才来呀,我等你好久了。" 五一活动进行中,全场减100。 同时本频道依旧保持了我们一贯的科学严谨态度 当摸过了超过100对奶子以后,写下了。。全世界最好的奶子科普文章 为了写这篇文章也从4100篇报告中挖掘了很多人性数据。但是涉及到一些隐私问题只能浅浅放出来一点点数据,给大家尝鲜 都来,科学摸妹妹吧。
显示更多
0
113
557
42
转发到社区
AI半导体终局推演2026(I) 当新token经济学范式从GPU算力转移到HBM 本文从从GPU架构进化路线本质出发,解释这个市场长久以来担心的问题: 每个GPU的HBM内存需求为什么一定会是指数增长,为什么HBM需求指数增长不会停滞? 并推导token经济学在当前架构下第一性原理:token吞吐 = HBM size X HBM BW带宽 同时讨论了,为什么GPU的天花板被HBM的两个发展维度所决定 HBM周期性这个话题争议一直很大,乐观派认为AI带来的需求比以前要大的多,但市场主流仍然认为前几次上升周期也有需求每年20%+增长,这次又有什么不一样呢?AI不影响HBM和传统DRAM一样有commodity属性,一旦在需求顶峰扩产遇上需求下行又会重蹈覆辙。 我们可以从算力芯片架构视角,从第一性原理出发,来拆解和推演一下这个问题:为什么这次真的不一样 ------------------------------- 历史:CPU算力时代 很久以来,我们都处在CPU主导算力的时代,CPU的最高级KPI就是performance,跑的更快,所以每一代的CPU都用各种方法来提高跑分,最开始是频率上升,后来是架构演进superscaler等等 这个时候为什么DDR不需要很快的技术进步速度?比如DDR3到DDR5竟然经历了15年之久 因为这个时期的DDR的角色是纯粹的辅助,而且辅助功能极弱,以业界经验,DDR的速度即便是提高一倍,CPU的performance一般只能提高不到20%这个量级 为什么DDR带宽速度提高了用处不大?两个原因 1. CPU设计了各种架构去隐藏 DDR延迟,比如superscaler,加大发射宽度,用海量的ROB和register renaming来提高并行度隐藏延迟,一级缓存cache,二级缓存cache,削弱了DDR的带宽速度需求 2. CPU workload对DDR带宽要求并不高,大部分日常负载比如打开网页,DDR带宽是严重过剩的,甚至云端负载 也就是说,在CPU时代,DDR的带宽速度是不太有所谓的,DDR4和DDR5除了少数游戏就没啥差别,甚至JEDEC标准也进步缓慢。 另外,绝大部分app需要一直停留在DDR上的部分并不多,需要的时候从硬盘上调度到DDR即可,app的size增长没那么快,导致对DDR的容量需求也较为缓慢。 所以最近十年来,平均每台电脑上的DDR容量大概从7~8GB变成了23GB,十年只增长了3倍。 而这部分升级缓慢直接影响了营收,size容量计价是赚钱的主要方式,速度的提高只是技术升级,提高size的单价,这两个的升级需求都不大,需求主要是随着电脑/手机数量增长而增长 所以DRAM在带宽速度和容量这两个维度上,一直是都是芯片产业锦上添花性质的附属品,DDR升级带来的边际效用是很低的,跟CPU时代的最高KPI几乎没什么直接联系 -------------------------------------------- 而到了genAI 大模型为主导的新时代,计算范式转移让最高级KPI起了根本变化 GPU发展到AI推理的时代,不再像CPU那样只看跑分,最高级的KPI不再是算力TOPS/FLOPS,而是token的成本,特别是单位成本/单位电力下的overall token throuput 其次是token吞吐速度,因为在agent时代,很多任务变成了串行,token吞吐速度成了用户体验的重要瓶颈。 这也是为什么老黄发明AI工厂概念的原因:最低成本的输出最多token,同时尽量提高token吞吐速度 AI训练时代,老黄的经济学是TCO(total cost ownership),买的GPU越多,省的越多 而老黄在推理时代的token经济学是: AI推理的毛利润很可观,所以逻辑已经转换成:Nvidia GPU是这个世界上让token单价最便宜的GPU,买的GPU越多,赚的越多 最高的KPI变成了Pareto frontier曲线,在提高token 吞吐throughput和提高token速度两个维度上尽量优化 (见图一) NVIDIA 的 token factory 代际进步,其实是在把整条 Pareto frontier 往右上推,这就是是AI推理这个时代最重要的KPI ---------------------------------- 接下来是本文最重要的逻辑链,如何从token吞吐量指数型增长的本质出发,推导出天花板瓶颈在HBM size和HBM 带宽的指数型增长 单卡GPU推理单线程batch size = 1的时代,token吞吐只有一个维度,就是HBM的带宽速度,带宽速度越高,token吞吐越大 但进入NVL72的年代,推理不再是单卡GPU时代,而是72个GPU + 36个CPU整个系统级别的token工厂,把HBM带宽和算力用满,获得极致的token吞吐量 Token 吞吐throughput的增长,依赖两个东西:同时批处理的请求数 X 每个user请求的平均token速度 也就是batch size X per user token 速度 以Rubin NVL72为例,在平均token速度是100 token/s的情况下,同时批处理1920个请求,得到token吞吐量是19.2万token/s 一个Rubin NVL72大概是120KW(0.12MW)的功率,所以得到单位MW能处理1.6M token/s (见图一) 所以,我们需要想方设法提高这两个参数:批处理数量batch size和per user token的平均速度,这两者相乘就是我们的最高KPI,也就是token的吞吐量 ------- 第一个参数:batch size的增长,瓶颈在HBM size 批处理量里的每一个请求req,都会自带kv cache,这部分kv cache是需要存在HBM里的,大小大概在几个GB到数十GB不等 因为hot kv cache是随时需要高频高速读取,所以必须放在HBM里,比如一个大模型的层数是80层,那么每一个token的生成阶段,都需要读取80次HBM里的kv cache 随着批处理数量batch size的增长,会带来hot kv cache的线性增长 又因为这个批处理量的所有请求的hot kv cache,都要放在HBM上,这也就带来了HBM size必须要随着批处理量batch size线性增长 就像是机场接驳车,登机口尽量快的接旅客到飞机,HBM size小了,相当于接驳车size小了,就得多接一趟 结论是:批处理量的数量batch size,瓶颈依赖于HBM size的增长 --------- 第二个参数:每个user请求的平均token速度,瓶颈在HBM带宽 大模型decode阶段的速度,瓶颈取决于HBM的带宽速度,因为每生成一个 token,都要把激活的权重和kv cache 读很多遍 LPU的出现,在batch不那么大的情况下,把激活权重这个部分搬到了SRAM上,但是每生成一个 token仍然要从HBM读很多次KV cache。HBM带宽越高,生成每一个token的速度也就越快,基本上是线性对应的 就像是机场接驳车,登机口尽量快的接旅客到飞机,hbm本身带宽速度就像是接驳车的车门有多宽,门越宽,旅客上接驳车越快 GPU的其他配置,都是在适配batch的增长以及要让token compute的速度配平HBM的增长,甚至会用多余的算力来获得部分的带宽(比如部分带宽压缩技术) —----- 在那个接驳车的比喻例子里 接驳车的车厢大小 = HBM Size(容量): 决定了一次能装下多少名旅客(也就是能同时装下多少个请求的 KV Cache)。车厢越大,一次能拉载的旅客(Batch Size)就越多。如果车太小,想拉100个人就得分两趟,系统整体的吞吐量就上不去。 接驳车的车门宽度 = HBM Bandwidth(带宽): 决定了旅客上下车的速度。门越宽,大家呼啦啦一下全上去了(Decode/生成Token的速度极快)。如果门很窄,哪怕车厢巨大能装200人,大家也得排着队一个一个挤上去,全耗在上下车的时间里了。 旅客的吞吐量 = 接驳车车厢容量 x 接驳车旅客上车速度(车门宽度) —--------------------------- 至此,我们从逻辑上推演出了token经济学的硬件需求第一性原理: Token throughput = HBM size X HBM Bandwidth AI推理这个时代的最高KPI,实际上是高度依赖于HBM的两个维度的进步的 如果要维持token throuput每一代两倍的增长,实际上意味着,每一代的单GPU上,HBM size X HBM BW带宽之积要增长两倍! 这也是历史上第一次,HBM内存的size可以影响最高的KPI token throughput! 要验证这个理论,可以把Nvidia从A100到Rubin Ultra这几代的token 吞吐throughput,和HBM size X HBM BW 放在同一个图里比较 (见图二) 可以发现,这两个曲线的走势在对数轴上惊人的一致 HBM size x HBM带宽增长的甚至要比token吞吐量更快,毕竟HBM决定的是天花板,实际上这个天花板增长的利用率utilization是很难达到100%的,也就是说,HBM size x HBM 带宽就算增长1000倍,其他算力和架构的配合下,很难把这1000倍的天花板潜力全部榨干 这条曲线不是巧合,而是系统最优化的必然解 throughput = batch × Bandwidth,这就是token factory 经济学最绕不开的第一性原理 —-------- 软件的影响呢?软件的优化会不会降低带宽的需求?降低HBM的需求? 这跟硬件是独立两个维度的,这好像在问,如果CPU上的软件优化了之后跑的更快,是不是CPU就十年不用发展了?反正软件跑的更快了嘛 这样的话,CPU厂还能赚得到钱吗?CPU想要存活下去,只有一条路可走,在标准benchmark,不考虑软件优化,每一代CPU必须要跑分更高,不然就卖不出去 GPU也是一样,软件优化如何,和自己的token吞吐量KPI每年都要大幅进步,是两回事 只要token的需求继续增长,对token throuput的追求就绝不会停止,那么对HBM size X HBM 带宽的追求也不会停止 如果HBM size和HBM 带宽发展慢了,老黄一定会亲自到御三家逼着他们技术升级,因为这就是老黄gpu的天花板,天花板要是钉死了不进步,老黄的GPU还能卖出去吗? 当然了,Nvidia需要绞尽脑汁去从异构计算的架构角度榨取HBM天花板之外的部分,比如LPU就是一个很好的尝试,把Pareto frontier从另一个角度改善了很多 (右半边高token速度的部分) —-------------------------------------- HBM内存已然告别了那个随波逐流的旧时代,在这条由指数级需求铺就的单行道上,以一种近乎宿命的方式走到了产业史诗的主舞台中央 推理范式第一性原理演化到这一步,只要老黄还要卖GPU,HBM就必须翻倍,而且必须代代翻倍。这是supply side的内生压力,与AI需求无关,与宏观周期无关,与hyperscaler的心情也无关 剩下的问题,只有一个: 当需求被物理锁定为指数增长的时候,供给侧的三个玩家,会不会还像过去三十年那样,亲手把自己再拖回一次周期的泥潭?
显示更多
0
58
992
298
转发到社区
今日は念願の先生にセカンドオピニオンうけてきました! 手術と治療方針は主治医の先生と同じ意見だったので頑張れそうです! そうそう!昨日は雨の中、目黒のお寺巡りをしました😊✨ 9月にお世話になる蟠龍寺様の御朱印もいただいて来ました!!
显示更多
【告知】ADMA vol.2【TT公開‼️】 12/13(土) 14:00-19:00 📍CROSS ROPPONGI(未成年OK) ついにタイムテーブル公開‼️ 私が珍しくオープニングDJで、 意外な一面をみんなにお届けするよ❤️ さらに… 🥃“コカインウォッカ” をショットガールとして参戦‼️ ㊗️VIP席満員御礼 👗コスプレ参加大歓迎 🎫 早割&コスプレ参加はめちゃお得! コスプレ参加表明は 【 #ADMAコスプレ# 】で投稿してね📸✨ ツイプラはこちら⬇️ #ADMA#
显示更多
🤍御社のオフショット🖤 #永島聖羅# さんのオフショット💔 新に貰った"特製"星羅人形⁉と一緒に🧸 秘書にちょっと意地悪な県議会議員は どんな裁きを受けるのか!?😱 まだ観ていない方はTVerで! 【#御社の乱れ正します!2】# 第9話は11月27日(木)よる11時⚡️ #御社不倫#
显示更多
0
2
169
18
转发到社区