注册并分享邀请链接,可获得视频播放与邀请奖励。

与「錦木千束」相关的搜索结果

錦木千束 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 錦木千束 的内容
#LycorisRecoil# リコリス・リコイル #cosplay# 錦木 千束@MMMenmentan 井ノ上 たきな tomoyo酱 📸@CcLost3
0
3
343
53
转发到社区
推特私訊功能開啟 有Patreon/寫真/工商合作相關 可以私訊詢問 謝謝大家💕 #リコリス# #錦木千束# #コスプレ#
0
7
404
19
转发到社区
国内各大企业家蹭马斯克合影, 让马斯克似乎感觉中国变了。 他一直在找一个人,杰克马。 他很奇怪这位会英语、从容自信的中国首富怎么突然不见了。 我们何尝不是? 川普再度访华,2017年到现在,也就9年。 那年,腾讯和阿里跻身全球市值前十的行列。 华为手机出货量达到1.53亿台,全球第二,超过苹果,逼近三星。 那一年,也是马云最意气风发的一年。 他像武侠小说里的风清扬——自由、张扬、无所不能。 砸900亿搞新零售。 到处演讲,会见各国元首,从容不迫。 主演《功守道》,跟李连杰、甄子丹、吴京对打。 还和王菲合唱《风清扬》。 那时的企业家,身上真有一种"时代主角"的感觉。 许家印财富一年翻四倍,首次成为中国首富。 李彦宏All in AI。 董明珠说华为手机第一格力第二。 就连跑路的贾跃亭,都自信地说"下周就回"。 后来很多人会说,2017年其实是中国互联网黄金时代最后的高潮。 那时的人们,真的相信技术、资本与全球化会永远向前。 2017年底,乌镇世界互联网大会召开。 丁磊组织"东半球最强饭局"。 之后又有刘强东、王兴组织"东兴局"。 饭桌上坐着中国互联网最有权势的一群人。 他们讨论的不只是赚钱,而是未来。 他们那时真觉得,未来在自己手里。 ------- 今天很多年轻人已经忘了, 当时这种"大国叙事"有多强。 你打开电视,是港珠澳大桥。 打开手机,是国产航母下水。 刷微博,是C919首飞。 连综艺和广告,都在讲"中国速度"、"中国奇迹"。 那年,中国首艘国产航母下水。 "一带一路"首届高峰论坛召开。雄安新区设立。 "人类命运共同体"被反复提及。 建军90周年阅兵。 香港回归20周年。 十九大召开。 所有新闻都带着一种历史车轮滚滚向前的气息。 经济学家林毅夫当时预测:到2030年,中国将超过美国成为世界第一大经济体。 今天看,你会觉得这个预测有点乐观。 但在2017年,很多人真信。 自信的人们 但回头看,会有一种奇怪的感觉:那仿佛已经不是同一个时代了。 ------------ 这9年里发生了太多事。 贸易战、疫情、俄乌战争、AI革命、房地产下行、互联网退潮、全球化收缩……世界像被人拧过一遍。 很多当年坚信不疑的东西,现在都变得模糊;很多当年热气腾腾的人和行业,现在已经沉默。 所以,当人们重新翻出2017年特朗普访华的视频时,会有一种强烈的时代感。 那真的是一个"烈火烹油、鲜花着锦"的年份。 那年11月8日,特朗普抵达北京。 很多年后,他仍在不断回味那次访问。 中国的"上升感" 他说,中国仪仗队是他见过最整齐的,"他们身高几乎完全一样,差距不到四分之一英寸"。 特朗普是一个极度重视排场、礼仪与个人感受的人。 你很少见他认真赞美什么,但他后来多次提到那次中国之行。 因为他确实被震撼了。 飞机刚落地,他就被直接带去了故宫。 不是普通参观,是包场。 整个故宫,在夜色里只为特朗普夫妇开放。 红墙、金瓦、宫灯、京剧、文物、长长的御道,像一个文明古国把自己的藏宝阁掀开了一角。 ------- 特朗普后来反复提到一句话:"从没人得到过这样的待遇。"他是真的信。 因为美国总统访问别国,一般是进会议室、住酒店、签文件。 很少有人会直接把五百年帝国的中轴线打开给他看。 而2017年的中国,也确实有一种"终于轮到我出场"的心态。那种感觉,就像是一个练了二十年武功、终于下山的少年。 今天再回头看2017年的新闻,会发现一种扑面而来的自信。 那一年春节,央视《新闻联播》推出特别节目——《厉害了,我的国》。 这个词后来直接变成了年度热词。 紧接着,央视财经开始做纪录片《厉害了,我的国》,向全国征集"百姓眼中的中国成就"; 之后又连续播放《辉煌中国》、《大国外交》、《超级工程》。 2017年的中国人,是真的相信"东升西降"已经开始了。 《战狼2》与那个时代 2017年,还有一件特别重要的事:《战狼2》。 今天很多人已经习惯了"战狼"这个词,甚至带点调侃意味。 但在2017年,《战狼2》不是调侃,它是情绪。 它最后拿了56.95亿票房,长期位居中国影史第一。 真正让它成为现象级的,其实不是动作戏,而是片尾那行字幕:"当你在海外遭遇危险,不要放弃!请记住,在你身后,有一个强大的祖国!" 那一刻,很多中国观众是真的热血沸腾。 因为过去几十年,中国人太习惯"落后挨打"的叙事了。 突然之间,电影里中国护照能救命了。 这种心理变化,非常巨大。 《战狼1》里的"犯我中华者虽远必诛",再到《湄公河行动》,再到海外撤侨、亚丁湾护航,这些真实事件和影视作品混合在一起,共同构成了2017年的强国想象。 那年电视剧《人民的名义》火得离谱。 年轻人一边吐槽"达康书记GDP第一",一边追反腐剧。 今天已经很难想象,一部主旋律电视剧能变成全民流行文化。 但2017年就是这样。 整个社会都处于一种"国家正在变强,而我也参与其中"的兴奋感里。 周杰伦演唱会叫"地表最强"。 范冰冰和李晨对未来也是信心满满,所以宣布"求婚成功"。 大家真觉得,好日子还在后头。 当然,中国男足还是没进2018年俄罗斯世界杯。 有些东西,确实稳定。 世界转向 关于那一年特朗普访华,美方很多高官、幕僚,都写了回忆录。 里面有很多有意思的细节。 比如,有人提到,中方在会谈中不断讲自己的长期规划:产业升级、科技发展、未来目标、合作愿景。 但特朗普其实不太感兴趣。 -------- 他最感兴趣的有两件事: 第一,3000多亿美元的大单; 第二,对他个人的超规格接待。 特朗普是一个非常"具体"的人。他对宏大叙事兴趣有限。 但他对排场、数字、交易、赢,非常敏感。 后来随行人员透露,特朗普对中国国宴印象极深,尤其是中式摆盘与大型宴会组织效率。 他无法理解,为什么几百人的国宴能像机器一样精准运转。 特朗普外孙女唱中文歌的视频,当时被反复传播。特朗普本人特别喜欢这个桥段,经常提起。 因为这让他感觉自己"跟中国关系很好"。 特朗普甚至说,与中国的问题,不怪中国,怪以前的总统。 而2017年的中国,也愿意展示这种友好。因为那时候,中美关系虽然已经有竞争苗头,但整体仍处于"斗而不破"的阶段。 甚至很多中国人当时觉得,特朗普虽然不靠谱,但未必比传统美国政客更坏。 因为他至少"讲交易"。 不像后来那样彻底撕裂。 ------------- 但历史很快转向。 特朗普访华没几个月,中美贸易战开始。 美国开始针对"中国制造2025"。 开始限制高科技出口。开始强调产业链安全。 后来很多分析认为,美国之所以反应如此激烈,一个重要原因,就是中国在2017年前后表现出的那种"高技术崛起"趋势,以及"厉害了我的国"的宣传。 那时候的美国,已经意识到,中国不只是"世界工厂"了,而是在向产业链上游走。 芯片、5G、AI、高端制造、新能源、航天……中国开始全面进入美国最敏感的领域。 而与此同时,特朗普上任后的美国,则不断"退群"。 退出TPP。 退出巴黎协定。 退出联合国教科文组织。 整个美国社会都弥漫着一种疲惫与撕裂。 如果用武侠来比喻。 2017年的中国,像一个刚闯入江湖、准备重塑武林规则的少年。 而美国,则像一个已经称霸江湖几十年、开始对世界失去耐心的老盟主。 于是,冲突几乎不可避免。 因为真正的大国竞争,从来不是意识形态,而是产业、科技、资本与未来。 ---------- 凡是过往 2017年的人们,并不知道后面会发生什么。 没人知道新冠。 没人知道房地产会调整。 没人知道互联网会降温。 没人知道AI会重新洗牌。 没人知道全球化会开始倒车。 所以今天回头看2017,会有一种特殊的感伤。 那是一种"后来的人,重新看旧照片"的感伤。 照片里的人在笑,但你知道后面会发生什么。 现在特朗普"前度特郎今又来"。 中国也已经不是那个青春少年。 这些年经历了太多事,双方都成熟了很多,也都疲惫了很多。 今天再谈中美,以及我们个人, 已经少了2017年的激情, 不再那么意气风发, 也不再那么轻信未来一定线性向上的投资, 兄弟们都多了一份沉稳。。。
显示更多
0
52
237
49
转发到社区
AI半导体终局推演2026(I) 当新token经济学范式从GPU算力转移到HBM 本文从从GPU架构进化路线本质出发,解释这个市场长久以来担心的问题: 每个GPU的HBM内存需求为什么一定会是指数增长,为什么HBM需求指数增长不会停滞? 并推导token经济学在当前架构下第一性原理:token吞吐 = HBM size X HBM BW带宽 同时讨论了,为什么GPU的天花板被HBM的两个发展维度所决定 HBM周期性这个话题争议一直很大,乐观派认为AI带来的需求比以前要大的多,但市场主流仍然认为前几次上升周期也有需求每年20%+增长,这次又有什么不一样呢?AI不影响HBM和传统DRAM一样有commodity属性,一旦在需求顶峰扩产遇上需求下行又会重蹈覆辙。 我们可以从算力芯片架构视角,从第一性原理出发,来拆解和推演一下这个问题:为什么这次真的不一样 ------------------------------- 历史:CPU算力时代 很久以来,我们都处在CPU主导算力的时代,CPU的最高级KPI就是performance,跑的更快,所以每一代的CPU都用各种方法来提高跑分,最开始是频率上升,后来是架构演进superscaler等等 这个时候为什么DDR不需要很快的技术进步速度?比如DDR3到DDR5竟然经历了15年之久 因为这个时期的DDR的角色是纯粹的辅助,而且辅助功能极弱,以业界经验,DDR的速度即便是提高一倍,CPU的performance一般只能提高不到20%这个量级 为什么DDR带宽速度提高了用处不大?两个原因 1. CPU设计了各种架构去隐藏 DDR延迟,比如superscaler,加大发射宽度,用海量的ROB和register renaming来提高并行度隐藏延迟,一级缓存cache,二级缓存cache,削弱了DDR的带宽速度需求 2. CPU workload对DDR带宽要求并不高,大部分日常负载比如打开网页,DDR带宽是严重过剩的,甚至云端负载 也就是说,在CPU时代,DDR的带宽速度是不太有所谓的,DDR4和DDR5除了少数游戏就没啥差别,甚至JEDEC标准也进步缓慢。 另外,绝大部分app需要一直停留在DDR上的部分并不多,需要的时候从硬盘上调度到DDR即可,app的size增长没那么快,导致对DDR的容量需求也较为缓慢。 所以最近十年来,平均每台电脑上的DDR容量大概从7~8GB变成了23GB,十年只增长了3倍。 而这部分升级缓慢直接影响了营收,size容量计价是赚钱的主要方式,速度的提高只是技术升级,提高size的单价,这两个的升级需求都不大,需求主要是随着电脑/手机数量增长而增长 所以DRAM在带宽速度和容量这两个维度上,一直是都是芯片产业锦上添花性质的附属品,DDR升级带来的边际效用是很低的,跟CPU时代的最高KPI几乎没什么直接联系 -------------------------------------------- 而到了genAI 大模型为主导的新时代,计算范式转移让最高级KPI起了根本变化 GPU发展到AI推理的时代,不再像CPU那样只看跑分,最高级的KPI不再是算力TOPS/FLOPS,而是token的成本,特别是单位成本/单位电力下的overall token throuput 其次是token吞吐速度,因为在agent时代,很多任务变成了串行,token吞吐速度成了用户体验的重要瓶颈。 这也是为什么老黄发明AI工厂概念的原因:最低成本的输出最多token,同时尽量提高token吞吐速度 AI训练时代,老黄的经济学是TCO(total cost ownership),买的GPU越多,省的越多 而老黄在推理时代的token经济学是: AI推理的毛利润很可观,所以逻辑已经转换成:Nvidia GPU是这个世界上让token单价最便宜的GPU,买的GPU越多,赚的越多 最高的KPI变成了Pareto frontier曲线,在提高token 吞吐throughput和提高token速度两个维度上尽量优化 (见图一) NVIDIA 的 token factory 代际进步,其实是在把整条 Pareto frontier 往右上推,这就是是AI推理这个时代最重要的KPI ---------------------------------- 接下来是本文最重要的逻辑链,如何从token吞吐量指数型增长的本质出发,推导出天花板瓶颈在HBM size和HBM 带宽的指数型增长 单卡GPU推理单线程batch size = 1的时代,token吞吐只有一个维度,就是HBM的带宽速度,带宽速度越高,token吞吐越大 但进入NVL72的年代,推理不再是单卡GPU时代,而是72个GPU + 36个CPU整个系统级别的token工厂,把HBM带宽和算力用满,获得极致的token吞吐量 Token 吞吐throughput的增长,依赖两个东西:同时批处理的请求数 X 每个user请求的平均token速度 也就是batch size X per user token 速度 以Rubin NVL72为例,在平均token速度是100 token/s的情况下,同时批处理1920个请求,得到token吞吐量是19.2万token/s 一个Rubin NVL72大概是120KW(0.12MW)的功率,所以得到单位MW能处理1.6M token/s (见图一) 所以,我们需要想方设法提高这两个参数:批处理数量batch size和per user token的平均速度,这两者相乘就是我们的最高KPI,也就是token的吞吐量 ------- 第一个参数:batch size的增长,瓶颈在HBM size 批处理量里的每一个请求req,都会自带kv cache,这部分kv cache是需要存在HBM里的,大小大概在几个GB到数十GB不等 因为hot kv cache是随时需要高频高速读取,所以必须放在HBM里,比如一个大模型的层数是80层,那么每一个token的生成阶段,都需要读取80次HBM里的kv cache 随着批处理数量batch size的增长,会带来hot kv cache的线性增长 又因为这个批处理量的所有请求的hot kv cache,都要放在HBM上,这也就带来了HBM size必须要随着批处理量batch size线性增长 就像是机场接驳车,登机口尽量快的接旅客到飞机,HBM size小了,相当于接驳车size小了,就得多接一趟 结论是:批处理量的数量batch size,瓶颈依赖于HBM size的增长 --------- 第二个参数:每个user请求的平均token速度,瓶颈在HBM带宽 大模型decode阶段的速度,瓶颈取决于HBM的带宽速度,因为每生成一个 token,都要把激活的权重和kv cache 读很多遍 LPU的出现,在batch不那么大的情况下,把激活权重这个部分搬到了SRAM上,但是每生成一个 token仍然要从HBM读很多次KV cache。HBM带宽越高,生成每一个token的速度也就越快,基本上是线性对应的 就像是机场接驳车,登机口尽量快的接旅客到飞机,hbm本身带宽速度就像是接驳车的车门有多宽,门越宽,旅客上接驳车越快 GPU的其他配置,都是在适配batch的增长以及要让token compute的速度配平HBM的增长,甚至会用多余的算力来获得部分的带宽(比如部分带宽压缩技术) —----- 在那个接驳车的比喻例子里 接驳车的车厢大小 = HBM Size(容量): 决定了一次能装下多少名旅客(也就是能同时装下多少个请求的 KV Cache)。车厢越大,一次能拉载的旅客(Batch Size)就越多。如果车太小,想拉100个人就得分两趟,系统整体的吞吐量就上不去。 接驳车的车门宽度 = HBM Bandwidth(带宽): 决定了旅客上下车的速度。门越宽,大家呼啦啦一下全上去了(Decode/生成Token的速度极快)。如果门很窄,哪怕车厢巨大能装200人,大家也得排着队一个一个挤上去,全耗在上下车的时间里了。 旅客的吞吐量 = 接驳车车厢容量 x 接驳车旅客上车速度(车门宽度) —--------------------------- 至此,我们从逻辑上推演出了token经济学的硬件需求第一性原理: Token throughput = HBM size X HBM Bandwidth AI推理这个时代的最高KPI,实际上是高度依赖于HBM的两个维度的进步的 如果要维持token throuput每一代两倍的增长,实际上意味着,每一代的单GPU上,HBM size X HBM BW带宽之积要增长两倍! 这也是历史上第一次,HBM内存的size可以影响最高的KPI token throughput! 要验证这个理论,可以把Nvidia从A100到Rubin Ultra这几代的token 吞吐throughput,和HBM size X HBM BW 放在同一个图里比较 (见图二) 可以发现,这两个曲线的走势在对数轴上惊人的一致 HBM size x HBM带宽增长的甚至要比token吞吐量更快,毕竟HBM决定的是天花板,实际上这个天花板增长的利用率utilization是很难达到100%的,也就是说,HBM size x HBM 带宽就算增长1000倍,其他算力和架构的配合下,很难把这1000倍的天花板潜力全部榨干 这条曲线不是巧合,而是系统最优化的必然解 throughput = batch × Bandwidth,这就是token factory 经济学最绕不开的第一性原理 —-------- 软件的影响呢?软件的优化会不会降低带宽的需求?降低HBM的需求? 这跟硬件是独立两个维度的,这好像在问,如果CPU上的软件优化了之后跑的更快,是不是CPU就十年不用发展了?反正软件跑的更快了嘛 这样的话,CPU厂还能赚得到钱吗?CPU想要存活下去,只有一条路可走,在标准benchmark,不考虑软件优化,每一代CPU必须要跑分更高,不然就卖不出去 GPU也是一样,软件优化如何,和自己的token吞吐量KPI每年都要大幅进步,是两回事 只要token的需求继续增长,对token throuput的追求就绝不会停止,那么对HBM size X HBM 带宽的追求也不会停止 如果HBM size和HBM 带宽发展慢了,老黄一定会亲自到御三家逼着他们技术升级,因为这就是老黄gpu的天花板,天花板要是钉死了不进步,老黄的GPU还能卖出去吗? 当然了,Nvidia需要绞尽脑汁去从异构计算的架构角度榨取HBM天花板之外的部分,比如LPU就是一个很好的尝试,把Pareto frontier从另一个角度改善了很多 (右半边高token速度的部分) —-------------------------------------- HBM内存已然告别了那个随波逐流的旧时代,在这条由指数级需求铺就的单行道上,以一种近乎宿命的方式走到了产业史诗的主舞台中央 推理范式第一性原理演化到这一步,只要老黄还要卖GPU,HBM就必须翻倍,而且必须代代翻倍。这是supply side的内生压力,与AI需求无关,与宏观周期无关,与hyperscaler的心情也无关 剩下的问题,只有一个: 当需求被物理锁定为指数增长的时候,供给侧的三个玩家,会不会还像过去三十年那样,亲手把自己再拖回一次周期的泥潭?
显示更多
0
58
992
298
转发到社区
赤壁烽火,照紅了小喬撥動的琴弦 大喬的錦囊裡,藏著顛覆戰局的奇謀 這亂世裡,最動人的風景 是我能在你身邊,一起出征江山🏹✨ 來分享一款不一樣的三國題材遊戲~【三國獵艷史】🌸 美人與戰場同行,浪漫與策略並存💋 一起闖蕩這個充滿故事的三國世界吧! 🔗: 📣 QQ遊戲攻略群:784819656、788787517 @WuMing0514 @masobu_game
显示更多
0
6
1.1K
54
转发到社区