注册并分享邀请链接,可获得视频播放与邀请奖励。

与「上车舞」相关的搜索结果

上车舞 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 上车舞 的内容
李珠珢的“上车舞”直拍杀疯了!谁能拒绝这||家人们!李珠珢这段棒球场上的直拍,我真的循环了N遍 #李珠珢# #上车舞#
0
0
114
3
转发到社区
✍️抓住主线就是简单模式(美股篇) 有一说一,我觉得其实美股或者说最近整个市场上所有正常的股票市场,都挺简单的,你说回调也回调吧,但是大势还是一路向上,不影响主干。 🌟大方向是AI 这么长时间的美股或者说日韩股市拉盘,归根结底都是AI革命带来的。 所以主线路就是AI,完全跟着AI走,基本上就没有错误的。 所有的回调都是为了杀杠杆,在最后一波暴跌之前的所有回调都是上车的机会。 都炒币这么多年了,大家应该都知道的,顶只有一次,底也只有一次,你就这么相信自己能买到? 🌟AI的大方向就是存储 主干找到了,就开始一个个找支流了,毕竟简简单单就是那么容易的说出来。 毕竟说比做简单,不然那么多人当分析师,不都去当交易员了? 这都是牛总告诉我的,除非存储崩盘了,不然任何时候买存储都等于抄底。 反正担心了就卖一点,跌多了买一点,永远在车上就行了。 毕竟天天吹那些涨的多的不会死的,一死了就大家全死了,就好像上周一样😂。 🌟AI周边是附带的旋律 最近炒AI,从存储在到光然后到MLCC在到玻璃,全产业带动。 基本上反正你跟着都行。 芯片+内存大方向,乱七八糟的跟着一大堆,只要大哥没出事,全体一起舞起来。 上周 $AVGO 一个财报,直接全体地震,一堆兄弟们开的杠杆都没了😮‍💨。 但是周五开始黄仁勋开始喊单,周末就把整个半导体+存储拉起来了,直到现在,周一周二的夜盘,基本上开始要把周五的跌幅收回了。 继续舞动乾坤了。 相信哥,跟着老师炒一样的,大多数时间都是开心的,只有崩盘得时候难受,万一老师教你开杠杆,那你可能大多数时候都是不开心的。
显示更多
我发现最近没有活在股市焦虑里的人是幸福的,因为最难受的应该是那些看着狂暴牛市一直涨而没有上车的人。 他们不是没有能力上车,有券商账户,手头也有点小钱,也有渠道能看到外边在发生什么,但就是因为各种原因错过了。 就像一趟高铁🚄从眼前开过,你眼睁睁的看着隔壁老王,手下intern,甚至一直看不起没有你优秀的初中同学,都狗屎运的上了车。 有很多人压根连高铁站在哪里都不知道,也没钱买票,所以心里根本毫无波澜。 但你不一样,你隔着车窗看着他们因为横财砸的失去面部表情控制的脸,手舞足蹈的计划要怎么使用这笔横财,额头的青筋猛跳。 每个夜晚你都在愤怒和后悔中难以入眠,好不容易睡着了又在"凭什么!老子之前可比你们有钱多了"的大喊中迷迷糊糊的醒来。 "应该暴跌了吧,tmd连商K的鸡🐔都在赚钱了啊,这必须是fomo了啊。快点暴跌,让那帮人还嘚瑟,我不赚钱你们也不应该这么发财啊! 让车开回来,这次我一定梭哈!😂😂😂 ~~~~~~~~~~~~~ 这波科技革命的财富转移太猛烈了,很多原本同一阶层的人财富拉开代际差距只在过去这么短短的几个月里。 让我想到了曾经的中国房市,BTC引领的加密浪潮。 还好这场🫧还没结束,好好游泳🏊🏻‍♂️
显示更多
0
37
27
0
转发到社区
AI半导体终局推演2026(I) 当新token经济学范式从GPU算力转移到HBM 本文从从GPU架构进化路线本质出发,解释这个市场长久以来担心的问题: 每个GPU的HBM内存需求为什么一定会是指数增长,为什么HBM需求指数增长不会停滞? 并推导token经济学在当前架构下第一性原理:token吞吐 = HBM size X HBM BW带宽 同时讨论了,为什么GPU的天花板被HBM的两个发展维度所决定 HBM周期性这个话题争议一直很大,乐观派认为AI带来的需求比以前要大的多,但市场主流仍然认为前几次上升周期也有需求每年20%+增长,这次又有什么不一样呢?AI不影响HBM和传统DRAM一样有commodity属性,一旦在需求顶峰扩产遇上需求下行又会重蹈覆辙。 我们可以从算力芯片架构视角,从第一性原理出发,来拆解和推演一下这个问题:为什么这次真的不一样 ------------------------------- 历史:CPU算力时代 很久以来,我们都处在CPU主导算力的时代,CPU的最高级KPI就是performance,跑的更快,所以每一代的CPU都用各种方法来提高跑分,最开始是频率上升,后来是架构演进superscaler等等 这个时候为什么DDR不需要很快的技术进步速度?比如DDR3到DDR5竟然经历了15年之久 因为这个时期的DDR的角色是纯粹的辅助,而且辅助功能极弱,以业界经验,DDR的速度即便是提高一倍,CPU的performance一般只能提高不到20%这个量级 为什么DDR带宽速度提高了用处不大?两个原因 1. CPU设计了各种架构去隐藏 DDR延迟,比如superscaler,加大发射宽度,用海量的ROB和register renaming来提高并行度隐藏延迟,一级缓存cache,二级缓存cache,削弱了DDR的带宽速度需求 2. CPU workload对DDR带宽要求并不高,大部分日常负载比如打开网页,DDR带宽是严重过剩的,甚至云端负载 也就是说,在CPU时代,DDR的带宽速度是不太有所谓的,DDR4和DDR5除了少数游戏就没啥差别,甚至JEDEC标准也进步缓慢。 另外,绝大部分app需要一直停留在DDR上的部分并不多,需要的时候从硬盘上调度到DDR即可,app的size增长没那么快,导致对DDR的容量需求也较为缓慢。 所以最近十年来,平均每台电脑上的DDR容量大概从7~8GB变成了23GB,十年只增长了3倍。 而这部分升级缓慢直接影响了营收,size容量计价是赚钱的主要方式,速度的提高只是技术升级,提高size的单价,这两个的升级需求都不大,需求主要是随着电脑/手机数量增长而增长 所以DRAM在带宽速度和容量这两个维度上,一直是都是芯片产业锦上添花性质的附属品,DDR升级带来的边际效用是很低的,跟CPU时代的最高KPI几乎没什么直接联系 -------------------------------------------- 而到了genAI 大模型为主导的新时代,计算范式转移让最高级KPI起了根本变化 GPU发展到AI推理的时代,不再像CPU那样只看跑分,最高级的KPI不再是算力TOPS/FLOPS,而是token的成本,特别是单位成本/单位电力下的overall token throuput 其次是token吞吐速度,因为在agent时代,很多任务变成了串行,token吞吐速度成了用户体验的重要瓶颈。 这也是为什么老黄发明AI工厂概念的原因:最低成本的输出最多token,同时尽量提高token吞吐速度 AI训练时代,老黄的经济学是TCO(total cost ownership),买的GPU越多,省的越多 而老黄在推理时代的token经济学是: AI推理的毛利润很可观,所以逻辑已经转换成:Nvidia GPU是这个世界上让token单价最便宜的GPU,买的GPU越多,赚的越多 最高的KPI变成了Pareto frontier曲线,在提高token 吞吐throughput和提高token速度两个维度上尽量优化 (见图一) NVIDIA 的 token factory 代际进步,其实是在把整条 Pareto frontier 往右上推,这就是是AI推理这个时代最重要的KPI ---------------------------------- 接下来是本文最重要的逻辑链,如何从token吞吐量指数型增长的本质出发,推导出天花板瓶颈在HBM size和HBM 带宽的指数型增长 单卡GPU推理单线程batch size = 1的时代,token吞吐只有一个维度,就是HBM的带宽速度,带宽速度越高,token吞吐越大 但进入NVL72的年代,推理不再是单卡GPU时代,而是72个GPU + 36个CPU整个系统级别的token工厂,把HBM带宽和算力用满,获得极致的token吞吐量 Token 吞吐throughput的增长,依赖两个东西:同时批处理的请求数 X 每个user请求的平均token速度 也就是batch size X per user token 速度 以Rubin NVL72为例,在平均token速度是100 token/s的情况下,同时批处理1920个请求,得到token吞吐量是19.2万token/s 一个Rubin NVL72大概是120KW(0.12MW)的功率,所以得到单位MW能处理1.6M token/s (见图一) 所以,我们需要想方设法提高这两个参数:批处理数量batch size和per user token的平均速度,这两者相乘就是我们的最高KPI,也就是token的吞吐量 ------- 第一个参数:batch size的增长,瓶颈在HBM size 批处理量里的每一个请求req,都会自带kv cache,这部分kv cache是需要存在HBM里的,大小大概在几个GB到数十GB不等 因为hot kv cache是随时需要高频高速读取,所以必须放在HBM里,比如一个大模型的层数是80层,那么每一个token的生成阶段,都需要读取80次HBM里的kv cache 随着批处理数量batch size的增长,会带来hot kv cache的线性增长 又因为这个批处理量的所有请求的hot kv cache,都要放在HBM上,这也就带来了HBM size必须要随着批处理量batch size线性增长 就像是机场接驳车,登机口尽量快的接旅客到飞机,HBM size小了,相当于接驳车size小了,就得多接一趟 结论是:批处理量的数量batch size,瓶颈依赖于HBM size的增长 --------- 第二个参数:每个user请求的平均token速度,瓶颈在HBM带宽 大模型decode阶段的速度,瓶颈取决于HBM的带宽速度,因为每生成一个 token,都要把激活的权重和kv cache 读很多遍 LPU的出现,在batch不那么大的情况下,把激活权重这个部分搬到了SRAM上,但是每生成一个 token仍然要从HBM读很多次KV cache。HBM带宽越高,生成每一个token的速度也就越快,基本上是线性对应的 就像是机场接驳车,登机口尽量快的接旅客到飞机,hbm本身带宽速度就像是接驳车的车门有多宽,门越宽,旅客上接驳车越快 GPU的其他配置,都是在适配batch的增长以及要让token compute的速度配平HBM的增长,甚至会用多余的算力来获得部分的带宽(比如部分带宽压缩技术) —----- 在那个接驳车的比喻例子里 接驳车的车厢大小 = HBM Size(容量): 决定了一次能装下多少名旅客(也就是能同时装下多少个请求的 KV Cache)。车厢越大,一次能拉载的旅客(Batch Size)就越多。如果车太小,想拉100个人就得分两趟,系统整体的吞吐量就上不去。 接驳车的车门宽度 = HBM Bandwidth(带宽): 决定了旅客上下车的速度。门越宽,大家呼啦啦一下全上去了(Decode/生成Token的速度极快)。如果门很窄,哪怕车厢巨大能装200人,大家也得排着队一个一个挤上去,全耗在上下车的时间里了。 旅客的吞吐量 = 接驳车车厢容量 x 接驳车旅客上车速度(车门宽度) —--------------------------- 至此,我们从逻辑上推演出了token经济学的硬件需求第一性原理: Token throughput = HBM size X HBM Bandwidth AI推理这个时代的最高KPI,实际上是高度依赖于HBM的两个维度的进步的 如果要维持token throuput每一代两倍的增长,实际上意味着,每一代的单GPU上,HBM size X HBM BW带宽之积要增长两倍! 这也是历史上第一次,HBM内存的size可以影响最高的KPI token throughput! 要验证这个理论,可以把Nvidia从A100到Rubin Ultra这几代的token 吞吐throughput,和HBM size X HBM BW 放在同一个图里比较 (见图二) 可以发现,这两个曲线的走势在对数轴上惊人的一致 HBM size x HBM带宽增长的甚至要比token吞吐量更快,毕竟HBM决定的是天花板,实际上这个天花板增长的利用率utilization是很难达到100%的,也就是说,HBM size x HBM 带宽就算增长1000倍,其他算力和架构的配合下,很难把这1000倍的天花板潜力全部榨干 这条曲线不是巧合,而是系统最优化的必然解 throughput = batch × Bandwidth,这就是token factory 经济学最绕不开的第一性原理 —-------- 软件的影响呢?软件的优化会不会降低带宽的需求?降低HBM的需求? 这跟硬件是独立两个维度的,这好像在问,如果CPU上的软件优化了之后跑的更快,是不是CPU就十年不用发展了?反正软件跑的更快了嘛 这样的话,CPU厂还能赚得到钱吗?CPU想要存活下去,只有一条路可走,在标准benchmark,不考虑软件优化,每一代CPU必须要跑分更高,不然就卖不出去 GPU也是一样,软件优化如何,和自己的token吞吐量KPI每年都要大幅进步,是两回事 只要token的需求继续增长,对token throuput的追求就绝不会停止,那么对HBM size X HBM 带宽的追求也不会停止 如果HBM size和HBM 带宽发展慢了,老黄一定会亲自到御三家逼着他们技术升级,因为这就是老黄gpu的天花板,天花板要是钉死了不进步,老黄的GPU还能卖出去吗? 当然了,Nvidia需要绞尽脑汁去从异构计算的架构角度榨取HBM天花板之外的部分,比如LPU就是一个很好的尝试,把Pareto frontier从另一个角度改善了很多 (右半边高token速度的部分) —-------------------------------------- HBM内存已然告别了那个随波逐流的旧时代,在这条由指数级需求铺就的单行道上,以一种近乎宿命的方式走到了产业史诗的主舞台中央 推理范式第一性原理演化到这一步,只要老黄还要卖GPU,HBM就必须翻倍,而且必须代代翻倍。这是supply side的内生压力,与AI需求无关,与宏观周期无关,与hyperscaler的心情也无关 剩下的问题,只有一个: 当需求被物理锁定为指数增长的时候,供给侧的三个玩家,会不会还像过去三十年那样,亲手把自己再拖回一次周期的泥潭?
显示更多
0
58
992
298
转发到社区
尼古拉斯-赵四-亚洲舞王:“我不信我十几年C1的驾龄,还开不了这破车!” 《上车那两下真给我唬住了》
2026年6月28日,河北曹某某遭家暴驾车逃离致丈夫死亡一案二审宣判,驳回上诉、维持原判:曹某某构成故意杀人罪,获刑11年,需赔偿家属5.4万余元,其父亲表示会继续申诉。 案件经过: 曹某某婚后长期遭受丈夫刘某家暴,2021年曾被打至鼓膜穿孔,2024年5月还因家暴报警调解;刘某性格多疑,多次到曹某某工作地查岗。 2024年5月21日凌晨,刘某怀疑妻子聚餐有异性,持刀与曹某某争执,酒驾带她出门寻找闺蜜对质,途中持续殴打;到闺蜜楼下未联系上人后,刘某将曹某某拖拽至车尾,撕烂其衣物、当众羞辱,全程持刀威胁。 曹某某上车想驾车逃离,刘某爬上引擎盖扒车,曹某某加速并晃动车辆试图甩开对方,车辆撞上花池发生事故。刘某内脏破裂抢救无效身亡,曹某某多处骨折、腹腔出血、鼓膜穿孔,重伤住院。 曹某某家属诉求: 曹某某是逃命自保,属于正当防卫,无杀人主观故意,丈夫死亡属于意外,请求改判无罪。 法院判决理由: 曹某某明知刘某扒附车身仍加速、甩车,能预见危险却放任致死结果,构成故意杀人; 刘某持刀家暴、存在重大过错,曹某某存在暧昧聊天记录,双方过错均在量刑中考量,因此从轻判处11年。
显示更多
@Hotpot01 @blknoiz06 这次没上车,肠子都悔青了
投资就是长得慢,有逻辑和基本面支撑,让上车的都赚钱。而不应该是几个叼毛kol 躲在阴暗潮湿的小群里发个$ANSEM 币,一天拉到一亿美金,在那吹嘘sol 多牛逼,又战壕又小将的。 现在币圈不受人待见,和这些发meme 币的煞笔,有直接关系。
显示更多
sol:Ansem拯救战壕,一起去往月球 bsc:大家推崇的大车头,一键sell,美美得吃 熊市的新东西还是得多关注ETH BASE 还有SOL 简中几十年以来都缺少一样东西---创造力 但是你要让他们学会了,他们会立马把这个玩法玩出一百种花样出来 不要离场 耐心等待,像 $Ansem 这样的机会,给足了上车的机会 资金往大一点,吃个几十个点 翻个倍 轻轻松松
显示更多