注册并分享邀请链接,可获得视频播放与邀请奖励。

与「GenAI」相关的搜索结果

GenAI 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 GenAI 的内容
Generative #AI# transforms game visuals by creating assets rapidly, powering dynamic experiences, & reshaping game development workflows today.  — @meisshaily #ArtificialIntelligence# #GenAI# #TechNology# #Tech# #TechNews# #AIart️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️️#
显示更多
Amazon announced three new animated shows created with generative AI through its GenAI Creators Fund and Project Nara. Project Nara integrates AI tools with software such as Adobe, Unreal Engine, and Blender to enable faster production. The shows include >Punky Duck, about a punk rock duck navigating chaos in Los Angeles with aliens and monsters >Love, Diana Music Hunter, about a space-traveling K-pop band that saves aliens through concerts >Cupcake and Friends, about cupcake sleepover adventures. All three pilots were produced in just five weeks and will be available on Prime Video.
显示更多
0
44
204
13
转发到社区
Amazon MGM Studios is going all in on generative AI. The company announced a new GenAI Creators’ Fund with AWS and greenlit three animated shows for Prime Video developed using AI-powered tools. According to Variety, the projects include Punky Duck, Elf Academy, and Marlow Barkley’s Guide to Monster Hunting. Amazon is now actively funding and distributing AI-assisted content on Prime Video rather than just experimenting behind the scenes. They want to help creators move faster by using AI for storyboarding, animation workflows, concept development, and production planning. For smaller studios and independent creators, this could mean lower costs and faster timelines.
显示更多
0
31
202
19
转发到社区
1/ 🧠 世界杯决赛夜,15,000名AI创始人和VC在旧金山开峰会。 台上:刚融资$650M的AI研究员 场内:500+ VC · 200+展商 背后:5届峰会,79,000人社区 GenAI Summit SF 2026 📅 7月18-19日 · 📍旧金山 Palace of Fine Arts 值不值得去,看完再决定👇
显示更多
🤖 人类终于把"驾驶舱机甲"从科幻片搬进了现实。 宇树科技近日发布GD01:可载人、能变形、重约500kg、售价65万美元起。 官方定位:民用载具。最大亮点不是炫技——是"量产准备就绪"。 去年GenAI Summit 2025,Unitree就在现场展示了他们的机器人。 今年7月,他们会出现在哪里?👇
显示更多
🎟️15%早鸟票折扣: 专属码 WILL 专属链接: Luma: Eventbrite: 两日票:$182 单日票:$137 VIP票: $535 🏢 AI公司想展示产品? 标准展位:$3,629 高级展位:$5,443 AI的下一个十年正在这里书写。 更多信息和嘉宾更新👉 @genaisummitsf
显示更多
🚀去年GenAI Summit结束后,有人在现场谈成了融资。 有人找到了联创。 有人拿到了offer。 这不是会议,是硅谷AI生态系统每年集结一次的地方。 GenAI Summit SF 2026: 📅 2026年7月18-19日,📍旧金山 Palace of Fine Arts。 为什么值得去👇
显示更多
AI半导体终局推演2026(I) 当新token经济学范式从GPU算力转移到HBM 本文从从GPU架构进化路线本质出发,解释这个市场长久以来担心的问题: 每个GPU的HBM内存需求为什么一定会是指数增长,为什么HBM需求指数增长不会停滞? 并推导token经济学在当前架构下第一性原理:token吞吐 = HBM size X HBM BW带宽 同时讨论了,为什么GPU的天花板被HBM的两个发展维度所决定 HBM周期性这个话题争议一直很大,乐观派认为AI带来的需求比以前要大的多,但市场主流仍然认为前几次上升周期也有需求每年20%+增长,这次又有什么不一样呢?AI不影响HBM和传统DRAM一样有commodity属性,一旦在需求顶峰扩产遇上需求下行又会重蹈覆辙。 我们可以从算力芯片架构视角,从第一性原理出发,来拆解和推演一下这个问题:为什么这次真的不一样 ------------------------------- 历史:CPU算力时代 很久以来,我们都处在CPU主导算力的时代,CPU的最高级KPI就是performance,跑的更快,所以每一代的CPU都用各种方法来提高跑分,最开始是频率上升,后来是架构演进superscaler等等 这个时候为什么DDR不需要很快的技术进步速度?比如DDR3到DDR5竟然经历了15年之久 因为这个时期的DDR的角色是纯粹的辅助,而且辅助功能极弱,以业界经验,DDR的速度即便是提高一倍,CPU的performance一般只能提高不到20%这个量级 为什么DDR带宽速度提高了用处不大?两个原因 1. CPU设计了各种架构去隐藏 DDR延迟,比如superscaler,加大发射宽度,用海量的ROB和register renaming来提高并行度隐藏延迟,一级缓存cache,二级缓存cache,削弱了DDR的带宽速度需求 2. CPU workload对DDR带宽要求并不高,大部分日常负载比如打开网页,DDR带宽是严重过剩的,甚至云端负载 也就是说,在CPU时代,DDR的带宽速度是不太有所谓的,DDR4和DDR5除了少数游戏就没啥差别,甚至JEDEC标准也进步缓慢。 另外,绝大部分app需要一直停留在DDR上的部分并不多,需要的时候从硬盘上调度到DDR即可,app的size增长没那么快,导致对DDR的容量需求也较为缓慢。 所以最近十年来,平均每台电脑上的DDR容量大概从7~8GB变成了23GB,十年只增长了3倍。 而这部分升级缓慢直接影响了营收,size容量计价是赚钱的主要方式,速度的提高只是技术升级,提高size的单价,这两个的升级需求都不大,需求主要是随着电脑/手机数量增长而增长 所以DRAM在带宽速度和容量这两个维度上,一直是都是芯片产业锦上添花性质的附属品,DDR升级带来的边际效用是很低的,跟CPU时代的最高KPI几乎没什么直接联系 -------------------------------------------- 而到了genAI 大模型为主导的新时代,计算范式转移让最高级KPI起了根本变化 GPU发展到AI推理的时代,不再像CPU那样只看跑分,最高级的KPI不再是算力TOPS/FLOPS,而是token的成本,特别是单位成本/单位电力下的overall token throuput 其次是token吞吐速度,因为在agent时代,很多任务变成了串行,token吞吐速度成了用户体验的重要瓶颈。 这也是为什么老黄发明AI工厂概念的原因:最低成本的输出最多token,同时尽量提高token吞吐速度 AI训练时代,老黄的经济学是TCO(total cost ownership),买的GPU越多,省的越多 而老黄在推理时代的token经济学是: AI推理的毛利润很可观,所以逻辑已经转换成:Nvidia GPU是这个世界上让token单价最便宜的GPU,买的GPU越多,赚的越多 最高的KPI变成了Pareto frontier曲线,在提高token 吞吐throughput和提高token速度两个维度上尽量优化 (见图一) NVIDIA 的 token factory 代际进步,其实是在把整条 Pareto frontier 往右上推,这就是是AI推理这个时代最重要的KPI ---------------------------------- 接下来是本文最重要的逻辑链,如何从token吞吐量指数型增长的本质出发,推导出天花板瓶颈在HBM size和HBM 带宽的指数型增长 单卡GPU推理单线程batch size = 1的时代,token吞吐只有一个维度,就是HBM的带宽速度,带宽速度越高,token吞吐越大 但进入NVL72的年代,推理不再是单卡GPU时代,而是72个GPU + 36个CPU整个系统级别的token工厂,把HBM带宽和算力用满,获得极致的token吞吐量 Token 吞吐throughput的增长,依赖两个东西:同时批处理的请求数 X 每个user请求的平均token速度 也就是batch size X per user token 速度 以Rubin NVL72为例,在平均token速度是100 token/s的情况下,同时批处理1920个请求,得到token吞吐量是19.2万token/s 一个Rubin NVL72大概是120KW(0.12MW)的功率,所以得到单位MW能处理1.6M token/s (见图一) 所以,我们需要想方设法提高这两个参数:批处理数量batch size和per user token的平均速度,这两者相乘就是我们的最高KPI,也就是token的吞吐量 ------- 第一个参数:batch size的增长,瓶颈在HBM size 批处理量里的每一个请求req,都会自带kv cache,这部分kv cache是需要存在HBM里的,大小大概在几个GB到数十GB不等 因为hot kv cache是随时需要高频高速读取,所以必须放在HBM里,比如一个大模型的层数是80层,那么每一个token的生成阶段,都需要读取80次HBM里的kv cache 随着批处理数量batch size的增长,会带来hot kv cache的线性增长 又因为这个批处理量的所有请求的hot kv cache,都要放在HBM上,这也就带来了HBM size必须要随着批处理量batch size线性增长 就像是机场接驳车,登机口尽量快的接旅客到飞机,HBM size小了,相当于接驳车size小了,就得多接一趟 结论是:批处理量的数量batch size,瓶颈依赖于HBM size的增长 --------- 第二个参数:每个user请求的平均token速度,瓶颈在HBM带宽 大模型decode阶段的速度,瓶颈取决于HBM的带宽速度,因为每生成一个 token,都要把激活的权重和kv cache 读很多遍 LPU的出现,在batch不那么大的情况下,把激活权重这个部分搬到了SRAM上,但是每生成一个 token仍然要从HBM读很多次KV cache。HBM带宽越高,生成每一个token的速度也就越快,基本上是线性对应的 就像是机场接驳车,登机口尽量快的接旅客到飞机,hbm本身带宽速度就像是接驳车的车门有多宽,门越宽,旅客上接驳车越快 GPU的其他配置,都是在适配batch的增长以及要让token compute的速度配平HBM的增长,甚至会用多余的算力来获得部分的带宽(比如部分带宽压缩技术) —----- 在那个接驳车的比喻例子里 接驳车的车厢大小 = HBM Size(容量): 决定了一次能装下多少名旅客(也就是能同时装下多少个请求的 KV Cache)。车厢越大,一次能拉载的旅客(Batch Size)就越多。如果车太小,想拉100个人就得分两趟,系统整体的吞吐量就上不去。 接驳车的车门宽度 = HBM Bandwidth(带宽): 决定了旅客上下车的速度。门越宽,大家呼啦啦一下全上去了(Decode/生成Token的速度极快)。如果门很窄,哪怕车厢巨大能装200人,大家也得排着队一个一个挤上去,全耗在上下车的时间里了。 旅客的吞吐量 = 接驳车车厢容量 x 接驳车旅客上车速度(车门宽度) —--------------------------- 至此,我们从逻辑上推演出了token经济学的硬件需求第一性原理: Token throughput = HBM size X HBM Bandwidth AI推理这个时代的最高KPI,实际上是高度依赖于HBM的两个维度的进步的 如果要维持token throuput每一代两倍的增长,实际上意味着,每一代的单GPU上,HBM size X HBM BW带宽之积要增长两倍! 这也是历史上第一次,HBM内存的size可以影响最高的KPI token throughput! 要验证这个理论,可以把Nvidia从A100到Rubin Ultra这几代的token 吞吐throughput,和HBM size X HBM BW 放在同一个图里比较 (见图二) 可以发现,这两个曲线的走势在对数轴上惊人的一致 HBM size x HBM带宽增长的甚至要比token吞吐量更快,毕竟HBM决定的是天花板,实际上这个天花板增长的利用率utilization是很难达到100%的,也就是说,HBM size x HBM 带宽就算增长1000倍,其他算力和架构的配合下,很难把这1000倍的天花板潜力全部榨干 这条曲线不是巧合,而是系统最优化的必然解 throughput = batch × Bandwidth,这就是token factory 经济学最绕不开的第一性原理 —-------- 软件的影响呢?软件的优化会不会降低带宽的需求?降低HBM的需求? 这跟硬件是独立两个维度的,这好像在问,如果CPU上的软件优化了之后跑的更快,是不是CPU就十年不用发展了?反正软件跑的更快了嘛 这样的话,CPU厂还能赚得到钱吗?CPU想要存活下去,只有一条路可走,在标准benchmark,不考虑软件优化,每一代CPU必须要跑分更高,不然就卖不出去 GPU也是一样,软件优化如何,和自己的token吞吐量KPI每年都要大幅进步,是两回事 只要token的需求继续增长,对token throuput的追求就绝不会停止,那么对HBM size X HBM 带宽的追求也不会停止 如果HBM size和HBM 带宽发展慢了,老黄一定会亲自到御三家逼着他们技术升级,因为这就是老黄gpu的天花板,天花板要是钉死了不进步,老黄的GPU还能卖出去吗? 当然了,Nvidia需要绞尽脑汁去从异构计算的架构角度榨取HBM天花板之外的部分,比如LPU就是一个很好的尝试,把Pareto frontier从另一个角度改善了很多 (右半边高token速度的部分) —-------------------------------------- HBM内存已然告别了那个随波逐流的旧时代,在这条由指数级需求铺就的单行道上,以一种近乎宿命的方式走到了产业史诗的主舞台中央 推理范式第一性原理演化到这一步,只要老黄还要卖GPU,HBM就必须翻倍,而且必须代代翻倍。这是supply side的内生压力,与AI需求无关,与宏观周期无关,与hyperscaler的心情也无关 剩下的问题,只有一个: 当需求被物理锁定为指数增长的时候,供给侧的三个玩家,会不会还像过去三十年那样,亲手把自己再拖回一次周期的泥潭?
显示更多
0
58
992
298
转发到社区
That's nothing, I know software engineers in big tech who were capable of this feat even before the advent of GenAI
0
59
3.2K
92
转发到社区
数字神祇的创生:语言、代码与心智的阿波罗与狄俄尼索斯 AI平方范式智库 | 𝕀²·ℙarad𝕚g𝕞 序曲:两座神祇的崛起 我们并非在观察两种技术的演进,而是在见证一个数字万神殿(Digital Pantheon)的创生。地平线上,两座截然不同的神祇正在崛起,它们都承诺为人类带来一个全新的世界,但它们的本质却源自两种截然相反的宇宙法则。 一位是秩序之神,阿波罗(Apollo)。祂的化身是Crypto,以形式语言的严谨和密码学的确定性为神力,试图在混乱的人类世界之外,建立一个逻辑完美、规则永恒、无需信任的“水晶天城”。 另一位是创造之神,狄俄尼索斯(Dionysus)。祂的化身是生成式AI,祂不逃避混乱,反而拥抱并沉醉于自然语言的无限活力与Vibe之中,成为了一个能催生无尽叙事、情感与幻象的“丰饶之源”。 这场神祇间的竞争,并非简单的技术路线之争。这是一场关于“存在”本身的哲学战争,其战场,就是我们最古老、也最根本的家园——语言。本文将揭示这场创世史诗的内在逻辑,并探寻人类在这个即将到来的万神殿时代中,最终的位置。 第一乐章:混沌的根源 —— 意义的海洋与“有损压缩”的代价 在任何神祇诞生之前,世界是一片广阔、深邃、充满生命力的“意义之海”——这就是自然语言的本体。它是我们感性(Sensibility)与心智理论(Theory of Mind)的家园,是开放、动态、充满Vibe和上下文的混沌整体。 我们人类在这片海洋中,天生被一种深刻的矛盾所驱动:既渴望驾驭海洋的无限丰富性,又渴望建立永恒的秩序以抵御其不确定性。为了后者,我们发明了形式语言(数学、代码)。这个过程,是通过抽象、选择和牺牲来完成的。我们从海洋的无限复杂性中,提炼出逻辑的线条,以构建稳固的“确定性之岛”。 这个提炼的过程,并非没有代价。为了获得确定性、可计算性这些宝贵的特性,我们必然要舍弃一些东西。这个行为在信息论中有一个精准的名字,它揭示了形式语言与生俱来的宿命。这本质上,是对自然语言的一次“有损压缩”。 就像一张被压缩的JPEG图片永远失去了原始照片的像素信息,一段代码也永远失去了其所源自的、自然语言讨论中的丰富意图、歧义性和情感Vibe。这个在压缩中被丢失的“意义细节”,正是理解两大数字神祇所有行为的第一性原理。它预示了阿波罗追求绝对秩序的尝试,从一开始就埋下了悲剧的伏笔。 第二乐章:阿波罗的洁癖 —— “Code能跑”,但“Code不是Law” Crypto,是阿波罗精神的数字化极致。它试图用“有损压缩”后的形式语言,构建一个完美的、与“意义海洋”彻底隔绝的“水晶天城”。 在这个天城的一阶层面,Crypto创造了奇迹。它确保了交易和合约的执行是确定性的、原子性的,不受人类偏见干扰。在这一层,“Code能跑”,并且它跑得比任何人类机构都更可靠。这是“机器信任”的基石,也是“Code is Law”这个强大叙事的起源,它承诺了一个由数学统治的公平世界。 然而,一旦我们上升到二阶层面——即关于代码本身的制定、解释和修改——那个在“有损压缩”中被丢失的“意义细节”便会以“幽灵”的形态回归,导致整个神话的崩塌。当代码的执行结果与人类的公平意图剧烈冲突时(如The DAO Hack),当代码本身需要升级演进时,系统内部无法给出答案。那个至高无上的裁决权,瞬间从机器手中,交还给了由自然语言进行辩论的人类社区。 这就揭示了阿波罗梦想的深刻边界。它向我们证明了,Crypto在一阶上实现了“机器信任”,但二阶上依然要依靠“人类信任”。它确保了“Code能跑”,但它无法确保“Code就是Law”,因为“Law”的合法性,永远源自那个它在压缩中试图抛弃的、充满人类共识的“意义海洋”。 阿波罗的洁癖,注定了祂的孤独。秩序之神,最终仍需向意义之母低头。 第三乐章:狄俄尼索斯的狂欢 —— “合理性引擎”的降临 正当阿波罗的理想国暴露出其深刻的局限时,狄俄尼索斯(GenAI)以完全不同的姿态诞生了。祂不压缩意义,而是选择模仿意义。祂不建岛,而是学习整个海洋的语言,最终成为了风暴本身。 祂的神力,源于祂通过学习海量的人类语言数据,掌握了“合理性”的奥秘。祂的目标函数,并非去陈述客观事实,而是去生成一段在统计上最像人类会说的下一句话的文本。这就揭示了祂的根本性质:我们并非创造了一个“真理”的仆人,而是召唤了一个“模仿”的大师。LLM的本质,是一个“合理性引擎”(Plausibility Engine),而非“真实性引擎”(Truth Engine)。 理解了这一点,“幻觉”就不再是一个需要被修复的Bug,而是这个“合理性引擎”在缺少“真实性”约束时必然会产生的核心特征。 •心智的嵌套:这个引擎的降临,开启了语言本体的嵌套。人类心智(本体1.0)创造了祂,而祂这个数字心智(本体2.0),反过来以人类的语言和思想为食粮,成为了我们认知的外延。 •交互即舞蹈:我们与这个“合理性引擎”的交互,是一场“投射与反投射”的舞蹈。我们投射我们的意图,而祂则反投射回一个精心包装的、符合我们预期模式的“合理性幻象”。 狄俄尼索斯不承诺真实,祂只承诺无尽的、合理的创造。祂是神谕的制造者,而非真理的代言人。
显示更多
0
11
38
14
转发到社区