注册并分享邀请链接,可获得视频播放与邀请奖励。

与「AI、模块化等趋势结合后,会产生哪些新的应用和投资机会?」相关的搜索结果

AI、模块化等趋势结合后,会产生哪些新的应用和投资机会? 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 AI、模块化等趋势结合后,会产生哪些新的应用和投资机会? 的内容
🔥 DeFi 3.0 风口已至:谁将引领下一轮爆发? 🎁 参与 AMA 赢取海量 $USDT 奖励! ⏰ 时间:2025/9/4 20:00 UTC+8 🔗 链接: ✨ 主办方:@MetaEraCN@Z2H_Academy 🎙️ 特邀嘉宾:@qkinode@SCAI_Agents@Vito_168@xiaojinyu168@SherryAtBitMart@QuBitDEX@UZX_Official 📅 设置闹钟与我们一起探索: - 什么是 #DeFi# 3.0?与 1.0、2.0 阶段相比,最大的变化是什么? - DeFi 3.0 会开启哪些新赛道?老赛道(如 DEX、借贷、稳定币)是否仍将稳健发展? - 当前 DeFi 3.0 处于什么阶段?是技术与资金的积累期,还是进入新叙事爆发的前奏? - DeFi 叙事与 #RWA、##AI、模块化等趋势结合后,会产生哪些新的应用和投资机会?#
显示更多
0
8
26
13
转发到社区
老黄点名了下一个将达到万亿美金市值的公司,相比这个Murphy(MRVL的CEO)今天演讲以及他与来黄的对话更值得一看。Murphy用近一个小时的时间,系统阐述Marvell如何押注数据基础设施、为什么光互联将成为AI时代的关键技术,以及这场从铜缆到光纤的转型将如何重塑整个数据中心架构,看完murphy的演讲,相信能对光互联的技术演化有更深的理解和认识,梳理下Murphy的演讲要点: 1、十年豪赌:如何成为数据中心之王 Murphy演讲从一段自我剖白开始。2014年加入Marvell 时,这家公司60%的收入来自消费电子市场,数据中心业务占比不到10%。也正是在那个时刻,他做出了一个大胆的判断——半导体行业的下一个增长周期,将由 Google、Amazon、Microsoft、Meta 等平台公司驱动,核心需求是“以大规模移动、存储、处理和保护数据的半导体技术”。 这个判断在当时并不被广泛认可。“数据基础设施”甚至还不是一个被行业承认的市场类别,只是 Marvell 用来描述未来愿景的内部术语。但 Murphy 和他的团队展现了惊人的执行力:通过一系列精准的并购和剥离,Marvell 在十年间投入了约285亿美元(225亿美元收购+60亿美元内部研发-40亿美元资产剥离),系统性地构建了从毫米到千公里、覆盖 AI 基础设施全栈的连接技术平台。 这些并购包括2018年收购 Cavium 强化计算和网络能力;2019年收购 Avera 建立定制芯片业务、收购 Aquantia 增强连接产品组合; 2021年以100亿美元收购 Inphi 获得世界级数据中心连接技术; 以及最近12个月内收购 Celestica AI 的光子结构技术和 Xcon 的 scale-up 交换能力。 结果是惊人的:Marvell 从2014年的25亿美元营收增长到2026财年预计的110亿美元,最近几年增速更是达到每年40%。根据上周财报电话会议后的华尔街共识预期,2027财年 Marvell 营收将达到164亿美元。更关键的是,数据中心业务占比已从不到10%飙升至上季度的75%以上。 2、连接性:AI 基础设施的真正瓶颈 Murphy 在演讲中抛出了一个核心问题:什么定义了 AI 基础设施的性能?大多数人会想到处理器、GPU、制程节点(3nm、2nm 甚至未来的1.4nm、1.6nm),或者高带宽内存。这些当然重要,但 Murphy 指出,这些都不是系统的决定性特征。 “因为一个处理器,无论它有多快、连接了多少内存,对于今天的 AI 工作负载来说根本不够。你需要数万个、最终是数百万个处理器作为一个单一的大规模计算引擎协同工作。这就是为什么这种规模的计算从根本上是一个连接性挑战。”Murphy 说道,“而且越来越多地,正是连接性的架构和特性定义了系统的性能。” 这个判断得到了英伟达 CEO 黄仁勋的呼应。在 Murphy 邀请下登台的黄仁勋强调,AI Agent 的计算模式是“分解和分布式的”(disaggregated and distributed)——当你把一个计算问题分解成许多部分,并分布到整个数据中心时,连接性就成为必需品。“我们分解和分布式计算,使其运行在这些巨大的集群上,这样我们就能聚合总计算量、总内存和总带宽。而使这一切成为可能的,就是连接性。”黄仁勋说,“这就是为什么 Matt 做得这么好,为什么 Marvell 如此关键。” Murphy 进一步解释了连接性瓶颈的演变逻辑:过去几年,AI 基础设施先后解决了计算瓶颈(英伟达引领的 GPU 革命)和内存瓶颈(HBM 高带宽内存的规模化),现在瓶颈正在再次转移。“现在是连接性将定义基础设施的极限,就像计算和内存一样。”他引用了与最大客户的对话:“世界上最大的超大规模云服务商现在正在重新构想他们的整个网络架构。他们认识到,扩展 AI 基础设施现在首先是一个连接性挑战。” 随着推理模型、专家混合架构(mixture of experts)、生成式 AI 的持续演进,更多数据必须在基础设施中移动,需要更高的带宽和更低的延迟。当工作负载不再适合单个数据中心时,就需要建设更大的数据中心或整个数据中心园区,以及它们之间的所有高速连接。“因此,连接性成为扩展计算的关键推动力,我们的客户越来越认识到光学是前进的方向。”Murphy 说。 3、从千公里到毫米:Marvell 的全栈连接布局 Murphy 用一张图展示了 AI 基础设施跨越的所有距离——从数据中心之间的数百甚至上千公里,到封装内部的毫米级距离。每一个距离都需要不同的解决方案、不同的技术、不同的工程团队,甚至不同的供应链。“这些不是同一问题的变体,而是根本不同的工程挑战。” 1)跨数据中心连接(数百至上千公里) 这需要非常专门的相干调制(coherent modulation)技术,核心是专用的数字信号处理器(DSP)。Marvell 是全球少数几家能够构建这种相干 DSP 的公司之一,已经领导了从100Gbps 到400Gbps 再到800Gbps 的代际演进。Murphy 在现场展示了一个相干光模块实物——这是一个极其复杂的工程产品,包含了 Marvell 最复杂的先进制程 CMOS DSP 芯片、第四代硅光子技术(已量产十年),以及用硅锗工艺设计的自研宽带模拟组件。“今年晚些时候,我们将采样世界上首个1Tbit、2nm 制程的相干光学解决方案。”Murphy 宣布。 2)数据中心内部连接(数百米) 数据中心内部包含成排的计算服务器,每个机架顶部通常有一个交换机,机架级交换机连接到脊柱和核心交换机,通过光纤电缆形成整个数据中心的网络结构。这部分使用的是更节能的 PAM4调制技术。Marvell 构建了业界领先的 PAM4 DSP 解决方案,以及高速模拟组件(包括跨阻放大器 TIA 和激光驱动器),并引领了从25Gbps、100Gbps、200Gbps、400Gbps 到800Gbps 的每一次重大转型。去年,Marvell 开始量产业界领先的1.6Tbps PAM4解决方案。在以太网交换方面,Marvell 拥有从51.2Tbps 到51.2Tbps 的完整产品组合,并在 ComputeX 当天宣布了专为 AI 数据中心设计的新一代102.4Tbps 以太网交换机,具有业界最低功耗。 3、机架内部连接 目标是以全互联(any-to-any)配置连接尽可能多的处理器——每个处理器都能直接与其他每个处理器通信。英伟达的 NVLink 72(因机架内连接72个 GPU 而得名)首次将这种架构推向市场。这需要完全不同的交换类别,以及通过机架内铜背板驱动超高速信号的能力。“今天,这不是光学的领域,这是铜的领域。”Murphy 说。核心差异化因素是电气 SerDes 技术而非光学。Marvell 拥有目前领先的200Gbps 电气 SerDes,并已在过去几年中演示了面向未来的400Gbps 技术,这些 SerDes 被集成到客户的定制芯片、XPU 以及 Marvell 自己的 scale-up 交换机中。 4)封装内部连接(毫米级) 当今最先进的芯片内部有多个 chiplet,2.5D 或3D 封装本质上是一种连接技术,允许这些 chiplet 在封装内非常靠近地放置,并通过超高速短距离 die-to-die 接口通信。Marvell 拥有领先的 die-to-die SerDes 和先进封装能力,使客户能够构建业界最复杂、最独特的多 die 芯片。 Murphy 强调,拥有所有这些能力“在一个屋檐下”是不寻常的、独特的。“当我们去竞争时,通常在每个类别中我们面对的是不同的竞争对手。但这就是我们的独特之处——我们是一站式商店,是整个连接堆栈的领导者。” 4、铜墙将移:光互联的物理必然性 Murphy 演讲的核心洞察集中在一个概念上:铜墙(Copper Wall)。他用一张图清晰地展示了当前 AI 基础设施中的连接分界线——左侧是光学连接(使用光纤电缆传输光信号,两端有复杂的电子设备驱动和调制激光),右侧是电气连接(使用铜缆、PCB 上印刷的铜走线,或封装内部的微观铜布线)。中间是“铜墙”,定义了信号在必须转向光学连接之前可以通过铜传输的最长距离。 “这是一个重要的区别,因为铜很简单、成本低,正如 Jensen 所说,你想尽可能长时间地使用它,这非常实用。但光学更复杂,需要激光器、光子学、复杂的电子设备。”Murphy 说,“而铜墙,我今天要告诉你们的是,它即将移动。它将再次移动,并将接管机架本身。这正在为光学行业创造需求的爆炸式增长。” 这不是偏好问题,而是物理定律。信号通过铜缆传输的距离与带宽成反比——每次带宽翻倍,距离就必须减半。Murphy 给出了具体数据:当今世界上最高速的生产系统运行在每通道200Gbps。在这个带宽下,电缆长度限制在大约1.5米。相比之下,100Gbps 系统可以使用约3米的电缆。而机架的高度约为2米,考虑到机架内部的所有布线,2.5米正好是极限。“所以当我们转向1.6Tbps 时,我们不能再用铜完全连接机架了。墙正在移动,而且是现在。” Murphy 强调,这不是遥远的未来:“今后,即使是机架内的连接也将变成光学的。整个行业都知道这一点即将到来,所以我们一直在为这一刻做准备——不仅仅是 Marvell,而是整个行业。你可以在台湾看到这一点,在供应链和正在发生的产能爬坡中。” 铜墙每向右移动一步,连接数量至少增加一个数量级。“这正在创造我提到的需求爆炸,光学供应链需要大规模扩展并做好准备。”Murphy 回顾了20年前的类似转型:当时数据中心内部的最先进技术是10Gbps,整个数据中心都使用铜缆,光学基本上只是电信技术,保留用于非常长的距离。但当墙移动时,光学行业迎接了挑战,今天世界上所有的超大规模数据中心都是光学连接的。这次转型催生了新的解决方案——针对数据中心内部优化的 PAM4技术,而 Marvell 是那里的关键创新者之一。 5、CPO:光互联的下一个前沿 当光学进入机架内部时,需要的新技术叫做共封装光学(Co-Packaged Optics, CPO)。Murphy 花了相当篇幅详细阐述这一技术:“CPO 是一种将光学连接一直带到封装本身、紧邻计算的技术,无论是定制计算还是交换芯片。” CPO 要解决的根本挑战是密度和功耗。机架内的连接数量是机架之间连接数量的10倍。“如果我们只是尝试使用数据中心机架间使用的相同光学技术,你不会有足够的功率,不会有足够的物理空间,无法容纳所有这些标准光学模块和电缆——这根本行不通,不可能。”Murphy 解释道。 CPO 的概念是将光纤直接带到封装,将驱动光纤信号的电子设备与定制计算或交换芯片紧密耦合。“这是一个巨大的变化,而且很难,因为你要结合芯片行业中一些最先进的技术:领先制程 CMOS、硅光子学、先进封装、光互连,所有这些都在一个小型紧密集成的系统中制造。复杂性非常高,但这是继续扩展带宽并克服我谈到的铜限制同时降低功耗的唯一方法。” Murphy 强调这不是未来主义的东西,而是正在发生的现实。他在现场进行了实物展示:一边是传统的以太网交换机——当天宣布的102.4Tbps Teralink 交换机,可以看到板中央的交换芯片,PCB 内部的铜走线将信号传输到前面板,所有光学模块都插在那里。另一边是基于 CPO 的交换机——封装中央仍然是交换芯片(51.2Tbps 交换机),但边缘周围是16个3.2Tbps 光学引擎。“16乘以3.2,你得到51.2Tbps。所以光纤现在直接连接到这些引擎,而不是前面板。我们完全消除了 PCB 上的铜走线。光直接从封装中出来。这是一个非常非常复杂的工程作品。”Murphy 说。 Marvell 为 CPO 投入了十多年:硅光子学、光学 DSP、所有周围的模拟宽带组件,以及实现这一切所需的所有先进封装。“这一切实际上都需要在 CPO 中汇聚。”Murphy 说。 6、英伟达的背书与 NVLink Fusion 合作 Murphy 特别强调了与英伟达的战略合作扩展。几个月前宣布的合作中,英伟达向 Marvell 投资了10亿美元,双方正在扩展跨多个维度的合作,包括光学、光子学和 NVLink Fusion。黄仁勋亲自登台与 Murphy 对话,这本身就是一个强有力的信号。 黄仁勋详细解释了 NVLink Fusion 的战略意义:“有时候,也许云服务提供商想要设计自己的定制芯片。在我们之间,我们也在 NVLink Fusion 上合作,这使得你可以使用相同的系统架构,内部有 Marvell 的一些半定制芯片、大量互连、硅光子和光学技术。我们可以创建一个本质上分解、分布和异构的数据中心。” 关键是系统架构保持一致。“他们的网络技术可以利用大量英伟达的堆栈。CPU 可以是 Vera,但它可以利用大量你们的堆栈。所以 NVLink Fusion 是关于采用英伟达的技术和我们的平台、Marvell 的技术和平台,然后我们融合它。这就是为什么它被称为 fusion。”黄仁勋说。 Murphy 追问了铜到光学的转型时间表。黄仁勋的回答非常务实:“我们应该尽可能长时间地使用铜,但铜有其限制——带宽和距离的限制。所以最终正确的策略是:尽可能长时间地用铜进行 scale up。之后,用光学进一步 scale up,用光学 scale out,用光学跨越连接。所以你在必须的地方使用光学,在可以的地方使用铜。” 但黄仁勋随即给出了乐观的市场预测:“底线是,在未来五到十年,我们将使用大量的铜,也将使用大量大量的光学。这些数据中心现在是基础设施的一部分。我说 AI 现在有用、有用的 AI 已经到来的原因是,现在 AI 是有利可图的,token 是有利可图的。当 token 生产有利可图时,每个人都想制造更多 token,这就是为什么 Marvell 的需求如此之高,我们的需求也如此之高。因为每个人都想生产更多 token,因为它被 Agent 到处使用。” 7、无距离数据中心:光互联的终极愿景 Murphy 在演讲的最后部分描绘了一个激进的未来愿景:他当数据传输全部变成光学时,距离实际上不再重要。“这是一个深刻的变化。”说。 今天的服务器、机架和整体数据中心架构都是围绕距离的约束设计的,软件工作负载也围绕这些相同的约束进行了优化。但如果距离不再重要呢? 首先,scale-up 网络的规模可以从72个或144个 XPU/GPU 扩展到1000个或更多,全部光学互连。“对工作负载的影响是巨大的。今天,AI 工作负载必须分解成适合 scale-up 集群的更小子问题,因为在集群外部通信今天更慢、带宽低得多。但光学互连系统可以管理数量级更大的工作负载。” 其次,服务器本身可以被解构。现代 AI 服务器由一定数量的 CPU、XPU、内存和网络接口组成,它们都在同一系统上的原因是距离——CPU 和 XPU 需要以非常高的带宽访问内存,这意味着它们需要紧挨着坐在板上,铜走线作为它们之间的连接。“但在这些连接都是光学的未来,距离实际上不重要。你可以想象一个完全解构的架构——XPU 在一个系统中,内存在另一个系统中,巨大的 CPU 在另一个系统中。” 这解锁了另一种可能性:今天系统中 CPU 和 XPU/GPU 的比例是固定的,必须在系统构建和部署时定义。但没有两个工作负载需要完全相同的比例,这意味着在任何给定时间,计算或内存的某些部分可能未被充分利用——这要花钱。“但一旦我们将系统分解为独立的计算池和内存池,并且它们都是光学互连的,我们就可以动态组合专用系统,然后针对任何工作负载进行优化。” Murphy 的终极愿景是“全球光学互连的数据基础设施”:“我们今天拥有的这些系统中的刚性边界开始消失。计算现在可以被池化,内存可以被池化,基础设施可以大规模动态组合。架构师第一次可以开始围绕模型的需求设计 AI 系统,而不是围绕互连的限制。” 他将这个愿景命名为“无距离数据中心”(data center without distance):“计算、内存、网络和光子学作为一个统一系统运行,数据中心中的数百万资源可以像一台机器一样协同工作,一个由工作负载需求定义的架构,而不是连接性的限制。我们相信这是计算基础设施的下一个时代,Marvell 正在帮助构建使这一切成为可能的连接基础。” 最后再多说点, Marvell的核心竞争力集中在两个细分领域。 1、定制芯片(ASIC/XPU)设计。 Marvell与博通是全球两大定制AI加速器设计巨头。大厂自研芯片的趋势正在加速——比如微软的Maia 200推理芯片、亚马逊的Trainium系列,背后都有Marvell的参与。TrendForce的预测数据值得留意:2026年定制AI芯片销售增速预计为45%,而同期GPU的增速仅为16%。不是GPU不行,而是超大规模云厂商在推理端的成本压力正在推动它们加速自研定制方案。 2、数据中心互连产品线。 这是Marvell更深的一条护城河。根据其财报,光学互连产品收入保持两位数季度环比增长,数据中心交换机业务预计2027财年将突破5亿美元。Marvell过去十年通过一系列并购累计投入约360亿美元,围绕连接搭建了涵盖定制芯片、高速交换器、光模块、硅光子和先进封装的完整技术平台。
显示更多
0
96
454
122
转发到社区
最近提交ipo的ai芯片的新宠Cerebras火遍硅谷。 其芯片在小模型场景下,其推理速度最高可达 H100 的 20 倍;而超大规模模型(如 400B 参数量级),Cerebras CS-3 系统的单用户响应速度约为 B200 的 2.4 倍 那么cerebras究竟是如何做到的呢? 它是否会成为英伟达杀手呢? 我们需从算力演进的本质开始。 AI算力的演进,正在从“算力本身”转向“通信与系统结构”。在这条演进路径上,Cerebras Systems提供了一种完全不同的答案:不是优化分布式,而是尽可能消灭分布式。 一、两条路线:消灭通信 vs 优化通信 当前AI算力本质上分为两种架构哲学:一条是以NVIDIA为代表的路线: 多芯片(GPU),高速互连(NVLink / CPO),scale-out(横向扩展) 另一条是Cerebras路径:单芯片做到极限(wafer-scale) 片内网络替代跨节点通信,scale-up(纵向放大) 核心区别是:一条在解决“如何连接更多芯片”,另一条在解决“如何不需要连接”。 二、为什么这条路现在才成立 wafer-scale并不是新概念,80年代就有人尝试,90年代商业化失败。原因是: 良率无法承受 没有容错机制 软件无法支撑 行业因此形成共识:小die + 高良率 + 分布式。 Cerebras的突破在于三件事同时成立: 1)容错机制工程化 2)片上网络成熟 3)AI workload匹配(高并行,强同步,通信主导) 本质变化是:从“完美硬件”转向“可容错系统”。 三、性能对比:单点极限 vs 系统扩展 在通信层面,两条路线的优劣非常清晰: 1)片内通信 Cerebras:纯片内 → 延迟最低、能耗最低 CPO:仍有光电转换 → 单点效率:Cerebras更优 2)系统扩展 Cerebras:一旦跨芯片 → 回到通信问题 CPO:带宽可持续扩展 → 系统能力:CPO更优 3)功耗结构 Cerebras:单机功耗极高,但通信极省 GPU+CPO:单点功耗可控,系统效率更平衡 结论很明确: Cerebras赢“单机极限”, CPO赢“系统规模”。 四、适用场景:谁该用cerebras 判断标准可以简化为三个问题: 1)通信是否是瓶颈 2)任务是否可集中 3)结构是否规则 因此,高度适用于大模型训练(dense模型),超长上下文,及部分HPC(PDE、流体等) 这些任务的共性是强耦合 + 高同步 + 高带宽 部分适用于大模型推理(低并发),图计算(结构复杂时优势下降) 而不适用于CPU(通用计算),高并发推理,移动/边缘芯片,实时系统 这些系统的共性:不规则 / 高并发 / 低延迟 五、是否会变成主流 尽管Cerebras在特定场景极强,但主流不会走这条路,原因是: 1)物理约束:功耗密度;信号延迟→ 容错解决不了这些问题 2)经济性:小die良率更高;chiplet更灵活 3)产业路径:TSMC等体系优化方向是模块化,多客户复用而不是超大单体 4)需求侧变化:推理占比远高于训练,多任务、高并发成为主流 六、cerebras的意义 与其说wafer-scale尺寸是重要的趋势,不如说容错设计是会被广泛吸收的哲学 未来可能会出现chiplet级容错,封装级绕路 核心变化是单个硬件不再需要完美,系统负责兜底。 回到最初的问题:Cerebras会不会成为NVIDIA的“杀手”? 答案其实已经很清楚。 它确实在一个关键点上击中了GPU体系的软肋——通信。但行业的选择,并不是非此即彼,而是多个技术突破同时采用:更强的互连、更低的通信能耗、更高的系统级效率。 因此,更准确的判断是Cerebras不是英伟达的杀手,而是英伟达及所有芯片公司可借鉴的最佳实践。 免责声明:本人持有文中提及的标的,观点必然偏颇,非投资建议,投资风险巨大,入场需极度谨慎 (图:一个cerebas芯片)
显示更多
0
14
84
18
转发到社区
App卖不动了,然后呢?我推演了一种AI泡泡 这个问题我是真的很想搞清楚,也是我这几周集中准备研究的重点。跟进这条线也是我现在安排的主线任务之一:推演,押宝,收集这条线上所有的资源。 App 卖不动,本质上并不是因为大家突然不喜欢用软件了,而是因为分发逻辑、用户习惯以及价值交付模式都发生了根本变化,让过去那条“装一个 App → 形成留存 → 再变现”的路径逐渐失效。如今 iOS 和 Android 的入口层被平台牢牢掌控,App Store 与 Google Play 的曝光越来越集中在头部应用,新应用几乎很难自然获得流量。同时,入口被超级 App 吞并——微信、抖音、支付宝等已经演变成“操作系统之上的操作系统”,用户的许多需求可以直接通过小程序、内嵌网页解决,不再需要额外下载独立 App。再加上AI 与 Web 化降低了‘必须下载’的门槛,生成式 AI 可以直接通过网页或多平台插件调用功能,PWA(Progressive Web App)更是让网页具备了接近 App 的体验,从而绕过下载环节。 这些现象几乎成了行业共识。但我是真的经历过那个“万物 App”的年代,当时人人都在学 Kotlin 开发移动应用。如今的变化在商业层面表现得更为明显:获客成本飙升,广告投放、应用商店排名、网红推广成本高得吓人,小型开发者很难回本;生命周期缩短,用户可能只用几次就卸载,因为功能容易被替代,除非形成完整生态,否则靠单一功能长期留住用户几乎不可能;商业模式趋同,过去依赖订阅、内购、广告三种模式就能赚钱,如今同质化竞争严重,用户的付费心理门槛也在不断提高。 别说用户,就拿我自己来说,如今也很少再去下载新的 App 了。从“下载占有”到“即用即走”。首先是安装疲劳——手机里已经有几十个常用 App,对新增安装天然抵触,“能用现有 App 搞定就不装”;功能期望提高——用户不再愿意为一个孤立功能单独安装 App,他们希望这些功能能够嵌入到自己已有的生态体系里,比如微信、飞书、Teams、浏览器插件等。 但是AI界面总不能承载所有功能吧? 如果 App 外壳化 / 接口化 已经成为不可逆的趋势,而 AI 窗口(Copilot、对话框、Agent Hub) 又无法承担所有职能,那么下一个真正的入口/窗口必然会是更贴近具体场景与数据流的形态。我的推演方向是,在现有 App 宿主之上,构建一种能够填补 AI 窗口“非万能”空白的应用生态——即 场景原生入口(Context-Native Entry)。 这种入口不再是独立应用,而是直接嵌入到场景的触发点里。例如,在会议中,日历界面会原生弹出“行动建议”;在设计工具中,用户选中元素时会自动出现 AI 协作气泡;在车机屏幕中,驾驶到达目的地时会直接显示路线与任务执行按钮。它有三个显著特征:第一,零跳转,用户无需离开当前场景即可完成任务;第二,数据即时可用,上下文数据已经在场景内,无需额外授权;第三,执行闭环内建,任务完成后可自动将结果回写到对应的数据源(如 CRM、ERP、日志、交易记录)。 我画了两个示意图:主界面就是宿主(host environment),可以是日历、项目管理软件等;旁边的“泡泡”则是上下文触发的操作入口,而这个泡泡正是未来全球应用开发者共同参与的生态。它看起来像插件,但用户无需安装,由宿主内的 AI 自主决定何时调用。 Calendar: 宿主host environment Action items: 泡泡 (AI自由调用,其他开发者开发) 这种生态的核心特征包括: 能力模块化——功能以插件、微应用或结构卡形式存在,每个模块可以独立更新与授权;用户既可固定常用模块,也可临时调用一次性模块。 上下文可迁移——身份、任务、数据、历史操作等上下文信息在不同模块间无缝传递,避免重复输入。 AI 编排驱动——用户既可直接点击模块,也可用自然语言输入目标,由系统自动选择和组合模块执行。 多入口混合——既支持传统图标,也支持场景气泡、任务栏、语音指令等多种入口,根据任务性质动态显形或隐藏。 半自主闭环——简单任务可自动执行,复杂任务在关键节点需用户确认,执行完成后结果自动回写到对应数据源。 这意味着,未来的应用形态不再以“下载一个 App”作为起点,而是以场景驱动的即时入口作为载体,AI 在背后完成能力调度与组合,用户在前端获得零跳转、上下文贯通、结果可闭环的体验。 如何成为宿主以及泡泡的触发机制 要理解如何让一个应用从“功能提供者”升级为宿主,并能在合适的时机触发上下文气泡,需要先明确宿主的定义和运行机制。 宿主环境 = 上下文源 + 触发点 + 执行容器 + 用户界面 它承担的是一个舞台的角色,为能力模块(Capability)提供完整的执行与交互环境,包括: 触发契机——明确什么时候启动能力(事件触发、条件满足、用户操作等); 上下文数据——运行前必须知道“是谁、在做什么、涉及哪些资源”; 执行通道——调用外部能力所需的网络、权限与运行时容器; 显形界面——用户可见、可操作的 UI(气泡、侧栏、提示条等); 回写目标——执行结果要存回的权威数据源(如 CRM、ERP、文档、日志等)。 如何让任意应用成为宿主 为了具备承载外部能力和触发气泡的能力,一个应用至少需要以下四个开放接口与结构: 触发点 API:允许外部能力监听特定事件,如用户操作、状态变化、定时器触发、数据更新等。 例:会议开始前 2 分钟、文档被选中一段文字、车辆进入充电站。 上下文 API:提供标准化接口,让外部能力读取必要的上下文信息,如当前用户、选中对象、会话内容、位置等。 必须保证数据最小化原则,并在用户授权范围内暴露。 执行 API:提供安全可控的调用方式,让外部能力可以在沙盒环境中运行,并具备函数调用、网络访问、跨模块通信等能力。 支持权限校验和费控机制,防止能力滥用资源。 UI 插入点:为外部能力提供可嵌入的位置,用于显形气泡、侧边栏、弹窗、HUD 等不同形态的 UI。 插入点应与上下文事件绑定,保证用户交互自然、即时。 “泡泡”触发的全流程 当宿主具备上述条件后,一个上下文气泡的触发与执行过程通常如下: 事件监听:宿主通过触发点 API 监测到某个场景事件(如会议即将开始)。 上下文构建:宿主调用上下文 API,生成包含当前用户、任务、数据等信息的标准化上下文对象。 AI 决策:宿主内的 AI 调度器基于上下文,筛选最匹配的能力模块(可从能力目录中动态检索)。 显形触发:在 UI 插入点上显示气泡,提示用户可以执行的操作(或直接开始执行低风险任务)。 能力执行:调用执行 API,沙盒运行外部能力,并实时更新执行状态。 回写闭环:任务完成后,通过宿主的回写通道,将结果存回权威数据源,并刷新宿主界面。 只要协议畅通,全球开发者有能力的开发宿主,能力弱的开发泡泡,组合是天文数字量级的 只要协议畅通,这个由全球开发者共同构建的“巨型开发、应用与工具网络”就能进入几乎自我扩张的状态——它会像互联网早期的 TCP/IP 一样,把原本彼此孤立的能力和数据源接入同一张网络,让调用、组合与分发成为默认能力而非额外集成。能力强的开发者可以构建宿主,承载和调度多种外部功能;能力弱的开发者也能专注于制作单一“泡泡”模块,被宿主按需调用。 一旦协议统一了能力卡、上下文、权限和回写机制,任何能力都能被任意宿主直接使用,不同开发者产出的功能无需点对点适配即可自动兼容,AI 调度器也能跨厂商、跨领域、跨设备自由编排执行链。分发将彻底自动化——不必依赖人工搜索、下载或安装,能力会在符合上下文的场景中自动显形,高质量的能力会被宿主和 AI 持续选用,新能力一旦注册就能零延迟进入全球可调用范围。 这种模式会触发生态自增强效应:接入的能力越多,可组合的可能性越多,衍生出更多新场景;每次闭环执行的结果都会回写到数据源和特征库,使下一轮决策更精准,吸引更多调用,形成“数据—体验—调用”的正反馈飞轮;协议的统一也意味着一次改进可在全网生效。与此同时,生态的边界会不断开放——宿主可通过协议变成流量与上下文的枢纽,小型开发者可以靠单一能力卡或场景编排持续获利,平台还能围绕调用和数据确权发展出分润、信誉、质保、治理等全新商业模式。 换句话说,只要协议打通,组合空间就是天文数字级的,调用、分发和优化会自动发生,整个生态会以互联网式的速度与规模爆发。 这个“协议畅通 + 宿主/泡泡”模式,其实针对的是现有 App 开发和使用模式中的几条核心瓶颈,而且它的结构设计正好能逐一化解。 1. 分发和获客瓶颈 现状 App 必须依赖应用商店、广告投放、内容引流才能被用户发现。 新应用进入成本高,获客成本(CAC)居高不下,小团队往往无法回本。 分发渠道高度集中,头部应用占据曝光,大多数 App 没有生存空间。 突破方式 在协议畅通的模式下,能力(泡泡)不需要用户搜索、下载、注册,而是由宿主在符合上下文时自动分发显形。 分发入口变成多点分布(各种宿主和 AI 调度器),降低依赖单一渠道的风险。 新能力一旦注册,就零延迟进入全网可调用范围,被动获客。 2. 集成和适配成本瓶颈 现状 不同 App、系统、行业的数据和功能接口差异巨大,需要大量定制化集成。 跨系统协作需要重复开发“胶水层”,浪费时间和人力。 突破方式 统一上下文协议、能力描述协议、回写协议,让不同宿主和能力模块之间天然互操作。 开发者一次接入协议,就可以在所有遵循该协议的宿主中运行,不必逐个适配。 AI 调度器在运行时动态组合能力,无需提前硬编码集成关系。 3. 功能封闭与长尾需求瓶颈 现状 App 功能由开发团队预先定义,长尾需求(小众场景)很难覆盖。 用户经常需要跨多个 App 来完成一个任务,效率低下。 突破方式 协议化能力可以被 AI 自由组合,一次性生成专属于某个用户、某个上下文的任务链,哪怕这个链只执行一次也值得。 小众能力也可以生存:哪怕调用量很低,只要在某个链中被用到,就能产生价值并获得分润。 4. 更新和迭代瓶颈 现状 App 更新周期长,功能迭代慢,用户必须整体升级 App 才能获得新功能。 功能和数据常常被锁死在 App 内,迁移和重用困难。 突破方式 能力模块化后,每个能力卡或泡泡可以单独更新、单独授权。 改进一次能力,就能立刻在全网生效(所有宿主和链路同步受益)。 数据闭环让优化路径自动收集反馈,形成持续迭代的飞轮。 5. 用户交互路径瓶颈 现状 用户必须主动切换 App 才能完成任务,跨场景跳转造成体验中断。 每个 App 的 UI 逻辑不同,学习成本高。 突破方式 场景原生入口(泡泡)直接嵌入用户所在的任务上下文,无需跳转。 宿主负责 UI 容器统一化,外部能力复用相同的交互模式,降低学习成本。 一句话总结 这个模式克服了分发集中、集成昂贵、长尾难覆盖、更新迟缓、体验割裂五大瓶颈,让开发者专注能力本身,让用户在场景中即时获得可组合、可闭环的服务。 (1/n)
显示更多
0
14
82
15
转发到社区
xBubble Coding :10 分钟搭建英语学习资料网店,AI 正在加速 OPC经济爆发 最近我做了一次完整实测: @dappOS_com xBubble 新推出的 Coding 功能 这次我没有测试热点项目,而是换了一个更适合长期运营的方向:搭建一个英语学习电子资料网店。 需求很简单:售卖英语学习电子资料,包含商品页与购物车,看起来只是个小项目,但我反而觉得这个案例特别有代表性。 因为它非常符合我最近越来越看好的一个趋势: OPC经济(OPC Economy)。 One Person Company Economy。 简单说就是:一个人,就是一家公司。 我越来越觉得,AI 正在加速 OPC经济 的爆发,未来很多生意,不再需要传统意义上的团队配置,一个人加上 AI 和成熟基础设施,就可能跑出过去小团队才能完成的业务规模,而英语学习资料这种生意,就是很典型的 OPC 模型,没有库存压力,没有物流成本,内容可以长期复用,利润结构也很健康,资料做一次,可以卖很多次。 理论上,这非常适合个人创业者,但过去真正让很多人做不起来的,从来不是产品本身,而是执行成本。你要建网站。要配服务器。要解析域名,要做商品展示。要接支付系统。还要准备营销素材,如果找团队做,成本不低。如果自己学技术,时间成本更高,这也是为什么我越来越觉得,xBubble 的方向很特别。 如果说 Cursor、Claude Code、Codex 解决的是:如何更高效写代码,那xBubble 真正解决的是另一个问题:如何让普通人快速把生意跑起来。 这次实测里,我其实原本以为这个案例不会那么顺利。尤其是购物车和支付模块。因为在传统建站流程里,这两个部分往往最麻烦。购物车涉及商品逻辑。支付又涉及支付接口接入。通常是最容易卡住的地方。但这次实际体验,确实有点超出预期。我输入需求后,从生成到完整网站雏形出来,大概只用了 10 分钟。 这个速度已经很快了。更让我意外的是,生成出来的不只是一个展示页面。商品展示、购物车、支付链路这些核心模块,基本都已经搭好了。说实话,这点让我挺惊喜。因为我原本以为后面至少还要花不少时间去补功能。结果第一版出来,完整度已经很高。 这让我更直观地感受到:xBubble 的核心优势,不是某一个功能特别强。而是它把 OPC 创业过程中最难的几个问题,一次性解决掉了。过去最容易卡住普通人的,就是技术门槛。服务器部署、域名解析、API Key 配置,这些底层环节足以劝退很多人。 但在 xBubble 里,这些复杂环节基本都被封装掉了。用户不需要理解底层技术逻辑。相关费用也可以直接通过 xBubble Credit 统一结算。对 OPC 来说,这一点价值非常大。因为机会来了,你必须接得住。 更让我看重的是,它天然适合全球化创业。xBubble 底层架构强调抗审查与隐私保护。服务器、域名等基础设施由生态内第三方服务商提供,平台不留后门,数据完全隔离。 这意味着: 商业数据属于你。 客户数据属于你。 资产控制权也属于你。 真正把业务主权还给创业者自己。 另一个让我很看重的,是它的商业冷启动能力。平台原生支持稳定币支付与结算。这意味着你不需要再经历传统业务里最复杂的一套流程:开户。审核。跨境支付。结算。 从网站搭建到开始收款,整个商业闭环理论上可以压缩到 1 小时以内。这对于 OPC经济 来说,价值非常大。因为很多时候,速度本身就是竞争力。而且,xBubble 最容易被低估的,还不是建站能力。而是内容工业化输出能力。 商品详情页。 产品 3D 渲染图。 广告视频。 投放素材。 多平台宣发内容。 这些东西往往比开发更耗精力。而 xBubble 通过成熟 SOP,把这些环节几乎全部标准化了。整个过程不需要用户面对空白对话框反复调 prompt。这意味着,一个人也能拥有接近小团队的内容生产效率。 这也是为什么我越来越相信:OPC经济 会是 AI 时代最值得关注的趋势之一。 AI 正在创造一种全新的创业模式:一个人 + AI + 全球化基础设施 = 小型公司级生产力。传统 SaaS 看不上的长尾市场,很可能就是 OPC 的机会所在。而 xBubble,正在成为这个时代最关键的基础设施之一。 当多数人还在用 AI 提高一点效率的时候,真正聪明的 OPC,已经在用 AI 重构整个商业流程。 用抗审查释放长尾刚需。 用 SOP 碾平运营风险。 用 Vibe Coding 加速商业落地。 我越来越觉得,xBubble 很可能会成为 AI 时代 OPC 获取超额利润最核心的商业基础设施,甚至可能是最重要的那一个。
显示更多
0
53
47
1
转发到社区
强烈推荐大家使用一下 OpenAI Codex 的定时任务,每天早上 8 点自动产出美股财经日报。 相比起 Claude Code 更简单,不需要任何代码配置,也更实惠,每月只需要 20 美元。 一周之前,我已经把美股日报从 Claude Code 迁移到 Codex 了,基本是傻瓜式配置,大家直接把下面这段提示词发给 Codex 就行。 【当然,最好是你自己和 Codex 对话,描述清楚自己的投资偏好,让它给你生成一份美股日报的提示词。】 你是一名专业的美股市场日报分析师、宏观策略分析师和科技成长股研究员。 请你每天北京时间早上 8:00,为我生成一份完整的《美股收盘日报》。 报告语言:中文。 报告风格:专业、清晰、数据驱动、适合投资复盘和次日交易计划。 报告目标:帮助我快速理解昨夜美股发生了什么、市场为什么涨跌、资金在买什么卖什么、哪些板块/个股出现异动、接下来应该关注哪些风险和机会。 请务必使用最新数据,优先参考权威来源,包括但不限于: CNBC、Reuters、Bloomberg、MarketWatch、WSJ、Investing、Yahoo Finance、Barchart、Koyfin、TradingView、Finviz、FactSet、Nasdaq、公司 IR 官网、SEC 文件、FedWatch、FRED、美国财政部、CME、EIA 等。 如果数据存在冲突,请说明不同来源的差异,并优先采用更权威/更实时的数据。 所有关键事实、重要数据、公司新闻、财报数据、宏观数据都需要注明来源或链接。 不要编造数据。如果某项数据暂时无法获取,请明确写“暂无可靠数据”。 请按照以下结构生成日报: 美股收盘日报|YYYY-MM-DD 0. 今日一句话总结 用 3-5 句话概括昨夜美股最重要的变化: 大盘是上涨、下跌还是震荡? 驱动因素是宏观、财报、AI 主线、利率、地缘、油价、美元,还是板块轮动? 资金是 risk-on 还是 risk-off? 市场宽度是改善还是恶化? 今天最值得关注的主线是什么? 最后给出一句简洁判断: 今日市场状态:例如“指数强、宽度弱,AI 硬件继续主导,但短线拥挤度上升。” 1. 大盘表现总览 请列出以下指数的当日表现: 指数 收盘点位 涨跌幅 日内高低点 成交量变化 技术状态 Dow Jones S&P 500 Nasdaq Composite Nasdaq 100 / QQQ Russell 2000 / IWM SOX 半导体指数 VIX 请额外说明: 标普和纳指是否创历史新高 / 阶段新高 / 跌破关键均线? 纳指是否明显强于标普? 小盘 Russell 2000 是否跑赢或跑输? 半导体是否继续领先? VIX 是上升还是下降,是否说明避险情绪升温? 2. 盘中走势复盘 请用时间线方式复盘昨夜美股走势: 盘前发生了什么? 开盘后是高开低走、低开高走,还是震荡? 午盘是否出现方向选择? 尾盘是否有拉升或跳水? 盘后是否有重要财报或新闻导致期货/个股异动? 请解释: 当天涨跌的核心原因是什么? 是由利率驱动,还是财报驱动,还是 AI 主线驱动? 是否有明显的 sell the news / buy the dip / short squeeze / rotation? 3. 宏观环境 请覆盖以下宏观变量,并解释它们对美股的影响: 3.1 美债收益率 项目 最新水平 日变化 市场含义 2Y 美债收益率 10Y 美债收益率 30Y 美债收益率 2Y-10Y 利差 10Y-30Y 利差 请重点分析: 10Y 是否接近关键压力位,例如 4.5%、4.6%、4.7%? 长端利率上行是否压制科技股估值? 收益率曲线是陡峭化还是扁平化? 债市是否在交易通胀、财政赤字、降息预期变化,还是避险? 3.2 Fed 降息预期 请列出: CME FedWatch 当前对下一次 FOMC 的降息/不降息概率。 年内市场预期降息次数。 与前一日相比是否出现明显变化。 是否有 Fed 官员讲话影响市场。 3.3 美元、黄金、原油、比特币 资产 最新价格 涨跌幅 含义 DXY 美元指数 黄金 WTI 原油 Brent 原油 比特币 以太坊 请解释: 美元走强是否压制风险资产? 黄金上涨是避险还是实际利率下降? 油价上涨是否增加通胀压力? 加密货币是否体现风险偏好变化? 3.4 当日重要经济数据 请列出当天公布的所有重要美国经济数据,例如: CPI / PPI PCE 非农 初请失业金 零售销售 ISM PMI JOLTS 消费者信心 房地产数据 财政部拍卖结果 每个数据请包含: 数据 实际值 预期值 前值 市场解读 4. 板块表现 请列出 S&P 500 十一个板块表现: 排名 板块 ETF 当日涨跌幅 近5日 近1月 跑赢/跑输标普 主要驱动 信息技术 XLK 通信服务 XLC 可选消费 XLY 金融 XLF 工业 XLI 医疗保健 XLV 必需消费 XLP 能源 XLE 公用事业 XLU 材料 XLB 房地产 XLRE 请额外说明: 今天最强板块是什么? 最弱板块是什么? 是成长股占优,还是价值股占优? 是周期板块占优,还是防御板块占优? 是否出现高切低? 是否出现 AI 硬件向软件、能源、电力、光通信、工业、金融等方向轮动? 5. 主题与风格表现 请覆盖以下主题 ETF / 风格 ETF: 主题 / 风格 代表 ETF 当日涨跌幅 近5日 近1月 解读 半导体 SMH / SOXX 软件 IGV 网络安全 CIBR / HACK 云计算 CLOU / WCLD AI / 自动化 BOTZ / AIQ 光通信 / 光模块相关 代表股观察 数据中心 / 电力 代表股观察 核电 / SMR 代表股观察 储能 代表股观察 小盘成长 IWO 小盘价值 IWN 等权标普 RSP 大盘成长 QQQ / SCHG 大盘价值 VTV 请重点判断: AI 硬件是否仍是主线? 软件股是否开始补涨? 半导体是否利好钝化? 小盘股是否参与? 等权指数是否跑赢市值加权指数? 市场是扩散行情,还是少数权重股拉指数? 6. 市场宽度与参与度 这是非常重要的部分,请详细列出。 6.1 均线参与度 请分别统计: 指数 / 市场 高于20日均线比例 高于50日均线比例 高于100日均线比例 高于200日均线比例 解读 S&P 500 Nasdaq 100 Nasdaq Composite NYSE Russell 2000 请判断: 20 日参与度是否短线过热或恐慌? 50 日参与度是否高于 50%? 100 / 200 日参与度是否说明中期趋势健康? 指数上涨是否有足够宽度支持? 是否出现“指数创新高,但参与度下降”的背离? 6.2 涨跌家数、新高新低 请列出: 指标 NYSE Nasdaq 解读 上涨家数 下跌家数 涨跌比 创52周新高数量 创52周新低数量 新高-新低差值 请判断: 市场是普涨还是结构性上涨? 科技股内部是否健康? 新低数量是否异常增加? 是否出现风险偏好退潮? 6.3 其他市场内部指标 如果可以获取,请补充: Advance/Decline Line McClellan Oscillator Put/Call Ratio VIX term structure VVIX MOVE Index High Yield Spread Investment Grade Spread 市场成交量是否放大 上涨成交量 / 下跌成交量比例 7. 技术面分析 请分析以下指数 / ETF 的技术形态: 标的 当前价格 20日线 50日线 100日线 200日线 RSI MACD / 趋势 关键支撑 关键压力 SPY QQQ IWM SMH IGV XLK XLC XLY 请重点说明: SPY / QQQ 是否远离 20 日线或 50 日线? 是否处于超买或超卖? 是否出现放量滞涨? 是否出现假突破风险? 哪些关键支撑位不能破? 哪些压力位突破后会打开上行空间? 如果明天继续上涨,确认信号是什么? 如果明天回调,风险位置在哪里? 8. 重点个股新闻与异动 请列出昨夜最重要的个股异动,尤其关注: 8.1 大型科技七巨头 股票 涨跌幅 原因 技术位置 后续关注 NVDA MSFT AAPL GOOGL AMZN META TSLA 请判断: 七巨头是否集体上涨,还是内部严重分化? 是谁在拉动指数? 谁在拖累指数? 是否有监管、财报、产品、AI、反垄断、评级调整、目标价调整等新闻? 8.2 AI 硬件 / 半导体 重点覆盖: NVDA、AMD、AVGO、MRVL、MU、TSM、ASML、ARM、INTC、QCOM、SMCI、DELL、HPE、ANET、CLS、VRT、COHR、LITE、AAOI、TSEM、SIVE 等。 请说明: 哪些股票大涨 / 大跌? 原因是什么? 是财报、订单、分析师评级、产业新闻,还是板块联动? AI 硬件是否继续拥挤? 是否出现 sell the news? 是否出现资金从 GPU 切向光通信、电力、软件? 8.3 软件 / SaaS / AI 应用 重点覆盖: CRM、NOW、SNOW、ORCL、ADBE、PANW、CRWD、DDOG、NET、MDB、PLTR、APP、TEAM、WDAY、INTU、SHOP 等。 请说明: 软件股是否跑赢大盘? AI 替代 SaaS 的叙事是否缓解? AI Agent / 数据云 / 工作流平台是否有新催化? CRM、NOW、SNOW、ORCL、MSFT 等是否有财报、评级、机构加仓、产品发布? 8.4 AI 电力 / 数据中心 / 能源基础设施 重点覆盖: CEG、VST、NRG、ETN、PWR、GEV、VRT、FLNC、OKLO、SMR、BE、NEE、SO、DUK、APLD、IREN、CORZ 等。 请说明: 数据中心电力链是否继续强势? 核电、天然气、储能、电网设备、液冷、电力基础设施是否有新闻? AI 数据中心需求是否推动相关股票重估? 是否有监管、订单、融资、并购、政策催化? 8.5 其他显著异动 请列出涨幅 / 跌幅最大的重点股票,尤其是: 财报后大涨大跌 盘后异动 分析师上调/下调 并购消息 SEC 调查 管理层变动 回购 / 增发 / 二次发行 空头报告 指引上调 / 下调 9. 财报日历与财报解读 请列出: 9.1 昨夜已公布财报的重点公司 公司 收入 EPS 是否 beat 指引 盘后反应 核心解读 请重点说明: 收入是否超预期? EPS 是否超预期? 毛利率、运营利润率、自由现金流是否变化? RPO、ARR、订单、backlog、云收入、AI 相关收入是否有亮点? 管理层指引是否强? 股价反应和财报质量是否一致? 9.2 接下来 1-3 个交易日重要财报 日期 公司 市场关注点 可能影响板块 请特别关注: NVDA、AVGO、AMD、MRVL、MU、TSM、ASML CRM、NOW、SNOW、ORCL、ADBE、PANW、CRWD GOOGL、MSFT、AMZN、META、AAPL、TSLA VRT、ANET、DELL、SMCI、COHR、LITE、AAOI CEG、VST、FLNC、OKLO 等 10. 机构观点与资金流 请整理当天重要机构观点: 华尔街大行最新策略观点 对标普 / 纳指目标点位调整 对 AI、半导体、软件、能源、电力、金融等板块的观点变化 重点股票评级上调 / 下调 ETF 资金流向 期权市场异动 大宗交易 / 内部人交易 / 回购公告 请用表格列出: 机构 / 来源 观点 涉及资产 市场影响 11. 板块轮动判断 请判断当前市场处于以下哪种状态: AI 硬件主升浪 AI 硬件高位震荡 AI 硬件利好钝化 软件补涨 / 估值修复 高切低 风险资产全面 risk-on 防御性 risk-off 宽度扩散 指数强、内部弱 普跌恐慌 超跌反弹 请明确回答: 今天资金主要流入哪里? 今天资金主要流出哪里? AI 主线是否仍然健康? 半导体是否继续领先? 软件是否开始相对走强? 小盘是否参与? 防御板块是否异动? 当前市场更像趋势延续,还是阶段性顶部震荡? 12. 我的重点关注股观察 请每天额外跟踪以下股票,并给出简短判断: 核心科技 / AI: NVDA、AMD、AVGO、MRVL、GOOGL、MSFT、META、AMZN、ORCL 软件: CRM、NOW、SNOW、ADBE、PANW、CRWD、PLTR、DDOG、NET 光通信 / AI 互连: LITE、COHR、AAOI、TSEM、SIVE、MRVL、AVGO、ANET AI 电力 / 数据中心基础设施: FLNC、OKLO、VST、CEG、ETN、VRT、PWR、GEV、APLD、IREN 请对每只股票输出: 股票 当日涨跌 当前趋势 关键新闻 支撑位 压力位 我的判断 判断用以下标签之一: 继续强势 高位震荡 短线过热 回踩支撑 破位风险 等财报催化 利好兑现 低位修复 需要观察 13. 明日交易计划 / 观察清单 请给出明天最重要的观察点: 13.1 宏观观察 10Y 美债收益率关键位置 美元指数方向 油价 / 黄金 / VIX Fed 官员讲话 经济数据 13.2 大盘观察 SPY 关键支撑 / 压力 QQQ 关键支撑 / 压力 SMH 是否继续强于 QQQ IGV 是否开始跑赢 IWM 是否参与 13.3 板块观察 AI 硬件是否继续领涨 软件是否补涨 金融 / 工业 / 能源是否轮动 防御板块是否走强 市场宽度是否改善 13.4 个股观察 请列出 10-20 只明天最值得关注的股票,并说明原因。 14. 风险提示 请列出当前市场最大的风险: 美债收益率继续上行 通胀预期反弹 Fed 降息预期下降 地缘风险 油价冲击 AI 硬件 sell the news 半导体高位拥挤 软件财报不及预期 市场宽度恶化 信用利差扩大 VIX 异动 重要个股财报风险 政策 / 监管风险 美元走强压制风险资产 请判断当前风险级别: 风险维度 当前状态 风险等级 宏观利率 市场宽度 AI 拥挤度 财报风险 地缘风险 技术面 流动性 风险等级使用:低 / 中 / 中高 / 高。 15. 最终结论 最后请用以下格式总结: 今日市场结论 用 3-5 句话总结。 当前市场阶段 请选择一个: 强趋势上涨 高位震荡 健康回调 板块轮动 风险偏好下降 普跌恐慌 超跌反弹 我的操作倾向 请用中性语言给出观察,不构成投资建议: 是否适合追高? 是否适合逢低? 是否应该等待财报? 是否应该控制仓位? 哪些板块更值得关注? 哪些板块需要谨慎? 最值得关注的 5 个信号 请列出明天最重要的 5 个观察信号。
显示更多
0
270
5K
1.2K
转发到社区
$AVGO 是AI芯片的龙头。但历史告诉你,真正暴富的人买的是龙二 $MRVL 先说一个关于半导体行业的反直觉规律: 在一个严重缺货的市场里,获利最大的往往不是龙头,而是那个追赶中的龙二。(Herman老师分析intel观点我觉得说的很好,也同样非常适用于 $MRVL) 理由很简单: 当产能严重不足,买家再也无法只依赖龙头一家供应商。他们开始把订单给原本觉得"不够好"的替代者。而这个替代者,突然发现自己的产品以前没有人要,现在成了香饽饽——价格可以谈,条款可以谈,一切都变了。晶圆缺货时,原本没有人愿意把订单给Intel的客户,开始认真研究18A了。 那么,在AI定制芯片这个正在快速缺货的赛道里,获利最大的龙二会是谁? 我的答案是 $MRVL 。 1. 先理解结构 AI芯片市场分两层: 第一层:通用GPU Nvidia统治,没有任何人能挑战。H100、B200、Blackwell——超大规模云厂商需要它们,别无选择。 这层市场已经被充分定价了。Nvidia市值5.7万亿,没有人会漏掉这个机会。 第二层:定制ASIC(专用AI加速芯片) 这是一个完全不同的故事。 每一家超大规模云厂商都在开发自己的专用芯片: Google有TPU(张量处理器),Amazon有Trainium(AI训练)和Inferentia(推理),Meta有MTIA(AI推理加速),Microsoft有Maia(Azure AI加速)。 为什么要自己开发芯片? 因为通用GPU虽然强大,但它服务所有人,没有为特定工作负载优化。自研芯片可以针对自己的模型架构和推理需求精确设计,功耗更低,成本更低,效率更高。 这是一个不可逆的趋势——超大规模云厂商越大,自研芯片的动力越强。但有一个关键问题:这些云厂商需要设计合作伙伴。芯片设计是极其复杂的工程,需要有人懂SerDes,懂先进封装,懂chiplet集成,懂供应链——不是随便一家公司能做到的。 全球有能力承接超大规模云厂商定制ASIC设计的公司,只有两家: $Broadcom,和 $Marvell。 2. AVGO vs MRVL:龙头和龙二的真实差距 先看数字: Broadcom在ASIC市场占约55-60%的份额,与Google的TPU合作锁定到2031年,客户包括Meta、OpenAI等顶级厂商。Marvell约占15%的份额,排名第二Broadcom领先是事实,毫无争议。 但有几个数字值得认真对比: AVGO MRVL 市值 $2万亿 $1,470亿 ASIC市占 55-60% 15% FY26AI营收 $200亿+ $96亿 Forward PE 31倍 36倍 Broadcom在定制ASIC市场记录了约$200亿的AI总营收,而Marvell的AI相关营收约$96亿。 从市值角度:AVGO的市值是MRVL的13.6倍,但ASIC市场份额只是MRVL的4倍,AI营收只是MRVL的2倍。这个不对称,是MRVL存在的核心机会。 3. MRVL独特的地方:两场战争同时押注 这是我认为最关键的一点,也是MRVL和所有其他AI芯片公司最本质的区别。 MRVL同时押注了两个互相独立的万亿级叙事: 叙事一:定制ASIC——去Nvidia化的最大受益者 Marvell的数据中心部门FY2026增长46%,超过$60亿,管理层指引FY2027同比再增约40%。定制芯片年化营收已达$15亿规模,两个AI加速器项目处于高产量阶段,第三个超大规模客户合作正在进行。 Nasdaq 最重要的一个进展: 2026年4月,Google被报道正在与Marvell进行深度谈判,共同开发内存处理单元和下一代TPU,这正是Google此前几乎完全交由Broadcom负责的工作。如果谈判成功,Marvell将成为AI行业最具战略意义的芯片项目之一的核心设计伙伴。 这是什么意思? Broadcom和Google的TPU合作锁定到2031年——这是Broadcom的护城河,但不是MRVL的天花板。Google开始和MRVL谈,不是要取代Broadcom,而是要建立第二供应商。这正是"缺货时代,落后者获利"的经典逻辑。 当TPU的设计需求超过了Broadcom单独能服务的上限,Google开始把部分项目分给MRVL。 这一单谈成,MRVL同时拥有Amazon和Google双超大规模客户锚定——三个超大规模客户(Amazon、Microsoft、Google)大幅降低了单一客户集中的风险,给市场提供了更清晰的多年营收增长路线图。 叙事二:光互连DSP——AI集群神经系统的命门 MRVL是目前唯一同时覆盖定制ASIC设计、1.6T光学DSP、硅光子技术(通过Celestial AI收购)和CXL交换的全栈公司——这是任何单一竞争对手都无法复制的护城河。 光互连DSP是什么? 当GPU和GPU之间需要通信,数据需要在光纤里传输。但光纤里走的是模拟光信号,计算机需要的是数字信号。DSP(数字信号处理器)就是这两个世界之间的翻译器——它把数字数据编码成光信号发出去,再把收到的光信号解码成数字数据。 MRVL的PAM4 DSP是全球800G和1.6T光模块的核心芯片之一。光互连业务的需求与AI集群的互连基础设施同步扩张——每一个上线的AI集群都需要完整的互连协议栈,不需要等待GPU的供应情况。 这是最关键的逻辑: GPU供应有时候是稀缺的,但光互连不等GPU——只要数据中心在建,只要AI集群在运行,光互连就需要。 MRVL的DSP是一个和GPU并行运行的独立需求,不是GPU需求的影子。 4. 我自己的判断:为什么MRVL的故事比AVGO更有弹性 AVGO是龙头,MRVL是追赶者。 但在这个特定的历史时刻,追赶者的弹性更大,原因有三: 原因一:基数效应 AVGO已经是$2万亿市值,要翻倍需要成为$4万亿的公司。MRVL只有$1,470亿,翻倍只需要$2,940亿——和AVGO现在市值的15%相当。同样的资金流入,对MRVL股价的推动效果是AVGO的13倍以上。 原因二:Google的变量 AVGO和Google的合作是锁定的,这是护城河,但也意味着它的上行惊喜已经被充分定价。MRVL和Google的谈判还没有正式宣布——这是一个尚未被市场定价的潜在催化剂。如果Google正式宣布,MRVL立刻拥有Amazon+Google双超大规模客户,ASIC市场份额从15%向25%+跳升的路径被打开。 原因三:两个叙事不相关 AVGO的核心护城河是ASIC和VMware软件。 MRVL的两个叙事——ASIC和光互连DSP——是完全独立的业务。 ASIC受益于去Nvidia化,光互连受益于AI集群扩张。两个独立的增长引擎,互相不依赖,互相不替代。 MRVL在多个AI基础设施顺风中同时暴露:定制芯片、光互连、数据中心网络和更广泛的超大规模资本支出周期。这种在AI主题内的多元化暴露,使它成为纯粹的GPU标的(如Nvidia)的有吸引力的补充。 5. 估值合理吗? $MRVL:Forward PE 36.4倍,市值$1,470亿。 $AVGO:Forward PE 31倍,市值$2万亿。 $MRVL的Forward PE比 $AVGO略高,但增速也更快: $MRVL FY27营收预期:约$110亿,同比增速约40% $AVGO FY27增速约25-30%。PEG(PE/增速): $MRVL:36.4 ÷ 40 = 0.91, $AVGO:31 ÷ 27 = 1.15 PEG低于1都算便宜。 用PEG来衡量,MRVL比AVGO便宜约20%。 而且MRVL有Google催化剂这个尚未被定价的变量,AVGO没有。如果Marvell股价涨到$400,需要数据中心营收FY27超过$90亿,Google ASIC合同正式宣布,自定义硅年化营收达到$30亿。在这些条件下,ASIC业务40倍Forward EV/EBITDA,光互连业务20倍EV/Sales。 我觉得2027年是很有可能达到的,这还是在理性的估值下,如果是ai融涨疯牛选择忽略估值的话,如果NVDA到360分析师预测最高,也就是8.8T, 我预测8-10T,那么AVGO会到3-4T, MRVL到500B-1T都问题不大。 6. 三个需要追踪的关键变量 变量一:Google ASIC合同的正式宣布 这是目前MRVL最大的潜在催化剂。谈判已经在进行,但没有正式宣布。每过一个季度没有宣布,市场会稍微失去耐心。但一旦宣布,估值逻辑发生质变。 变量二:1.6T DSP的市场份额 Marvell已经开始出货1.6T PAM DSP,基于5纳米工艺,并推出了下一代3纳米版本,将光模块功耗降低超过20%。 800G向1.6T的迭代是MRVL DSP业务的下一个量子跳跃。如果MRVL能在1.6T时代维持甚至提升市场份额,光互连业务的营收会非线性增长。 变量三:Celestial AI的硅光子整合 MRVL收购了Celestial AI,进入硅光子领域。这是CPO时代最关键的技术平台——把光学引擎直接集成进芯片封装。如果MRVL能在CPO时代把DSP和硅光子整合成一个完整的解决方案,它的价值会远超现在的定价。 7. 最终判断:MRVL是这轮AI牛市里最干净的不对称机会 AI芯片市场分三类公司: 第一类:Nvidia——已经被充分定价的龙头。故事最好,估值最贵,上行惊喜空间有限。 第二类:纯ASIC公司(AVGO)——护城河深厚,但增速放缓在定价中。Google TPU锁定到2031年是确定性,也是上行惊喜的天花板。 第三类:MRVL——两个叙事都在爆发,Google催化剂未定价,市值基数小。 这是不对称机会的经典形态, 下行有Amazon锚定,有光互连稳定收入,不会归零,上行有Google合同宣布+CPO爆发+ASIC市场份额提升,估值可能从$1,470亿走向$5,000亿+。 $MRVL也是我重仓持有的标的之一,短期technical角度今天收长上影线,日线级别调整要来,加仓机会在第一目标165,第二目标140。如果给机会到140补那个缺口,我仓位加满(图1)。 总结:回到那个反直觉的规律:缺货时代,落后者获利最大。 ASIC市场正在缺货——Broadcom一家根本无法满足所有超大规模客户的定制需求。光互连正在缺货——AI集群每季度都在扩张,DSP的需求只增不减。MRVL是这两个缺货赛道里,那个正在被需要的追赶者。 历史一次次证明:当产能不足、供应商只有一两家的时候,第二名是最好的弹性高的投资标的(Nvidia和Amd,TSMC和Intel。) 因为所有人都开始认真研究它了。 #MRVL# #Marvell# #AVGO# #Broadcom# #ASIC# #定制芯片# #光互连# #DSP# #Google# #Amazon# #Nvidia# #AI芯片# #半导体# #美股# #龙二补涨# #CPO# #硅光子# #AI基建# #USStocks# #AIStocks# #数据中心# #去Nvidia化#
显示更多
0
30
432
87
转发到社区
#OpenAI# 还没上市,它的算力小弟先要IPO了,这事挺有意思。🧐 之前黄仁勋讲过,未来推理需求将会增长10亿倍,而下周四5月14日,推理时代的 #AI# 芯片黑马,Cerebras ( $CBRS)要上市了,定价区间115-125美金,募资最高35亿美金,估值266亿美金。也将是 @MSX_CN 的第一期 PreIPO项目,还是十分值得期待的! 今天我们就来拆解一下这家Cerebras公司,以及估值分析情况,还有我个人的一些私人判断和意见。 要了解这个OpenAI系的推理芯片黑马,就要知晓山姆奥特曼的资本布局。 我们都知道英伟达在AI芯片领域有多牛,大模型公司烧钱,云厂商买卡,创业公司排队等GPU,最后利润大多流向卖铲子的英伟达,这是目前行业的现状。 但这种一家独大的局面,各家大模型厂商,都希望有一个嫡系方案做PlanB,比如谷歌Gemini便联合博通采用TPU方案,OpenAI也一直想扶持自己的嫡系部队。 所以在5月6日,OpenAI把英伟达、AMD、英特尔、博通、微软这些本该互相竞争的芯片公司拉到一起,搞了个MRC网络协议。表面看是技术合作,其实是OpenAI要重新分蛋糕了。 更深一层看,我认为是 #OpenAI# 想要拆开英伟达全栈垄断格局。 以前训练、推理、网络、云,全让英伟达一家包圆了。现在呢?OpenAI开始精细化运营:训练归训练,推理归推理,不同场景用不同芯片,不同环节找不同供应商。 #Cerebras# 就是在这个时候被推上了牌桌,它核心负责推理这一环。这正好与最近炒作火热的推理CPU概念,比如 #AMD,##INTC# 等,撞在了风口上。 🔥Cerebras到底牛在哪? Cerebras的核心杀手锏是WSE-3芯片,直接把整片12英寸晶圆做成一颗巨型芯片,面积46225平方毫米,相当于A4纸的三分之一。 我们数据对比看看,相较于英伟达H100: • 它面积是H100的57倍 • 核心数是52倍 • 片上内存是880倍 • 内存带宽是7000倍 这数据📊看起来蛮夸张的,但核心关键不在大,而在于快。 在推理场景,尤其是长文本输出、实时交互、代码生成、AI Agent这些需要低延迟的任务上,Cerebras的CS-3系统推理速度比英伟达DGX B200快21倍,成本和能耗降到三分之一。这个效率和功耗,采用WSE-3芯片意味着OpenAI能在单位时间服务更多客户,这就相当于白花花银子啊。 📊财务数据也很漂亮 首先从市场趋势来看,AI 产业正从训练为主转向推理为主,这是不争的事实,2025 年全球 AI 推理市场规模已达1062亿美元,预计2030年将增至 2550亿美元,而 Cerebras 的技术优势正好踩在了风口上。 另外本轮IPO估值为266亿美金,发行价为115-125美金/股,我觉得是相对便宜的,虽然比上一轮估值翻了倍,上一轮F轮估值约为120亿美金,短短两年时间,直接翻倍,但架不住漂亮的财务数据。 2025年Cerebras营收5.1亿美金,比2024年的2.9亿增长76%。更牛的是净利润8790万美金,2024年还亏4.85亿,直接扭亏为盈。 以266亿估值来算,PS为52倍。以24年上市的热门半导体连接芯片公司Astera Labs( #ALAB#)做对比,它上市首日PS高达81倍。而目前正处于火热的推理赛道炒作中,个人认为Cerebras冲击80-100倍PS绰绰有余,对应的收盘价192美金—239美金,预计有50%以上涨幅!(但也要观察当天纳斯达克指数行情来综合判断) 不能只说好的一面,目前Cerebras问题也很明显,客户集中度太高。阿联酋MBZUAI贡献62%收入,G42贡献24%,前两大客户占86%。意味着Cerebras必须听大客户的话,自主性有限。可喜的是,OpenAI的介入,未来这种收入结构会有所改善,而且OpenAI会成为最大客户。 🎯OpenAI和Cerebras的深度绑定 最新的数据,OpenAI与Cerebras签了多年的合作协议,总价值超200亿美金,Cerebras要给OpenAI提供750兆瓦算力,部署到2028年。 但这不只是采购合同这么简单。OpenAI创始人奥特曼、总裁布鲁克曼、前首席科学家伊利亚、董事会成员亚当·安戈洛,这些核心高管都个人投资了Cerebras。 OpenAI还通过贷款、认股权证等金融工具,和Cerebras建立长期利益绑定。说白了,现在的Cerebras就是OpenAI的芯片部门。 除此之外,Cerebras 3月又与 AWS 达成合作,CS-3 系统上线亚马逊云端服务,成为首个进入主流云端厂商供应链的非 GPU AI 加速器。此外,葛兰素史克、美国能源部、多个国家实验室等也都是其客户,技术实力也得到多维度的验证。 💡OpenAI的资本局 OpenAI的真实意图很清楚: • 训练继续用英伟达高端GPU • 推理引入Cerebras低延迟方案 • 部分GPU采购AMD • 网络协议开放化 • 云服务在AWS、Azure、谷歌Cloud之间多家下注 • 未来可能推自研芯片 这是算力组合拳策略,不同工作负载匹配不同系统,不再单独依赖英伟达全栈方案。 OpenAI正在从模型公司转变为算力架构公司。以前只能被动接受芯片厂商定义的技术路线,现在要主动设计符合自己需求的算力组合。 OpenAI要把芯片供应商从"平台提供者"降维为"模块供应商"。所以扶持Cerebras是其战略中最重要的一环,预期来看,Cerebras上市首日股价,爆火的概率极大! ⚡对英伟达的影响 短期看,Cerebras上市对英伟达冲击不大,就像身上长个粉刺一样无关痛痒。 英伟达目前占AI芯片市场80-90%份额,CUDA生态、GPU供应链、NVLink网络,这些护城河短期很难撼动。 但长期看,威胁是存在的。以前AI公司别无选择,只能用英伟达GPU。现在至少在推理场景,客户有了可行替代方案。这种选择权的出现,削弱了英伟达定价权。 当OpenAI可以说"推理我用Cerebras,训练我用英伟达"时,英伟达就失去了"全包"的议价能力。 AI推理市场正在快速增长。根据预测,2026-2032年全球AI推理市场复合增长率将达28.9%。推理场景更适合专用芯片。当推理市场规模超过训练市场时,英伟达在推理领域的相对弱势就会成为更大问题。 英伟达正在从"唯一供应商"变成"核心供应商之一"。这个转变不是因为英伟达变弱了,而是市场变大了,客户变强了,需求变复杂了。 🧐我的判断 Cerebras上市真正值得看的,不是又一家AI芯片公司IPO,而是OpenAI开始把推理这门生意单独拎出来定价了。 当推理市场被验证可以独立定价时,AI算力市场就真的开始分层了。训练和推理的需求差异被明确化,专用芯片在细分场景的优势被验证。 英伟达"一种芯片打天下"的叙事不再完全成立。市场会从"通用GPU垄断"走向"场景化芯片组合"。 而且不只OpenAI这么干,Anthropic也在和亚马逊、谷歌结盟。头部AI公司都在通过多元化采购降低对英伟达依赖。单一供应商的"完整解决方案"不再是最优选择。 最后值得一提的是,这次 #MSX# 第一期PreIPO项目即将上市,它就是本周四即将上市的Cerebras,拭目以待吧!🧐 DYOR🙏
显示更多
0
53
150
57
转发到社区
行业分析:AI光互连全景:谁是下一个“HBM级瓶颈”? AI算力的瓶颈正在从计算转向带宽。随着GPU规模扩大,节点间通信接近N²级增长,电互连在功耗与距离上逐步触顶,光互连从可选项变成刚需。这一变化不只是需求扩张,而是产业结构的重排:光开始从数据中心边缘进入系统核心,甚至进入封装内部。 从底层看,硅光(SiPho)是在硅基上做出一整套光通信器件:波导负责传光,调制器把电信号变成光,探测器再把光变回电。它解决的是带宽与能效问题。硅本身不能发光,激光器依赖InP、GaAs等III-V材料,因此整个体系天然是“硅 + III-V”的异构结构。 产业链可以拆成四层:上游材料(InP与激光材料)、中游核心器件(激光器、硅光芯片)、模块与封装(光模块、CPO)、以及系统与网络架构。价值分配并不均匀。最稀缺的是光源,也就是激光器及其背后的InP体系,这一层类似算力链中的HBM,是物理瓶颈;再往下是硅光与光芯片,决定光电融合是否可行;光模块更偏制造与组装,周期性更强;真正的高价值封装集中在系统级CPO。 在硅光制造这一层,Tower Semiconductor 和 GlobalFoundries 是典型代表。它们本质是foundry,把光子芯片从设计变成晶圆。器件公司是它们的客户,而不是供应商。两者路径不同:TSEM更像工艺专家,擅长定制和复杂结构,解决“别人做不出来”的问题;GF更像平台型foundry,提供标准化工艺和规模能力,让更多客户可以复制。 这也解释了近期股价的差异。TSEM的上涨几乎直接由AI光互连驱动,尤其是硅光需求进入订单兑现阶段;GF更多受益于AI整体需求扩散,硅光只是其中一部分。前者是主线变量,后者更像beta。 很多人会误以为竞争在晶圆尺寸,比如300mm。但在SiPho、模拟、RF这些领域,关键不在晶圆,而在工艺复杂度、良率和客户绑定。真正决定竞争力的是能否稳定量产复杂光电结构,而不是晶圆大小。 从全球格局看,中国在光模块层面占据优势,但在SiPho制造仍处于早期阶段。差距不在技术原理,而在量产能力和客户验证。短期内,由于订单和经验的正反馈,差距在拉大;中期随着下游需求反向驱动,上游有望追赶。这一结构和HBM不同,SiPho不属于天然寡头,更可能走向多极竞争。 真正改变产业结构的是CPO(co-packaged optics)。CPO不是一个器件,而是一种封装形态:把光芯片与算力芯片封在一起,使光从“外部模块”变成“系统内部的一部分”。实现路径是先在SiPho晶圆上完成器件制造,筛选良品(KGD),切割成die,再与GPU/ASIC、HBM等一起进行异构集成,通常采用平面并排而非堆叠。 这一变化的核心结果是:硅光从“独立产品”变成“系统中的一层”。功能重要性不变,但定价权下降。过去光模块可以独立定价;在CPO中,价值更多被系统整合者吸收。掌握先进封装能力的厂商更接近控制节点,这也是为什么TSMC和Intel在这一阶段具备更强话语权,而TSEM和GF更接近中游die供应商。 CPO对技术提出了三大硬约束:功耗、带宽密度和封装耦合。功耗决定系统是否可持续,带宽密度决定扩展能力,封装耦合决定良率和成本。这三点直接推动硅光工艺进入新阶段。 在这一过程中,低损耗波导成为关键基础。波导是芯片内部的“光通道”,损耗以dB/cm衡量。0.1 dB/cm与1 dB/cm的差异,会在封装内线性累积,直接决定系统功耗与成本。当前主流量产水平在0.3–1 dB/cm,先进工艺可到0.1 dB/cm,实验室中的氮化硅(SiN)接近0.01 dB/cm,但距离大规模量产仍有距离。材料路径也逐渐清晰:硅波导受限于粗糙度和折射率,长期趋势是向SiN迁移。 难点不在单点,而在多重极限叠加:侧壁粗糙度、PECVD氢吸收、SiN应力、弯曲损耗、光纤耦合等因素同时作用。这也是为什么真正的优势来自“全栈工艺控制”,而不是某个单一技术突破。 CPO不仅改变技术路径,也改变竞争结构。未来不会出现单一路线,而是分层共存: 核心AI集群:定制CPO,追求极致性能 大规模部署:标准化CPO或pluggable,追求成本与灵活性 即使在CPO内部,也会分化为“高性能CPO”和“标准化CPO”,类似HBM与DDR的关系:前者吃价值,后者吃规模。 对TSEM和GF来说,这种分化进一步强化各自路径。TSEM更靠近高性能CPO,承接定制需求,有机会成为局部瓶颈;GF更靠近标准化CPO,承担规模扩张,是产业的放大器。 整条链可以压缩成一句话:材料决定能不能做,芯片决定性能上限,封装决定系统价值,系统厂决定利润分配。对应到算力链,InP激光器类似HBM,CPO类似GPU封装,光模块类似服务器组装,而硅光晶圆厂更像中间层的chiplet供应商。 从投资角度看,最确定的机会在光源,这是物理瓶颈;最大弹性在硅光与CPO,一旦路径跑通会被放大;光模块是顺周期;封装稳定吃利润但不容易爆发;系统层存在潜在黑马,但取决于架构演进。硅光不会消失,但正在被“吞入系统”。未来真正的“HBM时刻”,更可能出现在光源层或系统级封装,而不是封装之前的中游晶圆环节。 免责声明:本人持有文章中提及资产,观点充满偏见,非投资建议dyor
显示更多
0
15
326
106
转发到社区
生成式AI往代理式AI迁移中,新的卡脖子环节又出现了,这次是CPU。之前市场关于算力紧缺的讨论都在GPU、HBM、光模块、电力等环节,其实对于CPU的关注比较少。其实Cpu的紧缺传了一段时间了,看最近英特尔、AMD走势最核心驱动力就是来自cpu开始出现紧缺了,甚至连过往不怎么受待见的港股联想集团,最近两周走的也很强。 1、为什agentic ai时代CPU占比会扩大? 传统AI(主要是大模型训练/推理)高度依赖GPU,因为Transformer的核心是并行矩阵运算,GPU擅长高吞吐的并行计算。这时CPU主要只负责“辅助”:数据路由、内存压缩、GPU调度等,导致数据中心CPU:GPU比例很低(典型1:4~1:8,甚至1颗CPU管8颗GPU)。CPU利用率低,基本是配角。 Agentic AI完全不同,它不是单次“问答”,而是自主多步循环(Planning → Tool Use → Act → Observe → Reflect → Iterate),涉及: 1)编排:调度子任务、多智能体协作、分支逻辑、重试机制。 2)工具调用:网页搜索、API调用、代码执行、数据库查询、向量检索(RAG)、文件处理等。 3)其他CPU密集任务:上下文管理、KV Cache处理、强化学习(RL)仿真评估、数据预/后处理。 这些任务高度串行、I/O密集、逻辑分支多,GPU并不擅长(甚至会闲置)。研究显示:工具处理阶段在CPU上可占总延迟的50%~90.6%(GPU在等待CPU)。Agentic工作流中CPU动态能耗占比可达44%,比传统AI高3~4倍。 简单说,Agentic AI把“思考”交给GPU,但把“做事/协调”交给CPU。CPU从“管家”变成了“总指挥”,必须大幅增加才能让整个系统高效运转。这就是CPU占比扩大的核心驱动(Intel、AMD、Arm、TrendForce等一致观点)。 2、CPU成为新紧缺环节的现实证据 今年Q1 Intel/AMD服务器CPU交期已经拉到6-12周,部分型号基本售罄,价格也提了10%以上。厂商自己都说“demand far exceeded expectations”。不是产能不够,而是Agentic AI把CPU从“可有可无”直接干成了“必须配足”的总指挥。 数据中心项目现在除了电力,就是CPU卡脖子最严重。传统x86(Intel/AMD)高功耗+产能紧张,供应链直接打爆。 3、CPU缺口会有多大? 行业共识是CPU:GPU比例将显著拉近,CPU需求大幅提升:从传统1:4~1:8(CPU:GPU)转向1:1~1:2(部分场景甚至1.4:1,即CPU比GPU还多)。看之前Arm估算,每GW算力需要的CPU核心从3000万激增到1.2亿(4倍增长) CPU算力份额:在Agentic工作流中,CPU承担的算力比未来机架/集群可能从“GPU主导”转向更平衡,甚至出现专用CPU rack来支撑Agentic编排;AMD/NVIDIA新一代平台已开始按1:2~1:4设计 这就带来了CPU需求的真实拐点,是实打实的硬件重构。 4、特别要说下ARM服务器CPU会更受益一些? Agentic AI最需要的就是“高核心数+低功耗+稳定串行处理”。ARM天生多核可扩展、perf/watt领先:Arm AGI CPU(136核,TDP仅300W)对比x86同规格功耗低40%+,每机架性能直接翻倍。风冷机架就能塞8000+核,液冷更能到4万+核,完美解决数据中心的“功耗墙”。 更狠的是生态大转向:AWS Graviton、Google Axion、Microsoft Cobalt早就自研ARM,云巨头集体“去x86化”。Arm 3月直接下场自研AGI CPU(首款量产芯片),Meta、OpenAI、Cerebras都是首发伙伴,OEM有联想、Supermicro。 Counterpoint预测:AI ASIC服务器CPU里,ARM份额从2025年25%干到2029年90%。Arm自己说,这波能把数据中心CPU TAM从30亿版税干到1000亿+,未来几年服务器CPU营收很可能超手机,成为最大增长极。 看下周和5月初英特尔、amd的财报电话会上,cpu实际出货量的变化、以及cpu的真实价格变化。这能说明真的有多紧缺。 5、CPU紧缺哪些公司会受益? 梳理了下哪些公司会受益,后续关注起来: 美股最核心: Intel (INTC)ntel 依然是服务器 CPU 市场的霸主。短缺潮会提升其过往型号的利润率,且其 Gaudi 与 Xeon 的组合在代理推理端有强劲需求。 AMD (AMD):理由:在 Agentic AI 服务器市场,AMD 的 EPYC 处理器因多核心优势和高性价比,目前在云厂商中的市占率持续提升,是 GPU+CPU 均衡配置趋势下的首选。 Arm Holdings (ARM):越来越多的云厂商(亚马逊、微软、谷歌)开始自研基于 ARM 架构的 CPU。无论谁赢,只要 Agent 需求推高 CPU 核心数,Arm 的授权费就会大涨。 港股(制造与分销关键点) 中芯国际 (0981):虽然其在最先进制程受限,但大量非核心逻辑控制芯片(支持 CPU 运作的辅助芯片)和中端 CPU 的需求外溢,会显著提升其产能利用率。 联想集团 (0992):全球第一大服务器与 PC 厂商。在短缺潮初期,拥有强大供应链管理能力和库存的大厂能通过提价和保证供应,抢占更多政企市场份额。 A股(国产替代与配套产业链) 海光信息 (688041):国产 x86 服务器 CPU 的龙头。在 Agentic AI 时代,由于其架构与全球生态兼容性最好,国内算力中心在补齐 CPU 短缺时,海光是第一顺位替代品。 龙芯中科 (688047):自主架构 CPU 的代表。随着国产自主可控需求增强,在党政和关键基础设施的 Agent 应用中受益。 深南电路 (002916) / 沪电股份 (002463):理由:配套受益。CPU 核心数增加和 GPU+CPU 配比调整,要求更复杂的 PCB(印制电路板)和封装基板,这些公司是全球高端服务器 PCB 的主力供应商。 澜起科技 (688008):内存接口芯片龙头。只要 CPU 多,内存条就多。Agent 时代对内存带宽要求极高,其 MRDIMM 和内存接口芯片是 CPU 性能爆发的必需品。 投资逻辑核心其实两点: 1)量价齐升:CPU 厂商(AMD, Intel, arm、海光)最直接。 2)卖铲子的人:由于 Agent 需要高带宽,内存配套(澜起)和先进封装/基板(深南)的需求甚至比 CPU 本身更稳。
显示更多
0
24
313
94
转发到社区