注册并分享邀请链接,可获得视频播放与邀请奖励。

与「簡単調理」相关的搜索结果

簡単調理 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 簡単調理 的内容
做过视频的人都知道一个痛点:画面和声音永远对不齐 你用 AI 生成了画面,再用 AI 配了音,然后花几个小时手动调时间轴、对口型、卡节奏 稍微专业点的创作者,光音画同步这一步就能耗掉半天时间。更要命的是,调完还不一定自然 这个问题在 AI 视频生成领域一直没有解决方案,因为技术难度太高 ——要让声音和画面在生成的时候就天然对齐,而不是事后硬拼,这需要模型同时理解音频和视频的底层逻辑 直到百度文心团队放出了 NAVA-这是业界第一个仅有6.3B参数大小,但是能原生同步生成音视频的模型 其他能实现的模型哪个不是10B以上? 作为一个跑过无数 AI 工具的产品经理,我看到这个模型的第一反应是:这才是真正的技术突破 它到底能干什么? 你给 NAVA 输入一段文字描述,它直接输出720p 的视频+立体声音频,而且声画天然同步,不需要任何后期调整 这不是简单的文生视频+文生音频拼接,而是音视频在同一个生成过程中共同演化、原生对齐 音视频联合生成这个赛道,LTX、Ovi、MOVA 等模型都在做 但 NAVA 用了一个更聪明的架构:Align-then-Fuse,先让音视频在专门的对齐空间建立对应关系,再融合文本条件生成。 更炸裂的是参数量:6.3B 打败所有对手 NAVA 只有6.3B 参数,但在 Verse-Bench 基准测试上,音视频同步指标、视频质量、音频准确率全面超越: Ovi 1.1(10B 参数) MOVA(32B 参数) Davinci(15B) LTX 2.3(19B) 用三分之一甚至六分之一的参数量,拿下 SOTA。这意味着什么?意味着普通人真的用得起了 不需要4090显卡,不需要租昂贵的云算力,甚至12GB 显存的3060就有可能跑起来。而那些参数量动辄15B、19B 的模型,普通人根本碰不到,只能在云端按次付费 文心用6.3B 做到了别人19B 才能做到的效果,这不是简单的参数压缩,而是在模型架构和训练策略上下了真功夫 他们用了一个叫 Align-then-Fuse 的架构,先让音频和视频在专门的对齐空间里建立对应关系,再融合文本条件进行生成 这个技术路线的价值在于:小模型+高性能=普通人能用的 AI 工具 它解决了什么真实痛点? 我观察到三个场景,NAVA 可能发挥非常大的作用: 1.短视频创作者的效率问题: 现在做抖音、视频号内容,很多人卡在配音和画面匹配上。用传统工具,要么花钱请配音,要么用 AI 配音但对不上口型。NAVA 直接生成同步内容,省掉了这个环节 2.教育和培训内容制作: 很多老师、培训机构想做视频课程,但制作成本太高 如果能用文字描述直接生成带讲解的演示片段,内容生产效率会提升几倍 3.小白的内容创业门槛 过去你想做视频内容,得学剪辑、学配音、学调色 现在你只需要会写文案,描述清楚你想要什么,工具帮你生成 这对于想入局但没技术背景的人来说,是真正的降维打击 文心在下一盘什么棋? 有意思的是,NAVA 目前还只是研究阶段的开源项目,但它透露出的信号很明确: 文心在往音视频联合生成、甚至世界模型的方向布局 从产品思维来看,这个方向很聪明 视频生成是红海,音频生成也是红海,但音视频原生同步生成,还是蓝海 而且这个能力,恰好是搭建世界模型、实现真正多模态 AI 的关键拼图 更重要的是,他们选择了小模型路线 在大家都在卷参数量、卷算力的时候,文心用6.3B 做到了 SOTA 水平,这意味着他们在模型效率和工程优化上下了功夫 这对普通用户是好事,因为小模型意味着更低的使用成本、更快的推理速度、更容易的本地部署 NAVA 现在还在早期,但它代表的方向——让 AI 工具更轻、更快、更容易用,才是真正会改变普通人生活的技术路线 GitHub 项目地址: 论文地址: Hugging Face 模型页: #百度# #文心# #文心大模型# #NAVA# #大模型# #人工智能#
显示更多
0
16
21
1
转发到社区
发现一个宝藏应用,@dappOS_com 旗下的新产品 @xBubble_ai 简直惊喜。 记着明天得前几天晚上,为了制作一份详细的新项目投研简报,我全神贯注地在屏幕前与 AI 工具深度互动到了凌晨。 我尝试了多个不同的大模型,不断精进和打磨提示词,希望得到最完美的输出。 这个过程让我深刻意识到,熟练驾驭 AI 需要极高的耐心与时间投入。 我们都满怀期待地想让 AI 成为得力助手,但在实际操作中,为了让结果更精准,我们往往要投入大量精力去引导。 这让我开始思考:一定存在一种更流畅、更懂人心意的方式,让工具真正服务于我们的直觉。 于是,我发现了xBubble,它更加高效几乎能够一键解决我的烦恼,一图看清! 2.如今大模型的迭代日新月异,获取强大现在各大平台的新模型层出不穷,算力早已不是瓶颈, 但真正拉开体验差距的是什么?是“会写神级提示词”与“不会写”的差距,是“懂代码和编写技能(Skill)”与“完全不懂”的差距。 为了让大家直观感受到这种体验上的天壤之别,我们可以从几个真实的投研和工作场景,来看看传统 AI 工具和采用“低提示词”理念的 xBubble 到底有何不同:  3.对于很多追求高效的专业人士和中小团队来说,这背后隐藏着巨大的隐性时间投入。 为了让 AI 的输出稳定可靠,我们需要持续评估不同模型在各类任务中的表现,精心挑选适配的工具组合。 很多创业团队也面临着权衡:增设专职岗位预算较高,而让现有团队从头学习 AI 调优,沟通和学习成本同样可观。 更重要的是,每当大模型迎来更新,我们积累的经验往往需要重新建立。 我们真正渴望的,是一个能精准理解模糊指令、即开即用的智能系统,让大家把宝贵的时间集中在核心业务上。 4.好消息是,技术创新的脚步总能为我们带来极佳的解决方案。 近期 dappOS 推出的 xBubble 就是那个让人充满期待的行业破局者!它创新性地提出了 Low-prompt AI0理念,简单来说,就是“AI 替用户使用 AI”。 其核心枢纽 Bubble Pilot 就像一位超级懂你的智能管家,你只需要像和朋友聊天一样输入一句简短的需求,Pilot 就会自动接管后续的所有统筹工作。 它能迅速识别任务类型,自动匹配最优的处理路径,将繁杂的模型挑选、提示词构建、工具调用全部包揽,让你轻松畅享一键直达结果的愉悦体验。 你可能会好奇,Pilot 为什么能如此精准地理解我们的意图? 这要归功于其背后时刻都在成长进化的强大引擎——Bubble Engine。这是真正的“AI 学习 AI”。 当你提出一个新颖的需求时,Engine 会在后台自动生成海量的解决方案组合,  通过严格的测试框架与质量标准进行比对,最终将最高效、最完美的路径固化为通用的 SOP。 这意味着,在 xBubble 的生态里,随着大家的使用,高难度的技能会被自动沉淀,哪怕是零基础的小白 也能毫不费力地直接调用这些千锤百炼的最优解,获得大师级的交付品质。 为了满足极其多元的使用场景,xBubble 精心打造了两种极具安全感与实用性的运行环境。  第一种是云端的“Bubble Computer”,这是一个端到端的专属工作区。 面对需要搜集资料、撰写、排版等多步协同的复杂项目,它会自动开启安全的沙盒环境,按需加载所有技能,一气呵成地完成并交付最终成果。 第二种是主打本地陪伴的“Bubble Personal”模式,它能在你的设备上安全运行,协助管理本地文件与日程, 回想当初那个专注打磨提示词的夜晚,如果当时有 xBubble 的协助,我只需轻松输入一句“请帮我汇总今日链上热点并生成一份深度简报”, 便可去享受一杯香醇的咖啡,回来就能收获排版精美的专业成果。 科技演进的终极方向,永远是让人的创造力得到最大程度的释放。 正如 xBubble 所倡导的核心愿景:AI 应该学习 AI,AI 应该使用 AI,而用户,只需陈述目标。 兄弟们冲一波官网: dappOS 官网(
显示更多
0
69
96
14
转发到社区
体验了一下 @xBubble_ai @dappOS_com 的功能,感想颇多! 说句扎心的,撸毛圈现在真正拉开差距的,很多时候已经不是信息差了,而是谁更会把 AI 用起来。 不少人不是没看到早期项目,也不是不敢冲,更不是不会用 AI 工具,而是在使用工具时卡在了繁琐的前置流程中: 1、改 Prompt 2、调脚本 3、发现问题 4、再改 Prompt 这样循环往复会浪费大量时间。窗口期本来就短,结果时间都耗在"让 AI 先跑通"这件事上,等你好不容易折腾明白,机会也差不多过去了。所以,如果有一个 AI 工具不需要你循环往复地做这些事,而是你简单提一嘴就能轻松帮你解决各类问题,效率就会大大提高。 而 dappOS xBubble 就是我说的这类工具。它有意思的点就在于——它不是让你先学一堆东西再来用 AI,而是尽量把这些门槛直接拿掉。不用自己写代码,不用反复调 Prompt。 举一个例子,这里我分别对市面上某AI工具以及xBubble提出了一个诉求:"请为我找出 10 个当下可交互且未发币的 Web3 撸毛项目"。这刚好也是我平时撸毛+投研中非常需要使用到AI的场景也就是项目投研,如果还靠传统的方式去找项目的话效率太低了。 下面是俩个不同的AI工具给我制作的可交互项目图 1、图 1 是某 AI 平台生成的 可以明显看出,尽管它生成了 10 个项目,但这些项目大多已经发币,且很多任务都已截止。对于这种情况,我一般需要反复调试 4-5 次才能真正达到理想效果。 2、图 2 是 xBubble 生成的 对比非常明显,它理解了我真正的意图,甚至把项目的融资情况、项目介绍都列了出来。从专业性和绘图的精美度上来看,都是遥遥领先的。 那么为什么 xBubble 能如此快速、精确且专业地解决问题呢? 这主要得益于其巧妙的设计。xBubble 由 Pilot(执行)与 Engine(学习)构成:Pilot 将请求匹配至 SOP;Engine 自动研发并固化 SOP。两者协作实现 AI 自主学习与任务处理的闭环。简单来说,用户只要说一句话,它就能替你调动 AI 解决问题,且其强大的学习能力能自发地迭代进化。 所以,让合适的、专业的 AI 去处理问题,人才有精力去抓红利。好的工具不仅能节省你的时间,也能提供更大的便利! 【官推】 【dappos官网】 【xbubble官网】
显示更多
0
25
18
1
转发到社区
今天写文章配图就已经开始使用@dappOS_com @xBubble_ai 的ai了,感觉蛮不错 说实话,其实哪家ai都有相关的做图模型,但用起来会真的发现,为什么别人的ai做图那么厉害,那么好看,但是我自己的却还是很一般 同样一个任务,有人一句话就能拿到接近成品的结果,但有人要反复改 prompt、换模型、调格式、补背景,花费了大量的时间 这也是我一直以来的困扰,所以迫切地需要一个听我大概描述就能出符合我需求图的ai。 Low-prompt AI 的思路:不是让用户写越来越复杂的 prompt,而是让 AI 自己去理解任务、匹配流程、补齐执行细节。 所以今天也去试了一下xBubble 先看看实例吧,比如我今天写的关于“美股代币化的文章的配图”(图1) 我的指令是:根据我给你的内容,结合我的ip形象,创作出治愈系手绘插画风,并且给了一张示例图 图1上方作品是xbubble的成果:将我个人的ip形象整体是保留,并且美化的,让认识我的人知道这是我。并且提取我内容里提到的公司,把他们的图标也加入到图片里 图1下方作品是image 2 的成果:将我个人的ip形象进行修改,偏向手绘插画的风格,将内容里的关键句子添加于图片中 两张图风格应该是都有人喜欢的,但是对于我个人来说,是更偏向于xBubble的做图,因为更具有艺术性和个人色彩,对于做账号来说是需要的 🌟这其实就是 xBubble 功能里比较关键的一点: 不是只执行单一模型生成,而是尽量把用户的模糊需求转成更完整的任务流程。 模型选择、风格理解、内容提取、结果优化,这些原本需要用户反复调的东西,它会帮你往前推一步。 对于ai的真人感,我也去测试了一下 指令是: 16:9真人摄影封面图,一位年轻亚洲女性坐在夜晚高层窗边,气质聪明冷静,不网红、不油腻。她穿白衬衫和深色西装外套,手拿手机,桌上有笔记本电脑、冰美式、投资笔记和钢笔。窗外城市夜景,室内暖光,窗外冷蓝光,光影高级真实。 图2的上方作品是xBubble: 整体看起来更高级,也更像真实广告片截图。人物没有直视镜头,而是看向窗外,情绪更自然,夜景和台灯的冷暖光也比较舒服。桌面元素少,画面不乱,AI感相对低。 图2的下方作品是gemini: 人物正面对镜头、姿势太标准,桌面道具也有点堆满,像刻意生成出来的“商务女性办公图”。整体没有图一自然,质感也稍弱。但信息更加直白。 两张图其实都符合要求,但是XBubble 这张赢在真实感和审美,Gemini 那张赢在信息更满,但也更假,而我刚好测的也是ai的真人感 所以两个层面去进行测试,其实xBubble的审美和创作都是更胜一筹的,但是这种审美和风格每个人都是不一样的,所以大家可以根据自己的需求去选择适合自己做图风格的ai 在这里,只测试了 @dappOS_com 的Bubble Pilot: 负责理解用户的简短需求,并匹配合适的 SOP 去执行;如果没有现成路径,也会先用通用 Agent 完成任务。 还有 Bubble Engine也同样关键: B负责在后台学习和优化,不断测试不同模型、工具和流程,把更稳定的方案沉淀成新的 SOP。 所以我这次用它做图,感受到的不是“它会画图”这么简单,而是它在理解我的内容、识别我的 IP 形象、判断画面风格、提取文章重点、组织视觉元素这几个环节上,已经不太像单个模型直接出图,更像是有一套任务流程在帮我完成成图。 这也是 xBubble 的核心价值:把模型选择、提示词结构、工具调用、技能编写、结果测试这些原本需要用户自己折腾的部分,尽量交给系统处理。用户只需要把目标说清楚,剩下的由 Pilot 去分发,由 Engine 去学习和优化。 @dappOS_com
显示更多
0
94
67
3
转发到社区
最近在忙家里的事没怎么刷推,打开推发现前阵子满屏的小龙虾不见了,之前推特上全是小龙虾的教程我也试着安装操作过,最后都不了了之,看别人写的挺简单,到自己亲自动手操作发现有很多的问题,根本不是那么简单,还的不停的训练优化! 对于我这种普通人来说根本不想成为 AI 专家,我更希望的是让AI帮我更简单直接的处理问题,比如我一句话说完,你帮我把事情做完,而不是研究怎么使用AI 但现实是很多 AI 产品,已经复杂到像在学编程。尤其做图片和视频的时候特别明显,对于普通用户是真的不友好,同一句需求,不同 prompt 能跑出完全不同的结果,很多时候需要不停调 prompt,改半小时,最后 AI 还是没理解你真正想表达什么 我感觉这才是现在 AI 最大的问题:模型越来越强,但普通人的使用门槛也越来越高 最近看到@dappOS_com 做的 xBubble ,我反而觉得它思路挺对的,对于普通用户更友好 @xBubble_ai@dappOS_com 做的一个 AI Agent 产品,它想解决的就是普通人不会写提示词的问题。大多数人应该都不想天天去研究:哪个模型写代码更强、哪个模型做图更好、哪个参数该怎么调。比如我的需求就是最后能直接给我结果就行 我去刚试了一下,用xBubble 做了一个任务,也理解了它和普通 AI Agent 的区别在哪,不需要给他很多指令,不需要懂广告语,直白的说你想要什么,指令输出就能给你满意的图文 我就丢给他一句话:帮我生成一张图特朗普为主的东方特饮的广告图 正常情况下,这种需求需要自己选模型、写提示词、调参数,甚至反复重做。但在 xBubble 里,我只负责提需求。Bubble Pilot 会先理解我的目标,自动判断这是一个图片创作任务,然后把任务分发到最合适的 SOP 和执行链路。而且它不会固定使用某一个模型,而是自己判断当前任务更适合什么模型、什么工作流,以及哪些工具组合成功率更高。如果没有现成方案,它还会自动生成多种执行路径,持续测试和验证结果,最后选择效果最好的那个输出 而那些验证过、成功率高的流程,又会被沉淀成可复用的 SOP 同样的指令其他AI根本无法生生你所需要的内容,差距一目了然! xBubble 就做到了,会聊天就能用 AI 先说 Bubble Pilot。 我现在使用AI 遇到最大的问题除了不会问,还有就是是不会选模型、不会写提示词、不会拆任务 Pilot 类似一个总调度,你把需求说出来,它会自动去匹配对应的 SOP 技能,自己判断该怎么做、调用什么能力、需要走哪条流程。如果没有现成方案,它还会切到通用 Agent 接着执行,尽量把事情做完 另一个是 Bubble Engine 可以说就是AI 在自己训练自己,同一个任务,它会同时生成好几套执行方案,再去测试、筛选,最后把效果最好的那套沉淀成 SOP。后面再碰到类似问题,处理速度会越来越快,结果也会越来越稳定 除了智能调度,它现在还有两种运行模式 Bubble Computer 更偏云端,像写研究、做设计、生成图片、剪视频这种复杂任务,直接交给云端多 AI 协同处理,用户只负责提需求 Bubble Personal 是本地模式,可以直接操作你自己的文件、浏览器、应用和日程,但前提是经过授权。很多高风险操作也不会留在本机,而是在云端沙箱执行完直接销毁,安全性这块考虑得挺细 现在很多 Agent 每次都像临场发挥,结果很不稳定 但 xBubble 是提前把很多任务训练成成熟流程,下次类似需求直接调用 所以它做出来的东西,会更稳定,也更接近普通人真正能用的状态 现在越来越觉得,AI 后面真正拼的,可能不是谁模型参数更大,是怎样更简单的使用,不是让用户学习 AI,而是让 AI 自己学习 AI,从而让普通人更简单的使用AI。 @BTC_Alert_
显示更多
0
37
18
1
转发到社区
昨天实测 @dappOS_com @xBubble_ai xBubble vs 其他主流模型: 同一个prompt,两张图已经不是代际差距,而是工作流 vs 裸模型的降维打击!!! 我这次用的提示词如下: A girl standing in front of a mirror, but the reflection shows a futuristic robot version of herself, cinematic lighting, emotional atmosphere, realistic reflections.(一个女孩站在镜子前,但镜中映出的却是她自己未来主义的机器人版本,电影灯光,情绪氛围,真实倒影。) 这个 prompt 其实很适合测模型和工作流,因为它同时考验镜像逻辑、光影、人像、金属材质、空间关系和情绪表达,所以我特意使用了这么一套比较全面专业的提示词来做这组测试!!! —————————————————— 闲言少叙,直接上结果: 图一是我用 xBubble 跑出来的。 最明显的感觉是光影,这张图的光影已经接近电影镜头了!!!左边暖光像真实房间里的环境光,镜子里的冷光又能撑住科技感。人脸面部高光、皮肤反射、玻璃反射、金属高光都在一个统一的空间里,基本上已经是电影级 lighting 了!整体已经跟电影截图差不多了!!! 图二虽然也能完成最基本的设定,但视觉上更偏概念海报,蓝色发光和机械结构会更直接。第一眼大致看过去也很抓人,但仔细看,跟图一那种克制感和真实镜头感对比,完全不是一个时代的产物!!! 这也是我这次对 xBubble 比较有感的地方! 以前做这种图,经常要反复改 prompt、换模型、试风格、调细节,时间全耗在“怎么让 AI 正确理解我”上。 很多时候你以为自己在做图,实际是在做模型测试、工具测试和工作流测试。 —————————————————— 我理解的 xBubble 的核心就两句话: 1、AI 替你使用 AI。 2、AI 在后台学习怎么把 AI 用好。 Bubble Pilot 负责读懂你的简单需求,然后去匹配合适的 SOP。 Bubble Engine 则在后台持续训练这些 SOP,把模型选择、skill 调用、运行环境、MCP、第三方服务全藏在后台。 所以用户这边不用先研究哪个模型更适合出图、哪个 skill 更稳、哪个环境更适合跑任务。 你只要把目标说清楚,它自己会尽量把任务分发到更合适的路径里。 对会折腾 AI 的人来说,这可能只是少花一点时间。 但对很多 Web2 公司、一人公司、内容团队来说,这个差别很大。 因为他们真正需要的从来不是研究一堆模型参数,而是今天有个图要出、一个页面要做、一份内容要交,最好一句话就能跑出相对稳定的结果,极致的效率才是真正的生产力解放!!! 所以 xBubble 的 Bubble SOP 有意思的点就于它把会用 AI 这件事往后藏了一层,让普通用户不用先变成 prompt 工程师也能更快拿到可用结果。 —————————————————— 大胆预测一波,这轮 AI 最大的门槛,很有可能就是把复杂的工作流封装到普通人一句话就能用。 最后请看图 图一:xBubble 图二:另一 AI 模型 图三:我让 ChatGPT (GPT5.5)当裁判打分,结果一目了然。 同样提示词,结果自己看。
显示更多
0
74
38
0
转发到社区
之前看其他老师用AI做的一些优质的视频,经常忍不住发出感叹,woc,做得太牛逼了! 但我自己用同样的AI工具去做,就总是差强人意,像小学生出品。 这让我反思了一个问题:AI模型越来越强,获取工具也容易,但使用AI的门槛却在悄然升高,正在形成一道越来越宽的系统性鸿沟,会用的人和不会用的人,效率差距被迅速放大。🤔 新功能越多,普通人越跟不上。每发布一个新模型、新功能,都多出一道隐形门槛。 高手也需要不断研究模型差异、调试组合,认知和时间成本居高不下。普通用户试几次没好结果,就容易放弃,AI强大却难以真正发挥作用。 @dappOS_com 的xBubble @xBubble_ai 想解决的就是这个问题。 核心是低提示词。不靠猜意图,而是用预训练好的SOP+智能分发,让你一句话输入,就能拿到稳定好结果。每个SOP打包了技能、模型选用、运行环境和第三方服务,相当于一个专属小Agent。 🔹 Bubble Pilot是前台助手,发简单指令,它匹配最优SOP,走优化路径输出;没匹配就用通用模式。 🔹Bubble Engine在后台学习,用类似AI coding的方式生成SOP。预训练消耗较大,但SOP一旦生成,相似问题就能高效处理。运营上尽量聚合需求相近的用户共享SOP,特殊需求则单独收费。 这样,用户不用挑模型、调Prompt、配工具、验结果,只需说清楚想要什么。 实际用起来大概是这三种情况 ▪️命中SOP:直接走优化路径,效效果更好更稳 ▪️没命中:先给你可用结果,不卡住 ▪️反复提同一类需求:Engine就会自动建新SOP,下次体验直接升级。 🟩还有两种运行环境: Bubble Computer适合复杂项目,一次性完成研究、写作、设计、交付,全程不用管中间步骤。 Bubble Personal可操作本地文件、浏览器、日程,云端处理系统操作,更安全方便。 xBubble的理念就是:AI应该学习AI,AI应该使用AI,用户只需陈述目标。 把复杂工程藏到背后,让AI适应人,而不是人去适应AI,咱普通人也能轻松把AI变成日常生产力。 看最近会所哥@BTC_Alert_又又又萎了,用Bubble生成的这种类型,应该能治好你的症状吧哈哈哈哈
显示更多
记得Defi Summer 20年到22年这三年时间,大家经常感慨的一句话就是“币圈一天,人间一年” 因为技术迭代太快了,每天都有数不行的新东西出来,几天不看就跟不上节奏 现在这个感觉在币圈彻底消失,在AI那边出现了,每天的新东西就看不完,真的看不完 正好这几天看到圈里讨论Cerebras的帖子多了起来,昨天还看到不少路演信息,毕竟14号要挂牌交易。之前在Amber做分享的时候也单独讲过这个公司(当时用的那页PPT放在文末),所以简单说下我对Cerebras的判断 先说结论:这家公司很有意思,但核心变量不一定是他们造的芯片本身,而是未来AI的workload形态会是成什么样。 先简单说下它是干嘛的,防止有老铁还没看Cerebras 它最核心的技术,就是wafer-scale chip(晶圆级芯片),简单理解就是别人还在用“邮票大小”的芯片,它直接把整片晶圆做成一颗超大处理器,再配上超大 SRAM,把大量数据尽量留在本地高速处理,减少传统GPU最头疼的memory bottleneck。现在海力士美光涨上天就是因为HBM这东西太抢手,Cerebras是直接绕开了对HBM的依赖 很多人看到 Cerebras最牛逼的benchmark:推理速度比GPU快10-15倍,第一反应就是下一个英伟达?! 先别急。 这个benchmark最大的问题,是默认AI的核心需求永远是“更快吐token”。 如果只是人类盯着ChatGPT聊天,这故事其实没那么性感。你每秒吐 30 个 token,我已经快读不过来了。再翻10倍,边际体验提升几乎为零。 真正有意思的是 Agent。 Agent不读字,Agent消费Token。速度直接等于生产力。 一个OpenClaw/Hermes agent,如果要读网页、写计划、调 API、跑代码、报错重试、继续执行,一个任务可能要几十次 inference call。 每次 2 秒,任务就是分钟级体验。 每次 200ms,就是另一个世界。 所以 Cerebras更值得关注的地方,是 AI worker 这条线,而不是单纯的chatbot加速。 但问题来了 - 它的magic来自 wafer-scale + 超大SRAM,本地访问极快。但SRAM这东西有天然 tradeoff,速度快,容量贵,大模型塞不下就必须拆分。 而一旦拆分,chip-to-chip communication 就上来了。 LLM inference里最怕通信的恰恰是 decode 阶段。token 是一个一个往外吐的,每多一次 hop,延迟就是硬加上去,没法隐藏。 所以 Cerebras能不能成,关键根本不在“比 GPU 快几倍”,而是未来 AI 的主流计算形态到底是什么。 1. 时间线一 - 未来几年还是 前沿超大模型一统天下,动不动几千亿甚至万亿参数,所有请求都让超大模型自己处理,那 Nvidia的distributed infra 依然最舒服,Cerebras的速度优势会被通信损耗吃掉很多。 2. 时间线二 - MoE、蒸馏、量化这些技术如果继续快速进步,未来两年70B左右的模型做到今天700B模型 80%-90% 的效果,我一点都不意外。(这里要强烈感谢Deepseek一大波!) 如果世界往这个方向走,故事就变了。 大模型负责 planning / judgement / orchestration。 真正执行任务的大量 worker model 落在 30B-70B 这个区间。 这些模型足够聪明,又刚好能吃到高速本地推理带来的红利。 Agent 世界里,大部分token根本不需要最聪明的大脑。很多工作本质就是执行层体力活:浏览网页、改代码、调工具、retry、继续跑流程。 这个 topology一旦成立,Cerebras就直接进入自己的甜区 3. 时间线三 - 未来推理是端侧为主,用的都是8B,14B的这些小模型,那GPU也能跑的很好,甚至专用的ASIC芯片效率更高,这个场景下Cerebras的优势和护城河也就不高了 换句话说,超大模型云端推理或者超小模型的端侧推理这两个平行宇宙,Cerebras的优势都不够明显,只有主流推理落在32B-70B中等模型这个Size,正好“Big enough to stress GPU memory, Small enough to fit locally” 才是Cerebras最能大展身手的世界 所以我对Cerebras的判断是,300多亿的市值,短期看订单,财务报表这些数据,长期赌的则是未来Agent时代的计算范式到底落在哪个平行宇宙的时间线上
显示更多
0
11
71
10
转发到社区
强烈推荐大家看看DeepMind CEO Demis的最新判断。 真的,Google DeepMind 的 CEO Demis Hassabis 每一期访谈我觉得值得都花时间看看。这哥们讲东西很实在,而且通俗易懂。 早上边跑步边听完了他和 YC CEO Garry Tan 的最新一期播客。 刚刚把笔记写完,也给大家分享下。 多说一句,好多人问我这种笔记是不是 AI 写的。我说下自己的流程。 我会先完整听完播客,然后用语音输入法把感触尽量充分地讲出来,再让 AI 帮着整理初稿,最后自己逐字修改优化。 如果全部交给 AI 做总结,那等于把思考和理解的能力让渡给了 AI,对自己理解这件事其实没有任何价值。 OK,咱们进正题。 1 Demis 的态度非常明确,现在的大模型范式(大规模预训练 + RLHF + CoT)一定会是 AGI 最终架构的一部分,他不认为这会是条死路。 但要实现 AGI,还有几个关键问题要解决。这几个问题包括:持续学习、长程推理和记忆系统。 先从最容易看到的现象讲起,Context Window。 现在大模型处理长信息,最常用的招就是把 Context Window 一直撑大。一开始 8k,后来 32k,再后来 100 万 Token。听起来很厉害,但本质上是暴力堆砌。 Context Window 其实就相当于人脑里的 Working Memory,工作记忆。人的工作记忆能同时装多少东西?心理学里有个经典数字,7 个左右。背电话号码能记住 7 位上下,再多就溢出了。 大模型呢?已经做到 100 万 Token。 按理说,模型的工作记忆比人大几十万倍,应该比人聪明几十万倍才对。但显然不是。 问题也恰恰就出现在这。把所有东西都塞进 Context Window 里,里面包含了不重要的东西、错的东西、过时的东西。看起来信息很多,其实是一团乱麻。 那人为什么 7 个数字的工作记忆就够用? 因为人脑背后还有另一套机制在工作。我们记得几年前的事,记得童年的事,记得几小时前发生的事。这些都不塞在工作记忆里,而是另一套系统。 具体来说这套系统是海马体,大脑里负责把新知识整合进已有知识库的那个部分。 研究发现,人睡觉的时候,特别是 REM 睡眠阶段,大脑会重放白天重要的片段,让大脑从中学习。新东西在睡觉的过程里,温柔地融进了旧的知识体系。 这个把新东西融进旧知识库的过程,就是持续学习。 模型现在没有这套机制。每一次对话结束,刚学到的东西就会忘记。下次重新打开,还是上次那个模型,没长进。 2 再聊聊长程推理的问题。英文表达是 Long-term Reasoning。我翻译为了长程。 长程推理这个词太抽象了。Demis 讲了一个特别具体的故事,听完会立刻明白他说的是什么。 他说自己喜欢跟 Gemini 下国际象棋。下棋的过程里能看到模型的 thinking trace,也就是它在那里到底想了什么。 然后他发现一件怪事。 模型考虑一步棋的时候,思考链里清清楚楚写着,这步是个昏招。但接下来,它没找到更好的走法,于是又走回这步昏招。 明明知道是错的,还是把错的那一步走出去了。 这个细节比任何 benchmark 数据都说明问题。因为它暴露的是模型缺少对自己思考过程的某种内省能力。 正常人下棋,意识到一步是昏招之后,脑子里会有一个反应,停一下,再想想。停一下、再想想这个能力,模型现在没有。它能在每一步局部判断对错,但没法基于整盘棋的局势去调整整体策略。 这就是长程推理还没搞定的样子。模型可以一步一步往前走,每一步看起来都合理,但走到后面整盘棋的方向其实是错的。它没有那种退回到当前思考的上一层、重新审视一下的能力。 说到底,模型缺的是一种内省。 3 学习、长程推理、记忆,这是 Demis 在播客里点出来的三个 AGI 鸿沟。 除此之外,他还反复提到了创造力。 2016 年 AlphaGo 跟李世石下棋,第二局走出了著名的 Move 37。那一步棋走出来的瞬间,全世界的围棋高手都看呆了。 所有人类几千年下围棋积累的经验都告诉它不该下那里,但 AlphaGo 下了。下完之后大家发现,是一步神来之笔。 很多人觉得,这就是 AI 的创造力来了。 但 Demis 说,对他自己来说,Move 37 只是起点。他真正想看到的是另一件事。AI 能不能发明围棋这件事本身。 这两件事的区别非常关键。 Move 37 是在围棋这个现成的规则里,找到了一步人类没想到的招。但围棋的规则、棋盘的形状、黑白子的对弈方式,是人类发明出来的。AI 在已有的框架里非常厉害,但能不能自己造一个框架,是另外一回事。 Demis 给了一个具体的设想。 如果给 AI 一个高层次的描述。造一个游戏,五分钟能学会规则,要好几辈子才能精通,棋局有审美,一下午能下完一局。AI 能不能根据这个描述,自己倒推出围棋? 目前做不到。 为了把这件事讲得更清楚,Demis 还提了一个测试,他自己叫爱因斯坦测试。 用 1901 年人类已有的全部知识训练一个模型,看它能不能在 1905 年那个时间点,自己推出狭义相对论。 爱因斯坦在 1905 年那一年里,连写了几篇改变物理学的论文,后来叫爱因斯坦奇迹年。那些工作不是从已有的物理学论文里通过拼接得到的,是基于已有材料做了一次全新的概念跳跃。 爱因斯坦测试想问的就是这件事。AI 能不能做这种跳跃。 目前的大模型主要在做两件事,pattern matching 和 extrapolation。一个是从大量数据里找规律,一个是把规律往外延伸一点。但发现新东西需要的是类比推理的能力。从一个领域里抽出深层结构,搬到另一个全新的领域去用。 这个能力,模型现在还没有。也可能是有,但用法不对所以激发不出来。 4 除此之外,Demis 还分享了一个让我特别出乎意料的判断,他说未来 6 到 12 个月,真正的价值不在更大的模型,在更小的模型。 这一部分内容我反复听了好几次,确实突破我的已有认知。 不知道大家的想法,反正我自己,这一年来并没有怎么关注小模型的进展。毕竟行业的焦点就是把模型做大嘛。 那小模型的价值到底在哪? 最直接的是成本。同样一个任务,小模型的推理价格可能只是前沿模型的十分之一甚至更少。 但 Demis 说,比成本更重要的其实是速度。 这里有一个前提得先说清楚。Demis 不是在说速度可以替代智能。 他的原话是,当小模型的能力已经达到前沿模型的 90% 到 95%,也就是已经相当不错的时候,剩下那 5% 到 10% 的能力差距,比不上速度带来的好处。 比如现在工程师用 AI 写代码,已经形成了一种新的工作节奏。一个想法冒出来,几秒之内就能看到结果,不行就改,再不行再改。 这个一改再改的循环跑得越快,做出来的东西就越好。如果每次调用都要等十秒,整个工作流就被打断了。 更关键的是,快到一定程度,工程师在这种节奏里能进入心流。一个想法、一次尝试、一个反馈、再来一个想法,思维不被打断。 这件事写过代码的人都懂,进入心流和频繁掉出心流,产出的差距是数量级的。 Agent 也是同样的逻辑。一个 Agent 跑完一个任务可能要调几十次模型,每次慢一秒,整个任务就慢一分钟。慢到一定程度,Agent 就从一个能用的东西变成鸡肋。 小模型不是大模型的廉价替代品。有些事只有小模型能做。 比如手机、眼镜、家用机器人,需要的就是一个能在本地跑起来的模型。本地跑除了反应快,还有一个特别重要的好处,隐私。 家里机器人看到的视频、听到的对话,全部在设备本地处理,根本不上云。这件事对很多用户来说不是加分项,是底线。 成本、速度、边缘部署,这是小模型的价值。 5 讲完小模型的价值,接下来一个更关键的问题是,能力被压到这么小的参数里,会不会有上限? Demis 的判断是,目前没看到信息密度有任何理论上限。小模型的智能天花板还远没看到。 支撑这个判断的,是 DeepMind 在蒸馏这件事上的积累。蒸馏简单说就是先训练一个超大的模型,然后用这个超大模型去教一个小模型。教完之后,小模型用极少的参数,能复现原来 95% 以上的能力。 为什么 DeepMind 这么重视蒸馏?因为要把 AI 能力放进谷歌的头部产品中,前提是低延迟、低成本。前沿模型再强,每次推理花几秒钟、花几毛钱...这条路,恐怕很难走得通。 一个前沿模型发布之后,6 到 12 个月内,他们就能把这个模型的能力蒸馏到边缘设备能跑的小模型上去。这个时间表比很多人想的要快。 在很多场景中,小模型和大模型会相互配合。 举个例子,一个端到端的智能助手,绝大部分日常任务在本地的小模型上跑。智能眼镜看到的画面、家里机器人听到的对话、手机里的私人助理,模型直接在设备里读懂,不需要往云端传一遍。 只有遇到特别复杂、本地搞不定的问题,才向云端的前沿模型发起请求。 也就是说小模型在边缘做主力,前沿模型在云端做后援。 不过,这个构想对小模型的要求也比较高,它不能只会处理文字,还得能理解物理世界。 这就是为什么 Gemini 从一开始就坚持多模态,不光处理文字,也处理图像、视频、声音。 一开始这么做比只做文本要难得多,但眼镜也好,机器人也好,需要的是一个能看懂周围世界的模型,不是一个只会聊天的模型。 讲到这里,小模型这条路的轮廓就完全清楚了。它独立成立,不是前沿模型的廉价替代品,而是另一条同样重要的路。 嗯,很有启发。
显示更多
0
48
1.2K
239
转发到社区
近期的行情,是地狱难度操作级别,波动又快又乱,很多人跟不上节凑。 这种环境下,其实拼的已经不是谁更努力盯盘,而是谁用的工具更高效。 刚好看到@Bybit_ZH把原本一堆复杂的交易操作,直接做成了一个AI工具箱。 简单说,就是你不用再研究各种参数、接口和流程,只要一句话,就能让AI帮你把事情做完。 以前查行情、开仓、调仓位、做风控,都是一步一步手动点,现在直接丢给AI,它能自动帮你完成整套流程,从数据到执行一条龙。 而且它不是简单的聊天功能,背后是打通了大量API能力,行情、现货、合约、理财这些核心模块都覆盖了,相当于把专业交易那一套,变成普通人也能轻松上手的工具。 安全这块也考虑得比较到位,不需要你暴露API密钥,在现在这种环境里,用起来会更安心一点。 现在行情越难做,越要学会借力,而不是硬扛。 体验链接: 👉 @benbybit #Bybit# #AI交易# #交易新体验#
显示更多
0
137
144
4
转发到社区