注册并分享邀请链接,可获得视频播放与邀请奖励。

Berryxia.AI (@berryxia) “阿里最近通义实验室这个视频挺火的! 其实也和之前发的黄教授因果模型那个事儿还有异” — TopicDigg

Berryxia.AI 的个人资料封面
Berryxia.AI 的头像
Berryxia.AI
@berryxia
Building AI tools AI System Prompt Love Design & Coding & Share Prompt! 📮:Andyhuo@me.com
加入 December 2011
655 正在关注    44.7K 粉丝
阿里最近通义实验室这个视频挺火的! 其实也和之前发的黄教授因果模型那个事儿还有异曲同工之妙的地方! Tongyi Lab抛出一个问题:为什么AI在虚拟世界里很强,但让机器人去拿个鸡蛋却容易卡住? 他们的新视频在讲Embodied Intelligence的核心难点,机器人“想得清楚”和“做得稳”完全是两回事。 在数字世界里,模型可以反复试错、快速迭代。 但在物理世界,传感器噪声、执行延迟、环境变化、物理约束让每一步都充满不确定性。 一个简单的抓取动作,可能因为光线、摩擦力、物体形状的微小差异就失败。 这其实把当前AI的两大世界拉开了对比:语言和代码世界里,scaling law还在狂飙。 所以,待解决的问题还是很多,路还挺长。 AI时代,才是寒武纪爆发之际。
显示更多
兄弟们!这个研究有点牛逼啊! Physical AI 的瓶颈根本不是「模型不够大」,是一开始范式就错了。 先说一个真实场景:桌子高了 2cm,当前最强的 VLA 模型直接失败。 为什么? 因为它只学到了「手伸到某个位置」的相关性,根本不知道「为什么」会摔、「怎样」才能不摔。 这就是 LLM/VLA 路线的致命伤,它在互联网数据上学的是统计相关性,但物理世界运行靠的是因果律。 你可以生成一段完美的「桌面物体掉落」视频,但模型完全不知道下一秒会发生什么。 UCSD 黄碧薇教授 @huang_biwei 刚在 CVPR 2026 发了 Causal World Models(因果世界模型)框架,给这个问题指出了一条新路:让 AI 从「模仿动作」进化到「理解因果」。 不是学「人做了什么」,是让它学「这样做为什么有效、换一个场景为什么失效」。 她今天宣布 Aether AI 融资2000万美金,也成为全球首个因果世界模型公司。 关于她的含金量,我们也来挖一挖: ① 12 年因果 AI 深耕,CMU PhD(导师 Kun Zhang + Clark Glymour) ②100+ 顶会论文,Apple Scholar in AI/ML ③causal-learn 作者(Python 因果发现库,GitHub 高星) CLeaR 2025 Program Co-Chair ④世界模型赛道正热:杨立昆 AMI 融了 $10 亿+,李飞飞 World Labs $10 亿,国内 25 起融资超 22 亿。 几乎所有玩家都在卷数据量、卷仿真规模。 但 Aether AI 的切入点完全不同,不卷 Scale,卷因果结构。 这可能是具身智能从「花拳绣腿」到「真正理解物理世界」的范式转折点。 感兴趣的可以看看官网:
显示更多