兄弟们!这个研究有点牛逼啊!
Physical AI 的瓶颈根本不是「模型不够大」,是一开始范式就错了。
先说一个真实场景:桌子高了 2cm,当前最强的 VLA 模型直接失败。
为什么?
因为它只学到了「手伸到某个位置」的相关性,根本不知道「为什么」会摔、「怎样」才能不摔。
这就是 LLM/VLA 路线的致命伤,它在互联网数据上学的是统计相关性,但物理世界运行靠的是因果律。
你可以生成一段完美的「桌面物体掉落」视频,但模型完全不知道下一秒会发生什么。
UCSD 黄碧薇教授
@huang_biwei 刚在 CVPR 2026 发了 Causal World Models(因果世界模型)框架,给这个问题指出了一条新路:让 AI 从「模仿动作」进化到「理解因果」。
不是学「人做了什么」,是让它学「这样做为什么有效、换一个场景为什么失效」。
她今天宣布 Aether AI 融资2000万美金,也成为全球首个因果世界模型公司。
关于她的含金量,我们也来挖一挖:
① 12 年因果 AI 深耕,CMU PhD(导师 Kun Zhang + Clark Glymour)
②100+ 顶会论文,Apple Scholar in AI/ML
③causal-learn 作者(Python 因果发现库,GitHub 高星)
CLeaR 2025 Program Co-Chair
④世界模型赛道正热:杨立昆 AMI 融了 $10 亿+,李飞飞 World Labs $10 亿,国内 25 起融资超 22 亿。
几乎所有玩家都在卷数据量、卷仿真规模。
但 Aether AI 的切入点完全不同,不卷 Scale,卷因果结构。
这可能是具身智能从「花拳绣腿」到「真正理解物理世界」的范式转折点。
感兴趣的可以看看官网: