以前的视频 AI,都是你先问,它再看。
京东刚开源的 JoyAI-VL-Interaction,把这个顺序反了过来:它会一直看着摄像头或直播流,每秒自己判断一次——现在该说话、保持沉默,还是把任务交给后台 Agent。
火灾出现就提醒,比分变化就解说,画面触发条件才行动。
这听起来只是“实时了一点”,实际却是 AI 从被动工具变成了持续在场的观察者。
问题也随之来了:当 AI 可以24小时看着家庭、老人、工厂和公共空间,便利与监控之间的边界应该画在哪里?
视频里看实测效果。👇
显示更多
本地跑了一遍 VoxCPM2,最让我意外的不是它会说粤语、河南话,而是“声音”正在变成一种可以编辑的东西。
写一句提示词,就能指定年龄、音色、情绪和语速;再上传一段参考音频,它还能保留音色,重新控制表达方式。
以前语音模型追求的是“像不像本人”,现在已经开始解决“能不能按导演要求表演”。
当声音可以像图片滤镜一样被描述、复制和改写,它还算不算一个人的身份特征?
视频里放了方言、情绪控制和真人声音克隆的实测效果。👇
显示更多
我越来越觉得,Prompt 可能是 AI 时代最大的“新手陷阱”。
每天复制粘贴、补充背景、检查结果、继续追问……AI 变聪明了,人却成了它的全职保姆。
真正的分水岭,不是谁更会写提示词,而是谁能把重复工作变成 Loop:记住变化、主动运行、彼此协作,只在需要你决定时出现。
如果每一步都要你下命令,那到底是 AI 在替你工作,还是你在管理 AI?
视频里用“孩子春游”和“一把快坏的菠菜”,讲清了 Prompt、Loop 和 Loop of Loops 的区别👇
显示更多
马斯克这段访谈最值得讨论的,不是他一周工作 120 小时。
而是它戳破了一个 AI 时代的幻觉:
工具越来越强以后,人与人的差距就会变小。
但现实可能刚好相反。
AI 能帮你提效、自动化、降本、写代码、做内容、查资料。
可它很难替你承受:
连续失败。
现金快烧光。
团队动摇。
外界嘲笑。
所有选择都像错的时候,你还要继续做决定。
这段视频最残酷的地方在于:
创业很多时候不是“聪明人的游戏”。
而是“没有退路的人,能不能在高压和不确定性里继续下注”。
这不是鸡血。
也不适合包装成成功学。
但它确实提醒我:
AI 时代真正稀缺的,可能不是效率。
而是一个人在快被现实压垮时,还能不能保持判断力。
显示更多
马斯克在访谈里说了一个细节
我觉得比任何 AI 创业故事都值得看
2008年,SpaceX 和特斯拉同时濒临破产
他手里只剩 3000 万美元
只够救一家
他没办法选择让哪个"孩子"死
所以把钱平分了
然后去找朋友借钱付房租
显示更多
英伟达开源了一个视觉定位模型:LocateAnything-3B
几十个小黄人密密麻麻堆在一起
它一个不漏,全部框出来了
这背后的技术变化比"更准"这两个字值得多说一句
显示更多
马斯克在访谈里说了一个细节
我觉得比任何 AI 创业故事都值得看
2008年,SpaceX 和特斯拉同时濒临破产
他手里只剩 3000 万美元
只够救一家
他没办法选择让哪个"孩子"死
所以把钱平分了
然后去找朋友借钱付房租
显示更多
🚨阿里巴巴发布实时视频语音模型:Wan Streamer
这不是普通数字人。
它更像是让你和 AI 打一通“实时视频电话”:
你说话,它看着你听。
你打断,它能接住。
你表情变了,它也能反应。
半秒内接话,几乎没有冷场。
真正的重点是:
以前虚拟人是拼流水线:
语音识别 → 转文字 → 大模型思考 → 语音合成 → 表情驱动 → 视频生成
每一步都要排队,所以延迟高、互动僵硬。
Wan Streamer 直接把听、看、想、说、表情生成,塞进一个端到端大模型里。
一个 Transformer 直接处理实时音视频交互。
模型端响应约 0.2 秒,整体延迟约 0.55 秒。
这意味着 AI 不再只是“回复你”,而是开始像一个能实时交流的视频对象。
显示更多
刚融了 3 亿美元的 PhysicsX,做的事情值得认真看一下
传统工业仿真算一个流体工况要几天
他们用 AI 把这个压到毫秒级
但速度不是最重要的部分
更重要的是:工程师的角色在这个过程里变了
显示更多
Greg Isenberg 说了一个让我想了很久的判断:
AI 时代最稀缺的能力,不是写代码
是分发
因为制造东西越来越容易了
难的是让人看见它、信任它、买单它
这个逻辑如果成立
过去十年最被低估的那批人
接下来可能是最值钱的那批人
显示更多
百度出了个 OCR 模型
3B 参数,实际激活只有 500M
跑分赢了 235B 的 Qwen3-VL
不是说大模型不行
是这个方向在说一件不同的事:
在特定任务上,专才能打赢通才
显示更多
所有人都在盯着 AI 模型的参数和跑分
陈立武在这场采访里说了一句更冷静的话:
下半场比拼的不是谁的模型更聪明
是芯片、封装、电力、内存、制造能力
这些东西建起来要十年
不是发一篇论文的事
显示更多
英特尔 CEO 陈立武说了一个细节,
我觉得很多人没注意到:
AI 训练阶段,CPU 和 GPU 的比例是 1:8
现在进入推理和 Agentic AI 阶段
这个比例正在变成 1:4,甚至 1:1
如果这个趋势是真的
英特尔的处境比大多数人想象的要好得多
显示更多
把 AI 时代的工具逻辑带进了 Minecraft
Arnis:输入任意真实地址
几分钟内生成 1:1 比例的 Minecraft 地图
OpenStreetMap 数据 + 真实地形高程
你住的那条街,原样出现在游戏里
显示更多
英特尔 CEO 陈立武说了一个细节,
我觉得很多人没注意到:
AI 训练阶段,CPU 和 GPU 的比例是 1:8
现在进入推理和 Agentic AI 阶段
这个比例正在变成 1:4,甚至 1:1
如果这个趋势是真的
英特尔的处境比大多数人想象的要好得多
显示更多
李飞飞这段采访,越听越有压力。
她说未来真正被甩开的,可能不是被 AI 替代的人,而是还在用五年前流程工作的人。
以前产品经理不会写代码很正常:写 PRD、开会、等设计、排开发,几个月做个原型。
但现在旁边的人已经能用 AI 当天把 demo 跑出来,拿真实界面讨论需求,你还在说“我负责协调资源”。
差距可能就是这么拉开的。
AI 最狠的地方,不是替你工作,而是逼你从“传话的人”变成“能把想法做出来的人”。
显示更多
AI 教母李飞飞在采访里说了个挺狠的判断:
不会用 AI 的人,可能被淘汰都收不到通知。
这句话听着夸张,但放到产品经理身上其实很现实。
以前 PM 不会写代码没关系,写 PRD、拉会议、找设计、等开发,几个月出一个原型。
但现在如果别人已经能用 AI 把 demo 先跑出来,你还停在“我来协调资源”,差距可能已经开始了。
未来被淘汰的未必是岗位,而是还停在旧流程里的人。
显示更多
李飞飞这段话挺值得细想。
她说 AI 真正变聪明,不是因为它更会聊天、更会写代码,而是它开始理解“空间”。
能看懂一个房间,知道冰箱在哪;
能推理怎么走过去;
能在脑子里想象一个没见过的客厅;
还能真的伸手把衣服叠好、挂进衣柜。
所以她才说,AI 学会折衣服这件事,可能比写一篇漂亮文章更让人紧张。
因为那一刻,它碰到的不再是屏幕,而是现实世界。
显示更多
AI 教母李飞飞在采访里说了个挺狠的判断:
不会用 AI 的人,可能被淘汰都收不到通知。
这句话听着夸张,但放到产品经理身上其实很现实。
以前 PM 不会写代码没关系,写 PRD、拉会议、找设计、等开发,几个月出一个原型。
但现在如果别人已经能用 AI 把 demo 先跑出来,你还停在“我来协调资源”,差距可能已经开始了。
未来被淘汰的未必是岗位,而是还停在旧流程里的人。
显示更多
AI 教母李飞飞在采访里说了个挺狠的判断:
不会用 AI 的人,可能被淘汰都收不到通知。
这句话听着夸张,但放到产品经理身上其实很现实。
以前 PM 不会写代码没关系,写 PRD、拉会议、找设计、等开发,几个月出一个原型。
但现在如果别人已经能用 AI 把 demo 先跑出来,你还停在“我来协调资源”,差距可能已经开始了。
未来被淘汰的未必是岗位,而是还停在旧流程里的人。
显示更多
GitHub 上有个项目火了,叫 Godogen。
简单说就是:你给 AI 一句话,它自己给你做一个游戏出来。
不是生成几段代码那种,是从建工程、写逻辑、生成素材、跑引擎、截图检查,到发现画面不对再自己修,整套流程自动跑。
它的口号也很直接:
Prompt in, Godot game out.
说人话就是:你描述游戏,它负责把第一版做出来。
显示更多
接手别人的项目最痛苦的事:打开数据库,几百张表,没有文档,没有注释,表名还是拼音缩写。
ChartDB 解决这个问题。跑一条 SQL 就能把整个数据库结构导出来,自动生成 ER 关系图,哪张表跟哪张表关联、外键怎么连的,一眼看清。
不需要数据库密码,不需要装软件,不需要注册账号。还内置了 AI,直接用自然语言问"用户表和订单表是怎么关联的"就能得到答案。
MySQL、PostgreSQL、SQLite、Oracle 都支持。开源免费。
显示更多
的人提了一个思路:用 AI 写代码之后,人应该审计划,不应该审代码。
他的类比很准。写 C 语言的时候没人去检查编译器输出的汇编对不对,因为你信任编译器。AI 写代码也应该一样——你把精力花在计划对不对上,计划没问题就让它去生成。
问题是 Claude Code 的计划是一大坨 Markdown,在终端里看得人眼花。他做了个 /visual-plan 技能,让 AI 用 MDX 组件输出计划:线框图、API 结构图、Schema 变更,都是可视化的,能拖能缩放。
代码写完之后还有 /visual-recap,生成一份可视化变更总结。产品经理和设计师不用看代码 diff 也能看懂 AI 改了什么。
显示更多