注册并分享邀请链接,可获得视频播放与邀请奖励。

Vincent | 信号>噪音 的个人资料封面
Vincent | 信号>噪音 的头像

Vincent | 信号>噪音 (@VincentLogic)

@VincentLogic
信号>噪音 📡 Vincent Logic 每天挖真正好用的GitHub开源项目 专注AI工具 & 开发者效率 高密度干货,Zero fluff
380 正在关注    54.8K 粉丝
世界上第一个开源的AI视频制作系统
以前的视频 AI,都是你先问,它再看。 京东刚开源的 JoyAI-VL-Interaction,把这个顺序反了过来:它会一直看着摄像头或直播流,每秒自己判断一次——现在该说话、保持沉默,还是把任务交给后台 Agent。 火灾出现就提醒,比分变化就解说,画面触发条件才行动。 这听起来只是“实时了一点”,实际却是 AI 从被动工具变成了持续在场的观察者。 问题也随之来了:当 AI 可以24小时看着家庭、老人、工厂和公共空间,便利与监控之间的边界应该画在哪里? 视频里看实测效果。👇
显示更多
本地跑了一遍 VoxCPM2,最让我意外的不是它会说粤语、河南话,而是“声音”正在变成一种可以编辑的东西。 写一句提示词,就能指定年龄、音色、情绪和语速;再上传一段参考音频,它还能保留音色,重新控制表达方式。 以前语音模型追求的是“像不像本人”,现在已经开始解决“能不能按导演要求表演”。 当声音可以像图片滤镜一样被描述、复制和改写,它还算不算一个人的身份特征? 视频里放了方言、情绪控制和真人声音克隆的实测效果。👇
显示更多
我越来越觉得,Prompt 可能是 AI 时代最大的“新手陷阱”。 每天复制粘贴、补充背景、检查结果、继续追问……AI 变聪明了,人却成了它的全职保姆。 真正的分水岭,不是谁更会写提示词,而是谁能把重复工作变成 Loop:记住变化、主动运行、彼此协作,只在需要你决定时出现。 如果每一步都要你下命令,那到底是 AI 在替你工作,还是你在管理 AI? 视频里用“孩子春游”和“一把快坏的菠菜”,讲清了 Prompt、Loop 和 Loop of Loops 的区别👇
显示更多
马斯克这段访谈最值得讨论的,不是他一周工作 120 小时。 而是它戳破了一个 AI 时代的幻觉: 工具越来越强以后,人与人的差距就会变小。 但现实可能刚好相反。 AI 能帮你提效、自动化、降本、写代码、做内容、查资料。 可它很难替你承受: 连续失败。 现金快烧光。 团队动摇。 外界嘲笑。 所有选择都像错的时候,你还要继续做决定。 这段视频最残酷的地方在于: 创业很多时候不是“聪明人的游戏”。 而是“没有退路的人,能不能在高压和不确定性里继续下注”。 这不是鸡血。 也不适合包装成成功学。 但它确实提醒我: AI 时代真正稀缺的,可能不是效率。 而是一个人在快被现实压垮时,还能不能保持判断力。
显示更多
马斯克在访谈里说了一个细节 我觉得比任何 AI 创业故事都值得看 2008年,SpaceX 和特斯拉同时濒临破产 他手里只剩 3000 万美元 只够救一家 他没办法选择让哪个"孩子"死 所以把钱平分了 然后去找朋友借钱付房租
显示更多
英伟达开源了一个视觉定位模型:LocateAnything-3B 几十个小黄人密密麻麻堆在一起 它一个不漏,全部框出来了 这背后的技术变化比"更准"这两个字值得多说一句
显示更多
马斯克在访谈里说了一个细节 我觉得比任何 AI 创业故事都值得看 2008年,SpaceX 和特斯拉同时濒临破产 他手里只剩 3000 万美元 只够救一家 他没办法选择让哪个"孩子"死 所以把钱平分了 然后去找朋友借钱付房租
显示更多
🚨阿里巴巴发布实时视频语音模型:Wan Streamer 这不是普通数字人。 它更像是让你和 AI 打一通“实时视频电话”: 你说话,它看着你听。 你打断,它能接住。 你表情变了,它也能反应。 半秒内接话,几乎没有冷场。 真正的重点是: 以前虚拟人是拼流水线: 语音识别 → 转文字 → 大模型思考 → 语音合成 → 表情驱动 → 视频生成 每一步都要排队,所以延迟高、互动僵硬。 Wan Streamer 直接把听、看、想、说、表情生成,塞进一个端到端大模型里。 一个 Transformer 直接处理实时音视频交互。 模型端响应约 0.2 秒,整体延迟约 0.55 秒。 这意味着 AI 不再只是“回复你”,而是开始像一个能实时交流的视频对象。
显示更多
刚融了 3 亿美元的 PhysicsX,做的事情值得认真看一下 传统工业仿真算一个流体工况要几天 他们用 AI 把这个压到毫秒级 但速度不是最重要的部分 更重要的是:工程师的角色在这个过程里变了
显示更多
Greg Isenberg 说了一个让我想了很久的判断: AI 时代最稀缺的能力,不是写代码 是分发 因为制造东西越来越容易了 难的是让人看见它、信任它、买单它 这个逻辑如果成立 过去十年最被低估的那批人 接下来可能是最值钱的那批人
显示更多
百度出了个 OCR 模型 3B 参数,实际激活只有 500M 跑分赢了 235B 的 Qwen3-VL 不是说大模型不行 是这个方向在说一件不同的事: 在特定任务上,专才能打赢通才
显示更多
所有人都在盯着 AI 模型的参数和跑分 陈立武在这场采访里说了一句更冷静的话: 下半场比拼的不是谁的模型更聪明 是芯片、封装、电力、内存、制造能力 这些东西建起来要十年 不是发一篇论文的事
显示更多
英特尔 CEO 陈立武说了一个细节, 我觉得很多人没注意到: AI 训练阶段,CPU 和 GPU 的比例是 1:8 现在进入推理和 Agentic AI 阶段 这个比例正在变成 1:4,甚至 1:1 如果这个趋势是真的 英特尔的处境比大多数人想象的要好得多
显示更多
把 AI 时代的工具逻辑带进了 Minecraft Arnis:输入任意真实地址 几分钟内生成 1:1 比例的 Minecraft 地图 OpenStreetMap 数据 + 真实地形高程 你住的那条街,原样出现在游戏里
显示更多
英特尔 CEO 陈立武说了一个细节, 我觉得很多人没注意到: AI 训练阶段,CPU 和 GPU 的比例是 1:8 现在进入推理和 Agentic AI 阶段 这个比例正在变成 1:4,甚至 1:1 如果这个趋势是真的 英特尔的处境比大多数人想象的要好得多
显示更多
0
16
132
18
转发到社区
李飞飞这段采访,越听越有压力。 她说未来真正被甩开的,可能不是被 AI 替代的人,而是还在用五年前流程工作的人。 以前产品经理不会写代码很正常:写 PRD、开会、等设计、排开发,几个月做个原型。 但现在旁边的人已经能用 AI 当天把 demo 跑出来,拿真实界面讨论需求,你还在说“我负责协调资源”。 差距可能就是这么拉开的。 AI 最狠的地方,不是替你工作,而是逼你从“传话的人”变成“能把想法做出来的人”。
显示更多
AI 教母李飞飞在采访里说了个挺狠的判断: 不会用 AI 的人,可能被淘汰都收不到通知。 这句话听着夸张,但放到产品经理身上其实很现实。 以前 PM 不会写代码没关系,写 PRD、拉会议、找设计、等开发,几个月出一个原型。 但现在如果别人已经能用 AI 把 demo 先跑出来,你还停在“我来协调资源”,差距可能已经开始了。 未来被淘汰的未必是岗位,而是还停在旧流程里的人。
显示更多
0
16
240
62
转发到社区
李飞飞这段话挺值得细想。 她说 AI 真正变聪明,不是因为它更会聊天、更会写代码,而是它开始理解“空间”。 能看懂一个房间,知道冰箱在哪; 能推理怎么走过去; 能在脑子里想象一个没见过的客厅; 还能真的伸手把衣服叠好、挂进衣柜。 所以她才说,AI 学会折衣服这件事,可能比写一篇漂亮文章更让人紧张。 因为那一刻,它碰到的不再是屏幕,而是现实世界。
显示更多
AI 教母李飞飞在采访里说了个挺狠的判断: 不会用 AI 的人,可能被淘汰都收不到通知。 这句话听着夸张,但放到产品经理身上其实很现实。 以前 PM 不会写代码没关系,写 PRD、拉会议、找设计、等开发,几个月出一个原型。 但现在如果别人已经能用 AI 把 demo 先跑出来,你还停在“我来协调资源”,差距可能已经开始了。 未来被淘汰的未必是岗位,而是还停在旧流程里的人。
显示更多
AI 教母李飞飞在采访里说了个挺狠的判断: 不会用 AI 的人,可能被淘汰都收不到通知。 这句话听着夸张,但放到产品经理身上其实很现实。 以前 PM 不会写代码没关系,写 PRD、拉会议、找设计、等开发,几个月出一个原型。 但现在如果别人已经能用 AI 把 demo 先跑出来,你还停在“我来协调资源”,差距可能已经开始了。 未来被淘汰的未必是岗位,而是还停在旧流程里的人。
显示更多
0
23
275
47
转发到社区
GitHub 上有个项目火了,叫 Godogen。 简单说就是:你给 AI 一句话,它自己给你做一个游戏出来。 不是生成几段代码那种,是从建工程、写逻辑、生成素材、跑引擎、截图检查,到发现画面不对再自己修,整套流程自动跑。 它的口号也很直接: Prompt in, Godot game out. 说人话就是:你描述游戏,它负责把第一版做出来。
显示更多
0
11
119
15
转发到社区
接手别人的项目最痛苦的事:打开数据库,几百张表,没有文档,没有注释,表名还是拼音缩写。 ChartDB 解决这个问题。跑一条 SQL 就能把整个数据库结构导出来,自动生成 ER 关系图,哪张表跟哪张表关联、外键怎么连的,一眼看清。 不需要数据库密码,不需要装软件,不需要注册账号。还内置了 AI,直接用自然语言问"用户表和订单表是怎么关联的"就能得到答案。 MySQL、PostgreSQL、SQLite、Oracle 都支持。开源免费。
显示更多
的人提了一个思路:用 AI 写代码之后,人应该审计划,不应该审代码。 他的类比很准。写 C 语言的时候没人去检查编译器输出的汇编对不对,因为你信任编译器。AI 写代码也应该一样——你把精力花在计划对不对上,计划没问题就让它去生成。 问题是 Claude Code 的计划是一大坨 Markdown,在终端里看得人眼花。他做了个 /visual-plan 技能,让 AI 用 MDX 组件输出计划:线框图、API 结构图、Schema 变更,都是可视化的,能拖能缩放。 代码写完之后还有 /visual-recap,生成一份可视化变更总结。产品经理和设计师不用看代码 diff 也能看懂 AI 改了什么。
显示更多