注册并分享邀请链接,可获得视频播放与邀请奖励。

与「FUSE」相关的搜索结果

FUSE 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 FUSE 的内容
Excited to introduce StereoPolicy, led by @EvansXuHan. 📷📷🤖StereoPolicy is an effective way to add geometric cues to modern robot policy models while keeping the strengths of pretrained 2D encoders. ⁉️Why stereo for robot manipulation? Monocular RGB often lacks the depth cues needed for precise manipulation, while RGB-D and point clouds can be noisy or brittle, especially on reflective and transparent objects in real-world deployment. Instead of explicitly reconstructing disparity, depth, or point clouds, StereoPolicy directly fuses synchronized left/right RGB views to learn implicit stereo cues, avoiding extra reconstruction latency that can make real-time manipulation difficult. Project Page:
显示更多
0
3
116
24
转发到社区
A PhD student built a working nuclear fusion reactor in his garage, let an AI run it, and 400 thousand dollars later he works for Elon Musk. he posted it once. that single post ended with a grant in his account and a job offer from the most powerful man on earth. not a simulation. not a school project. an actual device that fuses atoms, sitting where his car used to be. fusion is the thing governments have been chasing for 70 years with billion dollar labs. the hard part was never the reactor itself. it was the control. the plasma inside has to be held at conditions hotter than the core of the sun, and it shifts and collapses in milliseconds. no human can react fast enough to keep it stable. so he stopped trying to do it himself. he handed the control loop to an AI. the model reads the sensor data hundreds of times a second, predicts how the plasma is about to move, and adjusts the magnetic fields before it ever drifts out of line. it does not wait for the plasma to misbehave. it sees it coming and corrects it before it happens. the same reaction-before-the-event speed no person could ever match. this is the exact kind of build people are tearing apart inside @NeuroClubAi. not to make reactors, but because the workflow is identical for anything hard. let the AI run the loop, predict the problem, fix it before it breaks. same playbook whether it is plasma or a business. then the post went out. within days Elon's fusion team reached out. they did not ask him to interview for an entry role. they handed him a 400 thousand dollar grant and pulled him onto the team building this at scale. one garage build turned a PhD student into an operator for the most ambitious man alive. here is the part that should stop you. he was one guy with a PhD, a garage, and an AI model doing the job that entire teams of physicists used to fail at. the AI was not assisting him. it was the operator. he built the hardware. the machine ran it. and that was enough to get noticed at the very top. most people think AI writes emails and makes pictures. meanwhile someone pointed it at one of the hardest physics problems on earth, held the plasma steady, and got paid by Elon Musk for it. the gap is not between humans and AI anymore. it is between the people who realize what this thing can already do and the people still using it to summarize their inbox.
显示更多
0
110
1.7K
353
转发到社区
做过视频的人都知道一个痛点:画面和声音永远对不齐 你用 AI 生成了画面,再用 AI 配了音,然后花几个小时手动调时间轴、对口型、卡节奏 稍微专业点的创作者,光音画同步这一步就能耗掉半天时间。更要命的是,调完还不一定自然 这个问题在 AI 视频生成领域一直没有解决方案,因为技术难度太高 ——要让声音和画面在生成的时候就天然对齐,而不是事后硬拼,这需要模型同时理解音频和视频的底层逻辑 直到百度文心团队放出了 NAVA-这是业界第一个仅有6.3B参数大小,但是能原生同步生成音视频的模型 其他能实现的模型哪个不是10B以上? 作为一个跑过无数 AI 工具的产品经理,我看到这个模型的第一反应是:这才是真正的技术突破 它到底能干什么? 你给 NAVA 输入一段文字描述,它直接输出720p 的视频+立体声音频,而且声画天然同步,不需要任何后期调整 这不是简单的文生视频+文生音频拼接,而是音视频在同一个生成过程中共同演化、原生对齐 音视频联合生成这个赛道,LTX、Ovi、MOVA 等模型都在做 但 NAVA 用了一个更聪明的架构:Align-then-Fuse,先让音视频在专门的对齐空间建立对应关系,再融合文本条件生成。 更炸裂的是参数量:6.3B 打败所有对手 NAVA 只有6.3B 参数,但在 Verse-Bench 基准测试上,音视频同步指标、视频质量、音频准确率全面超越: Ovi 1.1(10B 参数) MOVA(32B 参数) Davinci(15B) LTX 2.3(19B) 用三分之一甚至六分之一的参数量,拿下 SOTA。这意味着什么?意味着普通人真的用得起了 不需要4090显卡,不需要租昂贵的云算力,甚至12GB 显存的3060就有可能跑起来。而那些参数量动辄15B、19B 的模型,普通人根本碰不到,只能在云端按次付费 文心用6.3B 做到了别人19B 才能做到的效果,这不是简单的参数压缩,而是在模型架构和训练策略上下了真功夫 他们用了一个叫 Align-then-Fuse 的架构,先让音频和视频在专门的对齐空间里建立对应关系,再融合文本条件进行生成 这个技术路线的价值在于:小模型+高性能=普通人能用的 AI 工具 它解决了什么真实痛点? 我观察到三个场景,NAVA 可能发挥非常大的作用: 1.短视频创作者的效率问题: 现在做抖音、视频号内容,很多人卡在配音和画面匹配上。用传统工具,要么花钱请配音,要么用 AI 配音但对不上口型。NAVA 直接生成同步内容,省掉了这个环节 2.教育和培训内容制作: 很多老师、培训机构想做视频课程,但制作成本太高 如果能用文字描述直接生成带讲解的演示片段,内容生产效率会提升几倍 3.小白的内容创业门槛 过去你想做视频内容,得学剪辑、学配音、学调色 现在你只需要会写文案,描述清楚你想要什么,工具帮你生成 这对于想入局但没技术背景的人来说,是真正的降维打击 文心在下一盘什么棋? 有意思的是,NAVA 目前还只是研究阶段的开源项目,但它透露出的信号很明确: 文心在往音视频联合生成、甚至世界模型的方向布局 从产品思维来看,这个方向很聪明 视频生成是红海,音频生成也是红海,但音视频原生同步生成,还是蓝海 而且这个能力,恰好是搭建世界模型、实现真正多模态 AI 的关键拼图 更重要的是,他们选择了小模型路线 在大家都在卷参数量、卷算力的时候,文心用6.3B 做到了 SOTA 水平,这意味着他们在模型效率和工程优化上下了功夫 这对普通用户是好事,因为小模型意味着更低的使用成本、更快的推理速度、更容易的本地部署 NAVA 现在还在早期,但它代表的方向——让 AI 工具更轻、更快、更容易用,才是真正会改变普通人生活的技术路线 GitHub 项目地址: 论文地址: Hugging Face 模型页: #百度# #文心# #文心大模型# #NAVA# #大模型# #人工智能#
显示更多
0
16
21
1
转发到社区
💚SENDAI MUSIC FUSE💚 開催まであと…1日💥 いよいよ明日開催です‼️ 明日楽しむ準備はできていますか?? チケット購入はコチラから🔻 当日ROCKATERIA前特設テントでも 購入可能です♬ 🗣️リストバンド交換は 明日10:00〜ROCKATERIA前にて #SMF# #SMF2026# #FUSE# #仙台#
显示更多
0
0
47
23
转发到社区
最近,风华高科因RC/RS系列0402、0603晶片电阻订单激增,暂停部分新订单。 虽然只是是贴片电阻吗,但重要的,这是,高端、小尺寸、高一致性被动器件,的供需失衡信号。 0402 / 0603是封装尺寸。它既可以是MLCC,也可以是贴片电阻、电感、EMI滤波器。AI服务器真正需要的,是“小尺寸下还能维持高频、高一致性和长期可靠性”的器件。 AI的VRM复杂度提升、PDN越来越复杂。于是系统开始大量消耗:高频MLCC、小尺寸电阻、高频电感、钽电容、HSC。 这些器件单价不高,但属于“缺一个,整机就无法出货”的东西。 AI服务器里的需求本身是分层的。最核心的位置,比如GPU核心供电、HBM附近、ASIC substrate附近,仍然高度依赖:Murata Manufacturing、TDK Corporation、Taiyo Yuden。因为这里要求极低ESL、极低ESR、高频响应和长期可靠性。 但AI服务器并不只有核心位置。PSU、BBU、NIC、SSD、光模块、交换机,同样会消耗海量0402/0603。重要的是,AI正在先抽紧最顶级MLCC产能,然后压力开始向中高端0402/0603扩散。 最近大火的MLCC和0402电阻看起来是不同器件,但背后共享的是“小尺寸精密制造能力”。包括精密印刷、烧结、AOI检测、高频测试、超小尺寸良率控制、精密材料处理。 这和HBM产业链很像。最开始缺的是HBM,后来CoWoS、ABF、substrate、电源、散热、测试一起开始紧张。MLCC现在也开始出现类似现象。 真正最容易缺货的,往往不是最顶级料号,而是“能量产、能过验证、还能部分替代”的中高端规格。 2018年被动器件超级周期就是典型案例。当时车规MLCC先缺,高频小尺寸规格先涨,随后0402/0603全面涨价。因为一旦高端规格开始缺货,客户就会提前备货、长单锁产能、替代采购、超额下单,最后整个产业链一起紧张。 现在AI行业,可能正在重复这个过程。 更重要的是,这种紧缺会向二线供应商传导。当Murata Manufacturing、TDK Corporation、Taiyo Yuden 优先保障AI服务器和车规客户后,订单开始向:Vishay Intertechnology、Yageo Corporation、Bel Fuse Inc.、Fenghua Advanced Technology 溢出。 AI数据中心,正在把整个电子产业重新拉回“工业品逻辑”。从GPU,到HBM,到光模块,到电源,再到0402电阻,整个链条都在同时变紧。 这可能意味着,被动器件行业,正在进入新一轮量价周期。甚至可能是超级周期。 免责声明:本人持有文章中提及资产,观点充满偏见,非投资建议,dyor
显示更多
Collaboration comes in many different forms. 🐏 Introducing the Fuser Community Partner Program—built for creatives who move between disciplines, bring people into conversation, and share their process as naturally as they share their work.
显示更多
🍀SENDAI MUSIC FUSE🍀 //  最終出演アーティスト発表 &  タイムテーブル公開 \\ 大変お待たせいたしました‼️ 全出演アーティストが出揃いました👯 タイムテーブルも公開です⏰ お見逃しのないようプロフィール欄の当方HPをさらにチェック✔︎ #SMF# #SMF2026# #FUSE# #仙台# #サーキットフェス#
显示更多
0
1
204
68
转发到社区
Starship’s cargo bay delivers 1,000+ cubic meters of usable volume The entire International Space Station has a pressurized volume of 1,005 m³ It took 42 assembly flights and over $150 billion across 13+ years to build Starship can deliver more volume than the entire ISS in a single flight For context, a single payload bay can hold: → The interior volume of a massive 5-bedroom house → The volume of 20+ standard shipping containers → Entire space station modules (fully assembled) → Over two dozen Cybertrucks → Multiple Boeing 737 fuselage sections → 100+ large satellites with room to spare And it is 18 meters tall....meaning you can stack an entire 5-story building inside it And it is fully reusable. Launch the next massive telescope. Or an entire space station. Or the next Mars habitat All possible in a single flight This is why Starship is pure engineering magic
显示更多
0
645
8.8K
2.5K
转发到社区
The model knows when a task is complete to determine whether to retry it or move on - thanks to its multi-view reasoning and the ability to fuse live camera streams to understand a full scene. Watch it process multiple angles to confirm if the job is done ↓
显示更多
0
2
154
12
转发到社区
【第3弾出演アーティスト発表!】 SENDAI MUSIC FUSE 2026⭐️ カラコルムの山々/クジラ夜の街/西恵利香/ペンギンラッシュ/前髪ぱっつん少年/AFRO PARKER/KOHAKU/Laika Came Back/NEK!/Offo tokyo/the paddles/YUTORI-SEDAI/#KTCHAN# 詳細はHPから👀⬇️ #SMF# #SMF2026# #FUSE#
显示更多
0
1
141
40
转发到社区