注册并分享邀请链接,可获得视频播放与邀请奖励。

小互 的个人资料封面
小互 的头像

小互 (@xiaohu)

@xiaohu
带你了解全球最前沿科技、AI动态... 学AI找小互,找小互,上 ... 小互AI日报 社群:
1.7K 正在关注    110.9K 粉丝
Meta 发布 Brain2Qwerty v2 你帮你脑子里在想的什么,实时转换成文字 不需要任何植入,仅需佩戴 MEG(脑磁图)头盔就能把你大脑产生的磁信号实时解码成连贯句子,全程不需要任何手术 字词准确率达 61%,约是其他无创脑机接口方法(8%)的 7.6 倍;最佳参与者达 78%,超半数句子只差一个词。 这是目前性能最高的非侵入式脑机接口系统....
显示更多
Uber车主 用 AI 以乘客的名字即时生成音乐 恶搞乘客 当乘客听到自己名字的时候有点搞笑🤣
0
17
100
8
转发到社区
字节跳动几乎是在所有AI领域都达到了临界点 刚试了下他们新的 AI 音乐模型 SeedMusic 1.0 Preview 一句话生成了一首完整的歌曲,而且速度还很快,大概2-3分钟,效果还真是挺不错的... 提示词:来一首古风歌曲,但是有着现代流行音乐的节奏感,能让人朗朗上口,关于爱情的歌曲
显示更多
0
39
137
12
转发到社区
Seedance 2.5 发布会 感觉海外朋友很想了解 方便英文朋友了解内容,我配好了中英文双语字幕 嘿嘿
字节跳动发布全新视频模型Seedance2.0升级版和 Seedance 2.5 一次生成30秒短片 原生支持4K分辨率 支持50个全模台参考素材输入 支持3D白模 同时发布AI版权商业化平台,可以使用官方授权的各种IP电影版权进行创作,分成!
显示更多
0
21
45
2
转发到社区
字节跳动旗下AI聊天应用豆包推出专业版 正式开启付费 包月68元起,高级套餐500元/月 豆包专业版专注应用开发、数据分析等专业工作场景 豆包办公任务模式支持操作本地电脑、使用浏览器、调用Skills技能和定时任务等能力, 内置Office办公套件,并支持专业图片、视频设计,以及应用和网站生成。 专业版由最新的豆包2.1Pro模型驱动,该模型能力和opus 4.6相当,在该模式下,豆包可以理解工作目标,自主拆解任务,并调用本地电脑、文档、表格、网页等工具持续执行任务,从“回答问题”升级为“生产力工具”。 三级阶梯定价(连续包月):套餐越贵、额度越大。 标准套餐:68元/月,额度为免费版的5倍以上 加强套餐:200元/月,额度为标准套餐的4倍 高级套餐:500元/月,额度为标准套餐的10倍 学生特惠:即将面向在校大学生推出6个月活动,认证后享更多免费额度,标准套餐可享 38元/月 专属价。
显示更多
0
23
25
2
转发到社区
白天参加字节发布会 晚上又来理想发布会了😂 全新理想L8 纯电430公里,增程1670公里 增程车加油变成偶尔…
0
52
39
0
转发到社区
字节跳动发布全新视频模型Seedance2.0升级版和 Seedance 2.5 一次生成30秒短片 原生支持4K分辨率 支持50个全模台参考素材输入 支持3D白模 同时发布AI版权商业化平台,可以使用官方授权的各种IP电影版权进行创作,分成!
显示更多
0
227
2.2K
313
转发到社区
Codex正在后台偷偷“搞废”你的固态硬盘 固态硬盘(SSD)的寿命是靠“写入量”决定的,写得越多,死得越快 Codex 似乎一直在后台疯狂写入,哪怕你电脑挂机什么都不干,它也在后台疯狂地狂写日志文件 它正在把你的硬盘寿命给“烧”光… 狂造垃圾: 你就随便用用,它就偷偷在后台写了几万条毫无用处的废话记录 暗中伤盘: 别看日志文件只有几百兆,它的底层运行逻辑有大毛病,正在像针扎一样疯狂且高频地擦写你的硬盘。文件看着没变大,硬盘寿命倒被偷偷榨干了…
显示更多
0
14
18
4
转发到社区
实际上这个插件更好用,点一下就行:
发现卡比一个库也很实用,只需微信公众号URL,就能转成Markdown,还能下载网页中的图片。 发现内置会用一个叫camoufox的浏览器,看介绍叫Anti-detect 亲测好用,把能力吸收,让公众号文章也能转PPT。 地址见评论区
显示更多
0
49
115
15
转发到社区
豆包实时语音模型3.0 API 上线 看演示还是很牛P的,能干不少事情了 全双工:能同时听和说,像真人聊天那样可以随时插话 端到端:语音进、语音出,不进行转录,更快、更自然。 精准遵循 + 适时参与: 你可以一句话给它定规矩,比如多人聊天时说「现在先别出声,聊到世界杯时再加入」, 它就安静待命,等话题真到了再主动接话 最关键的一步升级: 它支持自定义工具,能在实时对话里直接调用工具完成任务,预定日历、发邮件、总结文档、发起查询,一句话语音就在对话流里办完。 这等于从「语音助手」往「语音 Agent」迈了一步
显示更多
0
17
34
2
转发到社区
牛P了 Codex推出一个 Record & Replay功能 也就是你可以教Codex干活 你把你在电脑上经常操作的人物给它演示一遍 Codex 会观察学习你的整个操作过程,然后自动生成一个 Skill 技能... 下次遇到同样的任务,Codex 就能按照你教它的流程和操作替直接替你干活... 官方拿"发 YouTube 视频"来演示: 他手动走一遍全套流程,拉元数据、配缩略图和英文字幕、上传存成私密、逐项核对。Codex 就在旁边看着,看完把整套流程记成了一个可复用的技能。 然后他新开一个对话,挂上下一条视频,Codex 自己照着全做完了,一步没差。 而且不只是发视频,你平时那些重复的电脑活都行: • 每个月报销,贴发票、填那张固定的单子 • 把一堆乱命名的文件批量重命名、归档 • 每周把数据导出来,填进固定的周报表 • 网上订票订酒店,重复填一遍又一遍的信息 干活的时候它自己调电脑操作、浏览器、你连的那些插件,组合着把事办完。 你不用再教 AI 每一步怎么做,只要做给它看一次,下次它就替你做... 从"每次写提示词"到"演示一次就够",这是一个跨越...
显示更多
0
11
50
8
转发到社区
Google 花了 27 亿美金买回来的人 不到两年 跳槽到了 OpenAI 看来大企业病不好治啊,Gemini 短暂领先后就没后劲了… 不知道 Gemini 3.5 Pro 能否雄起🤓
I’m excited to share that I’ll be joining OpenAI and look forward to working with the exceptional team there. It was a difficult decision to move on. I’m incredibly proud of the amazing team at Google and everything we’ve built together. It has been an honor and a pleasure to work with all of you.
显示更多
Apodex :一个面向深度研究而打造的 Self-evolving heavy-duty solver 专门解决那种"没有现成答案、需要大量调研才能搞定"的硬问题 可一次最多派出 150 个子 Agent 并行探索,总共能跑 15,000 步 在 BrowseComp 上超越了 GPT-5.5-pro,在 DeepSearchQA 上超越了 Claude-Opus-4.8 和 Kimi-K2.6... 在科研和金融领域具有强大的研究能力 ... 它的工作步骤是:深度研究—自我校验—撰写 主要特点: 1、多 Agent 团队协作:主 Agent 接到任务后拆解成子问题,异步派发给专业化的子 Agent,每个子 Agent 有自己独立的上下文、提示词和工具集。 子 Agent 的报告汇入共享报告池,编排器异步读取,不会被最慢的那个卡住。单任务最高可调度 150 个子 Agent,执行超过 15,000 步。 2、内置三层自我验证机制: 当子 Agent 报告出现分歧时,冲突审查员介入;具体声明需要落地时,事实检查员介入;草稿完成时,草稿审查员过一遍。 最后还有一个全局验证器对所有汇集的证据做终审。验证器在结构上是独立于推理器的,被提示去"评估"而不是"继续推理",可以推翻前面的结论。 3、由一个专门的 AgentOS 驱动:与执行任务严格分离,它只负责通用的底层事务: - Agent调度 — 150 个子 Agent 谁先跑谁后跑,资源怎么分配。 - 模型和工具路由 — 这个子任务该调哪个模型、该用哪个工具(搜索引擎、代码执行器、数据库等)。 - 事件流 — 子 Agent 之间怎么传递消息和状态更新。 - 检查点和追踪 — 跑到哪一步了,出错了能不能回滚。 - 成本记账 — 这个任务总共调了多少次 API,花了多少钱。 - 权限管理 — 哪些工具允许用,哪些数据允许访问。 这种设计好处是:当你添加新应用时候,只需一个插件代码文件夹,底下的调度、路由、记账、追踪这些基础设施全都现成的,不用动内核一行代码。
显示更多
Midjourney 预热了几天的硬件设备 竟然特么是个医疗硬件设备 他们发布了一台全身超声波计算断层扫描仪 设备使用 8,960 个独立传感器环绕人体排列,运动分辨精度达到皮米级别 初代原型机比 MRI 便宜 10 倍、快 60 倍 而他们还要开个Spa店,进去泡个澡就检查完毕了 无辐射,走进去走出来就行😅
显示更多
0
55
234
28
转发到社区
Unreal Engine 虚化引擎 5.8 今天发布, 其中一个新功能是加入了实验性的 MCP插件 让你可以用自然语言 通过 Claude Code 在虚幻引擎里创造各种场景: 从布置现代客厅(沙发/地毯/茶几) 到画边界生成整座城市(城区/高速/路网/建筑) 再到一句"波哥大早上九点半"自动算太阳位置和大气 过去手工要几个月、要调几十个光照参数的活 降到几天、一句话搞定
显示更多
0
25
67
9
转发到社区
国内互联网似乎进入了一个全新阶段了 只要你挂梯子不给使用了 我遇到好多 APP 都是这种情况了 😌
0
425
609
17
转发到社区
OpenAI 格局大了 宣布Codex (包含 App 客户端、命令行 CLI 和开发包 SDK) 支持直接接入任何开源大模型 不强制绑定 OpenAI 自家的模型 并且放出了一个文档:手把手教开发者如何把 Codex 客户端底层的“大脑”,替换成免费的开源模型…
显示更多
Reminder that you can use the Codex App, CLI and SDK with any open source model, not just with OpenAI models.
0
109
1.2K
150
转发到社区
Claude Code 之父自己的 CLAUDE.md 现在就两行... Claude Code 团队聊"少即是多"分享随着模型能力增加该如何和模型交流: “别跟模型较劲做加法,因为模型每代都在变强,你今天费劲搭的东西很快就白搭了。” 为什么 Claude Code 坚持做命令行不做 GUI? 因为模型进步太快,半年后可能界面就过时了... 具体落在四件事上: 1. CLAUDE.md 越短越好,定期清空重来 他自己的 CLAUDE.md 就两行,提 PR 自动合并、提 PR 发审批频道,其余规则全写进提交到代码库、全队每周共建的那份里。看到队友犯可避免的错,就直接在 PR 上 Claude 让它把规则加进去。 当系统提示"你的 CLAUDE.md 已经几千 token"时,他的建议是直接删掉重写:用最少的东西把模型拉回正轨,模型跑偏了再一点点加回来。而且你会发现,每换一代模型,要加的越来越少。 很多人的毛病是过度工程化。 2. 为什么坚持做命令行(CLI)而不做图形界面 因为模型进步太快,做不出一个半年后还不过时的 UI。 而且 CLI 反而降低门槛,用 Claude Code 不需要懂 Vim、Tmux、SSH,打开就有它带着走。团队里也有 Vim 死忠,"除非我死否则别想夺走我的 Vim",但他自己就用 VS Code,觉得自己是个普通工程师。 3. 终端输出"详细 vs 简洁"的拉锯 他个人喜欢啰嗦,能扫一眼发现模型跑飞,按 Esc 当场摁住。 半年前他想砍掉冗长的 bash 输出,结果 Anthropic 员工全员造反。最近把"读文件/搜文件"折叠成一行摘要(这放半年前发不出来,因为那时模型还常读错),GitHub 上又有人不干。于是加了 verbose 模式两边兼顾。 这套打磨方式就是:发布 → 自己用一个月 → 听用户骂 → 迭代。他说最爱的就是听用户到底想怎么用。 4. 用 AI 修 bug 的体验已经"离谱" 做好日志后,随口说"这个对象出错了",它就翻日志、自己搞清楚,甚至能开生产通道看线上数据库。 最戳他的一个例子:他自己查一个内存泄漏,做 heap dump、开 DevTools、翻代码翻半天没搞定。队友 Chris 直接把问题丢给 Claude Code,它自己写了个小工具分析 heap dump,比他更快找到了泄漏。 收尾的反思 他说"Agent 能做什么"这件事每换一代模型就变,新人往往比他这个老人用得还溜,"这事我得反复重新适应,因为我的脑子还停在过去。" 一句话总结:模型在飞涨,人的最优策略不是堆配置、堆脚手架、堆工具,而是做减法、保持轻、把判断让给越来越强的模型,并不断推翻自己过时的使用习惯。
显示更多
0
43
238
30
转发到社区
AMD 推出了一款和Mac mini 大小差不多的 本地 AI 开发平台 对标英伟达的 DGX Spark(GB10) 128GB 统一内存,无需联网可在本地跑最高 2000 亿参数的大模型 所有模型运行环境都配置好了,宣称:从开机到出 token 只要几分钟... 能跑GPT OSS 120B、Qwen 3.5 122B、Qwen 3.6B、GLM 4.7 Flash 30B等模型 配置置带 Wi-Fi 7、蓝牙 5.4、10GbE 有线网口、4 个 USB-C 口(其中一个用于供电)、一个 HDMI 2.1b 输出。 售价 3999 美元起
显示更多
0
108
523
60
转发到社区
溜溜梅开盘暴涨 189% 溜溜梅简称 LLM 正宗的 AI 大模型概念股
0
395
637
26
转发到社区