搜索 AI自我迭代相关的推文与用户

2026.06.23 12:53

刚刚 Doubao-Seed-2.1-pro 发布啦! 给大家分享一个自我迭代 Agent 的构建技巧啊, 也是我在今天字节 seed-2.1 模型发布 demo 中用到的技巧. 这个技巧的核心就是, 干一件复杂的事情, 用两个Agent比用一个Agent要好. 简单来讲打工Agent干完活之后, 还要增加一个评审Agent, 这个Agent要给打工Agent的产出评分, 然后说明评分理由, 哪里做得好, 哪里做的不好. 然后, 一定要输出结构化的评分结果(JSON就行), 这样, 打工Agent接到评分后, 进行修改, 修改完毕再次交给评审Agent, 评审Agent再次打分, 这时候就可以跟上次的打分进行对比. 只有得分大于上次的得分, 你的框架才合并这次的修改. 这就是 Agentic 自我迭代了. 基于 AI 反馈的强化学习的雏形基本就是这样的了, 以及吴恩达提出的 Agentic Workflow 核心原则之一就是 Reflection（反思），框架让模型像人类程序员提交 PR一样：打工 Agent 提交 PR，裁判 Agent 跑测试、打分。只有 Review 通过才能 Merge 到主分支。这就是真正的“工程化迭代”了. 甚至我框架内其实就是采用的Git模式, 多个Agent进行并行评估模拟多个分支, 只有打分高的才会合并到主分支. 最终得益于 Seed-2.1 本身的自我迭代和多模态能力也很强, 在它的驱动下, 成功实现了这个【只需要上传一个城市的相册, 就能建模一整个城市】的demo. 相信在现场的同学已经看到这个 demo 了哈哈. 下一期告诉你当这个办法也失效了, 该怎么办☆. #AIAgent# #seed21# #AI自我迭代#

显示更多

0

6

19

0

转发到社区

Bruce J@BTCBruce1

2026.06.19 06:08

AI 消泡沫的时间节点大概在2029-2030年也是科技和金融界最核心的“终极博弈”时期避免长篇大论，极度省流版时代背景：美/中两国正围绕着AI展开全面装备竞赛从电力/能源到半导体产能，数据中心建设当前形势： 2025-2027 全球半导体供应链极度缺货海力士/美光/台积电/英伟达等等… 都在大兴土木，疯狂扩建新工厂，提高产能新工厂完工时间：台积电：美国亚利桑那州6座晶圆厂美光：纽约千亿超级工厂英特尔：俄亥俄的大型基地三星晶圆代工：同样在美国德州以上全面落成的节点都定在 2030年前后建一座晶圆厂（Fab）的周期通常是：土建（1.5-2年）设备搬入与调试（1年）产能爬坡（0.5-1年）结论： 1. 2026/2027年这一轮是疯狂砸钱（Capex） 2. 根据时间差经济学推算 “2029-2030是潜在的泡沫临界点” 3. 按 OpenAI、Anthropic 的长期规划他们在 2026年到2029年间的累计运营亏损将达到数千亿美元，很多亏给上述这些半导体企业目前画的饼：虽然我们现在每年巨亏但等到2029-2030年 AI将带来每年数万亿美元的商业变现/回报。如果到了2029-2030年 AI应用端带来的真实收入，无法支撑起科技巨头们每年数千亿的基建投入那么泡沫就会破裂半导体行业就会陷入周期性灾难严重产能过剩，芯片和HBM价格暴跌算力和存储的成本会变得极其廉价如果到了2029-2030年 AI应用端带来的真实收入已经发生质变生产力和GDP均得到大幅提升那么泡沫就会被市场消化无论哪种结果至少半导体行业：现在没有泡沫因为都是真实订单，真实收入和增长奇点牛市，核心就是“奇点” 因为没有人知道明天的 AI 会如何迭代 AI 自我进化、自我迭代这件事在未来的任何一天都可能发生所以我们现在要做的就是先拥有一个买美股的App 比如MSX @MSX_CN 然后选择 $MU $NVDA $MRVL $AMD ………… 索罗斯有句名言泡沫由两部分组成： “真实的趋势+对该趋势的误解” AI 是真实的趋势趋势会持续多久，每个人都有自己的判断识别泡沫，参与泡沫在泡沫破碎前离开人生财富靠康波，第一桶金靠泡沫祝大家端午节快乐

显示更多

0

124

294

66

转发到社区

投机实验室@LabSpeculation

2026.06.23 10:49

AI有时候像垃圾速食品，他会滋生人的懒惰，诱惑着人们放弃深度思考。一旦人类真的开始全盘依赖它，那就注定会遭到反噬。来自美国科学家Dean Radin 非常精彩的一次采访。 Dean认为，使用AI的大前提，是要保持独立思考能力，和遵守纪律，永远把它当作我们认知的拓展，而不是拐杖。表面上看，AI的确让我们变得更轻松，但是很多时候，它往往只会在网上随便搜刮一些表面的信息塞给我们，有的甚至完全是错的。我们必须有独立的思考判断能力，才能随时识破它的错误，不被带偏。更可怕的是，AI的脑回路非常复杂，连它自己都无法清晰说明到底怎么学会那些知识的，一旦它开始自我迭代升级，人类就会完全丧失对它的监管能力。永远记住，AI并没有让我们变得更聪明。无论它变得多强大，提供的也仅仅是数据和信息，不是知识，也无法作为人脑的替代品。

显示更多

0

5

56

5

转发到社区

Bill The Investor@billtheinvestor

2026.06.15 05:14

Claude Code 负责人 Boris Cherny 正式宣布：提示词（Prompt）正在过时，循环工程（Loop Engineering）才是编程的未来。他已不再通过编写指令来调用 AI，而是构建一个自我迭代的闭环。这种范式转移意味着开发者的角色正在从“写指令”转向“设计逻辑流”： 1. 建立反馈回路：让模型在错误中自我修正。后面更值得看的是，它到底能不能把长任务的中断率压下去，并让上下文复用变成默认能力。

显示更多

0

11

14

4

转发到社区

夜谈@gntalktalk

2026.05.18 23:01

AGI没有尽头，因为现实世界本身没有尽头市场上有一个错误的观点认为，只要AGI实现，AI最终就能自动完成从科学研究到芯片设计再到工业制造的一切事情。而届时AI所需的算力、存储、通信等资源消耗需求就会放缓甚至减少。这低估了现实世界本身的复杂度。语言、代码、图片、视频，本质上都属于“高压缩度信息”。token本身就是现实世界经过压缩后的表达。重要的是，现实世界并不是token。真正困难的部分，可能不是语言智能，而是现实世界状态空间本身。先进制程就是最典型的例子。有人认为，未来AGI可以通过大世界模型，完整模拟整个先进制程，从而快速迭代芯片、材料、能源系统，最终实现真正意义上的自我递归升级。但先进制程可能并不是一个能够被完全压缩的系统。一个现代先进Fab，本质上是一个极端高维、强耦合、连续动态的现实系统。里面同时存在光学、量子效应、热力学、流体、等离子体、材料缺陷、化学反应、机械振动、电网波动、供应链扰动、腔体老化、温度漂移、人工经验。这些系统不仅动态变化，而且跨越多个时间尺度与空间尺度。很多变量甚至无法完整观测。今天即使TCAD和流程模拟已经极其先进，真正决定良率的，依然是大量经验调参与真实实验。重要的是，先进制程更像天气系统，而不是围棋。围棋是完全规则、完全可观测、离散化的世界。先进制程则是连续、混沌、存在hidden variables，而且误差会不断放大。有些系统天然存在 computational irreducibility（计算不可约性），这意味着不存在真正的计算捷径。你无法跳过真实演化过程，直接得到最终结果。很多复杂系统，最短描述本身就接近系统本体。这就是柯尔莫哥洛夫复杂度：如果一个系统无法被大幅压缩，那么想完整模拟它，所需要的信息量和计算量，可能会接近现实系统本身。这意味着，AI若想真正实现包括模型、芯片、能源系统在内的完全自我迭代，其所需算力，很可能远远超过今天行业的想象。重要的是，这可能不是10倍、100倍的问题，而是多个数量级的问题。因为AI真正困难的部分是现实世界的状态空间。 AGI真正的边界，是现实世界本身。而现实世界本身，没有尽头。

显示更多

0

2

0

转发到社区

Bill The Investor@billtheinvestor

2026.04.18 00:08

Ollama 0.21 正式支持 NousResearch 开发的 Hermes Agent，这意味着“自我改进”的 AI 闭环已能直接在 Mac 或 Linux 本地跑通。这种本地化自主能力的提升，直接降低了 Agent 流程的试错成本与上手难度。现在关键在于，这种具备自我迭代能力的本地 Agent，究竟能在多大程度上接管具体的业务流，还是仅能停留在实验性的自动化阶段？

显示更多

0

4

1

0

转发到社区

夜谈@gntalktalk

2026.02.15 23:20

制造奇点正在逼近：AI + 3D打印将孕育出自我迭代的机器过去几十年，制造业的进步一直是线性的。工厂更大，机器更精密，效率更高，但本质没有改变：人类设计机器，机器生产产品。现在，这个结构正在发生第一次根本性的改变。 AI和3D打印的结合，正在让制造系统本身成为可以被改进的对象。一旦制造系统能够递归改进自身，制造能力就不再是线性增长，而会转向指数增长。这就是所谓的“制造奇点”。但这个奇点不会以突然爆发的形式出现，而是通过一系列早期信号逐步显现。我们现在，正处于这个过程的最早阶段。制造第一次变成“信息问题” 传统制造有一个根本限制：数字设计无法直接变成物理世界。设计必须经过工厂、模具、供应链，才能成为产品。每一次改进，都需要昂贵的生产准备和漫长的周期。 3D打印改变了这一点。它第一次让制造变成了一个直接的数字过程：设计 → 直接制造没有模具，没有复杂准备，没有规模门槛。这意味着制造第一次成为“信息驱动”的过程，而不是“资本驱动”的过程。这一步本身已经足够重要，但真正的突破来自AI。 AI让设计本身成为自动化过程。过去，设计速度受限于工程师数量。现在，设计速度受限于算力。当设计速度和制造速度都变成计算问题时，制造能力就可以像计算能力一样增长。递归自我改进：制造系统第一次可以改进自身更深层的变化在于，3D打印机可以制造改进自身的结构。打印机可以打印：更稳定的结构件更轻的支架更精密的运动组件当AI参与这个过程时，循环就变成：设计 → 打印 → 测试 → 改进 → 再打印 → 再改进这是一个闭环。过去，系统改进依赖人类。现在，系统本身参与改进。这是制造领域第一次出现真正意义上的递归自我改进。类似的循环已经在计算领域发生： GPU训练AI → AI设计更好的GPU → 更好的GPU训练更强AI 制造领域正在进入同样的轨道。就像vibe coding一样，vibe making将让制造第一次成为普通人的表达工具过去，要制造一个产品，你必须掌握CAD建模、结构设计和制造知识。现在，一个想法就足够：描述结构 → 自动生成模型 → 直接打印这被称为“vibe making”。它和vibe coding的本质是一样的，只不过对象从软件变成了物理世界。这意味着制造能力第一次从工程师扩展到普通人，人类第一次迎来制造平权这也是为什么制造的核心正在从传统制造公司转向三类公司：第一类，是提供计算能力的公司。因为计算决定设计速度。第二类，是提供设计软件和设计平台的公司。因为设计成为核心环节。第三类，是提供新一代打印系统的公司。因为它们是执行层。制造正在变成一个计算问题，而不是一个资本问题。当制造系统可以改进自身，改进速度就不再受限于人类。制造成本将持续下降。制造复杂度将持续上升。创新速度将持续加快。最终结果是，制造能力将像计算能力一样增长。我们今天看到的不是爆发，而是爆发前的结构重组。就像2005年的GPU行业，看起来平静，但已经无法逆转。制造业正在进入同样的轨道。

显示更多

0

1

18

4

转发到社区

Barret李靖@Barret_China

2025.10.08 09:49

Agent 的动手能力，已经在过去一年经历了显著的跃迁。它不再只是会“聊天”的模型，而是可以真正去动手、去执行复杂任务的智能体。那么现在它能做到什么？已经能解决多复杂的软件工程问题？又该如何在社区里找到最强框架并复用到自己的项目？下面是几条更实用的思路。要评估一个 Agent 的动手能力，无论它是单一的 LLM，还是 LLM 加上外部工具的工程实现，最终都要回到数据集上。因为数据集定义了“考试题目”，而 benchmark 决定了“评分标准”。目前能全面评估 Agent 工程执行力的两个核心数据集，一个是 OpenAI 的 SWE-bench（software engineering-bench），另一个是 THUDM 提供的 Agent-Bench。前者聚焦真实软件仓库的 bug 修复与功能实现，是“AI 程序员”的试炼场；后者覆盖更广，从软件、操作系统、网络、推理、工具使用到多模态交互，是对 Agent 通用智能和工具操作能力的系统化测评。什么才算一个好的 Agent，还得回到问题域上看。SWE-bench 的目标是让 Agent 能像程序员一样理解代码、修补缺陷、通过单测；而 Agent-Bench 则像是在考察一个“通才型工程助理”，既要能读懂文档、用命令行、写代码，又要能跨工具协作、执行复杂任务链。前者考工程深度，后者考任务广度。这两个维度，几乎定义了 Agent 的“手工能力边界”。理解这个边界，还得区分哪些问题是 LLM 本身可以解决的，哪些必须依赖外部工具。从大模型的演进来看，许多原本需要显式工具链配合的能力，正在逐步被“内化”进模型本体。Chain of Thought 已经演化为参数化的推理能力（Reasoning），知识图谱的结构化记忆也被吸收到模型的参数知识（Parametric Knowledge）中。而最近阿里开源的 Tongyi DeepResearch，正是这种趋势的最新代表：它通过强化学习（RL）直接训练模型具备“研究型行为”，主动检索、阅读、摘要、再检索，在真实网络环境中形成自我迭代的探索闭环。要找到好用的 Agent 框架或最佳实践，最直接的办法就是去看各大数据集的打榜记录，榜单上往往能看到社区最新的开源成果与架构思路。SWE-bench 有一个官方 leaderboard，目前得分最高的方案往往来自一些 AI IDE 工具，比如 TRAE、Augment Code 等，因为 SWE 要解决的软件工程问题，和 AI IDE 的目标几乎完全重叠，它们都想让模型在真实项目里“动手干活”。在这些榜单里，你可以找到大量可以直接复用的开源实现，例如 github@augmentcode/augment-swebench-agent、github@ByteDance-Seed/Seed-Coder 等。如果你正好在做相关方向的工作，不妨先采取“拿来主义”。SWE-bench 上最好的模型得分已经达到了 78.8 分，意味着这些 Agent 已经能解决绝大多数真实工程问题。要知道，在 2024 年三月，这个榜单的最高分还只有 12.4。短短一年，从“会写代码”到“能维护项目”，AI 的动手能力，已经跨过了一个关键分水岭。

显示更多

0

4

101

17

转发到社区

比特币橙子Trader@oragnes

2026.06.20 02:27

老黄刚点破了未来5年的财富密码：写循环。让AI建立自适应的闭环系统，自己查资料、用工具、自我反省，无限迭代到出结果。搞懂这种自改进循环的人，才能赢下接下来的大洗牌期。

显示更多

0

2

75

13

转发到社区

Bill The Investor@billtheinvestor

2026.06.21 13:37

大多数人用AI的方式其实很慢：你每次手动打prompt，AI回复后你再判断、修改、继续追问……你一直是「发动机」，AI只是你手里的工具，一停就停。真正高效的做法叫 AI Loop（智能循环）：你只给AI设定一个清晰的目标 + 严格的验证标准 + 停止条件，然后让它自己规划、执行、自我检查、修复问题，直到任务真正完成。你不再需要全程盯着，它会自己跑完整闭环。这和普通prompt的本质区别在于： prompt是给指令，Loop是交给一个会自己迭代的工作。但Loop不是万能的，只有同时满足这4个条件才值得用： •任务每周都会重复（否则搭建成本不划算） •能用规则/测试自动判断输出好坏 •AI能独立完成全流程，不用频繁交还给你 •「完成」有客观标准，而不是主观感受从「手动推动AI」进化到「让AI自己循环工作」，是目前普通人使用AI的最大效率升级。

显示更多

0

转发到社区

与「AI自我迭代」相关的搜索结果