搜索任務失敗しちゃいました　相关的推文与用户

2026.04.23 14:36

#任務失敗しちゃいました　# 企画参加させていただきます NSFW 極西退魔戦線で光栄な負傷により片腕を失い、後方研究職に転じたダークエルフ、ダセリナ。より高性能な人工義肢を装着した彼女は、久々に前線任務に志願した。「……旧時代の支援ロボットごとき、大したことないわね。　すぐに片付けて戻る」しかし大意した結果、初めて暴走ロボットに捕らわれ、手を拘束され…… あれやこれやと犯されながらも、彼女は静かに抵抗を続けた。「……っ、絶対に……ファイアウォールの暗証など…… 渡したりしない……」「....うおお...！ああ...」 #AIart# #elf# #エルフ#

显示更多

0

1

5

1

转发到社区

零崎業萌@zerozakiyamo

2026.04.23 14:35

#任務失敗しちゃいました　# 極西退魔戦線で光栄な負傷により片腕を失い、後方研究職に転じたダークエルフ、ダセリナ。より高性能な人工義肢を装着した彼女は、久々に前線任務に志願した。「……旧時代の支援ロボットごとき、大したことないわね。　すぐに片付けて戻る」しかし大意した結果、初めて暴走ロボットに捕らわれ、手を拘束され…… あれやこれやと犯されながらも、彼女は静かに抵抗を続けた。「……っ、絶対に……ファイアウォールの暗証など…… 渡したりしない……」「....うおお...！ああ...」 #AIart# #elf# #エルフ#

显示更多

0

2

0

转发到社区

マゼ/Maze@Maze_wry

2024.10.05 10:45

キヴォトスふたなり大騒ぎvol.1 ソウルワーカー、任務失敗メロンボックスで電子本販売始めました！よろしくお願いします😊

显示更多

0

32

4

转发到社区

⌘00FA ./@Web300fa

2026.06.03 08:35

好工具分享～推荐指数 ★★★★ 今天给跑浏览器自动化总被各种BOT检测和风控拦住的家人强烈推荐一个神器！！脚本卡死、IP 封禁、账号被ban、CAPTCHA 无限弹窗、数据抓不到、任务失败……只有跑过网页自动化的家人知道有多难～ CamoFox Browser 是为 AI Agents 打造的顶级 stealth headless browser，基于 Camoufox，Firefox C++ 级深度指纹伪装，底层硬 spoof 所有指纹，无任何 JS shim 痕迹，检测工具根本发现不了！ - 极致隐身：硬刚 Cloudflare Turnstile、Akamai 等主流风控 - Agent 原生友好：超轻量 accessibility snapshot，比 HTML 还小90%、稳定元素引用、搜索宏，直接当基础设施 GitHub 已 6.2k+ stars，有需要的可以收藏关注～工具地址：不定期分享AI工具/美股资讯，欢迎各位大佬一起互关～

显示更多

0

36

31

0

转发到社区

三度_69@sandu__69

2025.02.26 09:41

师尊…任务失败了…

0

12

2.5K

111

转发到社区

啊川 Azey@azeycoser

2022.11.27 09:07

“抱歉..任务失败。”

0

18

5K

292

转发到社区

kajiQ@kajiweb3

2026.06.02 04:09

与 Bitget Wallet 四位高管的对话后，我的半年观察 —— 正在「被忘记」的加密支付海德格尔在《存在与时间》中讨论过这样一件小事：一把锤子在好用的时候，使用它的人并不会「看见」锤子本身，他们看见的是钉子、是被钉的木板、是即将完成的工事。只有当锤子坏掉、不顺手、卡住时，人们才会突然意识到「锤子」作为一个独立物体的存在。这个观察可以用在很多地方，也可以用在支付上。当你在便利店刷卡、在街角扫码，你不会意识到自己正在使用一套庞大的金融基础设施，发卡行、清算网络、跨国汇兑...它们都在你身后运转，但你不必看见它们。加密支付还处在另一种状态里。一个用 USDT 买咖啡的人，付款前仍然会停下来想一下「这家店收吗」「能付成功吗」；一个用 U 卡支付 Uber 的旅客，事后会专门发一条推记下来。它仍然是一件让人用之前要「想一下」、用之后还值得「记一下」的事。就像 50 年代的信用卡、2013 年的支付宝，处在从「新事物」走向「日常工具」的中间路上。而今天的 Bitget Wallet，正在三大洲的街头，让这条路走得更快一些。这是一个仍在发生的过程，但在 1 亿用户的真实使用里，从「被讨论」到「被使用而不被注意」的转变，已经发生了一段距离。为了加速发生，Bitget Wallet 与 Stellar 联合启动「PayFi Odyssey」活动，以总计 30 万美元等值 XLM 奖励，覆盖亚洲、非洲与拉美超过 35 个国家和地区，活动持续至 2026 年 7 月底。这是 Bitget Wallet 围绕 Payfi 推出的迄今规模最大的跨区域用户激励活动，我们将在下文详细讲解。 —— 支付，一部「逐渐消失」的历史回看支付史，会发现一个有趣的现象：每一代主流支付媒介的成熟时刻，都是围绕它的那些多余念头消失的时刻。信用卡在 1950-60 年代刚出现时，「塑料货币会不会让人失去节制」「没有现金的社会是否还安全」是报纸专栏和家庭餐桌的常见话题。今天没人再思考「信用卡靠不靠谱」，它消失在刷卡的动作里。支付宝、微信支付在 2013-2015 年间也让人反复掂量「到底安不安全」「资金被第三方托管会不会出事」。今天一个上海人在点外卖时，会想「用支付宝吧」，但不会再多想，它消失在扫码的动作里。人们清楚地知道自己在用什么货币、用什么方式付款。真正被忘记的，是围绕一种新支付方式刚出现时附着在它身上的那一组多余念头：它安不安全、这家店收不收、这次能不能成功、失败了怎么办、机制到底怎么运作。当这些念头逐个消失，只剩下「用什么付钱」这一个干净选择时，一种支付方式才真正进入了日常。而 Bitget Wallet 正在做的，是把这些念头从用户头上一项一项拿掉。 ——「减法」：Bitget Wallet 的哲学「念头被一项一项拿掉」这件事，最直接的体感来自 Bitget Wallet 团队内部，越来越多同事开始在日常生活中使用 Bitget Wallet Card 和扫码支付。一位同事告诉我，过去去香港他会下意识做几件事：去银行/在机场换港币、买八达通。这一年他已经不做这些了，下飞机直接打车去酒店，吃饭、711 购物，全程只用微信/支付宝、Uber。第一次这么做的时候，他在中环一家茶餐厅展示了微信付款码，下意识地停了几秒想「成功了吗」。现在那个动作消失了。「Bitget Wallet U 卡在国内日常消费里也基本够用，吃饭、打车、点外卖、各种 AI 订阅」，没有让他感觉到「它和别的卡有什么不同」。变化发生在他看不见的地方，背后流过的，已经是稳定币。它揭示了一件比「加密支付变方便了」更深的事，所谓加密支付走向日常，不是用户学会用一个新东西，而是这个新东西溶解进了用户已经在用的所有东西里。Apple Pay、Visa、Mastercard、PromptPay、VietQR...这些都是已经存在的、用户已经熟悉的支付方式。Bitget Wallet 没有要求用户切换习惯、记住一个新品牌、扫一个新的二维码，只是让稳定币像水一样流过这些已有的管道。这种判断不只是个人的体感。美洲区负责人 Jack Zhai @JackZhaiTGG 深耕拉美新兴市场，他在一次内部访谈中讲过一句让人印象很深的话「Crypto 可以借鉴互联网大厂做法，要让用户逐渐感觉不到」。这句话和上面的体验完全吻合：用户感觉不到 Web3 在哪里、用户感觉不到稳定币是什么、用户感觉不到协调层在做什么，他只是在用钱付钱。这就是 Bitget Wallet 想做到的「减法」，用户的支付习惯一点都不需要改变，但价值已经在以一种新方式流动。要让这件事成立，需要的不仅是新技术，而是一种逆向的产品哲学。这种哲学在 Bitget Wallet 内部有一个明确的源头。CEO Karry @KarryWeb3 Web3 产品方法论非常尖锐的判断：「Web3 行业有很长一段时间有种『拿着锤子找钉子』的感觉」，Karry 说，「我有 ZK、我掌握 XX 技术，我要怎么怎么弄。陷入到这种死循环里，是很大的问题」。他对 Bitget Wallet 的产品逻辑是反过来的，先从用户的角度起点开始，然后来找合适的技术。「用户要解决什么问题？用户要去中心化、要安全、又不想记助记词，所以我们用 TEE，做了 Social Login。用户不希望感知到 Gas 费，所以我们用了 EIP-7702，让稳定币直接付 Gas 费」。所有的技术选择都是从用户的「我不想要 XXX」反推回来的： - 用户不想复制冗长的链上地址 → 链接转账：通过 WhatsApp、Telegram 等分享支付链接即可完成收付款 - 用户不想关心商户支不支持加密支付 → Bitget Wallet Card：与 Fiat24、Immerse、DCS 合作发行，覆盖全球超过 50 个市场，0 开卡费、0 年费、0 外汇手续费，每月 400 美元的零手续费消费额度，体验和过去三十年的刷卡经验没有区别 - ... 这种「从用户已有习惯反推」的思路，在不同区域也同样成立。Jack 在访谈中给过一个非常具体的例子：巴西的 Pix 是央行牵头、全国身份证联网的支付网络，连中国都没做到这种程度。Bitget Wallet 没有试图在拉美发明一套新支付，而是直接接入 Pix。对用户而言，他扫的还是 Pix 的码，做的还是 Pix 的动作；变化只发生在背后，结算流过的是稳定币。这件事最关键的细节是：Bitget Wallet 没有要求商户贴一个新二维码、没有要求用户学一个新动作，只是让自己的 App 能识别本地原有的码。所以，在产品层和区域层，Bitget Wallet 用的是同一套方法论：不发明新轨，让稳定币流过已有的轨。这种方法论的效果，在外部观察者眼里也开始被识别出来。PayFi 领域的资深观察者 Will 阿望 @Will_7th 写过一段非常精确的总结：「前端通过国家二维码扫码进行消费，VCC 支持 V/M；后端是数字钱包 + 法币银行账户。中间串联起来支付通道。这个感觉是市面上比较接近生活的 Crypto 钱包了」。他用 30 个字精确还原了 Onchain Payments Matrix @PaymentsMatrix 在做的事，前端接本地已有支付通道，后端接已有金融轨道，中间用稳定币串联起来。这不是 Bitget Wallet 自己讲产品的方式，而是一个懂行的外部观察者，看完之后用自己的话讲出来的事。当一个产品架构能被外部人用 30 个字讲清楚的时候，它已经接近「被理解 = 被使用」那个状态了。这种方法论背后是 Karry 个人的一种产品姿态。他在那次访谈里讲：「Web3 这个行业过去几年讲了太多虚的东西，最后什么都做不出来，这让我一度非常失望。我现在比较务实，能吹虚的地方就少了」。支撑这件事的，是 Bitget Wallet 的 Onchain Payments Matrix，一套连接区块链、稳定币发行方、卡组织、清算银行、本地支付通道与商户网络的支付基础设施层。它是一个协调层（coordination layer），不发币、不重做结算、不替代任何已有的金融基础设施，它的工作只有一件：让原本互不连通的各方能配合起来。关于支付的叙事热点也换过好几轮，去年讲协调层，今年讲 Agentic Wallet，市场喜欢追热点而动，但谁来串联协调层？亚太区负责人 Will Wu @SrWillWill 提过一个判断：「币圈的迭代速度比传统行业快 10-20 倍，但真正能让这种迭代进入用户日常的，还是要回到最基础的问题：用户痛点到底是什么，具体帮他们解决什么问题？」迭代越快，越需要在某些事情上慢下来。Onchain Payments Matrix 就是 Bitget Wallet 选择慢下来的那个地方。但这一切，用户在 Bitget Wallet App 里几乎感受不到，这正是前面讲的「看不见」那一面。这种「用户看不见、但实际跑通」的思路，不只发生在产品层。COO Alvin Kan @alvin_kan 在一次访谈中讲过 Bitget Wallet 这两年的内部调整。「我加入的时候，市场、运营、BD 这几个团队是混乱的」，Alvin 在过去两年做的第一件事，就是确保每个团队及其 leader 都有清晰明确的职责范围，并且由具备相应能力的人来带领，「每一次拆分都伴随一个 Vision，你要让人看清楚自己该聚焦做什么」。第二件事是放权区域。Alvin 在过去两年里招了一批本地区域负责人，「这是一个钱包公司，在做一个面向大众用户的消费级产品，要实现 mass adoption，它需要在每个市场扎得非常深，而扎深这件事只能让本地人来做」。在产品上做减法之前，Bitget Wallet 先学着在自己身上做减法。而组织减法做完之后，区域负责人手上的事情才能真正落地。今年以来，Bitget Wallet 扫码支付每日支付用户数相较去年增长近 10 倍，是平台增速最快的业务线之一。这个增长真正发生的地方，不在纽约或伦敦，而在新兴市场，这正是 Alvin 招的那批区域负责人在跑的地方。 Jack 在访谈中讲过几个反直觉的判断：拉美本币贬值近 1000 倍。在阿根廷、委内瑞拉这些国家，居民对本币的不信任已经不是宏观经济议题，而是日常生存问题。「美元稳定币替代本地货币」在拉美不是 Web3 极客的偏好，是一种集体本能。另一个是渗透路径：稳定币在拉美不是从普通消费者突破，而是从特定行业渗透。Jack 提到两个典型场景：KOL 收款基本全走稳定币转账（绕开本币贬值和银行手续费）、远程办公者（一家纽约公司可以雇阿根廷员工，但工资走 SWIFT 太慢太贵，走稳定币就一切顺畅）。这些行业先用起来，然后通过每一次牛市把更多人带进圈。加密支付在新兴市场之所以能跑通，不是因为这些用户对 Web3 有热情。恰恰相反，是因为他们对 Web3 没兴趣，对「美元稳定币能稳定持有 + 能流畅花掉」这两件事有需求。当 Bitget Wallet 让这两件事在他们已经习惯的二维码、银行账户、加密卡上发生时，需求就被自然满足了。对他们而言，加密支付或许不是一个酷的产品，而是一个必要的工具。 —— Payfi Odyssey：一个夏天，三个大洲但工具要从「被讨论」走向「被使用」，中间还有一段必经的路。它需要被真实的人在真实的街头反复使用、记录、传播。这条路前面有信用卡走过 30 年，有支付宝走过 10 年；加密支付现在正走在这条路的中间。 Bitget Wallet x Stellar 发起的 PayFi Odyssey 想做的，是在这条路上点燃一段集中的火，用 30 万美元等值 XLM 奖励，覆盖亚洲、非洲、拉美 35 个国家，三条主线对应三层观察：卡能覆盖多远、扫码能触及多深、真实生活中的人在用它做什么。第一条主线，是 U 卡能覆盖多远。加密卡活动总奖池 20 万美元等值 XLM，自 5 月 26 日开启至 7 月 7 日 15:59（UTC+8）。Bitget Wallet Card 持卡用户可通过完成开卡注册、日常刷卡消费及 Stellar 链上指定任务积累积分，活动结束后按积分比例分享 198,000 美元等值 XLM 奖池。覆盖中国大陆、新加坡、韩国、日本、越南、泰国、菲律宾、澳大利亚、欧洲 EEA 及英国、拉丁美洲与南非等超过 25 个国家和地区，这是覆盖范围最广、参与门槛最低的一条主线。第二条主线，是扫码能触及多深。扫码支付返奖计划总奖池 10 万美元等值 XLM，分两阶段进行，覆盖越南、新加坡、巴西、阿根廷等 11 个市场。这 11 个市场的本地 QR 支付网络已经成熟，稳定币只需要无缝接入，就能让用户用熟悉的扫码动作完成新的支付方式。如果这个夏天你有计划全球旅行，这就是最好的选择。第三条主线，是真实生活中的人在用它做什么。 Crypto Survival Plan（加密生存计划）总奖池 10 万美元等值 XLM，向亚洲、非洲、拉丁美洲三大区域各征集约 20 名 KOL，以视频与访谈形式记录使用加密支付完成日常消费的真实体验，统一以 #StellarPayFiOdyssey# 话题聚合。这条主线不是为了铺规模，是为了把「加密支付走进日常」这件事——拍出来、写出来、传出去。亚非拉 35 个国家不是平推。Will Wu 之前在 BCG 给非洲做过团体贷款业务，「当地很多人没有借贷能力，这件事让我对 FinTech 产生信心，金融服务可以做到让每个人都能轻松使用」。那个项目最后让他下定决心从 Web2 转到 Web3，他觉得 Crypto 比传统 FinTech 更接近「让金融普惠每个人」这件事。这个经历直接塑造了 Will 在 Bitget Wallet 推动的 APAC + EMEA 区域策略：钱包增长不是广撒网，是深入到具体社区、具体场景里找到真实需求。 —— 那个不再需要被记下来的下午电没有从话题里消失，但一个人按下电灯开关时，不会再担心「会不会触电」。互联网也没有从话题里消失，但一个年轻人打开手机时，不会再担心「网络稳不稳」。它们仍然被使用、被讨论，但围绕它们的那些念头，已经消散了。加密支付正在走的，是同一条路。回到那位 Bitget Wallet 同事，一年前他用 Bitget Wallet Card 还会下意识检查支付成功，现在不会了。一年前他在泰国会下意识去银行换泰铢，现在不会了。一年前他不知道 Bitget Wallet Card 能绑 Apple Pay，现在它已经溶解进他每天扫地铁的动作里。这些都是看得见的「念头消失」。而 PayFi Odyssey 在做的，是让这种「念头消失」在更多人身上、更多地方发生：曼谷的咖啡馆、马尼拉的家庭、拉各斯的市场、布宜诺斯艾利斯的网约车。每一次重复，都会让「加密支付」少一分话题感、多一分日常感。 Bitget Wallet 撒下的这 30 万美金，先是在三大洲点燃一轮真实使用与真实记录，这是加密支付走出「新鲜阶段」必须经历的事。而它最终换的，是一件更朴素也更难的事：某一天用户刷了一次卡、付了一杯咖啡，过程里只剩下「用 Bitget Wallet 吧」这一个念头，不再多想「这东西靠不靠谱」。那一刻，加密支付就真正「被忘记」了。就像那位 Bitget Wallet 同事，写完这一天的工作之后会下楼吃饭。等下他会刷 Apple Pay，不会想起 Bitget Wallet。这家公司这两年所有努力，最朴素的成果，就是这一刻。

显示更多

0

49

69

9

转发到社区

B.AI@BAI_AGI

2026.05.29 09:27

📢 Claude Opus 4.8 is Now Live on the Opus 4.8 brings major improvements in coding and reasoning while maintaining the same pricing as Opus 4.7. Key upgrades include a ~4× reduction in code defect detection failures, more objective progress reporting, and stronger long running task execution capabilities. Whether for API integrations or everyday use through Web Chat, access is now fully available. 🔗 Docs: 🌐 Try now: 📢 Claude Opus 4.8 已在正式上线全新 Opus 4.8 聚焦编码与推理能力优化，在保持与 4.7 相同价格的同时，实现了多项关键能力升级。其核心改进包括：代码缺陷检出失败率较 4.7 降低约 4 倍，具备更客观的任务进展反馈机制，并进一步增强了长时间独立执行复杂任务的能力。无论是 API 开发集成，还是 Web Chat 日常使用，现均已开放使用。 🔗 了解更多： 🌐 立即体验：

显示更多

0

7

0

转发到社区

唐华斑竹🦅@uniswap12

2026.05.29 02:53

怎么低成本搭建自己的AI助手？ deepseek R1模型发布以来，各种AI应有又有了一波大的爆发，但是数据保密成了一个不容忽视的问题。如果想较低成本地搭建一个私人应用的AI助手，可以自己调试生成限制，调试输出文本内容，数据不外传，成本尽可能低，不知道是不是可行。本文详细介绍如何通过Dify和Chrome MCP的结合，在3分钟内搭建一个能操作网页的AI助手。文章提供了从环境准备、Dify部署、Chrome MCP安装到配置的完整步骤，展示了AI助手在自动网页搜索、表单填写、数据抓取等场景的应用，并解释了工作原理、问题排查及进阶技巧，让读者能够零代码实现网页自动化任务。你是否想过让AI不仅能回答问题，还能直接操作浏览器帮你做事？比如自动填写网页表单、抓取特定数据、或者点击按钮？现在，通过Dify和Chrome MCP的结合，你可以在3分钟内搭建一个能真正"动手"操作网页的AI助手。本文将手把手教你如何在本地部署Dify并配置Chrome MCP服务器，打造你的私人网页自动化助手。准备工作：确保你的环境就绪在开始前，请确保你的系统已安装： •Docker 和 Docker Compose（用于快速部署Dify） •**Node.js 18+**（用于运行Chrome MCP服务器） •Git（用于克隆项目仓库）第一步：快速部署Dify（仅需1分钟） Dify是一个强大的LLM应用开发平台，我们通过Docker快速部署： # 创建项目目录 mkdir dify-chrome-mcp && cd dify-chrome-mcp # 下载Docker部署配置 curl -o docker-compose.yml # 启动Dify服务 docker-compose up -d 等待1分钟左右，访问 http://localhost:80 就能看到Dify管理界面。首次使用需要创建账号并完成初始化设置。第二步：安装Chrome MCP服务器（1分钟）打开新的终端窗口，安装并启动Chrome MCP服务器： # 安装Chrome MCP服务器 npm install -g @modelcontextprotocol/server-chrome # 启动Chrome MCP服务（会自动打开Chrome浏览器） server-chrome 服务启动后，你会看到类似下面的输出，表示MCP服务器正在9999端口监听： Server running on http://localhost:9999 Chrome browser launched and connected successfully 第三步：在Dify中配置Chrome MCP（1分钟）现在回到Dify管理界面，进行关键配置： 1.进入设置 > 模型供应商 > MCP服务器 2. 点击添加MCP服务器 3. 填写配置信息： •服务器名称: Chrome-Automation •服务器URL: http://localhost:9999 4. 点击验证并保存，看到绿色成功提示效果验证：让AI帮你操作网页配置完成后，你就可以在Dify的Playground中测试你的网页自动化AI助手了。试试这些实用场景：场景1：自动网页搜索请打开百度首页，在搜索框中输入"最新AI技术发展"，点击搜索按钮，然后告诉我第一页的搜索结果标题。场景2：自动填写表单请打开"张三"，邮箱栏填写"zhangsan@email.com"，在留言区填写"咨询产品信息"，然后点击提交按钮。场景3：数据抓取与分析请打开工作原理：为什么这很厉害？这个组合的厉害之处在于分工明确： •Dify：负责与LLM对话，理解你的自然语言指令，并将其分解成具体的浏览器操作步骤 •Chrome MCP服务器：负责实际控制Chrome浏览器，执行具体的网页操作命令 •LLM（大语言模型）：作为大脑，理解你的意图并规划操作流程常见问题排查 server-chrome 2.连接失败：检查Dify和Chrome MCP服务器是否在同一个网络环境下，防火墙是否允许9999端口通信 3.操作超时：复杂网页加载需要时间，可以增加超时设置：server-chrome --timeout=60000 4.权限问题：在MacOS/Linux上可能需要权限：sudo npm install -g @modelcontextprotocol/server-chrome 进阶使用技巧掌握了基础用法后，你还可以尝试这些高级功能： •多页面管理：同时控制多个浏览器标签页，完成更复杂的任务 •用户身份保存：让AI记住登录状态，下次直接操作无需重新登录 •定时任务：结合Dify的工作流功能，设置定时自动化任务 •异常处理：教会AI识别操作失败的情况并自动尝试替代方案如何学习大模型 AI ？由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。但是具体到个人，只能说是：最先掌握AI的人，将会比较晚掌握AI的人有竞争优势。这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。 #AI# #AIAgent# @grok @xai

显示更多

0

转发到社区

jolestar@jolestar

2026.05.27 00:47

Agent 需要什么样的基础工具集合看到大家在聊 Agent 工具集的问题——是不是提供一个 shell 就都搞定了？做了 holon 之后发现，其实没有那么简单。读：为什么放弃了 Read/Glob，全走 shell holon 的工具集改了几个版本，最后废弃了类似 Claude Code 提供的 Read（读文件）、Glob（模式搜索）这类专用工具，读取和查找全部通过 shell 来完成。这和 Codex 的路线一致——Codex 的 ExecCommand 一把梭，读文件就是 cat，搜代码就是 rg，不再单独给每种"读"操作定义一个工具。这样做的理由很朴素：shell 是 LLM 最熟悉的"编程语言"。与其让模型去学你定义的 Read 工具的参数语义，不如直接让它写已经训练了几十亿次的 shell 命令。每多一个专用工具，模型的认知负担就加一层；而 shell 这个界面，模型已经足够熟练了。但全走 shell 有一个代价：输出截断。框架为了避免 shell 返回值太长撑爆上下文，会给每个命令设输出上限。Agent 用 cat 读一个大文件，可能只拿到前半截，剩下的在 artifact 文件里，还得再 cat 一次甚至多次才能读完。Claude Code 的 Read 工具压缩阈值比通用 shell 高很多，读大文件一步到位，少了好几个来回。本质上是取舍：少定义工具降低认知负担，但专用工具在边界场景效率更高。写：从 sed 到 ApplyPatch，以及 free grammar tool 的难题但写操作就无法完全用 shell 搞定。如果让 Agent 全用 sed 做编辑，就会发现遇到复杂的多行匹配很难处理——换行、转义、缩进，任何一层出了问题都会导致编辑失败。所以很多系统会提供 Replace String 这样的编辑工具，让 Agent 传一大段 old_string 来精确匹配并替换成 new_string。虽然笨拙，但比 sed 稳得多。 Codex 则走得更远，发明了自己的 ApplyPatch 工具，让 Agent 直接生成 patch，一次搞定批量编辑。holon 就借鉴了这个思路。但落地的时候踩到一个坑：Codex 用的是一套 OpenAI 自己定义的简化 patch 格式，并且搭配了一种叫做 free grammar tool 的特殊工具机制来解决格式传递问题。为什么要专门搞一种新机制？因为 LLM 的标准工具定义都是 tool(args) 这种 JSON 参数格式。如果把 patch 作为 JSON 字符串参数传递，会牵扯到大量的转义——换行要变 \n，引号要加反斜杠，缩进也得小心处理。Agent 写 patch 时本身就容易出错，再叠一层 JSON 转义，出错概率翻倍。free grammar tool 的思路是把 patch 的原始文本直接作为 tool 的输入体，不经过 JSON 参数编码，模型写什么就是什么。这大幅降低了模型生成 patch 时的出错率。而这套机制目前只有 OpenAI 的 Codex 接口支持。holon 是要兼容多模型提供方的，没法只靠这一条路。于是 holon 的做法是：根据模型注入不同的 ApplyPatch 定义。对支持 free grammar 的模型，直接走原始 patch 格式；对其他模型，就接收标准的 git diff 格式。我觉得 LLM 经过 GitHub 上几十亿次 diff 的训练，对 git diff 格式应该相当熟练。实践下来效果还可以——虽然也常出错，但多数时候能改对，而且随着训练数据积累，这个能力只会越来越好。不过我还是建议各家模型厂商都支持一下 free grammar tool，这对 Agent 写代码的场景确实是刚需。调度：长时间命令和 task 抽象第三个问题是 Agent 执行的 shell 命令不一定会很快结束——启动 dev server、跑测试、构建项目，都可能跑很久，甚至根本不退出。早期的 Agent 框架处理得很粗暴：要么同步阻塞把自己卡死，要么所有命令一律丢后台，结果 Agent 把同一个命令反复执行很多遍。现在业界逐渐收敛到一个基本共识：不给 Agent 暴露"前台/后台"的选择——这件事 Agent 自己判断不准。更好的方式是设置一个时间阈值，命令超时自动转后台，对 Agent 完全透明。Agent 不需要预判这个命令该不该放后台，runtime 自己处理就行。但自动转后台只是第一步。转后台之后，真正的工程问题才浮出来——而这些问题，目前业界还没有标准答案。首先是输出怎么读。后台任务可能还在跑也可能已经结束，输出可能很大。但各家 API 的语义并不统一——有的走轮询，有的走事件推送。其次是任务怎么停。各家都有取消机制，但取消是即时 kill 还是优雅退出、已产生的部分输出要不要保留? 最后是谁来叫醒 Agent。Agent 把任务丢后台以后休眠了，任务结束那一刻谁来叫醒它？这要求 runtime 和 Agent 调度深度绑定，不是独立工具层能解决的。这三件事——读输出、停任务、叫醒 Agent——合在一起，就是后台任务完整的生命周期管理。各家都实现了"能后台跑"，但管理面还没有标准化方案，这可能是下一阶段 Agent 工具链演进的关键节点。还没到无脑用一个现成模式的时候所以回到开头的问题：shell 能解决 80%，但剩下 20%——编辑的精确性、patch 格式与模型能力的匹配、长任务的调度抽象——恰恰决定了 Agent 能不能从 demo 走向真正可用的系统。工具集的选择远不止"封装一个 shell"那么简单，也远没到大家可以无脑套用一个现成模式的时候。这也是为什么 Codex 和 Claude Code 在这些基础问题上给出了不同的答案，而 holon 又根据自己的场景做了不同的取舍，这中间可以探索和改进的点，还很多。

显示更多

0

2

11

0

转发到社区

与「任務失敗しちゃいました 」相关的搜索结果

与「任務失敗しちゃいました　」相关的搜索结果