AI 编程赛道内卷加剧!Anthropic 再出企业安全重磅功能
2026年5月伦敦「Code w/ Claude」活动上,Anthropic 一口气放出两大核心安全更新,精准直击企业 AI 编码最大痛点:代码数据外泄、开发漏洞频发,正式正面对标 GitHub Copilot 企业版!
更新一:Claude 自托管沙箱(Claude Sandbox)
彻底打破公有云数据顾虑!采用「云端编排+本地执行」架构:
仅智能体逻辑留在 Anthropic 云端,所有代码、工具执行操作全部迁移至企业自有基础设施,完美实现「代码与仓库数据不出企业安全边界」。
兼容主流部署:Cloudflare / Daytona / Modal / Vercel
企业完全自主掌控运行环境、权限与审计日志
更新二:Security Guidance 安全插件
适配 Claude Code 的轻量化实时风控工具,嵌入开发全流程:
代码编辑、AI 生成变更、代码提交阶段自动扫描漏洞,智能识别风险代码、复盘代码差异,提前拦截安全隐患,无需人工逐一复核。
落地硬核效果
内部实测数据:研发团队的 PR 安全类评论直接减少 30%-40%,大幅降低安全 review 压力,提效又控险。
完整企业安全矩阵成型
本次更新叠加此前公布的 28 项企业合规安全集成能力,补齐了 AI 编程的最后一块安全短板。
不难看出,Anthropic 此番密集布局,核心目标就是强攻企业级 AI 编程市场,用私有化安全+实时漏洞防护,打响与 GitHub Copilot 的差异化竞争!
显示更多
OpenAI 的 Agents SDK 最近做了一次重要升级,增加了两个关键功能:内置沙箱执行环境和模型原生执行框架(Harness)。这次更新的目标,是帮助开发者更容易地创建安全可靠、能长时间稳定运行的 Agent。
以前开发者使用 OpenAI 的模型来搭建 Agent 时,模型本身的能力虽然够强,但实际运行环境却需要自己搭建。比如文件读写、代码执行、依赖安装、状态保存等基础功能都需要开发者手动处理,费时费力。
现在,SDK 自带沙箱执行环境,Agent 可以在这个统一受控的环境里读写文件、运行代码命令、自动安装依赖,还能保存状态。开发者再也不用从头开始搭建底层环境。
这个沙箱环境支持很多常见的云厂商,包括 Cloudflare、Vercel、Modal、E2B、Daytona 等,也允许开发者接入自己的解决方案。
此外,SDK 还提供了一个名叫 Manifest 的统一配置层,可以挂载本地文件或云存储空间,比如 S3、Google Cloud Storage 和 Azure Blob。从本地开发调试到正式生产上线,开发者只需一套配置就能搞定。
另一个亮点是 SDK 采用了模型原生的 Harness 架构,这种设计将 Agent 的状态保存和计算执行分离开来。这样一来,即便运行 Agent 的容器意外崩溃,也能快速恢复状态,继续执行任务,无需从头开始。此外,这种状态外置的做法也能有效保护敏感数据和凭证,避免因提示注入等安全漏洞导致数据泄露。
除了以上这些功能,SDK 还内置了 MCP 工具调用、Skills 渐进式能力暴露、AGENTS.md 自定义指令、Shell 工具命令执行、Apply Patch 文件编辑工具和灵活的记忆系统。这些以前需要开发者自己用 LangChain 等通用框架组合或手写的功能,现在全部内置在 SDK 中,由 OpenAI 针对自家模型专门优化。Oscar Health 的工程师反馈称,使用新的 SDK 才真正实现了临床记录处理工作流在生产环境中的稳定运行,远超此前尝试过的方案。
放眼行业,类似的生态竞争越来越激烈:Anthropic 推出了 Claude Code,Google 提供了 Agent Development Kit(ADK),现在 OpenAI 也将自家的 SDK 从轻量级框架升级为带沙箱、带状态管理的完整开发平台。对于开发者来说,选择哪个平台生态可能会比单纯选模型本身更关键。
当前 SDK 支持 Python,TypeScript 支持也正在开发中。所有 OpenAI API 用户均可直接使用,计费方式维持不变,仍然按照 Token 和工具调用标准收费。
显示更多
- 推出 Sandbank Cloud 适配器,支持基于 Base 链的 x402 USDC 自动支付功能,可使用钱包或 API 令牌进行身份验证
- 修复云支付流程中的重复支付问题,改进空响应处理和状态映射的准确性
- 增强 Daytona 适配器,现支持快照创建、沙箱类别和公开访问配置
- 改进命令执行支持,通过 Base64 编码和 Bash…
显示更多
Sandbank 现已推出 Cloud 适配器,集成 x402 USDC 支付功能,支持钱包和 API 令牌双重认证。同步改进 Daytona 命令执行能力,全面支持 Shell 语法,快照创建更灵活。多个适配器配置优化,提升平台稳定性和易用性。
显示更多
睡了 12 小时刚起,昨天睡前开 livelab 测试了几个 cloud sandbox provider 的长时间直播稳定性,daytona 目前是最好的,虽然只有 us/eu 机器,但送的额度够我直播一年
显示更多
sandbank v0.3.2 发布 — 让 AI agent 在沙箱里真正跑起来
这个版本解决了「在沙箱中运行 Claude Code」的完整链路:
🔐 Claude Code 登录自动化
startClaudeLogin(sandbox) 一行搞定 OAuth 登录,screen PTY 自动化处理 TUI 交互、80 列 URL 断行重组、auth code 注入。不再手动折腾。
👁️ Hooks 可观测
injectClaudeHooks(sandbox, { endpoint: { type: 'file' } }) 注入后,自动捕获 agent 的每次工具调用(PostToolUse)和停止事件。支持 HTTP 和文件两种模式。
👤 非 root 用户
Claude Code 的 --dangerously-skip-permissions 在 root 下静默失败。现在可以自由创建新用户并设定权限
🔧 BoxLite 适配
修复 Python bridge,适配最新 boxlite SDK 的 BoxOptions API。
所有功能 provider 无关,BoxLite / Daytona / Cloudflare 通用。
显示更多
昨天通宵 vibe sandbank 沙箱内外的通讯优化,把 cc/codex cli 这种需要交互的 OAuth 登录完全做到自动化了,这个时候就能体会到热替换的好处,因为在本地的集成测试完全是基于 boxlite 自动跑的,但是部署到线上的服务用的却是 daytona + boxlite(自己的 bare metal)完全不需要再测试另一个环境。不过说起来我已经很久没在本地开发过了,昨天是例外,我相信随着 agent matrix 的逐渐成熟,本地开发环境最终会被弃用
显示更多
今天正式上线了第 9 个 vibe 项目,
这个开源项目既是我在 codeben, chatben 当中的 sandbox 实践的抽象,也是接下来要发布的云端“1人公司”产品的核心组件,在 agent matrix 时代,云端沙箱成为了无比重要的基础设施,因为代码不再由预定义的程序执行,而是由语言模型现写现用,有史以来,软件不再是写死的服务,而是流动的 token。
每个云端沙箱的 API 都不一样。Daytona、Fly io、Cloudflare sandbox、裸金属机上的 boxlite vm,全都互不兼容。换个 Provider 就要重写一遍基础设施代码。但很多时候,我们希望产品平衡成本和效用,并在各种沙箱之间进行互相通信,共享记忆。
Sandbank 是设计用来解决这个问题的开源项目,它用一套接口解决连接各大沙箱基础设施,它支持:
✦ 命令执行、文件读写、端口暴露、快照恢复、实时交互式终端
✦ 内置多 Agent 会话编排 + WebSocket Relay 多沙箱通信
✦ Skill 注入系统,将 Skills 同步到任何云端沙箱
✦ 不同沙箱服务商的热替换,提升产品的横向拓展能力
如果你也在编写自己的 agent matrix 系统,可能还将目光集中在 local first 的本地部署方案,例如各种 openclaw 实例,但对于大型 to C 产品和服务,沙箱是最终的解决方案,迟早你的产品会需要使用 sandbox matrix,不妨参考下 sandbank 的实现,也许会有所帮助。
sanbank 在 MIT 协议下开源:
安装:npm i sandbank
GitHub:
官网:
显示更多
睡前做了 3 个完全不相关的事情:
1. 让 cc 写了个基于 XPBD/three.js 的 T 恤的 web 模拟器
2. 开始抽象几个服务共用的 sandbox service,发现市面上确实已经开始有类似的创业公司做 sandbox 抽象层
3. 将 chatben 的 sandbox service 迁移到 daytona,冷启动快了 3x,费用几乎和 fly io 差不多
显示更多
そして!
明日最終日なので先に言っちゃいます🧡絶対に見てもらいたいデイトナさんブースのDAYTONAロゴの下のサイネージ🌟
これは今年のカタログ撮影したときのから春夏秋冬いろんなシーンで撮影してきたものがギュッとつまっています🥰
モデルをさせていただいているので是非⁈絶対に見てください👀
显示更多