最近在开始弃用一些非常优秀的 Agent 工具,这边就不说名称了,核心原因是我发现目前这些 Agent 工具限制太多。虽然做了很多优化和调优,但它们还是限制了我使用和定义 Agent 的流程。
现在我把所有的东西都转成了基于 Markdown 的形式,然后让 Claude Code 和 CodeX 来调用基于 Skill 的方式。只要你把这个系统搭起来,是真的能够形成完整的、系统化的架构,而那些 Agent 的 SaaS 工具不行。
另一个关键点是成本:
1. LLM 成本:200美金订阅,成本基本上是无限覆盖的。但那些工具调用 Opus 4.7 + GPT5.5 模型的收费非常高。
2. 生成成本:其实生图、生视频的话,基于 API 的方式和即梦的 CLI 方式,成本还挺可控的。
整体而言,不管是成本还是流程的可控性,现在全部迁移到基于 Claude Code 和 CodeX 的本地方案,对我来说是最合适的。
这个方案也不是没有缺点。其核心逻辑和昨天大家讨论的 HTML 与 Markdown 类似。目前这个方案如果想要很好的视觉呈现,还是不及现有的那些 Agent 工具,但这就是一个取舍问题。
显示更多
注册用户已经破160万,模型消耗榜,GPT5.5 重夺冠军
chatben 重大更新,因为前几天把 sandbank cloud 扩容到了两倍,下午花了半小时把 chatben 从 fly io 和 cloudflare sandbox 完整迁移到了自家服务,并改成了用 codex GPT5.4 fast 模式运行,成本大幅降低,现在又快又稳定!
显示更多
Hermes Agent 在用了,目前感觉挺顺手:
- 一键导入同服务器的 OpenClaw 配置及记忆(不过我没这样做)
- 让其解决 Telegram 通信的 bug,解决好后,自动沉淀了个相关 Skill
- GPT5.4 模型的体感在 Hermes 里居然比在 OpenClaw 里好…
- 一些细节做的不错,比如 Token 燃烧进度,执行细则。赶紧超越 Claude Code 体验吧…
我会好好折腾下,希望发现更多惊喜。
显示更多
刚测试了GPT5.2PRO对WEB3领域100个关键点的解析,感觉特别适合小白入门!大家可以一起讨论优化下
Web3 不是互联网的版本升级,而是人类协作的相变——用密码学的确定性取代对中介的信任,用代码的刚性对抗人性的软弱。
它最深的张力:去中心化的极客理想,必须在资本逐利的开放丛林里存活。
大多数人只盯着代币涨跌,却从未理解"无需许可的共识"是何等宏大的制度实验。
这里没有法律兜底,只有代码裁决。 人性角斗场,莫过于此。
100条基石如下👇
显示更多
用 goal 看看能不能 one-shot 做完一个完整的项目。主 Agent 使用deepseek/deepseek-v4-pro 避免超限,子 Agent 用 gpt-5.5。
子 Agent 模型使用:
- 开发:使用 openai-codex/gpt-5.5(当子 Agent 调用这个模型失败后,fallback 到 opencode-go/deepseek-v4-pro)
- 探索、测试等任务:使用 opencode-go/deepseek-v4-pro
- 模型回退链路:如果 opencode-go/deepseek-v4-pro 有问题,回退到 stepfun/step-router-v1
显示更多
用 goal 看看能不能 one-shot 做完一个完整的项目。主 Agent 使用deepseek-v4-pro,子 Agent 用 gpt-5.5。
子 Agent 模型使用:
- 开发:使用 openai-codex/gpt-5.5(当子 Agent 调用这个模型失败后,fallback 到 opencode-go/deepseek-v4-pro)
- 探索、测试等任务:使用 opencode-go/deepseek-v4-pro
- 模型回退链路:如果 opencode-go/deepseek-v4-pro 有问题,回退到 stepfun/step-router-v1
显示更多
ChatGPT Free 帐号不能使用 GPT-5.5 了,现在 GPT-5.4 还能用,天才程序员陨落了一半变成普通程序员。
I never use planning mode in Codex.
GPT 5.5 loves to research, so I just have a conversation and reach a pseudo-plan in chat.
Then, I let it implement, maybe with a /fork beforehand to keep that plan as a revisit-able point.
Probably the biggest switch coming from Claude Code
显示更多
🧵GPT-5.6 泄露的真相
1/🧭 5.5 发布5天,5.6 已在跑流量
Musk 在奥克兰法庭作证的同一天,Codex rollout 日志里悄悄出现一行 model: gpt-5.6。
这不是巧合,这是 OpenAI 最擅长的舆情战法。👇
显示更多