Ren (@FakeMaidenMaker) “好问题 Hermes 省token方面有很多机制： 1. 缓存优化： hermes: 全session 缓存，缓存”

2026.04.13 20:44

好问题 Hermes 省token方面有很多机制： 1. 缓存优化： hermes: 全session 缓存，缓存命中接近100%; 并且 Hermes 把外部记忆、plugin 上下文等临时内容塞到 user message 里而不是 system prompt，确保 system prompt 的 prefix cache 永远命中。 openclaw: 动态内容（heartbeat、group chat context、runtime info）会更改 cache boundary，缓存打折扣虽然不省 token 但是 cache 命中高 = 省钱 2. Comapction 增量更新（省的不多） Hermes: 已有摘要时只 merge 新内容 openclaw: 每次 compact 重写摘要 3. 历史记录搜索方式（最省token的一集） Hermes: FTS5(关键词搜索) 命中 → 加载匹配会话 → 截取 ~100K 字符 → 廉价模型摘要 → 精炼结果注入 OpenClaw: Hybrid：向量+BM25 搜索 → 返回 top N raw chunks → 直接注入主模型 Context 读取 raw chunk, token 开销大！关于 skill 管理： 1. 能关 config 里有 creation_nudge_interval: 15 这个参数，每隔 x 轮对话自动判断是否有需要更新的 skill 设成 0 就禁用自动创建更新。 2. 如果太多了仍然还是要手动管理的检测到已有相关skill会进行更新而不是无限创建。如果长期使用skill太多，允许用户通过 `skills.disabled` 禁用一些skill或者直接删除。能用到 50+ 不同复杂流程被自动编写为skill的时候，相信你也是Master了。

显示更多