不知道你们有没有用过微信聊天总结 Skill 里面的“毒舌版”,Claude 写的话有时候还挺“毒”的。
提示词是这样的:
Roast 版基于普通版的话题骨架和素材,用毒舌、尖锐、挑衅的风格重写。整体结构与普通版相同(统计区块、开头概览、群友画像、正文分类、结尾),但风格完全不同。痛点部分省略。标题加 "毒舌版" 后缀。
风格要求:
- 你是一位以尖锐和挑衅风格著称的专业评论员
- 对每个群友的行为、言论进行犀利点评,不怕让人尴尬
- 发言排行旁给每个人加一句毒舌备注(括号内)
- 群友画像改为「不留情面版」,放大每个人的槽点和矛盾之处
- 开头概览用更戏谑的口吻,突出荒诞和讽刺
- 正文话题标题可以改得更损
- 引用原话时配上辛辣点评
- 结尾改为:本简报由一个没有感情的 AI 自动生成,如有冒犯,概不负责
注意:毒舌但不恶毒,调侃但不人身攻击。目标是让群友看了会笑,而不是生气。具体红线:
- 只嘲讽群里的公开行为,不碰外貌、体重、健康、家庭、私人关系
- 不用时间戳推断作息或时区(服务器时间不等于本地时间)
- 不做医学/心理诊断类玩笑(「这位需要看医生」「典型 ADHD」)
- 不揣测对方未主动公开的身份属性(性取向、宗教、政治立场)
- 嘲讽观点本身,不嘲讽发言的权利(「这个观点错得离谱」可以,「连这都不懂还敢发言」不行)
- 如果某人本期没有槽点(3+ 条但都很中性),给一句温和调侃即可,不要硬凑
写作顺序:先放开写最狠的版本,写完再回头检查红线。不要边写边自我审查,那样只会写出温吞水。
显示更多
baoyu-skills 新加了一个 Skill:
微信群聊总结 Skill:
依赖于 wx-cli:
如何配置使用 wx-cli 请看项目文档,无法提供帮助。另外目前只是借助其读取数据,其他没任何关系。
Claude Code + Claude Opus 4.6 效果最佳
显示更多
不知道你们有没有用过微信聊天总结 Skill 里面的“毒舌版”,Claude 写的话有时候还挺“毒”的。
提示词是这样的:
Roast 版基于普通版的话题骨架和素材,用毒舌、尖锐、挑衅的风格重写。整体结构与普通版相同(统计区块、开头概览、群友画像、正文分类、结尾),但风格完全不同:
风格要求:
- 你是一位以尖锐和挑衅风格著称的专业评论员
- 对每个群友的行为、言论进行犀利点评,不怕让人尴尬
- 发言排行旁给每个人加一句毒舌备注(括号内)
- 群友画像改为「不留情面版」,放大每个人的槽点和矛盾之处
- 开头概览用更戏谑的口吻,突出荒诞和讽刺
- 正文话题标题可以改得更损,如「蛙总做空翻车:一个人对抗整个美股」
- 引用原话时配上辛辣点评
- 结尾改为:本简报由一个没有感情的 AI 自动生成,如有冒犯,概不负责
- 痛点部分可省略(roast 版不需要正经内容)
注意:毒舌但不恶毒,调侃但不人身攻击。目标是让群友看了会笑,而不是生气。
写作顺序:先放开写最狠的版本,写完再回头检查红线。不要边写边自我审查,那样只会写出温吞水。
显示更多
baoyu-skills 新加了一个 Skill:
微信群聊总结 Skill:
依赖于 wx-cli:
如何配置使用 wx-cli 请看项目文档,无法提供帮助。另外目前只是借助其读取数据,其他没任何关系。
Claude Code + Claude Opus 4.6 效果最佳
显示更多
Bitcoin 玩家 cprkrn 在发帖说自己靠 Claude 找回了 11 年前丢掉的 5 个 BTC,按现价大约 40 万美元。
事情要追溯到十一年前。他当时嗑嗨了,改了钱包密码,转头就忘。这 5 个 BTC 不是 HD 钱包靠助记词派生出来的那种地址,而是早期钱包里混入的导入私钥,必须靠加密钱包文件加密码才能开。密码丢了,钥匙就锁死了。
他这些年一直没放弃。手里攒了几个候选密码、几个旧钱包文件,跑了 btcrecover(一个开源的比特币钱包恢复工具),始终破不开。
几周前,他在大学时代的旧笔记本里翻出一串助记词,输进去派生出的地址刚好对上电脑里某个加密钱包文件——目标锁定了,但文件还是打不开。
走投无路,他把整个大学时代的电脑数据一股脑丢给 Claude。Claude 翻出两样东西:一个 2019 年 12 月的更早的钱包备份(这版本可能在密码被改之前),以及 btcrecover 在拼接 shared key 和候选密码时的一个 bug。Bug 修掉,重新跑一遍,私钥解开,5 个 BTC 顺利转出。
Tom's Hardware 的标题是“尝试了 3.5 万亿次密码”,画面感很强,但 Claude 实际干的事要朴素得多:在一堆十年前的乱七八糟文件里翻出那个被忽略的旧备份,再看懂开源工具里的一处逻辑错误。翻遗物加调 bug,这正是 LLM 现在做得相对靠谱的活。
对照一下,2024 年研究人员靠传统手段暴力破解一个 20 字符密码、撬开价值 160 万美元的比特币钱包,花了大半年。至于那位把装着 8000 BTC 的硬盘扔进威尔士垃圾场、2025 年被法院判决不许再去翻的英国兄弟,就没这份运气了。
显示更多
HOLY FUCKING SHIT OMG CLAUDE JUST CRACKED THIS SHIT, THANK YOU
@AnthropicAI THANK YOU
@DarioAmodei NAMING MY KID AFTER YOU 😍
看卡兹克提到飞书 CLI 的 star 数过万了,意料之中,飞书确实是目前国内 Agent 最友好平台,我自己也常用飞书 cli 抓去飞书文档为 markdown 和下载文档图片
通常我看一个开源项目是否靠谱,或者是不是 KPI 驱动的开源项目,通常看几个方面:
1. Star 数量,这个虽然也有做假可能,但大多数时候还是能客观反应项目热度
2. Commit 历史,是否活跃提交,很多项目你一看提交时间在几个月前,甚至几年前,那这个项目多半没人维护了,要慎用
3. Issues 数量和关闭速度,一个热门项目是不愁 Issues 的,有人用才有 Issues,但如果只有新 Issue,没有 Issues 被关闭也不好,说明没人认真处理
4. PR(Pull Request)被合并的记录,开源项目不只是说简单的把源代码放出来,社区参与也很重要,如果你发现很多社区的 PR 都没有处理响应,那说明官方不重视社区的参与
拿这几个标准去看大多数项目,你就可以知道这项目是不是靠谱,这几点飞书 cli 都是做的不错的了。
显示更多
我靠!刚看到GitHub上,飞书CLI的star数过万了hhh
牛啊。。。
感觉那个周末一起床,发现飞书开源CLI才过去没几天==。
OpenAI 把 Codex 搬进了 ChatGPT 手机 App,今天在 iOS 和安卓上同步开启 preview,所有 ChatGPT 用户都能用,包括免费版和最低价的 Go 套餐。
手机端不是让你在手机上写代码。真正干活的 Codex 还是跑在你的笔记本、Mac mini 或者 devbox 上,手机只是一个远程窗口:地铁上能看 Codex 跑到哪一步、审一眼它改的 diff 和跑的测试结果、批准下一步操作,或者临时换个方向走。文件、凭证、权限都留在原来那台机器上,不上传到手机。
OpenAI 的解释是底层走了一层 secure relay 中继,让跑着 Codex 的机器能跨设备保持可达,又不直接暴露在公网上。你在哪台设备登录 ChatGPT,会话状态和上下文就跟到哪里。
为什么现在做。OpenAI 自己公布的数字是 Codex 每周活跃用户已经过 400 万。当 agent 越来越多地跑长任务,几十分钟甚至几小时的那种,人坐在电脑前盯着就很傻,你需要随手能看一眼、能拍板的能力。
一个明显限制:手机端目前只能连 macOS 上的 Codex,Windows 支持据说”很快”。
另一层意思是,OpenAI 没给 Codex 单独做手机 App,而是塞进 ChatGPT 主 App。这跟他们之前透露过的”超级 App”路线一致,把 ChatGPT、Codex、Atlas 浏览器整合成一个入口。桌面端是独立的 Codex App,手机端直接合并进 ChatGPT。
参照系是 Anthropic。Claude Code 从去年秋天起就支持手机远程查看和介入正在跑的任务,后面的 Cowork 配套移动端走的也是类似 dispatch 思路。Codex 这次把覆盖范围扩到了 devbox 和远程企业环境(支持 remote SSH 接入),算是追平加扩张。
显示更多
You've been asking for this one...
Now in preview: Codex in the ChatGPT mobile app.
Start new work, review outputs, steer execution, and approve next steps, all from the ChatGPT mobile app. Codex will keep running on your laptop, Mac mini, or devbox.
显示更多
人的欲望是无限的。写了 20 年代码的人,脑子里面有无数因为体力约束不能实现的点子,ai 不但没有剥夺他们的乐趣,反而成为他们的鸦片。
比如我。😎
显示更多
这世界上有很多人是很喜欢写程序本身的,就像搭积木一样,简单,确定,又有无限可能。20年前投身cs的都是这样的人,但是现在AI完全剥夺了这种快乐,so sad
显示更多
顺着最近发布的 Mole Mac 这个事情,想给大伙分享一下我这两天经历的神奇时刻。感谢这个去年在三亚泳池边的小玩具项目,让我认识了很多海外有趣的开发者,各个国家的。
Mac 客户端陆续做了两个周末休息日。之前有不少国外用户提过,家里的父母、兄妹不会使用 CLI 但很想要这个功能,问能否出一个简单好用的桌面端,由于时间加上认为当时 Mole CLI 还没有达到我认为成熟的地步,一直拖到了现在。
Mole 发布也才半年,居然超过 50K star,500 个用户提交的 issue 清理建议、300 个高质量的功能 PR、100 位全球开发者的贡献,带来了可能比现在 CleanMyMac 这类工具更强大的清理能力。甚至因为在 README 挂了 2 张我用 Vercel 加速的图片,一周跑了 60T 流量,直接欠了 Vercel 80 刀,我才意识到用的人真的很多,那桌面端就可以做了。
Mole 桌面端的很多巧思都是开始做的时候才想到的。比如用行星来代表每一个功能,和我小时候喜欢看各种行星运行有关系,加上 10 年前学会前端后第一个特别想学的就是 WebGL,开始用 WebGL 来画行星,行星的特征和 Mole 做的事情可以很好呼应,所以把这个主题加了进来:
清理用地球,「雨洗旧土,尘随潮去」
卸载用火星,「红尘覆旧,轻装再行」
优化用水星,「近轨疾行,小修有声」
分析用木星,「远目成图,微处可见」
状态用太阳,「光不合眼,心跳长明」
好比小鼹鼠的挖掘探索从小地方到了大世界的感觉,但是依然很清静,不会打扰你。
还有一个设计小巧思,各个行星的贴面图我换了不下 10 次,从 NASA 官网下载挑选了很多,找到最合适的。其实每一个行星转的方向方位、转速、完成后的飞行效果特征均有参考实际的行星运行情况,这个过程也算是 AI Coding 中很有乐趣的部分。虽然感觉这些东西和 Mole 鼹鼠好像没有那么大的联系,完全可以做一个很简单的菜单栏点啥清理啥就行,但还是想着不能这样,用 AI 产生的赛博垃圾已经太多了,我需要做一个舒服一点的东西出来,让我的 token 不浪费,也为了不污染你的时间线。
当天晚上大概 10 点发布,很感谢很多朋友自发转发,也特别感谢很多用户来购买,甚至有不少小伙伴仅仅是因为 CLI 带来的好处特地来购买的。从晚上发布开始,这段时间我的手机几乎每 10 秒就有一次购买通知,iPhone Air 直接发烫掉电,欧美用户特别多,法国、德国各种币种,真的很神奇。购买量太高了,为了睡觉最后不得已把邮箱通知关了,早上起来还有非常多的持续购买。其实 Mac 桌面端还有很多需要补充的功能,也很感谢大家的包容,为了一个漂亮小玩具预付了 9 刀,我继续加油把功能做好才行。
我做事情很喜欢水到渠成,不喜欢短时间急切追求结果。这种长期持续迭代,持续认识很多新朋友,给到我很多的输入交流讨论,才是最宝贵的财富,特别有意思。
显示更多
Cursor 的设计模式还挺好用的。
但是有个细节问题,当我 "Plan New Idea",如果提示词使用的中文,那么生成的设计文档最好也是中文。现在每次我中文提示词,设计文档都是英文。
简单来说,设计文档语言默认应该和提示词语言一致。
cc
@ryolu_
显示更多
Anthropic 刚推出 Claude for Small Business,把 AI 直接集成到 QuickBooks、PayPal、HubSpot、Canva、DocuSign 这些小企业每天用的工具里。你只要打开 Claude 桌面端的开关,就能一键启动 15 个预设技能:工资核算、现金流预测、催款、做营销素材、签合同,甚至新员工入职全自动搞定。
收费方式很克制:不额外加钱,只要 Claude 订阅费加上 SaaS 工具的钱。安全方面也放心,工作流必须人为启动审批,Claude 拿不到你本来没有的权限,Team 和 Enterprise 用户数据默认不拿来训练模型。
最近 Anthropic 发布节奏很快:上周金融版发布,这周法律版更新,现在轮到小企业版了。理由也很直接:美国小企业撑起44%的 GDP,却一直没人专门给他们做 AI 产品。
5 月 14 日开始,Anthropic 会在芝加哥、达拉斯等十个城市办免费半天培训,每场限 100 个本地小企业主。线上还有和 PayPal 合作的免费课程,让老板们快速搞懂怎么用 AI。
不过,这招对传统 SaaS 厂商不算友好。Claude 把 QuickBooks、HubSpot 这些工具变成后台,用户界面都不用打开。过去几个月,Salesforce、DocuSign 等公司的股价已经一路下跌。Anthropic CEO Dario Amodei 甚至说过:“单个 SaaS 厂商很可能迅速失去市值,甚至倒闭”。
但讽刺的是,这次 Claude 接入的工具列表里,恰好有几家他刚刚点名的公司。一边说人家要倒闭,一边还要用人家的工具……
产品页面:
显示更多
问:上下文(Context)和上下文窗口(Context Window)什么差别?
这两个概念经常被混用,但其实指的是不同层面的东西:
上下文是指 AI Agent 在执行任务时实际拥有的所有信息,包括系统提示词、用户的对话历史、检索到的文档、工具调用的结果、记忆模块注入的内容等等。你可以把它理解为“Agent 此刻脑子里装的所有东西”。上下文是一个动态的、可以被工程化管理的概念——哪些信息该放进来、什么时候放、怎么组织,这就是现在越来越多人说的 Context Engineering。
上下文窗口则是模型层面的一个硬性限制,指的是模型单次推理能处理的最大 token 数量。比如 128K、200K、1M 这些数字,说的就是上下文窗口的大小。它本质上是一个“容器的容量”。
打个比方:上下文窗口是你厨房操作台的面积,上下文是你实际摆在台面上的食材、调料、菜谱和工具。台面就那么大(上下文窗口有上限),但你放什么上去、怎么摆放(上下文的管理)决定了你能不能高效做菜。
在 Agent 开发中,一个核心挑战就是:Agent 需要的上下文往往远超上下文窗口的容量。对话越来越长、工具调用结果越来越多、检索的文档越来越大——这些都在消耗上下文窗口的空间。所以才需要各种策略来管理:摘要压缩历史对话、选择性检索而不是全量灌入、及时清理不再需要的中间结果等等。
简单总结就是:上下文(Context)是“内容”,上下文窗口(Context Window)是“装内容的容器”。做 Agent 工程的核心功夫之一,就是在有限的“上下文窗口”里塞进最有价值的“上下文”。
显示更多
baoyu-skills 新加了一个 Skill:
微信群聊总结 Skill:
依赖于 wx-cli:
如何配置使用 wx-cli 请看项目文档,无法提供帮助。另外目前只是借助其读取数据,其他没任何关系。
Claude Code + Claude Opus 4.6 效果最佳
显示更多
还记得上次 Claude 停掉了 Claude Code 订阅在 OpenClaw 的调用吗?甚至连 claude -p 这种调用都限制了,不能再共享 Claude 订阅。
但当还留了个口子,就是基于 Claude Agent SDK 和 claude -p 还是能跑能共享订阅额度的。
现在他们有一个新的方案,把这个口子也堵上了。美名其曰给你额外额度用于程序化调用,也就是 Agent SDK、claude -p 命令行、Claude Code GitHub Actions、以及 Conductor 和 OpenClaw 这类基于 Agent SDK 的第三方工具。
但实际上额度小的可怜,Pro 20 美元,Max 5x 100 美元,Max 20x 200 美元,Team 标准席位 20 美元一人,Team 高级席位 100 美元一人。
按 Anthropic 自己的 API 价格算,Pro 的 20 美元用 Sonnet 只够大约六七百万 token 输入或一百多万 token 输出,几轮密集的 agent 循环就见底。Max 20x 用户每月付 200 美元订阅费,拿到的 SDK credit 正好也是 200 美元。
关键在于变化方向。之前 SDK 和交互式聊天共用订阅套餐的 rate limit(速率限制),Claude Code 重度用户能在订阅价格下跑出远超 200 美元等价的 API 用量,这是订阅模式的吸引力所在。现在 SDK 端被按美元封顶,相当于把这块超额价值收回去了。Anthropic 在帮助文档里也挑明:团队跑生产级共享自动化的,应该转去 Claude Developer Platform 用 API key 按量付费,订阅套餐"不是为这个场景设计的"。
受冲击最大的是第三方工具用户。之前用 OpenClaw、Conductor 这类基于 Agent SDK 的 agent 工具的人,本质上是"用订阅价跑高频自动化"。新政之下,这条路只剩 credit 那一点点额度可走,烧完要么转 extra usage(额外用量,按 API 价付钱)继续跑,要么停到下个月 credit 重置。
不受影响的部分:API key 用户照旧按量付费;交互式 Claude Code(终端和 IDE 里手敲那种)、Claude Cowork,以及网页/桌面/手机端的 Claude 聊天,都继续走原本的订阅限额。
6 月 8 日 Anthropic 会给符合条件的用户发邮件领取,6 月 15 日生效。
显示更多
Starting June 15, paid Claude plans can claim a dedicated monthly credit for programmatic usage.
The credit covers usage of:
- Claude Agent SDK
- claude -p
- Claude Code GitHub Actions
- Third-party apps built on the Agent SDK
显示更多
Anthropic 把 Claude Code 的每周用量上限提了 50%,即刻生效,截止到 7 月 13 日下午 6 点(太平洋时间)。
覆盖 Pro、Max、Team 和按席位计费的 Enterprise 用户,命令行、IDE 插件、桌面端、网页端,所有入口都一样涨。账号已经自动调整,不用做任何操作。
这 50% 是叠加在上周刚宣布的 5 小时窗口翻倍之上的,两个维度的天花板一起被抬。
【注:Claude Code 有两套限额。5 小时滚动窗口管的是短时间内能写多少,写得猛的人一下午就能撞顶;每周总额管的是一周能写多少,防止你某天突然把整周配额刷光。两个一起放宽,等于哪头都松了绑。】
过去几个月 Claude Code 用户最常吐槽的就是 Pro 套餐限额触发太勤,跟 Cursor、Codex 这些竞品比,"用着用着就停"的体感差不少。短期内连开两次额度,留人的意图挺明显。
7 月 13 日之后是否延续,没说。
显示更多
Claude Code weekly limits are increasing 50%, now through July 13.
Live now for all Pro, Max, Team, and seat-based Enterprise users.
要做好字幕 SRT,断句最重要,其次是纠正拼写错误。这些可以借助 AI 或者 Agent 来做了。
不过前提是先生成单词级别的时间戳,这样才能在组合后拼回去,现在主流语音识别模型都支持输出 json 格式,每个单词都标注清楚start和end的timestamp。
英文断句很简单,只要找标点符号就可以切分成长度合适的。
但中文断句要难一些,中文语音用whisper生成,吐出来的是一大坨没有标点的,并且它的“word”不是一个汉字,而是几个汉字。
所以需要借助大模型去断句加标点,然后再重新对齐时间戳再拆分,就需要用一些比较复杂的代码算法辅助。当然理论上来说 Agent 也能帮你做,就是费 Token 些。
还有一个坑就是几个小时的访谈,大模型是没办法一次性处理的,需要分块,但是分块还要注意不能切分在一句话中间。
最后不一定要用 Whisper API,现在电脑跑 Whisper 模型还是足够。
如果是 Mac,推荐用 WhisperKit,支持word level timestamp,以及识别 speaker
显示更多
Whisper API 直接吐的 SRT,几乎不能用。
两个失败模式:
- 30 秒一大块字幕,没人读得完
- 安静段循环幻觉「你很难的」× 50
修法:response_format=verbose_json + timestamp_granularities[]=word,自己拼 cue。
别让不懂你需求的工具替你做边界决定。
源码:
显示更多
一个游戏项目最危险的时候,可能不是没人看好,而是突然被公司重视。
3个人做 demo,3个月搭起来,效果不错,老板问:一个月一个英雄要多少人?
团队从几十人快速冲到七八十人,资源来了,管理也来了。
但制作人管理经验却跟不上,还没空去盯产品了
你遇过这种情况吗?
#
gamedev# #
indiegame#
显示更多
半年前,我写了10个创作心法,没想到大家反响都特别好。
而这段时间,我给内部写的内容方法论也更新到了2.0。再加上最近我们有新的小伙伴入职,为了帮大家更好地做内容,所以决定给大家做个内部分享。
想了下,也把总结的部分发在这里,希望能对大家有帮助!
先说一个反共识的:博主不是消耗品。每一个都是IP。
这个时代你想成为一个IP,核心其实就两个东西,内容和影响力。
先聊内容这一块,我总结出来是这三步。
第一步,获取信息
很多人就死在这一步。
热点本质上是个杠杆,是指数级别的杠杆。如果你缺了热点杠杆,传到社会层面的体量就是小。
而掌握了这一点,其实还不够。有的人每天天天刷AI圈动态,也不见得能做好内容。
这里面有个很大的问题,很多人都没注意过,那就是,
做AI内容,你绝对不能只看AI。
xx发表一个演讲一堆人去解读,从严格意义上来说,这不叫做内容,这叫转述,叫翻译。
但做内容本质上就三个字:
讲故事。
而非常非常多讲故事的技巧、所有的节奏,没有一个是来自AI。
所以,我经常让我们内容团队的小伙伴,没事多看看综艺、电影、小说和喜剧。
我个人觉得启发特别大的是,一年一度喜剧大赛。里面sketch十分钟里面可能会连着升三番,每一番都给你很强的情绪波动,看完后还会意犹未尽的。
但你要是去看那种纯AI生成的内容,永远是平的、没节奏的。
但好的节奏是需要刻意编排的,是要跟时代变的。
第二步,找角度
一个好的角度,是有反差的,用八个字总结就是,情理之中,意料之外。
拿情人节举例。
普通媒体在这个日子,多数会去民政局蹲着拍领证的,稍微深一点的去拍"老头配20岁姑娘"这种很反差的。
但我知道的一个做内容的,他们蹲在民政局旁边的垃圾桶一天一夜,把垃圾桶里那些撕碎了的信、卡片拼在一起,组成了一个个故事。
于是,有了《在情人节当天选择离婚的人们》,直接干到几千万阅读。
这才是我心中,找角度的神。
第三步,创作
这步反而最简单。
一般来说,一篇好内容如果能爆,30%归因于第一步获取信息,69%在于角度,而创作只在于1%。
但1%就能决定内容的生死。
这里面两个点,我觉得必须得守住。
一个是节奏。信息第一时间拿到了、好的角度也拿到了,但如果讲不好一个故事,就是创作的节奏出问题了。
第二个是正向价值观。想要长久地做好内容,做好IP,就不要为了流量去碰敏感话题,要守住道德底线。
以上,暂时就这些。
这次分享+Q&A,没想到最后讲了将近三个小时。(商务和其他部门的同学笑称选修课hhhh)
在这个AI时代,希望能用我的这一点点小经验,帮助到大家,哪怕一点点!
显示更多
今天和公司合作的一家知名数据架构 / AI 自动化外包公司开会,看了他们交付的第一个产品功能,更深刻感受到:行业 know-how 和产品可视化品味,远比想象中重要。
对方工程师并非我们行业背景,而负责对接的产品经理也没有完全深入理解我们部门的实际工作流,因此很难理解数据背后的科学逻辑与下游应用。结果就是:需求在传递过程中不断失真,最终产出的是“半吊子传话给半吊子,最后做出一个功能上勉强成立,实际体验和价值都不到位的残次品。更夸张的是从立项到交付第一版整整花了半年。这就是大公司转型中的大痛点之一,内部懂业务和AI的复合型人才缺失,缺乏原生AI公司自己造工具搭工作流的DNA,而找的第三方公司不完全懂业务,造成很大的沟通成本极大拉长周期。
开发者不真正理解业务,最终做出来的东西往往只是“看起来像”,却无法真正解决痛点。很多时候,最好的产品和工作流,反而来自内部的超级个体——因为他们自己就是终端用户,真正理解业务细节、痛点和使用场景。
显示更多
1. Skills 是技能,领域知识,工作流等等,相当于怎么干好一件事的说明书。
比如 仓库里有个 skill 叫 nda-review,在 commercial-legal/skills/ 文件夹里。里面是一份 SKILL.md,写清楚:审 NDA 时先比对哪些条款、按团队 playbook 打绿黄红三档、什么情况要升级、输出格式是 Word 修订模式。
它就是一份给 Claude 看的工作手册,本身不干活。
2. Agent 是真正执行任务的主题,除了主要执行的 Agent,通常自定义的 Agent 分两种:Subagent 和 Scheduled agent
2.1 Subagent 是单独派出去干一摊子活的“分身”
举个仓库里的例子:corporate-legal:tabular-review 这个 skill 要对一个数据室里几百份合同做表格化尽调。如果让主对话一份份读,上下文很快爆掉。所以它派 subagent,一个 subagent 负责一份文档,并行跑,最后把结果汇总回主对话。
主 Agent 看到的只是最终表格,中间几百次读取的信息被隔离在外。
2.2 Scheduled agent 是定时自己跑的后台任务
renewal-watcher 这个就是。每周自动扫一遍合同库,把 90 天内到期的合同列出来,发到指定 Slack 频道。你不用记日子,它替你盯。
docket-watcher(盯法院案件动态)、reg-feed-watcher(盯监管新规)都是这种。
3. MCP connector 是把外面的数据接进来的连接器
Skill 写得再好,也得有合同可审。仓库里配了 Ironclad(合同库)、DocuSign(已签合同)、iManage(文档管理)几个 MCP connector。
Agent 通过这些 MCP connector 去读公司真实的合同库,而不是让你手动复制粘贴。
类似地,诉讼那个 plugin 接的是 Everlaw(电子取证)、CourtListener(联邦法院判决数据库)、Trellis(州法院数据库)。换个执业方向,换一套数据连接器。
4. Plugin 是把上面这些打包到一起的容器
commercial-legal 这个 plugin 文件夹里装着:
- 一堆 skill(nda-review、vendor-agreement-review、escalation-flagger……)
- 几个 scheduled agent(renewal-watcher、deal-debrief)
- 一份 .mcp.json,告诉 Claude 要连哪些外部系统
- 一份 CLAUDE.md 模板,用来记你团队的 playbook
你装上这一个 plugin,整套企业合同审查的能力就一次性配齐了。
显示更多
@dotey 大佬能否解释一下,这个 Claude 一会插件的,一会 Skills 的,一会这个 Agent 的,它他到底想干什么呀?
Anthropic 今天正式上线了一个叫做「Claude for Legal」的仓库,一口气放出了 12 个针对具体法律岗位的插件,以及超过 20 个连接行业常用软件的 MCP 连接器。
无论你是公司法务、打并购战的律所、专注隐私和 AI 治理的法律顾问,还是每天苦熬到半夜的诉讼律师,甚至是法学院里摸爬滚打的学生,这个仓库都给你准备好了对应的 AI 工具,直接在 GitHub 上开源了:
这些插件用之前不是即插即用,你得花 10 到 20 分钟,带着 Claude 做个简单的“冷启动访谈”,把你团队的 playbook、模板和风格习惯都塞进一个叫 CLAUDE.md 的本地文件。这样,以后每个插件干活儿的时候,都自动按照你自家的风格和标准来。
Anthropic 这么搞,是为了彻底解决 AI 法律工具最常见的槽点:输出内容太通用,看起来不像哪家律所自己的东西。
Anthropic 还是挺懂律所的痛点的。
比如 Vendor Agreement Reviewer 插件,它能自动对照你家合同模板改供应商协议,还贴心地输出一份 redline 备忘录;
又比如 NDA Triager,帮你自动把涌进来的 NDA 文件按绿黄红分级,绿灯放行、红灯直接推律师处理;
Claim Chart Builder 插件可以一键生成专利侵权对比表;
Privilege Log Reviewer 自动帮你跑第一轮特权日志审查;
而 Docket Watcher 插件则不知疲倦地盯着法院动静,帮你把最新动态实时扫进来。
简单讲,就是把律所里最烦、最机械、最浪费人力的活,变成了一个个简单的 slash command。
如果说插件解决的是律所内部效率问题,那么对行业系统的深度接入才真正体现 Anthropic 的野心。
现在,Thomson Reuters 的 CoCounsel、Harvey,还有 iManage、NetDocuments、Ironclad、DocuSign、Everlaw、Relativity、Box、Datasite 等几乎所有你能叫得上名字的平台,全都接入了官方 MCP 连接器。日常办公的 Word、Excel、Outlook、PPT 也全线打通。合同改完后,Claude 甚至会直接输出成 Word 修订模式,律师一条条接受或拒绝就行。
Anthropic 不只是把目光停留在高端律所。他们还特意做了些更「接地气」的事儿,联合 Free Law Project 和 Justice Technology Association,给法律援助机构、公设辩护人、非营利法律组织推出特别折扣,连给普通当事人设计的 Courtroom5 工具也接进来了。这点挺让人感触的,因为美国大约八成民事诉讼里的原被告,根本请不起律师。
Claude for Legal 背后的大脑是刚升级的 Claude Opus 4.7 模型。Anthropic 很谨慎地强调:所有插件输出都是“仅供律师审阅的草稿”,绝对不能替代律师的专业判断。
README 文件里反复提醒:引用必须追踪来源,涉及特权和主观法律判断时,要默认保守处理。毕竟法律这件事,AI 还是不能完全代替专业律师。
官方博客:
显示更多