超级个体｜柿子 (@yaohui12138)

2026.05.18 02:11

Karpathy 发布了一个github开源项目，狠狠让我惊艳到了这个项目叫 andrej-karpathy-skills,GitHub 13 万+ star,我愿称之为2026 最有用的 AI 工程项目它解决的问题极其精准：让 Claude Code 不再瞎写代码这个项目到底有多厉害？先说结论：一个 4KB 的文本文件，让 AI 写代码的错误率暴降 90% Karpathy 自己说，他现在 80% 的代码都让 Claude 写，但 AI 经常犯几个典型错误：不问就瞎猜需求过度设计，写一堆用不上的抽象改 A 顺手把 B、C、D 也重构了代码能跑就行，不管目标达成没有这个项目就是专门给 Claude Code 戴上guardrails，用 4 条行为准则约束 AI 的编码行为核心亮点：4 条准则改变一切整个项目就是一个 CLAUDE.md 文件，里面只有 4 条规则，但每一条都直击 AI 编码的痛点 1. Think Before Coding - 先思考再动手 AI 最大的问题是“太听话”，你说啥它就写啥，从不质疑这条准则要求：明确说明假设、权衡 tradeoffs，不确定就直接问不再是“我猜你想要这个”，而是“我理解你的需求是 A，但 B 方案可能更合适，你要哪个？” 2. Simplicity First - 极简实现优先 AI 天生爱炫技，你要一个登录功能，它给你写个完整的 OAuth 2.0 + JWT + 刷新令牌 + 权限系统这条准则强制：只写刚好能解决当前问题的最小代码不搞 speculative abstractions，不写未来功能，不过度工程一个用户反馈：用了这条规则后，代码 diff 从动辄几百行缩减到几十行，review 轻松太多 3. Surgical Changes - 手术式精准修改这是我最爱的一条 AI 有个恶习：你让它改个 bug，它顺手把整个文件的命名风格、缩进、注释全优化了这条准则要求：只改用户要求的部分，严格匹配原有代码风格不碰无关文件，不顺手 refactor，不加“看起来更好”的改动有开发者实测：启用这条后，git diff 从“满屏红绿”变成“3 行精准修改” 4. Goal-Driven Execution - 目标驱动执行 AI 经常写完代码就交差，但代码能跑 ≠ 任务完成这条准则要求：把任务转化为可验证的目标/测试/成功标准，然后 loop 执行、验证、迭代直到真正达成目标才停止这让 AI 从“代码生成器”变成“问题解决者” 真实效果：社区反馈炸裂 X 上这个项目刷屏了，开发者反馈高度一致：代码质量飞跃：diff 更紧凑、干净，overbuild 和 side changes 大幅减少错误率暴降：有人实测从 41% 掉到 11%，继续优化后低至 3% 中文社区评价：“必备 skills”“Claude/Cursor 实用技能 Top1”“直接扔项目里就完事了” 很多人直接 @ 朋友推荐：“把这个 CLAUDE.md 放进去，Claude 立刻像换了个人，写代码更靠谱、不乱改、不瞎猜“ 使用方式：简单到离谱这是我见过最简单的 AI 工程优化方案：方法一：直接 curl 把 CLAUDE.md 下载到项目根目录 curl -o CLAUDE.md 方法二：用 Claude Code / Cursor 的 plugin 一键安装支持 Claude Code、Cursor 等主流 AI coding 工具完全开源（MIT 协议），拿来就用作为产品经理出身的开发者，我看到的不只是 4 条规则，而是对 AI 编码行为的深刻洞察 Karpathy 做的事情本质上是：给 AI 建立编码的第一性原理，他把他对于AI编程的理解写入了文件中不是教 AI 怎么写代码（它已经会了），而是教 AI 什么时候该问、什么时候该停、什么时候该简化这 4 条准则就像产品经理给开发团队定的 PRD 原则：需求不清楚？先问功能够用就行？别过度设计改需求？只改需求相关的做完了？先验证目标达成没有它能帮到我们什么？如果你是独立开发者或小团队，这个项目能直接提升你的 AI 协作效率：减少返工：AI 不再瞎猜需求，写出来的代码更符合预期降低 review 成本：改动精准，不用在一堆无关修改里找真正的变更提升代码质量：极简实现意味着更少的 bug、更好的可维护性加速迭代：目标驱动让 AI 真正解决问题，而不是生成代码对于中大型项目，这是让 Claude Code 真正“生产可用”的关键一步我的使用体会我在自己的几个项目里部署了这个 CLAUDE.md，最直观的感受是： AI 变聪明了以前它是个听话的实习生，你说啥它做啥，经常做错现在它像个有经验的同事，会主动问“你确定要这么做吗？我有个更简单的方案” 代码 diff 变干净了以前一个小需求能改几十个文件，现在精准到只改 3-5 行我的工作重心变了以前 60% 时间在 review AI 的代码、修 bug 现在 80% 时间在思考产品逻辑，AI 真正成了生产力工具最后这个项目被誉为 2026 年 AI coding 领域的“现象级”黑魔法工具小文件，大作用如果你在用 Claude Code / Cursor 写代码，强烈建议直接把这个 CLAUDE.md 扔进项目根目录 GitHub 地址：试过的人基本都是“已全项目部署”的状态作为一个天天和 AI 协作的开发者，我的建议是：别犹豫，直接用

显示更多

192

转发到社区

超级个体｜柿子@yaohui12138

2026.05.18 02:08

作为一个把 Claude 用到极致，codex偶尔使用的非技术人员，我来谈一下我对于codex和claude的感受： Codex 正在吞噬应用层的一切，Claude 正在吞噬编码层的一切先说 Codex 的应用层吞噬 Codex 现在已经不是一个编程工具了它是一个能操作你电脑上所有东西的超级 App，这点大家应该都深有体会 1. Computer Use - 后台操作你的 Mac 4 月 16 日上线，Codex 可以用自己的光标看、点击、输入多个 Agent 可以在你的 Mac 上并行工作，不干扰你自己的操作前端设计、游戏开发、任何 GUI 应用，它都能操作 2. Chrome Extension - 接管你的浏览器 5 月 7 日上线，Codex 现在能直接在 Chrome 里工作它能操作你已经登录的网站，使用你的 Cookie 和认证状态跨多个标签页并行处理任务，在后台运行不打断你 3. 90+ Plugins - 连接你的所有工具 GitHub、Slack、Gmail、Google Drive、Notion 每个 Plugin 打包了 Skills、App 集成、MCP 服务器一键安装，直接用 4. Skills - 把重复工作变成一条指令你可以把任何多步骤工作流打包成一个 Skill 输入 / 触发，就像训练好的员工一样 OpenAI 自己用 Skills 做每日问题分类、CI 失败总结、发布简报 5. Automations - 让 AI 在你睡觉时工作设置定时任务，Codex 可以自动运行每天早上生成工作简报，每周五做项目总结它甚至能跨天、跨周持续执行长期任务，自动唤醒继续工作 6. Memory - 记住你的偏好和历史 Codex 会记住你的个人偏好、纠正过的错误、花时间收集的信息下次任务自动用上，质量更高，速度更快 7. 图像生成 - 直接在工作流里生成图集成了 gpt-image-1.5，需要配图的时候直接生成不用跳出去用别的工具你自己能发现，Codex 的逻辑是什么？让 AI 成为你所有软件之上的操作系统不是造新工具，而是把现有工具全部串起来这才是应用层吞噬再说 Claude 的编码层吞噬 Claude Code 在 2026 年的定位已经非常清晰：它要重新定义什么叫“开发者” 1. 100 万 token 上下文 - 读取整个代码库 Claude Code 能读取你的整个项目，理解所有文件之间的关系不是单文件建议，而是跨文件重构 2. 自主执行 - 从规划到测试全自动你只需要描述想要什么，Claude Code 会：规划方案 → 写代码 → 运行测试 → 读取错误 → 自动迭代修复整个过程不需要你插手 3. Terminal + IDE + Desktop - 全场景覆盖在 Terminal 里用命令行在 VS Code、JetBrains 里用插件在 Desktop App 里用图形界面所有配置、MCP 服务器、Skills 全部同步 4. SWE-bench 80.8% - 行业最高分这是衡量 AI 解决真实 GitHub Issues 的标准测试 Claude Code 是 2026 年最高分真实团队用它 20 小时迁移 5 万行代码，事故调查时间减少 80% 5. 自动记忆 - 记住你的构建命令和调试模式 Claude Code 会自动保存项目上下文、调试模式、你偏好的方法跨 Session 记忆，不用每次都重新解释 6. Hooks - 自动化你的开发流程每次编辑后自动格式化每次提交前自动 Lint 用 Shell 命令串联整个工作流 Anthropic 自己说，他们公司现在大部分代码都是 Claude Code 写的工程师的角色变成了：架构师 + 产品思考者 + 编排者管理多个 AI Agent，给方向，做决策这就是编码层吞噬的本质：把编程从技能变成了表达所以，Codex vs Claude 的本质区别是什么？ Codex 的方向：应用层超级个体操作你已有的软件，自动化所有日常工作适合 90% 的普通人核心能力：串联现有工具 Claude 的方向：编码层超级个体帮你写代码、改代码、部署代码适合 10% 的创造者核心能力：从零创造新东西但这里有个被所有人忽略的东西：Claude 不只有 Code，还有 Cowork Claude Cowork 是什么？它是 Claude 针对非技术人员推出的应用层工具 Marketing、Data 团队发现自己在用 Claude Code 做复杂的多步骤工作 Anthropic 观察到这个现象，就做了 Cowork Cowork 的核心能力：操作你的本地文件和应用 38+ Connectors 连接 Slack、Notion、Google Drive、Microsoft 365 Projects 让每个项目有独立的文件、上下文、记忆 Scheduled Tasks 定时自动执行任务 Plugins 打包 Skills、Connectors、Sub-agents 你看，Claude 的野心其实是：用 Claude Code 吞噬编码层用 Claude Cowork 吞噬应用层如果你是普通人，想提升日常工作效率： Codex 和 Claude Cowork 都可以 Codex 的 Computer Use 更激进，能操作任何 GUI Claude Cowork 的 Projects 更稳定，适合长期项目如果你是开发者，想做产品、做项目： Claude Code+codex 是第一选择 SWE-bench 最高分的规划能力+codex的推理能力，代码质量最好 2026 年的 AI 竞争，比的是谁能把 AI 更好地嵌入到用户的日常工作流里 Codex 在应用层走得最激进 Claude 在编码层走得最深，同时用 Cowork 补齐应用层这两个方向，正在重新定义“一个人能做什么” 应用层和编码层，都在被 AI 吞噬，而我们，正站在这个变革的最前沿，真的很兴奋！

显示更多