注册并分享邀请链接,可获得视频播放与邀请奖励。

超级个体|柿子 的个人资料封面
超级个体|柿子 的头像

超级个体|柿子 (@yaohui12138)

@yaohui12138
超级个体践行者|AI产品经理,日常分享 AI搞钱实战,AI编程系列教程,AI工作流实操, 只分享干货,利他即利己. 公众号:AI超级个体柿子
260 正在关注    20.1K 粉丝
Karpathy 发布了一个github开源项目,狠狠让我惊艳到了 这个项目叫 andrej-karpathy-skills,GitHub 13 万+ star,我愿称之为2026 最有用的 AI 工程项目 它解决的问题极其精准:让 Claude Code 不再瞎写代码 这个项目到底有多厉害? 先说结论:一个 4KB 的文本文件,让 AI 写代码的错误率暴降 90% Karpathy 自己说,他现在 80% 的代码都让 Claude 写,但 AI 经常犯几个典型错误: 不问就瞎猜需求 过度设计,写一堆用不上的抽象 改 A 顺手把 B、C、D 也重构了 代码能跑就行,不管目标达成没有 这个项目就是专门给 Claude Code 戴上guardrails,用 4 条行为准则约束 AI 的编码行为 核心亮点:4 条准则改变一切 整个项目就是一个 CLAUDE.md 文件,里面只有 4 条规则,但每一条都直击 AI 编码的痛点 1. Think Before Coding - 先思考再动手 AI 最大的问题是“太听话”,你说啥它就写啥,从不质疑 这条准则要求:明确说明假设、权衡 tradeoffs,不确定就直接问 不再是“我猜你想要这个”,而是“我理解你的需求是 A,但 B 方案可能更合适,你要哪个?” 2. Simplicity First - 极简实现优先 AI 天生爱炫技,你要一个登录功能,它给你写个完整的 OAuth 2.0 + JWT + 刷新令牌 + 权限系统 这条准则强制:只写刚好能解决当前问题的最小代码 不搞 speculative abstractions,不写未来功能,不过度工程 一个用户反馈:用了这条规则后,代码 diff 从动辄几百行缩减到几十行,review 轻松太多 3. Surgical Changes - 手术式精准修改 这是我最爱的一条 AI 有个恶习:你让它改个 bug,它顺手把整个文件的命名风格、缩进、注释全优化了 这条准则要求:只改用户要求的部分,严格匹配原有代码风格 不碰无关文件,不顺手 refactor,不加“看起来更好”的改动 有开发者实测:启用这条后,git diff 从“满屏红绿”变成“3 行精准修改” 4. Goal-Driven Execution - 目标驱动执行 AI 经常写完代码就交差,但代码能跑 ≠ 任务完成 这条准则要求:把任务转化为可验证的目标/测试/成功标准,然后 loop 执行、验证、迭代 直到真正达成目标才停止 这让 AI 从“代码生成器”变成“问题解决者” 真实效果:社区反馈炸裂 X 上这个项目刷屏了,开发者反馈高度一致: 代码质量飞跃:diff 更紧凑、干净,overbuild 和 side changes 大幅减少 错误率暴降:有人实测从 41% 掉到 11%,继续优化后低至 3% 中文社区评价:“必备 skills”“Claude/Cursor 实用技能 Top1”“直接扔项目里就完事了” 很多人直接 @ 朋友推荐:“把这个 CLAUDE.md 放进去,Claude 立刻像换了个人,写代码更靠谱、不乱改、不瞎猜“ 使用方式:简单到离谱 这是我见过最简单的 AI 工程优化方案: 方法一:直接 curl 把 CLAUDE.md 下载到项目根目录 curl -o CLAUDE.md 方法二:用 Claude Code / Cursor 的 plugin 一键安装 支持 Claude Code、Cursor 等主流 AI coding 工具 完全开源(MIT 协议),拿来就用 作为产品经理出身的开发者,我看到的不只是 4 条规则,而是对 AI 编码行为的深刻洞察 Karpathy 做的事情本质上是:给 AI 建立编码的第一性原理,他把他对于AI编程的理解写入了文件中 不是教 AI 怎么写代码(它已经会了),而是教 AI 什么时候该问、什么时候该停、什么时候该简化 这 4 条准则就像产品经理给开发团队定的 PRD 原则: 需求不清楚? 先问 功能够用就行? 别过度设计 改需求? 只改需求相关的 做完了? 先验证目标达成没有 它能帮到我们什么? 如果你是独立开发者或小团队,这个项目能直接提升你的 AI 协作效率: 减少返工:AI 不再瞎猜需求,写出来的代码更符合预期 降低 review 成本:改动精准,不用在一堆无关修改里找真正的变更 提升代码质量:极简实现意味着更少的 bug、更好的可维护性 加速迭代:目标驱动让 AI 真正解决问题,而不是生成代码 对于中大型项目,这是让 Claude Code 真正“生产可用”的关键一步 我的使用体会 我在自己的几个项目里部署了这个 CLAUDE.md,最直观的感受是: AI 变聪明了 以前它是个听话的实习生,你说啥它做啥,经常做错 现在它像个有经验的同事,会主动问“你确定要这么做吗? 我有个更简单的方案” 代码 diff 变干净了 以前一个小需求能改几十个文件,现在精准到只改 3-5 行 我的工作重心变了 以前 60% 时间在 review AI 的代码、修 bug 现在 80% 时间在思考产品逻辑,AI 真正成了生产力工具 最后 这个项目被誉为 2026 年 AI coding 领域的“现象级”黑魔法工具 小文件,大作用 如果你在用 Claude Code / Cursor 写代码,强烈建议直接把这个 CLAUDE.md 扔进项目根目录 GitHub 地址: 试过的人基本都是“已全项目部署”的状态 作为一个天天和 AI 协作的开发者,我的建议是:别犹豫,直接用
显示更多
0
12
192
30
转发到社区
作为一个把 Claude 用到极致,codex偶尔使用的非技术人员,我来谈一下我对于codex和claude的感受: Codex 正在吞噬应用层的一切,Claude 正在吞噬编码层的一切 先说 Codex 的应用层吞噬 Codex 现在已经不是一个编程工具了 它是一个能操作你电脑上所有东西的超级 App,这点大家应该都深有体会 1. Computer Use - 后台操作你的 Mac 4 月 16 日上线,Codex 可以用自己的光标看、点击、输入 多个 Agent 可以在你的 Mac 上并行工作,不干扰你自己的操作 前端设计、游戏开发、任何 GUI 应用,它都能操作 2. Chrome Extension - 接管你的浏览器 5 月 7 日上线,Codex 现在能直接在 Chrome 里工作 它能操作你已经登录的网站,使用你的 Cookie 和认证状态 跨多个标签页并行处理任务,在后台运行不打断你 3. 90+ Plugins - 连接你的所有工具 GitHub、Slack、Gmail、Google Drive、Notion 每个 Plugin 打包了 Skills、App 集成、MCP 服务器 一键安装,直接用 4. Skills - 把重复工作变成一条指令 你可以把任何多步骤工作流打包成一个 Skill 输入 / 触发,就像训练好的员工一样 OpenAI 自己用 Skills 做每日问题分类、CI 失败总结、发布简报 5. Automations - 让 AI 在你睡觉时工作 设置定时任务,Codex 可以自动运行 每天早上生成工作简报,每周五做项目总结 它甚至能跨天、跨周持续执行长期任务,自动唤醒继续工作 6. Memory - 记住你的偏好和历史 Codex 会记住你的个人偏好、纠正过的错误、花时间收集的信息 下次任务自动用上,质量更高,速度更快 7. 图像生成 - 直接在工作流里生成图 集成了 gpt-image-1.5,需要配图的时候直接生成 不用跳出去用别的工具 你自己能发现,Codex 的逻辑是什么? 让 AI 成为你所有软件之上的操作系统 不是造新工具,而是把现有工具全部串起来 这才是应用层吞噬 再说 Claude 的编码层吞噬 Claude Code 在 2026 年的定位已经非常清晰: 它要重新定义什么叫“开发者” 1. 100 万 token 上下文 - 读取整个代码库 Claude Code 能读取你的整个项目,理解所有文件之间的关系 不是单文件建议,而是跨文件重构 2. 自主执行 - 从规划到测试全自动 你只需要描述想要什么,Claude Code 会: 规划方案 → 写代码 → 运行测试 → 读取错误 → 自动迭代修复 整个过程不需要你插手 3. Terminal + IDE + Desktop - 全场景覆盖 在 Terminal 里用命令行 在 VS Code、JetBrains 里用插件 在 Desktop App 里用图形界面 所有配置、MCP 服务器、Skills 全部同步 4. SWE-bench 80.8% - 行业最高分 这是衡量 AI 解决真实 GitHub Issues 的标准测试 Claude Code 是 2026 年最高分 真实团队用它 20 小时迁移 5 万行代码,事故调查时间减少 80% 5. 自动记忆 - 记住你的构建命令和调试模式 Claude Code 会自动保存项目上下文、调试模式、你偏好的方法 跨 Session 记忆,不用每次都重新解释 6. Hooks - 自动化你的开发流程 每次编辑后自动格式化 每次提交前自动 Lint 用 Shell 命令串联整个工作流 Anthropic 自己说,他们公司现在大部分代码都是 Claude Code 写的 工程师的角色变成了:架构师 + 产品思考者 + 编排者 管理多个 AI Agent,给方向,做决策 这就是编码层吞噬的本质:把编程从技能变成了表达 所以,Codex vs Claude 的本质区别是什么? Codex 的方向:应用层超级个体 操作你已有的软件,自动化所有日常工作 适合 90% 的普通人 核心能力:串联现有工具 Claude 的方向:编码层超级个体 帮你写代码、改代码、部署代码 适合 10% 的创造者 核心能力:从零创造新东西 但这里有个被所有人忽略的东西:Claude 不只有 Code,还有 Cowork Claude Cowork 是什么? 它是 Claude 针对非技术人员推出的应用层工具 Marketing、Data 团队发现自己在用 Claude Code 做复杂的多步骤工作 Anthropic 观察到这个现象,就做了 Cowork Cowork 的核心能力: 操作你的本地文件和应用 38+ Connectors 连接 Slack、Notion、Google Drive、Microsoft 365 Projects 让每个项目有独立的文件、上下文、记忆 Scheduled Tasks 定时自动执行任务 Plugins 打包 Skills、Connectors、Sub-agents 你看,Claude 的野心其实是: 用 Claude Code 吞噬编码层 用 Claude Cowork 吞噬应用层 如果你是普通人,想提升日常工作效率: Codex 和 Claude Cowork 都可以 Codex 的 Computer Use 更激进,能操作任何 GUI Claude Cowork 的 Projects 更稳定,适合长期项目 如果你是开发者,想做产品、做项目: Claude Code+codex 是第一选择 SWE-bench 最高分的规划能力+codex的推理能力,代码质量最好 2026 年的 AI 竞争,比的是谁能把 AI 更好地嵌入到用户的日常工作流里 Codex 在应用层走得最激进 Claude 在编码层走得最深,同时用 Cowork 补齐应用层 这两个方向,正在重新定义“一个人能做什么” 应用层和编码层,都在被 AI 吞噬,而我们,正站在这个变革的最前沿,真的很兴奋!
显示更多
0
9
76
15
转发到社区