Claude Code 构建者 Boris Cherny 谈「未来产品团队的五种角色原型」
在 AI 工具普及的背景下,工程、产品、设计、数据科学等传统职能边界正在消融,融合为按"产出方式"而非"专业领域"划分的新型角色。他基于 Claude Code 团队提炼出五种原型。
五种角色原型
1、Prototyper 原型师 -- 提出全新想法;高产,但多数不落地
2、Builder 构建者 -- 把原型/想法快速转为生产级产品或基础设施;让想法变成可用
3、Sweeper 优化清理者 -- 打磨 UI、简化代码与系统、下线冗余、优化性能;让系统变干净、变快
4、Grower 增长者 -- 对已建成产品持续迭代,提升 PMF;提升市场契合度
5、Maintainer 维护者 -- 守护成熟系统,保障安全/可靠/快速/高效随规模扩展;让系统长期稳定
三个关键洞察
1. 角色 ≠ 职能。 五种原型与岗位头衔无关——设计师可以是 1,也可以是 2 或 3;工程师同理。决定角色的是"擅长做哪类事",而非"在哪个部门"。
2. 一人多角色。 多数人横跨 2 个角色,少数跨 3 个。角色组合比单一标签更能描述一个人的真实价值。
3. 产品阶段决定角色配比。
· 新产品 / 未达 PMF:需 1+2+3(造点子、能落地、能收拾)
· 找到 PMF / 增长期:需 2+3+4,配少量 5
· PMF 稳固 / 成熟期:需 3+4+5,配少量 2
更深一层的含义
· 从"职能分工"到"价值流分工":传统组织按"写代码 / 画设计 / 做研究"切分;未来或按"谁负责创造、谁负责落地、谁负责打磨、谁负责增长、谁负责守成"切分。当 AI 让跨域行动成本下降,单人可覆盖的链路变长,职能壁垒自然松动。
· 团队健康度 = 角色配比与阶段的匹配度:不是招"最强的人",而是招"当前阶段最缺的角色"。全员 1+2、没有 3 的团队会陷入"只造不收"的泥潭;全员 5、没有 1 的团队会失去创新。
· 角色是动态漂移的:同一个人随产品阶段推移,角色重心会迁移(从 1 → 2 → 4/5)。组织需容忍并支持这种演化。
显示更多
Codex Remote 功能好像有个 bug
在当前 5 小时额度用光时,消息发出去,thinking 几秒钟就没了,没有额度提醒,也没有任何其他异常,就是什么都没有了。。
中午吃饭的全程都在纳闷,到底咋了,吃完饭赶紧回家看,呃。。好吧,没额度了
显示更多
啊?茅台要造芯片啦?
好玩,如果是真的,名字就太欢乐了。
茅台芯片的工艺是什么?酱香!
最强的芯片是什么?飞天!
芯片的制程呢?45度!
那。。算了,都在酒里了,干!
显示更多
今天看到 X 上余承东亲自拍摄的尊界 V800 广告视频
我真以为是 AI 生成的呢,我还在那琢磨,这难道是 Seedance 2.5?这么逼真?
没想到是真的啊!余承东自己在微博发布的,163万观看。
不得不说,HW 还是太懂它的目标用户群体了,是它目标的群体,心里可能无比的自豪和憧憬,向往余总能让他们早点花掉兜里的 100w+ 零花钱,让这辆低调奢华有内涵的象征身份和情怀的爱车停在自家车库里。
不是它目标群体的我们,看完不禁倒吸一口凉气,一辆车,居然能把我最喜欢的元素,元素反过来,集合到一起,从车外到车内,每一步、每一秒都尴尬到扣地。。
如果你觉得我夸张了,请你认真看完每一秒 😂
显示更多
逗死我了,美国政府 BAN 了 Llama,是因为太强太危险了吗?当然不是,因为太烂了。。拿出来,丢人!
BREAKING: US Government Bans Llama 4, citing concerns that it is “just really bad”
What If OpenAI Codex Ran on Windows XP?
Claude Code 构建者 Boris Cherny 谈「未来产品团队的五种角色原型」
在 AI 工具普及的背景下,工程、产品、设计、数据科学等传统职能边界正在消融,融合为按"产出方式"而非"专业领域"划分的新型角色。他基于 Claude Code 团队提炼出五种原型。
五种角色原型
1、Prototyper 原型师 -- 提出全新想法;高产,但多数不落地
2、Builder 构建者 -- 把原型/想法快速转为生产级产品或基础设施;让想法变成可用
3、Sweeper 优化清理者 -- 打磨 UI、简化代码与系统、下线冗余、优化性能;让系统变干净、变快
4、Grower 增长者 -- 对已建成产品持续迭代,提升 PMF;提升市场契合度
5、Maintainer 维护者 -- 守护成熟系统,保障安全/可靠/快速/高效随规模扩展;让系统长期稳定
三个关键洞察
1. 角色 ≠ 职能。 五种原型与岗位头衔无关——设计师可以是 1,也可以是 2 或 3;工程师同理。决定角色的是"擅长做哪类事",而非"在哪个部门"。
2. 一人多角色。 多数人横跨 2 个角色,少数跨 3 个。角色组合比单一标签更能描述一个人的真实价值。
3. 产品阶段决定角色配比。
· 新产品 / 未达 PMF:需 1+2+3(造点子、能落地、能收拾)
· 找到 PMF / 增长期:需 2+3+4,配少量 5
· PMF 稳固 / 成熟期:需 3+4+5,配少量 2
更深一层的含义
· 从"职能分工"到"价值流分工":传统组织按"写代码 / 画设计 / 做研究"切分;未来或按"谁负责创造、谁负责落地、谁负责打磨、谁负责增长、谁负责守成"切分。当 AI 让跨域行动成本下降,单人可覆盖的链路变长,职能壁垒自然松动。
· 团队健康度 = 角色配比与阶段的匹配度:不是招"最强的人",而是招"当前阶段最缺的角色"。全员 1+2、没有 3 的团队会陷入"只造不收"的泥潭;全员 5、没有 1 的团队会失去创新。
· 角色是动态漂移的:同一个人随产品阶段推移,角色重心会迁移(从 1 → 2 → 4/5)。组织需容忍并支持这种演化。
显示更多
Fine-tuning massive LLMs used to be painfully slow, but not anymore!
4 open source libraries that accelerate fine-tuning of Large Language Models
1. Unsloth AI
• Fine-tune models like Qwen3, Llama 4, and Gemma 3 up to 2× faster with 70% less VRAM
• Uses optimized Triton kernels and manual backprop for exact accuracy
• Supports low-resource setups and runs on consumer GPUs or even Colab/Kaggle with ~3 GB VRAM
GitHub repo →
2. LLaMA Factory
• Fine-tune over 100 models (LLaMA, Mistral, Gemma, etc.) using a simple CLI or WebUI
• Supports LoRA, QLoRA, full or frozen fine-tuning across 2–8‑bit precision
• Includes built-in dataset templates, training monitors, and model export options
GitHub repo →
3. DeepSpeed
• Built for large-scale distributed fine-tuning with ZeRO and FSDP
• Optimized for multi-GPU and multi-node training with advanced memory management
• Trusted in production environments for scalable LLM training
GitHub repo →
4. Axolotl
• Yaml-based setup for fine-tuning, LoRA/QLoRA, DPO, GRPO, and multimodal workflows
• Includes kernel optimizations for memory-efficient training
• Actively maintained with support for Hugging Face, model export, and inference
GitHub repo →
显示更多
居然在几年前的节目广告里,看到了「大众途观𝕏」,和 𝕏 平台一样的 𝕏 😂
LoanLens 是一套基于 LandingAI 的 AI 审贷初筛系统:从六类借款人文档中抽取结构化字段、做欺诈检测与可解释评分,并附带仅限当前案件的 RAG 问答,把人工核对文档的工作自动化为第一遍机器审查。
处理流水线
6 类文档 → ADE 结构化抽取 → KPI → 欺诈检测 → 评分决策 → 案件 RAG
为何不用普通 OCR
审贷要的是 可接入业务逻辑的结构化证据,不是文本块:
· Schema 驱动:按字段契约抽取,不是猜模板
· 可追溯:字段能回溯源文档
· 视觉层:AOD 补文本抓不到的布局/篡改信号
欺诈与评分
· 姓名一致性:六类文档姓名 TF-IDF 比对,相似度 < 0.95 告警
· 护照篡改:核心组件相对位置 vs 参考几何;严重视觉欺诈可直接否决
评分刻意简单透明(信用 23%、DTI 23%、收入时效 20% 等;≥60 批准,40–59 复核,<40 拒绝),审核员可 inspect 各信号贡献,无黑盒总分。
显示更多
突然想到一个问题:美国政府可以限制他们国家的 AI 团队(OpenAI 和 Anthropic)按照政府的要求对外提供模型,范围、条件、节奏都可以限制,甚至一刀切。
但是对几个月后会追上的中国模型,怎么办?他们大部分都是开源的啊!
难道要搞一个美国版 GFW?再限制美国模型托管团队们不能推理中国模型?
显示更多
刚刚在 Chat 垃圾箱翻到一封邮件,做 llm api 中转站的,咨询合作。
好奇点进网站,首页赫然写着「Claude Fable 5」,第一反应是它们可能曾经接过,后来下架后没调。
手贱我用他们给的邀请码注册了,让 Codex 跑一下 Fable 5 的调用,居然通了 😂
这。。到底是背景太硬,还是嘴太硬。。
显示更多
OpenAI GPT-5.6 系列模型预览发布
好消息是 Sol 很强!坏消息是目前只能小范围预览,要配合美国政府监管审查!A 厂求仁得仁,转身拖 O 厂下水,原来 A 厂的 AI 宪法,就是:都别活 😄
· Sol - 旗舰,最强能力 $5 / $30
· Terra - 均衡,日常主力 $2.50 / $15
· Luna - 轻量,最低成本 $1 / $6
Terra 性能与 GPT‑5.5 相当但成本减半;Luna 在最低价位仍保留较强能力。
新能力:从"单 Agent 推理"走向"多 Agent 协作"
两个值得注意的新机制:
· Max reasoning effort:给 Sol 更深的推理预算。
· Ultra mode:超越单 Agent,通过 subagents 协同加速复杂任务。
Ultra 模式是本文最实质的能力跃迁信号——它把模型能力从"单个推理体"扩展到"协调多个 subagent 的系统"。在 Terminal‑Bench 2.1(命令行工作流基准)上,Sol Ultra 达到 91.9%,Sol 88.8%,而 Ultra 与非 Ultra 的差距本身说明"subagent 调度"带来了可观增益。
三大领域基准:编码、生物、网络安全的"效率前沿"叙事
OpenAI 反复使用一个框架:性能—效率前沿(performance-efficiency frontier),即不只比分数,更比"达到同等分数需要多少 token"。
· 编码:Terminal‑Bench 2.1 新 SOTA。
· 生物学:GeneBench v1(长程基因组与定量生物学分析),Sol 比 GPT‑5.5 分数更高且 token 更少。
· 网络安全:
· ExploitBench:Sol 用约 1/3 的输出 token 即可与 Mythos Preview 竞争。
· ExploitGym(UC Berkeley 联合前沿实验室):三档模型随推理增强,能力同步提升。
显示更多
Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced model for efficient, everyday work, and GPT-5.6 Luna, a fast and affordable model for high-volume work.
显示更多
终于让 ZCode 用上 Computer Use 了
给 ZCode 安装了 Cua 这个插件,以下草稿来自
@Zai_org ZCode +
@trycua Cua 对 Chrome 的直接操作。
把开源 Computer Use 接进 ZCode,agent 现在能真正操作 macOS:截图、读无障碍树、点击、打字。绕开 Apple Events 权限死结,改走 CGEvent + Accessibility API。
它刚自己算了 7×6=42,又开了 Chrome 导航到微博和 X——就是发这条的浏览器。GUI 四十年都是给人设计的接口,现在正变成 agent 也能直接操作的界面。
显示更多
And then there’s the picky eater example.
Instead of giving a generic meal plan, SuperNori notices what’s been going on, looks for more relevant meal ideas, and has something ready by the next morning.
If family AI can help the person who is usually keeping track of everyone else, that feels worth paying attention to.
Join the waitlist:
What would you want a family AI to help with? Repost or comment SuperNori and tag
@Nori_FamilyAI.
#
partner#
显示更多
I also like the anniversary example.
A calendar conflict appears. A normal reminder might stop there.
SuperNori understands the moment, checks for restaurants that still have a table tonight, and gives you a few options to choose from.
It’s not taking the decision away from you. It’s bringing the right options to you earlier.
显示更多
In many families, the tiring part is rarely one big thing.
It’s all the small things someone has to keep in mind every day: when to leave because of traffic, what’s running low at home, whether the living room needs cleaning, how the kids are eating, whether an anniversary overlaps with another plan.
SuperNori is building a Proactive Family AI Agent to notice those small changes before they become things someone has to remember.
@Nori_FamilyAI @IsaacDrgn #
partner#
显示更多
The hard part of RAG isn't finding the right chunk!
When you chunk a document for RAG, each chunk lands in the index on its own, disconnected from the section it came from. So two chunks with identical text, but from completely different parts of the document, look exactly the same to a flat index.
That becomes a problem the moment a question needs context from more than one section. The chunks come back, but how they relate to each other gets lost.
ADE Section fixes this. It reads the parsed document, builds the actual hierarchy, and figures out where every chunk falls within it. That gets attached to the chunk before it's embedded.
Once that's in place, a broad question can stay at the section level. A specific one can drop into a sub-chunk. You can scope a search to one part of a document instead of the whole thing.
Citations get more accurate too. The model knows exactly which section a fact came from.
Run ADE Parse, then run ADE Section.
显示更多
终于让 ZCode 用上 Computer Use 了
给 ZCode 安装了 Cua 这个插件,以下草稿来自
@Zai_org ZCode +
@trycua Cua 对 Chrome 的直接操作。
把开源 Computer Use 接进 ZCode,agent 现在能真正操作 macOS:截图、读无障碍树、点击、打字。绕开 Apple Events 权限死结,改走 CGEvent + Accessibility API。
它刚自己算了 7×6=42,又开了 Chrome 导航到微博和 X——就是发这条的浏览器。GUI 四十年都是给人设计的接口,现在正变成 agent 也能直接操作的界面。
显示更多
OpenAI 的工作正被 Agent (Codex) 重塑,且已经覆盖每一个部门,不止研发团队!
来自 OpenAI 官方博客,OpenAI 用 Codex 的一整年使用数据,证明:知识工作的基本单位,正从「一问一答」转向「委托长周期任务」,Codex 就是这个答案!
# 四条实证结论
1. 任务变长、变难
· 约 24% 的 Codex 请求,对应人类需 1 小时以上 的工作
· 到 2026 年 5 月(个体用户样本):
· 80.6% 至少有一次 ≥30 分钟任务
· 70.2% ≥1 小时
· 25.6% ≥8 小时
· 内部重度用户:P99 用户单日可并行跑 60+ 小时 agent 运行时长(多 agent 并发)
2. 从 ChatGPT 到 Codex 的结构性迁移
OpenAI 内部变化最剧烈:
· 2025 年 8 月前:员工 token 中 Codex 占比 <10%
· 2026 年 6 月:99.8% 的 output token 来自 Codex
部门迁移节奏:
· 工程 2025 年 12 月率先过半
· 法务、财务、招聘 约 2026 年 4 月快速 crossover
· 工程师今日 99% token 在 Codex;律师/招聘 85%+
外部用户分化明显:
群体 | Codex 占 output token 份额
· OpenAI 员工 | 99.8%
· 组织用户 | 63.3%
· 个人用户 | 16.5%
3. 非开发者增长最快
自 2025 年 8 月以来,非开发者用户增长:
· 个人:137 倍
· 组织:189 倍
· OpenAI 内部:12 倍(基数已高)
H1 2026 活跃用户整体 5 倍以上,增量主要来自开发者以外人群。
4. 岗位边界被模糊
· 工程/研发:仍以编码为主
· 财务、市场、运营:以 知识工作 为主
· 但业务职能员工用 Codex 产出的工作中,超过 1/4 是工程/编码类(自动化、数据处理、调试等)
Agent 降低「跨界执行」成本——非技术人员也能做原本需工程支持的事。
总结
当 Agent (Codex) 足够好用且组织摩擦足够低时,人们会把 AI 从「顾问」当成「劳动力」——委托更长、更难、跨岗位的任务,并并行编排多个 Agent;ChatGPT 式聊天在工作场景中被 Codex 快速替代。
显示更多