Anthropic 的最新 AI 政策研究,真是为封堵来自中国的竞争操碎了心😆 2028 将是决策窗口的临界点——届时"数据中心里的天才国度"(Dario 在 Machines of Loving Grace 里的隐喻)已经落地,而届时的赢家会决定全球 AI 的规则与规范。研究给出两条互斥路径:
情景 1 · 民主阵营领先:美国维持 12-24 个月的智能优势,规则由民主国家书写;中国下一代模型要等到 2029-2030 才能复现 2028 年美国发布的能力跃迁;
情景 2 · 中美胶着:政策不作为,导致中国实验室通过芯片走私 + 海外数据中心 + distillation(蒸馏攻击)追到近前沿;中国数据中心配合"够用就行"的廉价模型蚕食全球南方,威权阵营拿到全球部署的话语权。
研究给出的三个具体政策建议:
1. 堵漏洞:收紧芯片走私查处、限制海外数据中心远程接入、收紧半导体制造设备(SME)出口与维护服务。这是最重要的,因为它直接压低中国实验室的"算力天花板",连带让蒸馏攻击都难做;
2. 守创新:通过立法明确"distillation 攻击违法",建立美国实验室间以及实验室与政府间的威胁情报共享通道。白宫科技政策办公室发了备忘录,众议院、参议院、战争部都在跟进;但美国实验室之间也在做高度类似的事。反蒸馏立法如果通过,它能精准打击中国实验室,还是会变成"前沿实验室之间互锁的法律武器"?
3. 推美式 AI 出海:延续白宫《AI Action Plan》里"出口美国 AI 技术栈"的方向,抢全球基础设施位置。
但研究最严重的问题是:里面充满了利益相关者偏见,Anthropic 同时是政策诉求者、Mythos 能力的拥有者、和 Project Glasswing 的发起者。它推的每一条政策——更严的出口管制、反蒸馏立法、政府背书 American AI 出海——都对它直接有利 。。。
显示更多
We've published a paper that explains our views on AI competition between the US and China.
The US and democratic allies hold the lead in frontier AI today. Read more on what it’ll take to keep that lead:
显示更多
我们一家人用三款AI模型
- 小孩喜欢 Gemini(学习最佳)
- 老婆用 ChatGPT(日常问答)
- 我用 Claude(工作流自动化)
御三家 一个都不少
还好没教 Oliver 同学用 Grok 😜
显示更多
Codex on your iPhone 📱
连接成功 体验丝滑 现在可以手机上遥控查看 Dataroom 资料了🤟
You've been asking for this one...
Now in preview: Codex in the ChatGPT mobile app.
Start new work, review outputs, steer execution, and approve next steps, all from the ChatGPT mobile app. Codex will keep running on your laptop, Mac mini, or devbox.
显示更多
RIP claude -p 💀
Starting June 15, paid Claude plans can claim a dedicated monthly credit for programmatic usage.
The credit covers usage of:
- Claude Agent SDK
- claude -p
- Claude Code GitHub Actions
- Third-party apps built on the Agent SDK
显示更多
今天 Claude 在开发者大会上低调推出了一个小功能“Dream” - 做梦!在 Platform 控制面板里选择 Agent 留下的记忆,让它做梦就行,模仿了人类“梦境”修剪记忆和整理思绪的逻辑,可以异步执行,对已有的 memory 进行反思、整理 + 改进,挖出未被显式写下的新模式,这不是简单的总结!
Dario 在各种播客多次提到过,持续学习很重要,但不需要在模型的权重层做,只要 Context 足够大,通过优秀的工程架构也能实现的。真正的"持续学习",可能只需要一个独立的离线 curation 循环——这就是 Dreams😴
显示更多
基于 Transformer 架构的 LLM 最大的问题就是没有时间感,我觉得这是主观智能甚至是意识到重要部分,时间的连续感知和记忆的先后形成了“自我”!每次涉及到Agentic 任务我都得让模型自己使用 tool 确定操作时间,别让它靠幻觉脑补😂 不知道我这样对不对?
显示更多
Stanford 用 1500 个工人和 844 个任务告诉 YC:你们 41% 的钱投错了方向 —— 你们投的都是"人们不想要"或"不需要"的东西,而那些"想要但没什么人做"的事正在等待 founders。论文中工人最想自动化的前 10 个职业 Claude 的使用量只有 1.26%,现有 AI 使用反映的是早期采用者偏好,不是真实工作场所需求!
WORKBank 把工作任务划分成了四个象限,高渴望和高能力分别表示对 AI 高需求和 AI 目前的能力:
🟢 Green Light(高渴望 + 高能力)
这一象限聚集的工作类型:数据录入 / 文件整理 / 日程安排 / 例行报告生成 / 标准化客服流程 / 重复性信息检索整合(QA、合规类)
🟠 R&D Opportunity(高渴望 + 低能力)
这一象限聚集的工作类型:跨系统协调(涉及多个工具/部门但仍结构化)/ 长上下文研究 + 综合分析 / 项目计划和资源分配 / 中等复杂度的创意设计
这正是创业公司应该看的方向——工人想要 AI 帮忙,但当前 AI 能力还没到位。
🔴 Red Light(低渴望 + 高能力)
这一象限聚集的工作类型:内容创作的最终呈现(艺术/设计/媒体红灯比例 47.6% 全行业最高)/ 客户面对面的关系类(销售/法律咨询/客户管理)/ 决策的"署名"环节(草稿可以 AI 写但谁署名 = 谁负责)/ 创意的灵感判断("这个 ok / 不 ok"的最终拍板)
特征:技术上 AI 能做,但做的人在乎自己的 ownership / 创造性 / 客户关系——这是最容易引发劳动法纠纷和文化抵制的区域。中国法院的两个判例(Zhou 在 QA / Liu 做地图录入)就涉及这一区。
⚪ Low Priority(低渴望 + 低能力)
这一象限聚集的工作类型:高度物理 / 跨系统手动追踪(电话、纸质文件、人工对接)/ 高度地方化、低标准化(每个城市/机场/银行流程都不同)/ 长尾的客户异常处理 / 受监管约束极强的小批量任务
特征:双低 = 不必做。论文也指出,这些任务人类做得也不开心(已经被流程化得很惨),只是 AI 现阶段也帮不上忙。
最被忽视的发现:同一职业内的不同任务往往横跨多个象限。最典型的例子 - 程序员:
- "重构同一模式代码" → 🟢
- "理解模糊的用户需求" → 🟠
- "在客户面前展示 demo 并应对质询" → 🔴
- "在老旧 COBOL 代码里追一个偶发 bug" → ⚪
这意味着"程序员被 AI 替代"可能是一个伪命题。程序员的某些任务在绿灯区(已被 Claude Code 大量自动化),某些在红灯区(客户沟通、责任归属),某些在 R&D 区(AI 还做不到的复杂理解)。
这也是 Diana / Cat Wu 描述的"PM 与工程师角色融合"在数据上的解释——工作不是被替代,是被重新切分到四个象限里🤔
显示更多
他是前 AI 时代的人类😜
在ai带来的文明冲击面前
大谈历史周期,大国冲突的达里奥就像个sb
人工智能时代的人工智障
在 xAI 联创陆续离职之时,xAI 公布了这段 45 分钟的内部全员大会录像,Elon Musk 主持,回顾了 xAI 过去 30 个月的成就、公司重组、团队介绍、基础设施进展,以及联合 SpaceX 一起绘制的未来新大饼🫓
1. 成立仅 2.5 年的 xAI 已取得惊人进步,而竞争对手(如 OpenAI 等)已有 5-20 年历史、更大团队和资源。
xAI 在语音、图像、视频生成(生成量已超过所有竞争对手总和);部署了首个 10 万 H100 GPU 训练集群,现已经接近 100 万 H100 等效算力。
科技公司竞争力在于“速度与加速度”,xAI 是最快的,无人能及。Elon 感谢了离职员工贡献,并宣布公司重组以适应规模增长(像生物从单细胞到多器官分化)。
2. 公司分为四大应用领域 + 基础设施层
- Grok 主模型 + 语音团队(合并):从零起步,6 个月内开发语音模式,超越 OpenAI;现已在 200 多万辆 Tesla 中运行。模型将极大提升知识工作者生产力(10 倍);将构建让用户轻松完成工作新“门户”;
- 编码团队(Lead: Makro):编码模型已实用,能加速工程师 10 倍;路径通往递归自我改进(AI 训练下一代 AI)。2 - 3 个月内能达到 SOTA;年底可能直接生成二进制代码,绕过传统编程;与 SpaceX 合作解决算力/能源瓶颈;
- 图像/视频团队(Imagine)(Lead: Tyler H. 等):6 个月前从零起步,现排行榜领先;生成 60 亿图像/月(远超 Google 等)。未来将实现更长视频(10-20 分钟一键生成)、实时渲染、交互世界。这个团队的目标是领先 Meta 抵达“元宇宙”,到时实时视频生成/理解将占大部分 AI 算力;
- Macro Hard 团队(Lead: Toby, John 等):构建全能数字人类模拟器,能在电脑上完成任何人能做的事(包括工程、医学、设计火箭);聚焦 GUI 代理(80-95% 软件有图形界面);其目标是模拟整个只靠数字输出的公司(例如 Microsoft),这将带来巨大经济繁荣。
3. 基础设施与支持团队介绍
- 核心产品基础设施/API 将支持所有产品线;
- 用领域专家(医学、金融、法律)评估模型,提升真实性和减少偏见;Grokopedia 已达 600 万文章,目标 Grok 5 无需外部搜索;
- Memphis 超级集群已经支持了 30 万+ GPU,正在扩张;这是世界最大超级计算机之一;单个数据中心 6 周内完成 850 英里光纤、2.7 万 GPU安装;从架构到电力垂直整合,追求最高效率(PUE)。
算力优势是 AI 公司成功关键,xAI 部署最快!
4. X 平台的计划
- X App 用户超 10 亿(安装量);下载/参与度大幅增长;已经开源了推荐算法;
- Grok Chat 将独立成 X Chat App(加密、音视频、多人、桌面分享);X Money 即将测试推出,目标是所有货币交易的中心。
5. xAI + SpaceX 的宏大愿景
- 理解宇宙需探索宇宙,当前地球能源仅用 1%,需扩展到太空获取太阳能量(百万倍潜力);
- 计划建立地球轨道数据中心(100-200 GW/年,未来 terawatt);月球工厂 + 质量驱动器(mass driver,发射 AI 卫星,达千 GW+);抵达火星及更远的地方;
最终将延伸意识之光到恒星,探索银河系,发现外星文明遗迹。“未来从未如此激动人心” - Elon Musk
显示更多