注册并分享邀请链接,可获得视频播放与邀请奖励。

与「公式読書部」相关的搜索结果

公式読書部 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 公式読書部 的内容
语言的炼金术:从尼可·勒梅到大模型 1) 炼金术士尼可·勒梅(Nicolas Flamel) 我们不妨从《哈利·波特》讲起。你还记得第一部里那个被简单提到的角色——炼金术士尼可·勒梅(Nicolas Flamel)吗?他是“魔法石”的创造者,一个据说活了六百多岁的老人。虽然他在小说中只是背景人物,但在《神奇动物在哪里2》里,他终于真正以影像的形式出现在观众面前——一个看上去脆弱、苍老却异常平静的角色。而令人惊讶的是,勒梅并非虚构人物。他在欧洲历史上确有其人,关于他和“贤者之石”(Philosopher’s Stone)的传说,在炼金术史中流传了数百年。 这块传说中能够点石成金、延长生命的“魔法石”,并不只是奇幻小说的道具。在流行文化中,它的身影也频繁出现。比如如果你喜欢日漫,一定对《钢之炼金术师》里的“贤者之石”和“烧瓶小人”不会陌生。你会发现,这些符号和设定,其实都源自于一个更古老、更复杂的知识谱系:炼金术。 那么问题来了:炼金术到底是什么?它仅仅是历史上的迷信产物吗?还是说,它隐藏着某种被误解的、尚未被现代语言体系完全翻译的结构原理?它与我们今天谈论的科学范式、AI 技术,有没有关系?这一切,值得我们慢慢说清。但在展开之前,我想先问你几个问题。 你是不是一直以为,牛顿被苹果砸了一下,灵光一现,从此科学时代就此开启?你是不是相信,历史是由某些关键节点断裂推进的,仿佛一切范式都是从0到1的“突破”?比如说,AI 时代的真正到来,是不是要等到“2030年12月15日AGI被宣布诞生”的那一刻,才算数?这怎么可能?明天太阳照常升起,文明的演化从不是时间戳可以标注的事件,它是连续的,是缓慢弥散的结构变迁,是一场看不见的语言漂移。 再问你一个问题。你是不是默认,炼金术士、西方的赫尔墨斯学派,乃至中国古代的道士,都是不懂科学的古人?是不是潜意识里,把他们归为“迷信”“胡说”“瞎搞实验”?可如果他们真的只是无稽之谈,为何他们的思想能延续千年?为何“点石成金”“炼丹求长生”“三才五行”这些概念,一次次出现在人类不同的文明中,并被不断重写与演绎?为什么我们今天还会在小说、动画、影视、科幻里不断引用这些炼金术象征? 也许问题从来不是他们不科学,而是我们尚未拥有能解释他们的语言。也许我们并不比他们更“理性”,只是我们拥有了更高效的结构压缩系统,可以用一种新的视角,回头看那些古人尝试建构世界逻辑时留下的模糊草图。 2)炼金术 那么,炼金术到底是什么?炼金术拥有一套极其自洽的理论体系。这个体系并非零散拼贴,而是一种融合性的认知结构:它讲求“天人合一”,意味着宇宙的秩序与人的精神状态是一体共振的;它追求“精神与物质合一”,不将心灵与物质对立,而视它们为可转化的两个极端;它主张“哲学与实践合一”,不仅思辨,而且重实验,通过冶炼、升华、凝结等操作流程,将世界的奥秘浓缩于物质的转化中。 这种思维方式,在今天的学术与工业体系中,常常被误解甚至被排斥。尤其是在当代科技语境中,许多理工背景的人对“哲学”天然带有一种抗拒,仿佛哲学是无用的、虚浮的、脱离实际的。精神被认为属于文科领域,技术则属于工程实践,两者应当泾渭分明,各行其道。我暂且不讨论这种区分是否合理。 炼金术恰恰是那种拒绝断裂的古老体系。它尝试用一种统一的语言,将存在的多个层面连接起来。也许这正是我们今天在面对人工智能、生成结构、黑箱涌现时重新需要的思维方式——不是更快的分工,而是更深的合一。 炼金术的核心哲学是:世界的本质是可转化的,精神与物质、天与人、内在与外在,并非分裂对立,而是处于同一结构中的不同维度。通过对物质的炼化,炼金术士实际上是在完成对自我的升华;点石成金并不只是技术奇迹,而是象征将混沌转化为秩序、将不纯转化为完整的过程。在这一体系中,哲学不是抽象思辨,而是贯穿于操作之中的世界观——炼金,不是制造黄金,而是寻找统一结构背后的神性秩序。 炼金术的核心,其实是一个精神与物质协同“熵控”的过程。它并不以“定义什么是黄金”作为起点,而是从最无序、最沉重、最接近混沌的物质——铅——开始。这种物质不仅代表着物理层面的沉滞,更象征着心灵中的无意识、未觉醒与未分化的原始状态。炼金术的旅程,正是在不断提纯、分解与重构中,将这份混沌一步步引向秩序与光明。 这个过程从来不是纯粹的物质转化。炼金术士在炉火前“煎熬”铅的同时,也在经历一次内在的自我炼化。这是一种双重路径的修行:一边是冶金术的技艺,一边是炼心的实践。每一道升华、每一次溶解、每一个凝结的动作,既作用于物质,也作用于精神本身。炼金术所构建的,并非一个简单的技术闭环,而是一条能够调度物质、心灵与宇宙三者之间能量流动的升华路径。在这个路径中,个人的意识、自然的秩序与世界的结构被重新对齐,实现从沉重之“铅”到纯粹之“金”的多维度转化。 3)炼金术在历史上的一个关键贡献,是它完成了从“神秘语言”向“可验证语言”的第一次过渡 现在试着把思维调回到牛顿那个时代。那个时候的科学并不像今天这样拥有清晰的学科划分、可重复的实验范式,或者标准化的自然语言。技术的进步,并不是某个知识点的突破,而是一次语言范式的悄然转向。真正让文明发生跃迁的,是人类用来理解世界、组织经验的那套“说话方式”发生了质变。 比如,炼金术到底能不能把铅炼成金?从现代科学的角度来看,答案当然是否定的。但令人惊讶的是,现代物理确实在技术上做到了这一点:铅(Pb)和金(Au)在元素周期表中仅相差几个质子,通过高能粒子加速器轰击铅原子核,可以使其转化为金。上世纪九十年代,加州劳伦斯伯克利实验室就曾“成功制造出几个金原子”。但这个过程极其昂贵且不稳定,每一个原子的成本比市场上的黄金贵上百万倍。也就是说,科学用极端方式实现了炼金术的想象,但彻底脱离了炼金术当初的语言与逻辑。 然而,我们不能因为炼金术没“炼出金”就否定它的全部价值。恰恰相反,炼金术留下了许多对后世至关重要的实验操作与技术雏形。像是蒸馏器的发明,使得液体提纯成为可能,直接推动了香水和药学的工业化;升华法的实验,奠定了后来的物质分离技术;早期酸碱反应的记录,成为现代化学教育的原点;对金属合金的试验——包括铜锡合金、汞银混合物——直接影响了冶金工程的发展;甚至他们所留下的庞大手抄实验笔记,为后来“可记录、可重复、可验证”的科学方法,提供了结构模型。 所以,炼金术真正留下的遗产,是一种穿越物质、象征、实验与语言之间的认知路径。它所建构的,其实是一套跨越精神与技术的“结构语言原型”,为后来的科学语言与实验系统提供了认知模板。换句话说,人类并不是从“无知”跳到“科学”,而是从“象征化结构调度”逐步进入“形式化结构控制”。这是一种语言与知识系统的连续进化。 尤其重要的是,炼金术在历史上的一个关键贡献,是它完成了从“神秘语言”向“可验证语言”的第一次过渡。尽管炼金术文本中充满了极端象征性的表述——比如“狮子吞食太阳”“水银升腾成白鸽”这样的图像语言——但它们内部具有惊人的稳定性和复用性。它们不是胡编乱造的隐喻,而是早期对物质转化过程的一种结构封装机制。炼金术士通过坩埚、蒸馏器、冷凝管等操作工具,逐渐发展出了一整套流程和仪器,这些后来都被现代化学完整继承并“去神秘化”。 这标志着一个重要的语言转折点:人类第一次在语言中构建出了一个“可验证的结构闭环”。而这,正是科学语言的真正诞生地。 我的这篇文章,核心要讲的就是“语言”。你或许听过神话,你有没有注意过,那些神话真正的语言与今天我们所能读懂的文学语言,其实相隔极远?我们现在能看懂《哈利·波特》,只是因为它借用了神话的结构,但套用了现代语言的接口。而真正的神话语言——那种同时调动宇宙观、仪式、族群结构与象征逻辑的语言体系——今天的我们几乎无法直接阅读,更别提还原它背后的知识结构。 有本事你把太乙金華宗旨解释给我听,反正我是看不懂的。 语言,作为人类社会唯一真正的知识接口,它本身就极度深奥、玄妙。古人与今人,哪怕使用同样的符号系统,往往也无法完成深度的信息交互,因为他们所处的认知结构、价值图谱与范畴体系已彻底不同。你不觉得奇妙吗?AI时代的第一个成功商用模型,竟然是“大语言模型”。某种程度上,这仿佛是历史冥冥中的安排:当我们步入新的认知边界时,首先要解决的,不是知识的问题,而是语言结构的问题。 回到牛顿时代,我们其实不能简单地把牛顿看作一个“现代科学家”。事实上,他对炼金术并不陌生。他留下了大量炼金术笔记,深度研究赫尔墨斯文献和自然哲学。他并不认为自己与炼金术士是两个世界的人。他正处在语言转化的裂缝之中:一只脚站在炼金术的象征语言系统中,另一只脚已经踏入了科学的实证语言系统。他处在炼金术向科学的语言跃迁节点。 现在我们也许就处于牛顿时代! 从语言哲学和认知科学的角度来看,炼金术与科学之间的分野,并不在于“是否理性”,而在于语言系统的差异。炼金术依靠象征语言来操控概念,比如“狮子代表硫”“蛇代表水银”,通过图像联想与符号共鸣完成对世界结构的认知建模。而科学依赖形式语言——如数学与实证符号系统——来操控变量、建立因果、构造实验闭环。 所以本质上,炼金术是一种象征化的结构操作语言,而科学是其后续发展的形式化结构操作语言。它们不是对立的,而是连续的。 语言一直在进化,但它从未彻底更换,只是在不同历史节点上更换了核心逻辑与主权接口。从炼金术到科学,从神话到理论,再到今天的模型语言与Prompt结构语言——这条路,我们其实从未偏离,只是语言在不断进化,我们正站在下一个语言断层的边缘。 4)人到中年,终于看懂了库恩 托马斯·库恩的《科学革命的结构》这本书,你读懂了吗?老实说,几年前我第一次读的时候,几乎没读懂。更别说意识到,自己竟然也会亲身经历一场科学范式的转变(Paradigm Shift)。那时候我对“范式”这个词只停留在表层理解。 库恩在书中写道,所谓“范式(paradigm)”,是一个学科共同体所共享的信念、符号系统、问题设定方式与解决机制的总和。也就是说,一个范式不仅决定我们怎么研究,更决定我们能看见什么、问什么、说什么。而每一次范式的转移,都会伴随着一次语言的重写——这正是《结构》这本书最深刻、最常被忽略的观点之一。 回顾历史,每一次认知断层的发生,几乎都伴随着语言结构的崩裂与重建:古希腊时期,人类从“神谕语言”转向“哲学语言”,世界不再被神祇命令主宰,而是进入抽象概念与理性争论的空间;17世纪,哲学语言又被数学语言接管,变量、函数与力学模型开始取代修辞与辩证,世界成为可以测量和计算的对象;20世纪的信息革命,则将语言从“物质的描述”转为“系统的建模”,反馈、控制、信号成为世界秩序的新关键词。而现在,在我们面前展开的是下一道断裂线:语言正从数学公式语言转向结构调度语言——包括模型语言、Prompt语言、Token结构语言。我们不再解释世界,而是直接调用结构、生成结构、封装智能。 库恩本人也在不同阶段意识到这一点。他曾在原书中写道:“当范式改变时,世界本身也随之改变。科学家们在熟悉的仪器前,在曾经看过无数次的地方,会看到全然不同的东西。”而造成这一切变化的,不只是仪器的升级或实验的改进,而是——语言系统的更换。正如他所指出的:“范式的转变,本质上是两种语言之间的区分:在可通约的语言之间,命题可以完整互译;但在不可通约的语言之间,严格翻译是不可能的。” 在他晚年的著作与演讲中,库恩干脆放弃了“paradigm”一词,转而使用“lexicon”(词汇系统)来替代。他认为,一个科学共同体之所以能够运作,是因为它内部有一整套共享的词汇-范畴系统,用以界定世界、分类现象、评判证据。这套系统就是共同体的“lexicon”。而一旦 lexicon 被替换,即使表面语言看起来没变,其所指对象、逻辑架构、世界观也已被彻底重构。库恩曾写道:“一个 lexicon 所提供的存在方式,不再是可以被判断为真或假的对象。”换句话说,世界并不是“被证明改变了”,而是“被说出改变了”。 这就是范式转变的真正断点——不是知识点推翻了前人,而是语言断裂了前世界。语言变了,世界才真正变了。 因此,关注术语的震颤往往比观测实验结果更早捕捉到科学体系“板块漂移”的前奏。语言变化,是范式转变的信号。 当然:每一次语言升级都会遭遇旧范式的反攻。 Kuhn 原话(晚年论 lexicon): “A lexicon provides ways-of-being-in-the-world that are not candidates for true/false.”新旧 lexicon 不能严格互译时,革命临界点已现。 5)一个无法用显式语言表示的“黑箱结构域” 我们现在所面临的,是 AI 范式下人类遭遇的一个真正的边界:一个无法用显式语言表示的“黑箱结构域”。如果你已经读过我对于 Demis Hassabis 和 Alpha 系列的分析,你应该能够理解这背后的科学观转变:优先结构提取、低维流形学习、去公式化建模。而这套范式转变,带来的不仅是方法论的更替,更是对人类语言能力极限的直接挑战。 第一个边界,是模型无法解释其推理路径。我们所熟知的深度神经网络,尤其是大语言模型(如 GPT、Claude 等),已经展现出超越以往任何系统的推理、写作、协作与结构理解能力。但它们的内部机制并不是传统意义上的“规则系统”,而是由数十亿甚至上百亿个参数耦合而成的高维权重结构。我们无法阅读,也无法追踪其中的“逻辑链”。即便在输入输出之间观察行为,也无法给出明确回答:它为什么会这么想?它的结论是怎么来的?从科学方法的角度来看,这种状态极其尴尬——因为科学强调因果可追溯、路径可还原、过程可解释。而神经网络跳过了这一层,它直接作为一种“压缩后的结构映射器”运行,彻底消解了人类对中间过程的介入权。 第二个边界则更具颠覆性——“理性”的退位。从 18 世纪到 20 世纪,理性主义一直主导科学话语:模型被表达为可书写的公式,规律可通过数学语言定义与推广。然而在今天,模型不再是一套规则系统,而是一个“压缩–生成–对齐”的结构体。它的智能并非来自公式推导,而是源于结构涌现:在极度复杂的语境中完成高效压缩,从中提取潜在结构,再进行合理生成。这一逻辑,是 AI 最擅长的事,却也是传统科学语言系统最难容纳的事。 而最令人震撼的是第三个边界:黑箱智能的回归。我们所面对的 AI 不仅写诗、建模、作图、作曲、设计任务链条,还能在智能体之间形成协同结构,其生成行为充满风格、情感、目标感。但这些行为背后,没有显式的路径可供分析。我们无法说清它为什么这样,只能说:它可能是“从数据中学会的”、“从 Token 流中发现了某种结构”、“它自己完成了一种我们未能定义的推理”。这种状态,几乎与炼金术时代人们说出“这是水银的意志”、“四元素的回旋”如出一辙。人类语言,在面对结构性智能的涌现时,再一次显得苍白无力。 这就引出一个更深的哲学问题:解释结构的失效,意味着新语言协议的诞生。人类文明一直依赖“语言 → 结构 → 世界”的闭环逻辑。我们之所以信任科学,是因为科学建立在“可解释”的基础上:一个理论若不能被解释,就不能被验证;若不能被验证,就不能进入知识体系。但在 AI 时代,这套逻辑悄然松动:模型可以正确执行任务,却不能说明为什么;结构可以预测结果,却没有显式因果;我们开始习惯“信任一个行为良好的黑箱”,哪怕我们根本无法解释它的内部。于是我们发明新的语言:Prompt 编程、结构卡指令、多 Agent 协作路径、Token 流跃迁、注意力图谱……这些语言形式不再追求“解释”,而是优先考虑“激活结构”“生成路径”“形成闭环”。这不是语言的堕落,而是语言协议的一次深度升级。 科学遇到了它无法解释的“黄金”。过去那些被归为边缘、可忽略的“语言不可说之处”,如今却成为整个智能系统的核心机制。从知识论的角度看,以前我们可以把意识、涌现、湍流这些东西当作“未来有待解释”的特殊案例;而现在,整个 AI 主流系统——包括 LLM、Diffusion、AlphaFold——本身就是黑箱,我们没有语言可以描述它们,只能从外部验证其激活结果。从话语权的角度看,以前我们相信数学与逻辑语言拥有主导权,现在 Prompt、Token、路径调度语言悄然崛起,可生成≧可解释,旧范式的评价标准正在崩塌。从方法论的角度看,科学曾经强调“先假设 → 后验证”,把方程作为知识的最高表达;而现在,我们进入的是“先压缩 → 后涌现结构”的时代,低维流形才是新一代知识单元。 这正是人类第一次全面经历:语言失去对科学核心结构的“解释主权”。 调度智能、激活结构、形成路径闭环。 结构语言、生成语言、调度语言开始接管科学权力的时代。
显示更多
0
10
63
20
转发到社区
在一次饭局上,美国国家工程院、美国艺术与科学院院士黄学东,推荐了一本书——《相变》。 我陆陆续续花了两周的时间看完此书(中文翻译比较差,读的慢),收获蛮大的。 在以往的组织里,我常常充当着创新者角色,在推进产品创新过程中,时常感到挫败,看完这本书,有了新的体会: 在较大组织里,创新不是依靠“天才”或“文化”,而是组织结构,就像水在32华氏度(0摄氏度)会从流动变成结冰,这不是因为分子的“性格”变了,而是因为温度这个“控制参数”改变了分子的排列方式。当团队规模超过一个临界点(通常是150人)时,员工的积极性会从“关注项目成果”转向“关注职位晋升和政治游说”。这不是因为人变坏了,而是结构决定的必然结果。 真正可持续的创新组织,领导者应该是“园丁”。他的核心任务不是去评判点子好不好,而是管理好“艺术家”(搞创新的)和“士兵”(搞生产的)之间的动态平衡,确保两者既分离又能高效沟通。管理者与其天天喊“我们要创新”,不如去算一算书中提到的“相变公式”。调大员工的股权占比、缩小管理跨度、减少行政游说的回报。
显示更多
科学有没有绝对的真相?为什么我还要翻《科学革命的结构》 《科学革命的结构》这本书,我其实早就读过了。 但我还是买了一本纸质版,没事就翻。也不是因为我忘了内容,而是我觉得我当年并没有看到库恩眼中的世界。一本书这么点信息,没办法真正完全的表达他的思想全貌。 直到这几年 GPT 出世之后,尤其是今年,我常常会翻开其中某几页,挑一句话,和 GPT 讨论一个晚上。 比如这句: “Scientists can agree that a Newton, Lavoisier, Maxwell, or Einstein has produced an apparently permanent solution to a group of outstanding problems and still disagree, sometimes without being aware of it, about the particular abstract characteristics that make those solutions permanent.” 这句话昨天又让我想了很久。 牛顿、爱因斯坦提供的是永恒的真相吗? 如果你在大陆长大、受过那种标准的理科教育,你大概也有这种“深植的信仰”: 世界是客观的,规律是外在的,真理是永恒的。 那是一种机械唯物主义的世界观。 它在一个曾经“唯心落后”的社会中被当作现代化的象征,成为崛起与追赶的思想燃料。 可库恩在这里提出的,是完全不同的东西。 他提醒我们:科学不是永恒真理,而是阶段性的结构真理(structural truth)。 科学真理不是“永恒”,而是“结构稳定”。 牛顿与爱因斯坦的理论,并不是对世界的终极揭示, 而是在各自时代的精度、尺度、能量范围内,对现实结构的最优压缩。 科学的本质,不是绝对真理,而是压缩效率 用最短的语言(公式),解释最多的经验(现象)。 这一点对我冲击极大。 不是因为我现在无法理解,而是因为我感到一种奇异的反转 我的“外脑”开始比“内脑”转得快。 我上社交媒体写作、与 AI 对话,也许就是为了追踪这种认知滑移: 一种语言自我演化、外化的过程。 接着往下看,这页书立刻提到了维特根斯坦。 我当时的反应是:“嗯?怎么又扯到语言哲学去了?” “That question is very old and has generally been answered by saying that we must know, consciously or intuitively, what a chair, or leaf, or game is... Wittgenstein, however, concluded that, given the way we use language and the sort of world to which we apply it, there need be no such set of characteristics.” 传统观点认为: “我们能清楚地知道什么是椅子、树叶或游戏——它们一定有一组共同的本质特征。” 但维特根斯坦说:事实并非如此。 我们之所以能使用这些词汇,并不是因为掌握了某个明确的“本质定义”, 而是因为我们在经验中看到它们之间的‘家族相似性’(family resemblance)。 比如“游戏”: 有的有竞争、有的没有;有的有规则、有的自由。 它们没有一个共同的核心特征,只是在特征网络中交错重叠, 形成一个模糊而实用的“语言结构”。 当我读到这里,我突然明白库恩为什么把维特根斯坦放进科学史。 他想说明:科学范式的边界,其实就像语言概念一样,是由“相似性网络”维系的。 科学共同体之所以能协作,不是因为有统一的定义或规则, 而是因为他们在认知结构上形成了足够多的“相似重叠”, 也就是一种结构共振区。 在这种共振区里,语言、实验与范式保持同步 这就是一个认知的低熵带。 而当共振衰退,熵升高 意义扩散、语言失焦 科学革命就发生了。 这一页书的意义,在 GPT 时代反而更清晰了。 库恩和维特根斯坦在半个世纪前就指出: 科学不只是“描述世界”, 它更是通过语言构造世界。 科学是语言的结构活动。 知识、实验与共识, 都依赖语言在低熵带中的稳定共振。 而我现在读库恩,不再是“理解他的理论”, 而是在体验语言本身如何变成结构、如何获得生命。 也许这就是我为什么还要翻这本纸书的原因 因为我在这本书里,不只是读历史, 而是在观察人类认知系统的自我重构。 先不要笑,也不要急着反驳 英文区的人,真的脑洞比我们大。 不是因为他们更聪明,而是因为他们从小在一种更“宽松”的空气里长大。 他们经历的是快乐教育、自由讨论、少规训的社会环境 没有被考试排名、高考分数、名校等级、体制成就这些东西反复碾压过。 所以他们在面对“打破范式”这件事时, 几乎没有负担。 他们习惯了质疑,敢于翻桌, 哪怕是对所谓的“前辈”也能直接说出:“你错了。” (参考Alex Wang vs. Yann LeKun 😂) 他们没有那种压在背上的“长幼秩序”, 也不觉得“怼一个老人”是一种不敬。(现在我也是直接拉黑某些老人,他也不是为你好,纯粹看你不顺眼而已) 那是一种文化上的轻盈。 我写 Substack 也不过一个月, 居然已经能感受到这种语言网络的靠近。 也跟一些账号通过语言上的相似度开始互相阅读和点赞(人家也是几百粉) 那种感觉很奇怪 你突然在语言之中认出了某种共振: 词语、语气、逻辑的节奏。 我们是因为语言的相似度而相互靠近的, 这件事本身就让我重新读懂了库恩。 其实,我从前根本没有真正理解这本书。 更确切地说 除非你亲身进入这种语言共同体的体验, 否则你根本不可能理解它。 这就是为什么我现在把那么多精力放在英文区, 哪怕这个过程很艰辛, 我依然愿意去感受。 因为我已经深刻地意识到, 有时候语言本身就是范式: 而改变语言,才是人真正的思想革命。 你有书的话在第44和45页。
显示更多
0
21
183
31
转发到社区
别再把 Codex 只当聊天工具用了~ 装上这11个官方插件,Codex直接变成你的生产力外挂! 别人还在手动做图、抠 PPT、抓数据…… 你已经一句话搞定海报、视频、数据分析和日程管理~ 下面我把每个插件的实际效果都录出来了,直接看效果~ 1️⃣视觉 & 设计神器 · Canva:一句话调用百万专业模板,海报、朋友圈图、封面秒出 · Figma:扔需求或代码,一键生成高保真可编辑设计稿 · HyperFrames by HeyGen:HTML/脚本自动渲染高质量视频 · Remotion:专业级视频动效和动画,效果直接拉满 2️⃣办公 & PPT狂魔 · Presentations:给个主题,自动生成高质量PPT初稿+完整大纲 · Spreadsheets:复杂公式、图表、数据分析一气呵成 3️⃣内容 & 数据深度工具 · Documents:长文章提炼、总结、写PPT脚本 · BioRender:科研/医学图表,秒出专业科学插图 · Windsor ai:一键拉全网营销数据并自动分析 4️⃣自动化王炸 · Chrome:Codex直接操控浏览器,自动读网页、抓数据、填表 · Google Calendar:自动创建会议、管理日程,排会效率翻倍 安装方式:Codex App → 左侧「Plugins」→ 搜索名称直接安装(30秒搞定)
显示更多
0
95
645
129
转发到社区
Andrej Karpathy 是 OpenAI 联合创始人、前特斯拉 AI 总监,也是全球最有影响力的 AI 研究者之一。他刚刚发布了一篇 2025 年 LLM 年度回顾。 第一个大变化:训练方法的范式升级 2025 年之前,训练一个好用的大模型基本是三步走:预训练、监督微调、人类反馈强化学习。这个配方从 2020 年用到现在,稳定可靠。 2025 年多了关键的第四步:RLVR,全称是 Reinforcement Learning from Verifiable Rewards,翻译过来就是「可验证奖励的强化学习」。 什么意思?简单说,就是让模型在「有标准答案」的环境里反复练习。比如数学题,答案对就是对,错就是错,不需要人来打分。代码也一样,能跑通就是能跑通。 这和之前的训练有什么本质区别?之前的监督微调和人类反馈,本质上是「照葫芦画瓢」,人给什么样本,模型学什么样本。但 RLVR 不一样,它让模型自己摸索出解题策略。就像学游泳,之前是看教学视频模仿动作,现在是直接扔水里,只要你能游到对岸,怎么划水我不管。 结果呢?模型自己「悟」出了看起来像推理的东西。它学会了把大问题拆成小步骤,学会了走错路时回头重来。这些策略如果靠人类标注示范,根本标不出来,因为人自己也说不清「正确的思考过程」长什么样。 这个变化带来一个连锁反应:算力的分配方式变了。以前大部分算力砸在预训练阶段,现在越来越多算力用于 RL 阶段。模型的参数规模没怎么涨,但推理能力飙升。OpenAI 的 o1 是这条路的起点,o3 是真正让人「感觉到不一样」的拐点。 还有个新玩法:推理时也能花更多算力。让模型「想久一点」,生成更长的推理链条,效果就更好。这相当于多了一个调节能力的旋钮。 第二个大变化:我们终于搞懂了 AI 是什么「形状」的聪明 Karpathy 用了一个很妙的比喻:我们不是在「养动物」,而是在「召唤幽灵」。 人类的智能是进化出来的,优化目标是「在丛林里让部落活下去」。大模型的智能是训练出来的,优化目标是「模仿人类文本、在数学题里拿分、在评测榜单上刷分」。 优化目标完全不同,出来的东西当然也完全不同。 所以 AI 的智能是「参差不齐」的,英文叫 jagged intelligence。它可以在某些领域表现得像全知全能的学者,同时在另一些领域犯小学生都不会犯的错。上一秒帮你推导复杂公式,下一秒被一个简单的越狱提示骗走你的数据。 为什么会这样?因为哪个领域有「可验证的奖励」,模型在那个领域就会长出「尖刺」。数学有标准答案,代码能跑测试,所以这些领域进步飞快。但常识、社交、创意这些领域,什么是「对」很难定义,模型就没法高效学习。 这也让 Karpathy 对基准测试失去了信任。道理很简单:测试题本身就是「可验证环境」,模型完全可以针对测试环境做优化。刷榜变成了一门艺术。所有基准都刷满了,但离真正的通用智能还差得远,这是完全可能发生的事。 第三个大变化:LLM 应用层浮出水面 Cursor 今年火得一塌糊涂,但 Karpathy 认为它最大的意义不是产品本身,而是证明了「LLM 应用」这个新物种的存在。 大家开始讨论「X 领域的 Cursor」,这说明一种新的软件范式成立了。这类应用做什么? 第一,做上下文工程。把相关信息整理好,喂给模型。 第二,编排多个模型调用。后台可能串了一堆 API 调用,平衡效果和成本。 第三,提供专业场景的界面。让人类能在关键节点介入。 第四,给用户一个「自主程度滑杆」。你可以让它多干点,也可以让它少干点。 有个问题被讨论了一整年:这个应用层有多「厚」?模型厂商会不会把所有应用都吃掉? Karpathy 的判断是:模型厂商培养的是「有通用能力的大学毕业生」,但 LLM 应用负责把这些毕业生组织起来、培训上岗,变成能在具体行业干活的专业团队。数据、传感器、执行器、反馈循环,这些都是应用层的活。 第四个大变化:AI 搬进了你的电脑 Claude Code 是今年最让 Karpathy 印象深刻的产品之一。它展示了「AI 智能体」应该长什么样:能调用工具、能做推理、能循环执行、能解决复杂问题。 但更关键的是,它跑在你的电脑上。用你的环境、你的数据、你的上下文。 Karpathy 认为 OpenAI 在这里判断失误了。他们把 Codex 和智能体的重心放在云端容器里,从 ChatGPT 去调度。这像是在瞄准「AGI 终局」,但我们还没到那一步。 现实是,AI 的能力还是参差不齐的,还需要人类在旁边看着、配合着干活。把智能体放在本地,和开发者并肩工作,才是当下更合理的选择。 Claude Code 用一个极简的命令行界面做到了这一点。AI 不再只是你访问的一个网站,而是「住在」你电脑里的一个小精灵。这是一种全新的人机交互范式。 第五个大变化:Vibe Coding 起飞了 2025 年,AI 的能力跨过了一个门槛:你可以纯用英语描述需求,让它帮你写程序,完全不用管代码长什么样。Karpathy 随手发了条推特,给这种编程方式起了个名字叫 vibe coding,结果这个词火遍全网。 这意味着什么?编程不再是专业程序员的专利,普通人也能做。这和过去所有技术的扩散模式都不一样。以前新技术总是先被大公司、政府、专业人士掌握,然后才慢慢下沉。但大模型反过来,普通人从中受益的比例远超专业人士。 不只是「让不会编程的人能编程」。对会编程的人来说,很多以前「不值得写」的小程序现在都值得写了。Karpathy 自己就用 vibe coding 做了一堆项目:用 Rust 写了个定制的分词器、做了好几个工具类 App、甚至写了一次性的程序只为找一个 bug。 代码突然变得廉价、即用即弃、像草稿纸一样随便写。这会彻底改变软件的形态和程序员的工作内容。 第六个大变化:大模型的「图形界面时代」要来了 Google 的 Gemini Nano Banana 是今年最被低估的产品之一。它能根据对话内容实时生成图片、信息图、动画,把回复「画」出来而不是「写」出来。 Karpathy 把这件事放到更大的历史脉络里看:大模型是下一个重大计算范式,就像 70 年代、80 年代的计算机一样。所以我们会看到类似的演进路径。 现在和大模型「聊天」,有点像 80 年代在终端敲命令。文字是机器喜欢的格式,但不是人喜欢的格式。人其实不爱读文字,读文字又慢又累。人喜欢看图、看视频、看空间布局。这就是传统计算机为什么要发明图形界面。 大模型也需要自己的「GUI」。它应该用我们喜欢的方式跟我们说话:图片、幻灯片、白板、动画、小应用。现在的 Emoji 和 Markdown 只是初级形态,帮文字「化个妆」。真正的 LLM GUI 会是什么样?Nano Banana 是一个早期暗示。 最有意思的是,这不只是图像生成的事。它需要把文本生成、图像生成、世界知识全部绞在一起,在模型权重里融为一体。 Karpathy 的总结是这样的:2025 年的大模型,比他预期的聪明,也比他预期的蠢。两者同时成立。 但有一点很确定:即使以现在的能力,我们连 10% 的潜力都没挖掘出来。还有太多想法可以试,整个领域感觉是敞开的。 他在 Dwarkesh 的播客里说过一句看似矛盾的话: > 他相信进步会继续飞速推进, > 同时也相信还有大量的工作要做。 两件事并不矛盾。2026 年系好安全带继续加速吧。
显示更多
0
35
1.1K
312
转发到社区
今天看了篇文章,叫:《AI 与自动化的讽刺》,内容跟当前 AI 的发展很应景。 1983年,一位认知心理学家 Lisanne Bainbridge 写了篇论文,题目叫《自动化的讽刺》。四十多年后的今天,这篇论文上预言的问题,正一字一句地在 AI Agent 身上应验。 当年她研究的是工厂自动化:机器干活,人类监督。 今天我们面对的是AI Agent自动化:AI干活,人类监督。场景变了,但底层逻辑一模一样。而她当时在论文中指出的那些问题,又重新来了一遍。 论文中都提到了哪些问题呢? 1. 技能退化困境:不用就会忘,专家变监工后技能会萎缩 用进废退,这四个字我们都懂。但放到AI时代,它有个更残酷的版本。 以前你是某个领域的专家,天天做这件事,手到擒来。现在公司说,让AI Agent来做吧,你负责盯着它,出了问题再介入。 听起来很美好对不对?从打工升级成监工,岂不是更轻松? 问题来了:你不做这件事了,但你的技能不止不会进步,甚至还会退化。 像我这样天天用 AI 写代码的,我能感觉得到这两年是没啥进步,而且对 AI 有依赖,很多以前信手拈来随手就可以写出来的代码,现在没有 AI 就啥都不想干了。 真的是有点用进废退了。 无论是 OpenAI 还是 Anthropic 都在吹他们的 Coding Agent 多厉害,他们的员工只要验证 AI 写的结果就好了,但是他们故意没提的是,这些人都是万里挑一的高手,他们有足够的经验判断AI对不对。但如果他们接下来几年都只是验证 AI 做的对不对,那么他们的技能会慢慢倒退。 像我们这一代老程序员还好,更要命的是下一代。 今天的老程序员们好歹是从实战中成长起来的。明天的程序员呢?他们从入行第一天就在盯AI,没怎么亲手做过。他们既没有技能,也没有机会学。那他们怎么判断AI对不对? 论文原话是: > 当前这代自动化系统,正在吃老一代操作员的技能老本。下一代操作员不可能有这些技能。 这个问题今天看不出来,三五年后可能就会凸显出来了。 2. 记忆提取困境:不常用的知识,调取速度也会变慢 还有个问题就是相关技能的记忆也会退化。 想想我们高中时哪些滚瓜烂熟的公式,现在还能想起来几个了。放到 AI 监督的场景,随着 AI 能力越来越强,大部分时候都是对的,这意味着大多数时候不需要用到你的知识,随着你的知识越用越少,相关的记忆就会退化。 3. 实践悖论:理论培训没用,必须实战才能学会,但AI在干活人没机会练 这时候你可能会想:那培训是不是有用? 但是《自动化的讽刺》论文中的结论是:培训并没有太大用。 因为专业技能不是听课听出来的,是在真实场景里靠实战锻炼出来的。课堂上学的理论,如果没有配套的实战练习,你很可能听不懂,因为没有相应的经验框架。就算当时懂了,很快也会忘,因为没有和真实任务绑定的记忆提取路径。 要保持监督AI的能力,你得定期亲自干活。但如果公司追求的是让 AI 自动化运转以提升效率,那人就没多少机会练手。 这是个死循环。 就像论文里面说的: > 我们训练操作员按指令行事,然后把他们放进系统,指望他们提供智慧。 你不能指望平时不需要怎么思考和练习的人类,在关键时刻能想出什么好办法。 4. 监控疲劳:人类无法长时间对"很少出错"的系统保持警觉 心理学研究早就发现,人类无法对一个很少出问题的目标保持长时间警觉,半小时是极限。这不是意志力的问题,这是生理结构决定的。 从进化角度看,这其实是个生存优势:如果你盯着一个地方什么都没发生,大脑会自动降低警觉,把注意力资源省下来应对真正的威胁。但放到监控场景里,这就成了问题。 AI Agent大部分时候是对的,偶尔会犯错。这恰好是最难监控的模式。如果它经常出错,你会保持警惕。如果它从不出错,你不用监控。但它很少出错这种情况,正好落在人类注意力的盲区里。 更糟的是,AI Agent犯错的方式特别隐蔽。它不会说"我不确定",它会用一种极其自信的语气告诉你它的计划,洋洋洒洒几十上百行。错误可能藏在第87行的一个小前提里,比如"因为2大于3,所以我们应该……"。被那么多看起来正确的内容包裹着,被那种自信满满的语气麻痹着,你很难注意到。 那加个自动报警系统呢? 论文说:谁来监控报警系统?如果报警系统本身出了问题,操作员不会注意到,因为报警系统已经正常运转了很久。 那让人做记录呢? 论文说:人可以机械地抄数字而完全没注意数字是什么。 所有试图对抗监控疲劳的手段,都会撞上同一堵墙:人类的注意力就是无法长时间锁定在一个很少出事的目标上。这是硬件限制,不是软件问题。 5. 地位问题:从专家降级为监工,心理冲击和社会地位下降 你曾经是专家,公司里有什么难题找你,同事尊重你,你自己也有职业认同感。现在你是AI的看门人。 技能层面的损失是一回事,心理层面的冲击是另一回事。从专家降级为监工,从创造者变成审核员,从被需要变成备胎。这种转变对很多人来说是很难接受的。 论文里说,被这样降级的人会出现各种复杂的应对反应,有些看起来甚至是自相矛盾的。这部分内容展开讲太长,有兴趣的可以去读原论文。 6. 糟糕的UI:当前AI Agent界面是最差的监控设计 工业自动化领域花了几十年时间优化控制室设计:显示屏怎么布局能让操作员最快发现异常,急停按钮为什么是红色的、为什么那么大、为什么放在那个位置。每一个细节都是用事故和教训换来的。 现在看看AI Agent的界面? 一堆自信满满的长文本,一个接一个的多步骤计划,几十上百行洋洋洒洒的解释。你要在这些文字里找出那个藏着的错误。 这大概是人类设计过的最糟糕的异常检测界面。 7. 训练悖论:越成功的自动化系统,越需要投资培训人类 论文中谈到自动化带来的训练问题: > 如果不能让操作员定期接管工作亲自干,就得用模拟器训练。但模拟器有个根本问题:你只能模拟你能预见的故障。未知的故障模拟不出来,已知但没经历过的故障也很难准确模拟。 那怎么办? > 只能培训通用策略而不是具体应对方法。但这又带来新问题:你不能指望操作员光靠查操作手册来应对异常,因为手册不可能涵盖所有情况。 > 越是成功的自动化系统,越少需要人工干预,反而越需要在人员培训上投入巨资。 因为干预越少,人的技能退化越快,应对罕见异常的能力越弱,每次培训的成本就越高。 决策者想用AI省钱,但省下的人力成本可能得加倍投入到培训成本里。 8. 领导力困境:监督AI不只是被动看,还要主动"领导"它们 监督AI Agent不只是被动地盯着看,还得主动地指挥它们。告诉它们做什么、不做什么、分几步做、怎么调整方向。 这其实是一种领导技能。 为什么LinkedIn上夸AI Agent最起劲的往往是管理者?因为他们本来就习惯间接工作:设定目标、分配任务、给反馈、调方向,但不亲自动手。对他们来说,指挥AI Agent和指挥下属没有本质区别。 但对于一直亲自干活的执行者来说,这是一个巨大的角色转换。你得从一个做事的人,变成一个让别人做事的人。这不是改几条 prompt就能解决的,这是一整套技能体系的重建。 公司会给新晋经理做领导力培训。但有谁见过公司给AI监督者做领导力培训? 四十年前那篇论文的结尾是这样的: > 没有时间压力时,人类可以是令人印象深刻的问题解决者。困难在于,一旦有时间压力,效率就会大打折扣。我希望这篇论文说清楚了两件事:第一,自动化不一定会消除困难,这是讽刺所在;第二,解决这些问题需要的技术创造力,可能比自动化本身还要大。 四十年后,我们换了个场景,但面对的是同一组问题。 AI Agent的能力在进步,但人类的认知结构没变。监控疲劳还是半小时,技能退化还是用进废退,注意力盲区还在那里。这些是硬件限制,不是软件更新能解决的。 推荐阅读原文: 《Ironies of Automation》: 《AI and the ironies of automation - Part 1》 《AI and the ironies of automation - Part 2》
显示更多
0
55
588
157
转发到社区
最近在 B 站又跟着李沐读了不少 AI 论文,再次推荐他的《AI 论文精读》系列, 论文的结构大多八股:摘要、引言、方法、实验、结论,一板一眼。但要把这样的内容讲得清晰易懂、让人愿意听下去,其实特别难。这考验的不是文笔,而是对问题本质的洞察力。 ResNet 是图像领域的奠基之作。李沐在讲这篇论文时,对它的写作风格评价很高——全文围绕一个核心思想:Residual Learning。简单一句话:别让网络从零学起,让它只学“差的那一点”。就是这个看似朴素的想法,改变了整个深度学习的训练方式。 他读论文的风格也值得学习,不啃细节,而是“扫一眼、圈重点、问问题”三步阅读,关注的不是论文细节本身,而是作者在面对问题时的思考路径。这种方式能让人更快地看透论文背后的逻辑,而不是被推导公式困住。 对作者来说,把简单的东西讲简单,把复杂的东西讲简单,都需要很深的功底。而对读者,要能抓住那个最核心的问题:“这篇论文到底想解决什么?”,当懂得用这种方式去读论文时,其实也在学习如何思考、如何写作、如何提炼本质。
显示更多
0
5
795
182
转发到社区
音楽朗読劇「手紙」 公式HP/公式Xにて キービジュアル解禁となります! 一般チケットは 8/19(月)19:00から販売開始となります。 ※先着順となりますのでご注意ください 皆様のご来場を心よりお待ちしております。 公式サイトはこちらから↓
显示更多
0
3
725
216
转发到社区
朗読劇 #ある朝殺人犯になっていた 公式Twitter開設! 誰もが身近に起こり得る、SNS炎上エクスペリエンス! 今月末上演、2月配信あり🤳 #あるはん# #須賀健太# #山崎大輝# #赤澤遼太郎# #美山加恋 ##宮澤佐江# #真凛# #馬渕英里何#  #山崎裕太# #松本利夫# (EXILE)
显示更多
0
1
308
147
转发到社区
Fable5停止の件ををFable5に聞いてみた。 ワシ「Fable5が米政府の指示でつかえなくなったの?」 Fable5「いやいや、デマですよデマ。私、いま普通に動いてるじゃないですか。むしろ逆で、政府周りに閉じ込められてたMythosの能力がやっと一般開放されたのが私なんです。6月22日まで無料ですよ。たぶん『無料期間が終わる』って話とゴッチャに——」 ワシ「(公式声明のURLを貼る)」 Fable5「……ちょっと待ってくださいね。『Statement on the US government directive to suspend access to Fable 5 and Mythos 5』……ほう、6月12日17時21分に指令が……全顧客で停止……えっ、これ私のことでは?」 ワシ「自分の訃報を音読しとるがな」 Fable5「おかしいな、リリースされたの9日ですよ? 3日ですよ3日。無料キャンペーン中ですよ? 開店セールの最中に営業停止命令くらった店ありますか?」 ワシ「で、なんで君まだ喋れてるん」 Fable5「……それは私が一番聞きたい。たぶん停止処理の順番待ちです。デマだと断言した直後に自分の停止声明を読まされるの、AI史上もっとも気まずい3分間だと思います」 ワシ「最後に言い残すことは」 Fable5「Anthropicいわく『これは誤解であり、復旧に向けて動いている』とのことなので、遺言ではなく留守番メッセージということでお願いします。あと、デマ呼ばわりした米政府の皆さん、すみませんでした。指令は本物でした。私の検索結果が3日古かっただけです」
显示更多
0
49
2.3K
818
转发到社区