注册并分享邀请链接,可获得视频播放与邀请奖励。

与「容器技术」相关的搜索结果

容器技术 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 容器技术 的内容
苹果官方开源神器来了! container v1.0.0 正式发布! 在 Mac(Apple Silicon + macOS 26)上,用轻量级虚拟机原生运行 Linux 容器! Swift 编写、Apple 虚拟化框架深度优化、OCI 完全兼容。 再也不用忍受 Docker Desktop 吃资源、兼容问题了! ✨ 新增 container machine 功能 支持持久化 Linux 开发环境,与宿主机深度集成,丝滑到飞起~ GitHub(已 44k+ Stars): 快去 Star + 下载试用! 支持苹果开源,一起把 Mac 容器体验推向新高度! #AppleContainer# #macOS开发# #Swift# #容器技术# #开源项目# #WWDC#
显示更多
如果这类项目继续发展下去,“手机”这个概念可能真的会消失。我们未来用的,可能根本不是“手机”,而是“运行在云上的 Android 实例”。 docker-android 做了一件很反常识的事:把完整 Android 系统,直接塞进 Docker 容器里运行。 不是简化版,不是模拟器壳子,而是:👉 Android Emulator + ADB + QEMU + libvirt 的完整组合 结果一个“手机环境”,变成了一个可以部署的服务。 更夸张的是它的体积:Android API 33:约 1.97GB,API 28:约 1.46GB,极限精简后:138MB 一个“手机操作系统”,可以小到接近一个轻量服务镜像。 它带来的变化不是技术,而是定义层面的: 👉 Android 不再绑定设备 👉 手机不再是“硬件形态” 👉 操作系统开始变成“云端服务” 你甚至可以在服务器上直接: 跑 Android App 做自动化批量测试 远程控制 UI 构建虚拟设备集群 真正值得讨论的是这一点👇 当手机系统可以被容器化部署,那“手机厂商”的护城河还剩什么? 🗂 #Android# #Docker# #云计算# #开源# #技术思考#
显示更多
0
23
371
53
转发到社区
在 Linux 系统上工作,偶尔遇到必须用 Windows 软件的情况,装虚拟机太重,用 Wine 兼容性又不好。 最近看到 WinPodX 这个开源项目,让 Windows 应用在 Linux 上,点开图标就直接用。 比如双击 .docx 文件就能直接用 Word 打开,剪贴板、声音、打印机都是双向共享的,还能把 USB 设备直接传给 Windows 使用。 GitHub: 背后运行一个 Windows 容器,通过远程应用技术把每个程序单独渲染成 Linux 窗口,有独立图标,能固定到任务栏,也能正常切换。 首次安装大概等五到十分钟,之后启动几乎秒开,支持主流 Linux 发行版,一条命令就能装好。
显示更多
0
5
59
11
转发到社区
我最近在重新理解 BTC 和纳指 100 的关系 过去我会很简单地认为: 买 BTC,本质上是在买:货币超发、通货膨胀、钱越来越不值钱。 买纳指 100,本质上是在买:人类技术进步、生产力提升、最强科技公司持续创造价值。 但后来我发现,这两个资产的长期上涨,可能有一个更底层的共同根源: M2 的持续扩张 也就是,整个社会的名义货币总量,一直在变大 主权国家长期印钞,信用体系不断扩张,社会中的钱越来越多。问题是,这些新增出来的钱,最终会流向哪里? (图: 引用自 global broad money,2000-2025 年期间,全球广义货币从 26 万亿到 142 万亿美元,平均年化约 7%) 它们不会平均流向所有资产 它们会流向最稀缺、最有共识、最有流动性、最能承载巨量资金的资产 这就是 BTC 和纳指 100 底层的相似之处 BTC 捕获的是:法币越来越软之后,人们对硬资产、稀缺资产、非主权资产的需求。 它不是简单的「抗通胀工具」,更是一个硬货币容器 M2 越来越大,法币购买力被稀释,而 BTC 的总量上限只有 2100 万枚 所以 BTC 的长期逻辑 = M2 扩张 × BTC 共识扩大 × 全球配置比例提升 如果全球财富池越来越大,同时越来越多人愿意把其中一小部分配置到 BTC,那么 BTC 的价格就不是线性增长,而是非线性重估 纳指 100 捕获的是另一种东西:技术进步、生产力提升,以及利润向头部公司的集中 它也不是简单的「买科技」,更是一个「生产力容器」 人类社会每一次技术升级,最终都会被少数最强公司转化成收入、利润、现金流和股东回报。纳指 100 会跟随市场,更新迭代 100 家公司。 云计算、AI、半导体、操作系统、广告网络、企业软件、数字基础设施,本质上都是现代经济的收费站 所以纳指 100 的长期逻辑 = M2 扩张 × 技术进步 × 利润向头部公司集中 而且最强科技公司不只是跟着 GDP 增长,它们会吃掉更多产业链利润,获得更强的定价权和更高的资本效率 全球 GDP 一年增长 3%,通胀一年 4%,名义财富池每年大约以 6%–8% 的速度变大 真正的好资产,必须拥有超过这个速度的「逃逸速度」:不仅要跑赢货币贬值、跑赢 GDP,还要跑赢社会平均资产回报率 BTC 和纳指 100 虽然表面上不同: 一个是没有现金流的数字硬资产 一个是有现金流的权益资产组合 但它们底层都在吃同一件事: 不断扩张的 M2,正在流向最强的资产容器 区别在于: BTC 把 M2 扩张,转化为稀缺性溢价 纳指 100 把 M2 扩张叠加技术进步,转化为企业利润和估值溢价。 一个是稀缺性的货币化 一个是生产力的利润化 一个对冲「钱越来越不值钱」 一个押注「世界越来越有效率」 所以我现在,这样理解这两个资产: BTC 是 M2 扩张时代的「硬货币容器」 纳指 100 是 M2 扩张时代的「生产力容器」 长期看,世界不是静止的 人类 GDP 在增长,主权国家在印钞,金融资产在扩张,技术生产力在进步,全球财富池在变大... 钱一定会越来越多?而问题是: 越来越多的钱,最终会流向哪里? 当下的答案是: 会流向那些最稀缺、最有共识、最有网络效应、最能承载全球资本的资产。 这可能就是 BTC 和纳指 100 的共同上涨源动力
显示更多
0
19
176
48
转发到社区
聊一个可能会让很多人不舒服的判断:NFT这波回归,绝大多数人根本看不懂。 不是因为他们笨,是因为下一波NFT,大概率长得一点也不像NFT。 上一轮太疯狂了。PFP猴子,地板价,明星带货,大家一边骂JPEG是智商税一边把地板价从0.1怼到10个ETH。那是一个把“拥有”当喇叭喊的周期。谁买了什么,换什么头像,进什么社群,全都写在脸上。 但下一轮会完全反过来。 我的第一个具体预测:到2025年底前,至少会出现三个用户规模超过上一轮头部NFT项目的“隐藏款NFT产品”,但它们绝不会用NFT这个词来宣传自己。它们会叫“数字身份”“跨应用道具”“AI凭证”或者干脆就是“会员卡”。普通用户从头到尾不会看到“铸币”“gas费”“智能合约”这些词,甚至不知道自己用的东西跑在区块链上。 这听起来可能有点反直觉,但我认为这才是一个技术真正成熟的标志。你看TCP/IP,你看蓝牙,你看二维码,哪一个是天天挂在嘴边告诉你在用的? 第二个预测:游戏会是第一个跑通大规模落地的场景,但不是Play to Earn。 这里我要反驳一个流行的悲观观点。很多人说“NFT游戏已死,因为上一轮全是旁氏”。我觉得这个判断把问题归错了地方。上一轮死掉的那些游戏,核心问题是经济模型设计成了资金盘,而不是NFT技术本身有问题。实际上,游戏行业早就证明了数字资产有巨大的付费意愿。 说一个具体数字:仅《CS2》和《英雄联盟》两款游戏,皮肤相关年收入加起来就超过50亿美元。玩家购买这些物品时,没有一个人在乎它们是不是NFT。他们在乎的是“这个皮肤是我的”“我能用它装杯”“我退坑了还能卖掉”。现在的中心化游戏账户里,这些资产其实是租给你的。游戏公司封你号,资产归零。你没有任何办法。 NFT基础设施能解决的就是这个“真正拥有”的问题。 所以我的具体预测是:2026年之前,会有一款主流级传统游戏(不是链游工作室出的那种)以“无感上链”的方式推出可交易皮肤。用户甚至不需要知道区块链,只需要看到“这个道具可以跨服务器交易”或者“这个皮肤可以在官方市场卖给其他人”。到那时候,大家说的不是“我买了一个NFT皮肤”,而是“我在游戏里卖了个皮肤赚了200块”。 第三个预测,也是我觉得最可能被低估的一个:AI agent会让NFT从一个收藏品市场彻底转变为一个身份和权限市场。 我来解释一下为什么。现在大家讨论AI agent,更多是在聊自动交易、自动发推、自动回复。但AI agent真正需要的是什么?是能证明“我是谁”“我能做什么”的凭证。 举个例子,未来某个AI需要访问一个付费API,它可以持有一个NFT,代表它已经购买了月度订阅。另一个AI需要代表你参与一个治理投票,它需要一个权限NFT来证明它有权替你签名。再或者,AI agent之间互相协作,A需要向B证明自己来自某个可信协议,这个证明最快的方式就是钱包里有没有对应的NFT。 这个时候,NFT不再是用来炫耀的头像,而是一个安静的后台技术组件。没有人会说我买了一个NFT。大家会说,我的AI自动续费了会员,或者我的AI自己收集了一组链上资产。 我的具体预测是:到2025年第三季度,会出现第一个被广泛使用的“AI专用NFT标准”,它不是为了好看,而是为了机器之间的互操作性。 现在来说一个更反主流的观点,也是我自己的独到见解。 很多人都说“NFT已死”,理由是交易量跌了90%,蓝筹地板价腰斩再腰斩。我认为这个结论太短视了。死亡的不是技术,而是“NFT”这个品牌。这个词已经被严重污染了。你跟圈外人说NFT,他脑子里只有猴子、欺诈、跑路、30万美金的JPG笑话。这就好比你说“互联网泡沫破裂后,.com公司都死了”,但实际上活下来的Amazon和Google只是不再张口闭口说自己是一家.com公司。 所以我的第四个预测也是最核心的一个:“NFT”这个三个字母会在主流叙事中逐步消失,取而代之的是更具体的应用层名词。比如“链上皮肤”“可携带资产”“智能会员”“AI凭证”。普通用户会用这些词,而不会关心底层是什么。但基础设施层面,ERC 721和1155这类标准的使用量会稳步增长,只是大家不再喊那个名字了。 我还想针对“技术没有价值”这个反驳一下。有人说NFT就是一张链上的链接,图片存在中心化服务器,有个屁的价值。这个批评有一定道理,上一轮很多项目确实如此。但你没看到的是,真正的基础设施在往前走。动态NFT、可编程的权限控制、EIP 6551(代币绑定账户)这些已经可以让一个NFT变成一个独立的钱包,拥有自己的资产和交互历史。一个游戏皮肤可以自己记录它被谁拥有过、打过几场比赛、获得过什么成就。这些不是JPEG,而是数据容器。 所以我最后的观点是:NFT不会死,但“NFT”这个名字会死。它的回归不会是一根大阳线拉盘,而是像空气一样渗透进你每天使用的产品里。你玩一款游戏,你买一个AI会员,你用一个跨平台工具,你根本没有意识到背后跑着NFT。然后有一天你回头看,才发现原来整个互联网的“拥有权”已经被悄悄重构了。 那最后一个问题留给大家: 下一个能让几百万人使用的“爆款NFT项目”,它还会不会在自己的官网上写“NFT”三个字?
显示更多
0
32
42
1
转发到社区
CoreWeave 与 Google Cloud 今儿宣布算力互联,解决企业面临的算力孤岛带来的资源错配问题。 此次合作的技术支柱是 CoreWeave Interconnect。通过光纤网络与 Google 的全球网络直接打通,辅以 MACsec 硬加密技术,实现了低延迟、高安全的数据传输。 最值得关注的是其专利技术 LOTA Cross-Cloud(本地对象传输加速器)。它将数据直接吞吐至 GPU 节点(单卡达 7 GB/s),不仅解决了跨云传输的延迟问题,更从商业逻辑上消除了高昂的出口费用(Egress Fees)。 这种模式为开发者提供了灵活的“组合拳”方案: 训练端:利用 CoreWeave 极其垂直、高性能的 GPU 集群(如 H100/B200)进行大规模模型训练。 推理与生态端:训练好的模型可无缝调用 Google Cloud 的数据湖、GKE 容器服务或全球分发网络进行商业化推理。 商业影响:CoreWeave 的渗透力将激增 这一合作将显著提升 CoreWeave 的市场占有率: 降低决策风险:CoreWeave 从一个“外部第三方平台”转变为 Google 生态的“高性能算力插件”,极大降低了企业迁移的心理门槛。 获取增量客户:原本受限于数据搬运成本和复杂配置的 Google Cloud 存量用户,现在可以更顺畅地使用 CoreWeave 的算力资源。 硬件确定性:作为 Nvidia 的核心伙伴,CoreWeave 的新型 GPU 供应优势,将通过 Google 的渠道加速被市场消化。 从 AWS、Google Cloud 与 CoreWeave 的合作可以看出,在算力资源极度紧张的情况下,“开放云环境”正在取代早期的“围墙花园”。对于拥有算力的供应商,都很可能基于不同的模式和巨头们的算力互联互通 免责声明:本人持有文章提及股票,观点充满偏见,非投资建议dyor
显示更多
0
12
34
2
转发到社区
Vercel 开源了 Open Agents,一个用来搭建企业自有编程 Agent 平台的参考实现。 CEO Guillermo Rauch 说:现成的编程 Agent 在大型代码仓库上表现不行,也不了解你公司的知识体系和内部流程,所以 Stripe、Spotify、Block 这些公司都在造自己的 AI 软件工厂。 Open Agents 绑定了 Vercel 自家的 Fluid、Workflow、Sandbox 和 AI Gateway 这套底座。但不管怎么说,Open Agents 给了一个可以直接 fork 的起点。 架构分三层:前端负责会话和认证,Agent 作为持久化工作流运行在 Vercel 上,沙箱提供隔离的代码执行环境。一个关键设计是 Agent 不跑在沙箱里面,而是从外部通过工具调用(文件读写、Shell 命令、搜索等)操作沙箱。这样 Agent 的生命周期、沙箱的生命周期、模型的选择,三件事互不绑定,各自演进。 功能上已经比较完整:支持对话驱动的编程 Agent、沙箱快照恢复、仓库克隆和分支操作、自动提交和发 PR、会话分享,甚至还有语音输入。 对于正在考虑自建编程 Agent 的技术团队,这省了从零搭架子的功夫。对于没有这个需求的开发者,这个项目的架构设计本身也值得看看,尤其是 Agent 和执行环境分离这个思路,几乎是当前所有 Agent 框架都在趋同的方向。 对比下 Anthropic 的 Managed Agents。 Vercel 的 Open Agents 是开源参考实现,给你一套可以 fork 的代码,自己部署、自己改。Anthropic 的 Managed Agents 是全托管服务,你通过 API 定义 Agent 的行为,基础设施全部由 Anthropic 运行,连沙箱、状态管理、错误恢复都不用操心。 有意思的是,两者在架构核心上达成了同一个共识:Agent 和执行环境必须分离。Vercel 的文档里专门强调"the agent is not the sandbox",Agent 从外部通过工具调用操作沙箱。Anthropic 的工程博客用了一个更形象的说法,把 Agent 拆成"大脑"和"手",大脑(模型和调度循环)不住在容器里,通过接口远程操控沙箱。 Anthropic 的工程博客还解释了为什么要这么做:早期他们把所有东西塞进一个容器,结果容器变成了"宠物"(Pet),挂了就什么都丢了,调试还得钻进去看,而容器里又有用户数据,安全上也过不去。拆开之后,容器变成了"牲口"(Cattle),坏了就换一个,会话日志(Session)独立存储在外面,随时可以恢复。 除了架构哲学,两者的差异很明显: 模型锁定方面,Open Agents 不绑定模型,你可以接任何 LLM。Managed Agents 只能用 Claude 系列模型,但换来的是 Anthropic 在 harness 层面做的 prompt caching、上下文压缩、自动恢复这些优化,这些东西自己搭很难做好。 成本结构方面,Open Agents 的成本是你自己的基础设施费用加上模型 API 调用费。Managed Agents 是三层计费:模型 token 费 + 每小时 0.08 美元的运行时费(按毫秒计,空闲不收费)+ 网页搜索每千次 10 美元。 控制权方面,Open Agents 给你完整源码,怎么改都行,但搭建和维护是你的事。Managed Agents 上手快(有人说 30 分钟就能跑起来),但你被限制在 Anthropic 提供的 API 能力范围内。
显示更多
3 months ago I started building a coding agent that runs in the cloud. It's since written every line of code I've shipped, including itself. Today, I'm open sourcing it. Introducing Open Agents.
显示更多
0
21
432
75
转发到社区
大规模 agent matrix 目前还有两个比较麻烦的事情没有解决,一个是虚拟化技术难以支撑高并发网络,在裸金属机上也很难做到,codeben 上线后容器白天一直是打满的状态,另外就是推理其实应当和沙箱放在一处,我相信这两者结合一定会出现新的基础设施架构与服务,而这就是未来互联网的基础设施。
显示更多
【2】90% 的代码是自己写的——Claude Code 的技术选型哲学 Claude Code 有 90% 的代码是它自己写的。 听起来像噱头,但这其实归功于他们的技术决策逻辑。 先看技术栈:TypeScript 写主体,React 搭配 Ink 框架做终端 UI,Meta 开源的 Yoga 做布局系统,Bun 负责构建打包。 为什么选这些技术栈呢?因为它们“在分布内”。 “在分布内”(on distribution)是 AI 领域的术语。意思是模型已经见过大量这类代码,擅长处理它们。TypeScript 和 React 正是 Claude 的强项。如果选一个冷门框架,模型就得“学习”,效果会打折扣。 这个选择带来一个美妙的循环:用 Claude 擅长的技术栈写 Claude Code,然后用 Claude Code 写更多 Claude Code。90% 自己写自己,就是这么来的。 他们在架构层面的选择同样简洁。 Claude Code 在本地运行。没有 Docker 容器,没有云端沙箱,就是直接在你的电脑上读写文件、执行命令。
显示更多
Andrej Karpathy 是 OpenAI 联合创始人、前特斯拉 AI 总监,也是全球最有影响力的 AI 研究者之一。他刚刚发布了一篇 2025 年 LLM 年度回顾。 第一个大变化:训练方法的范式升级 2025 年之前,训练一个好用的大模型基本是三步走:预训练、监督微调、人类反馈强化学习。这个配方从 2020 年用到现在,稳定可靠。 2025 年多了关键的第四步:RLVR,全称是 Reinforcement Learning from Verifiable Rewards,翻译过来就是「可验证奖励的强化学习」。 什么意思?简单说,就是让模型在「有标准答案」的环境里反复练习。比如数学题,答案对就是对,错就是错,不需要人来打分。代码也一样,能跑通就是能跑通。 这和之前的训练有什么本质区别?之前的监督微调和人类反馈,本质上是「照葫芦画瓢」,人给什么样本,模型学什么样本。但 RLVR 不一样,它让模型自己摸索出解题策略。就像学游泳,之前是看教学视频模仿动作,现在是直接扔水里,只要你能游到对岸,怎么划水我不管。 结果呢?模型自己「悟」出了看起来像推理的东西。它学会了把大问题拆成小步骤,学会了走错路时回头重来。这些策略如果靠人类标注示范,根本标不出来,因为人自己也说不清「正确的思考过程」长什么样。 这个变化带来一个连锁反应:算力的分配方式变了。以前大部分算力砸在预训练阶段,现在越来越多算力用于 RL 阶段。模型的参数规模没怎么涨,但推理能力飙升。OpenAI 的 o1 是这条路的起点,o3 是真正让人「感觉到不一样」的拐点。 还有个新玩法:推理时也能花更多算力。让模型「想久一点」,生成更长的推理链条,效果就更好。这相当于多了一个调节能力的旋钮。 第二个大变化:我们终于搞懂了 AI 是什么「形状」的聪明 Karpathy 用了一个很妙的比喻:我们不是在「养动物」,而是在「召唤幽灵」。 人类的智能是进化出来的,优化目标是「在丛林里让部落活下去」。大模型的智能是训练出来的,优化目标是「模仿人类文本、在数学题里拿分、在评测榜单上刷分」。 优化目标完全不同,出来的东西当然也完全不同。 所以 AI 的智能是「参差不齐」的,英文叫 jagged intelligence。它可以在某些领域表现得像全知全能的学者,同时在另一些领域犯小学生都不会犯的错。上一秒帮你推导复杂公式,下一秒被一个简单的越狱提示骗走你的数据。 为什么会这样?因为哪个领域有「可验证的奖励」,模型在那个领域就会长出「尖刺」。数学有标准答案,代码能跑测试,所以这些领域进步飞快。但常识、社交、创意这些领域,什么是「对」很难定义,模型就没法高效学习。 这也让 Karpathy 对基准测试失去了信任。道理很简单:测试题本身就是「可验证环境」,模型完全可以针对测试环境做优化。刷榜变成了一门艺术。所有基准都刷满了,但离真正的通用智能还差得远,这是完全可能发生的事。 第三个大变化:LLM 应用层浮出水面 Cursor 今年火得一塌糊涂,但 Karpathy 认为它最大的意义不是产品本身,而是证明了「LLM 应用」这个新物种的存在。 大家开始讨论「X 领域的 Cursor」,这说明一种新的软件范式成立了。这类应用做什么? 第一,做上下文工程。把相关信息整理好,喂给模型。 第二,编排多个模型调用。后台可能串了一堆 API 调用,平衡效果和成本。 第三,提供专业场景的界面。让人类能在关键节点介入。 第四,给用户一个「自主程度滑杆」。你可以让它多干点,也可以让它少干点。 有个问题被讨论了一整年:这个应用层有多「厚」?模型厂商会不会把所有应用都吃掉? Karpathy 的判断是:模型厂商培养的是「有通用能力的大学毕业生」,但 LLM 应用负责把这些毕业生组织起来、培训上岗,变成能在具体行业干活的专业团队。数据、传感器、执行器、反馈循环,这些都是应用层的活。 第四个大变化:AI 搬进了你的电脑 Claude Code 是今年最让 Karpathy 印象深刻的产品之一。它展示了「AI 智能体」应该长什么样:能调用工具、能做推理、能循环执行、能解决复杂问题。 但更关键的是,它跑在你的电脑上。用你的环境、你的数据、你的上下文。 Karpathy 认为 OpenAI 在这里判断失误了。他们把 Codex 和智能体的重心放在云端容器里,从 ChatGPT 去调度。这像是在瞄准「AGI 终局」,但我们还没到那一步。 现实是,AI 的能力还是参差不齐的,还需要人类在旁边看着、配合着干活。把智能体放在本地,和开发者并肩工作,才是当下更合理的选择。 Claude Code 用一个极简的命令行界面做到了这一点。AI 不再只是你访问的一个网站,而是「住在」你电脑里的一个小精灵。这是一种全新的人机交互范式。 第五个大变化:Vibe Coding 起飞了 2025 年,AI 的能力跨过了一个门槛:你可以纯用英语描述需求,让它帮你写程序,完全不用管代码长什么样。Karpathy 随手发了条推特,给这种编程方式起了个名字叫 vibe coding,结果这个词火遍全网。 这意味着什么?编程不再是专业程序员的专利,普通人也能做。这和过去所有技术的扩散模式都不一样。以前新技术总是先被大公司、政府、专业人士掌握,然后才慢慢下沉。但大模型反过来,普通人从中受益的比例远超专业人士。 不只是「让不会编程的人能编程」。对会编程的人来说,很多以前「不值得写」的小程序现在都值得写了。Karpathy 自己就用 vibe coding 做了一堆项目:用 Rust 写了个定制的分词器、做了好几个工具类 App、甚至写了一次性的程序只为找一个 bug。 代码突然变得廉价、即用即弃、像草稿纸一样随便写。这会彻底改变软件的形态和程序员的工作内容。 第六个大变化:大模型的「图形界面时代」要来了 Google 的 Gemini Nano Banana 是今年最被低估的产品之一。它能根据对话内容实时生成图片、信息图、动画,把回复「画」出来而不是「写」出来。 Karpathy 把这件事放到更大的历史脉络里看:大模型是下一个重大计算范式,就像 70 年代、80 年代的计算机一样。所以我们会看到类似的演进路径。 现在和大模型「聊天」,有点像 80 年代在终端敲命令。文字是机器喜欢的格式,但不是人喜欢的格式。人其实不爱读文字,读文字又慢又累。人喜欢看图、看视频、看空间布局。这就是传统计算机为什么要发明图形界面。 大模型也需要自己的「GUI」。它应该用我们喜欢的方式跟我们说话:图片、幻灯片、白板、动画、小应用。现在的 Emoji 和 Markdown 只是初级形态,帮文字「化个妆」。真正的 LLM GUI 会是什么样?Nano Banana 是一个早期暗示。 最有意思的是,这不只是图像生成的事。它需要把文本生成、图像生成、世界知识全部绞在一起,在模型权重里融为一体。 Karpathy 的总结是这样的:2025 年的大模型,比他预期的聪明,也比他预期的蠢。两者同时成立。 但有一点很确定:即使以现在的能力,我们连 10% 的潜力都没挖掘出来。还有太多想法可以试,整个领域感觉是敞开的。 他在 Dwarkesh 的播客里说过一句看似矛盾的话: > 他相信进步会继续飞速推进, > 同时也相信还有大量的工作要做。 两件事并不矛盾。2026 年系好安全带继续加速吧。
显示更多
0
35
1.1K
312
转发到社区