注册并分享邀请链接,可获得视频播放与邀请奖励。

与「技术思考」相关的搜索结果

技术思考 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 技术思考 的内容
如果这类项目继续发展下去,“手机”这个概念可能真的会消失。我们未来用的,可能根本不是“手机”,而是“运行在云上的 Android 实例”。 docker-android 做了一件很反常识的事:把完整 Android 系统,直接塞进 Docker 容器里运行。 不是简化版,不是模拟器壳子,而是:👉 Android Emulator + ADB + QEMU + libvirt 的完整组合 结果一个“手机环境”,变成了一个可以部署的服务。 更夸张的是它的体积:Android API 33:约 1.97GB,API 28:约 1.46GB,极限精简后:138MB 一个“手机操作系统”,可以小到接近一个轻量服务镜像。 它带来的变化不是技术,而是定义层面的: 👉 Android 不再绑定设备 👉 手机不再是“硬件形态” 👉 操作系统开始变成“云端服务” 你甚至可以在服务器上直接: 跑 Android App 做自动化批量测试 远程控制 UI 构建虚拟设备集群 真正值得讨论的是这一点👇 当手机系统可以被容器化部署,那“手机厂商”的护城河还剩什么? 🗂 #Android# #Docker# #云计算# #开源# #技术思考#
显示更多
0
23
371
53
转发到社区
强烈推荐大家关注以下13个AI 帐号。 这13个人主要是身份是工程师、科学家。 他们几乎影响了历史发展进程。 @karpathy - Andrej Karpathy(约248万粉丝) Bio:我喜欢训练大型深度神经网络。曾任Tesla AI总监、OpenAI创始团队成员、斯坦福博士。 AI社区最受欢迎的“网红导师”,讲解极度清晰,常分享模型训练实战心得和前沿趋势,适合所有水平的学习者。 @fchollet - François Chollet(约66.5万粉丝) Bio:Keras & ARC-AGI 创建者。 Keras框架之父 + ARC通用智能基准提出者,技术深度与哲学思考结合极强,能看到最前沿的AGI思考。 @ylecun - Yann LeCun(约116万粉丝) Bio:图灵奖得主,前Meta首席AI科学家。 深度学习三巨头之一,观点犀利直接,常对行业热点发表一针见血的评论,信息含金量极高。 @AndrewYNg - Andrew Ng(约153万粉丝) Bio:Coursera联合创始人,前百度/Google Brain负责人。 AI教育界第一人,课程推荐、职业建议和落地经验极其实用,非常适合想系统学习或转行的从业者。 @rasbt - Sebastian Raschka(约44.6万粉丝) Bio:《Build a Large Language Model From Scratch》作者。 从零实现LLM的顶级实践者,代码教程和论文解读质量极高,是工程师最爱的技术干货账号。 @lilianweng - Lilian Weng(约22万粉丝) Bio:前OpenAI AI安全与机器人VP,Lil'Log博主。 AI安全、强化学习和机器人领域的深度思考者,长文综述质量顶尖,适合想深入某个细分方向的人。 @jeremyphoward - Jeremy Howard(约29.4万粉丝) Bio: 联合创始人,前Kaggle总裁。 实用深度学习倡导者,教学方法和开源工具非常接地气,风格亲切且强调“能上手”的实战派。 @simonw - Simon Willison(约18万粉丝) Bio:Datasette & Django联合创建者。 AI工程实践和LLM工具链专家,产品感和实用性极强,常分享好用的开源AI工具和工程技巧。 @ID_AA_Carmack - John Carmack(约163万粉丝) Bio:游戏传奇程序员(Doom引擎之父),现专注AGI。 极客之神,直率的技术哲学思考和跨领域洞见(游戏+火箭+AI),深度极高,启发性爆棚。 @gwern - Gwern(约7.5万粉丝) Bio:互联网研究者,挑剔的深度分析者。 粉丝虽少,但硬核程度顶级,常发布高质量AI实验、长文分析和独特观点,是“硬核爱好者”必备账号。 @goodside - Riley Goodside(约20.3万粉丝) Bio:提示工程专家,前Google DeepMind/Scale员工。 LLM提示技巧和模型行为研究最强账号之一,分享大量实用技巧+有趣截图,幽默且直接能用。 @drfeifei - Fei-Fei Li(约66.9万粉丝) Bio:ImageNet之母,Stanford HAI联合主任。 计算机视觉先驱,兼顾学术深度与AI人文/伦理视角,视野开阔且充满人文关怀。 @demishassabis - Demis Hassabis(约93万粉丝) Bio:DeepMind CEO、诺贝尔奖得主。 AlphaGo/AlphaFold之父,直接来自AGI最前沿的第一手信息和愿景,含金量最高。
显示更多
0
54
188
36
转发到社区
技术人的迷茫,社会的矛盾,临界感的逼近:其实都是同一个问题。 我们需要理解:共识—协议—结构—叙事 的循环 技术人迷茫,尤其是中国的技术人。肉眼可见,推特上越来越多的中青年工程师在寻找“出海”和“独立开发”的机会(这里头有多少卖课的?)。经历过 2010 年代那套“跟随战略”之后,再看看自己手机上那一万个 App,你还能生出再做一个 App 的冲动吗?经历过 LLM 横空出世的狂喜,再看到任何套壳功能都迅速被指数级进化的模型吞没,你是不是更想躺平?——毁灭吧,赶紧的。 我也经历过这样一个阶段,但后来我发现,这其实是个死胡同。因为从根本上说,我们从未真正体验过、进入过现代意义的工业迭代。我们习惯的是“好学生”模式:接外包、抄作业、后发优势、跟随战略,把硅谷的成功搬过来。可整个技术圈没有经历过真正意义上的“原生循环”,所以才在眼前的巨变里显得格外无力。 这一切是什么?它不是单一事件,而是万千头绪的叠加: 科技飞跃发展; 社会躁动不安,就业市场低迷,“毕业即失业”,高校知识体系彻底脱节; 经济衰退、通缩,社会信心几年内跌入低谷; 国际关系骤然僵化,中美关系从十年多次往返签证到如今的彼此封闭; 信息流汹涌而至,大脑完全跟不上节奏。 在这样的背景下,问题回到原点:开发个什么?开发出来给谁?用来干嘛?你如何知道它有用?还是只是在盲目堆积代码? 共识—协议—结构—叙事 的循环 我们往往没有认真思考过:在工业社会里,技术突变如何推动社会变革,这背后有一个极其关键的循环。这个循环不是单一的直线,而是社会在各个层面上不断上演的动态过程:有成功,也有失败;有偶然的发现,也有刻意的设计。在一个技术既遵循达尔文主义的自然选择,又承载人为设计和制度化推动的社会里,这个循环才是技术变革真正的动力。 很多人以为,新技术的崛起是从下往上,从第一行代码写起,逐步推到最高权力层面。但事实并非如此。技术的应用与扩张,从来都是“自上而下”与“自下而上”的互动:它有反馈、有闭环、有分叉(fork),并且这一切是可以通过文字去探讨和推演的。如果你完全没有想过这个循环,大概率只能在失败者的阵营里。 遗憾的是,我看到许多中国技术人,尤其是独立开发者,技术感很强,但社会感、推演力和与社会共识的连接力却非常薄弱。于是他们更容易陷入“功能”与“代码”的死循环,却缺乏把技术嵌入社会循环的能力。事实上,这个循环并不是有固定起点和终点的,而更像是一条首尾相接的蛇:你生我,我生你,彼此生成,彼此强化。 那它到底是怎样的呢?我认为,这个循环的基本原型就是:共识—协议—结构—叙事。 共识—协议—结构—叙事 这一循环,是技术与社会互动演化的核心路径。 首先是一种 共识(Consensus)。社会必须在价值和判断上达成某种普遍认同,这才是一切循环的起点。没有共识,协议就是空洞的,结构是僵化的,叙事则变得虚假。比如,“货币必须有信用”,“AI 必须可解释”,“能源必须清洁”——这些共识都是推动制度与技术演化的起点。 当共识逐渐稳定,就会被转化为 协议(Protocol)。协议把抽象的价值翻译成可执行的条文、标准或接口,它是文明的源代码。金本位制、法币制度、GDPR、AI 法案、巴黎协定,这些都是共识的协议化结果。 随着协议被执行,它会在社会层面逐步沉淀为 结构(Structure)。结构是一种“硬件化”的结果,协议通过它转化为具体的组织、岗位、制度和产业网络。央行体系、银行网络、AI 伦理审计部门、第三方评估机构、碳交易市场、绿色能源产业链,都是从协议中演化出的社会结构。 然而,如果没有 叙事(Narrative),结构和协议是难以为社会大众理解和接受的。叙事把冷冰冰的制度转化为可传播的符号和故事,是文明的扩音器。比如,“美元=国家信用”“In God We Trust”,“透明=竞争力”“AI 是人类的最后发明”,“拯救地球”“绿色未来”,这些叙事为协议和结构提供了合法性和情感支撑。 整个循环以 闭环逻辑 的方式运转:共识被写入协议,协议沉淀成结构,结构通过叙事放大,再次反馈回新的共识。如此周而复始,推动技术与社会的互动演化。理解并主动参与这一循环,才是真正意义上的“做技术”。 当然,不是说所有的技术都能完美符合这个循环,但我们可以举一个人人都听得懂的例子:比特币。 比特币最初的起点,是一个共识:货币不应该完全依赖政府信用,价值必须有去中心化的保障。这个共识源自 2008 年金融危机之后的信任崩塌——“货币必须透明、可验证、不可随意增发”。 在这个共识的基础上,比特币的白皮书就是那份协议。它不是模糊的宣言,而是一套清晰的规则:区块链、工作量证明、有限发行、点对点的验证机制。这些协议把去中心化的理想翻译成了可执行的程序代码。 随着协议的运行,逐渐形成了新的结构。矿池、交易所、钱包服务商、监管沙盒、开发社区,这些都是围绕比特币协议自然生长出来的社会和产业组织。就像央行体系是法币制度的结构化产物一样,比特币也有了自己的生态结构。 但如果没有叙事,比特币不会传播开来。比特币背后的叙事是“数字黄金”,是“对抗通胀的避险资产”,是“货币的未来”。这些叙事让比特币从极客圈走向公众视野,让它成为一种社会现象,而不仅仅是几千行代码。 于是我们就能清晰看到:比特币从共识到协议,再到结构,最后被叙事放大,然后又反过来推动新的共识(例如“区块链不止是货币,还可以用于智能合约”)。这就是循环的力量。 我们现在正处在一种 “结构化推演信息”真空 的状态。 真的,完全真空。科幻故事满天飞,但真正基于链式因果的大规模合理推演和尝试的共识信息,却几乎难以找到。尤其是当下,我们所熟悉、从小习以为常的范式——比如全球化——已经走到尽头。整个世界进入了一种“范式不稳定”时期:过去的经验逐渐松动,看上去根本撑不到未来。 2015 年我去德国旅行时,眼中的德国是一个已经走上工业化巅峰的“社会主义”国家;而现在呢?德国车在美国的存在感越来越低。美国也是如此,我刚到美国时的感受和现在完全不同。国内更不用说,大家刚经历了一个黄金时代,转眼房价突然腰斩,魔幻得让人怀疑现实。 这一切意味着什么?意味着整个世界的上层结构都已经发生了深刻变化。如果上层已经变了,你怎么还能用旧有的技术思维去想象今天的开发工作?循环已经断裂,信息的偏差正在急剧放大。更何况,当 LLM 这种级别的技术成熟时,它投下的可不是一块小石子啊,而是一颗彻底改变水流方向的深水炸弹。 应用型的技术的思考,一定是先从上层出发的 上层逻辑的变化在于:技术必须先从社会层出发,才不会陷入“自嗨内卷”。 因为只有当方向和价值被锚定之后,技术才有存在的意义。 首先,上层决定合法性。技术的生死,往往并不取决于性能是否优越,而是取决于社会是否愿意认同它。谷歌眼镜的技术曾经十分先进,但因为社会共识没有准备好,它最终失败了;而比特币在技术上并不复杂,却因为共识和叙事先行,至今仍顽强存活。换句话说,合法性才是技术能否走出实验室的真正门票。 其次,上层可以约束迭代方向。如果技术仅仅从下层出发,往往会在“能做什么”的自我探索中迷失,结果是越做越偏离社会需要。而一旦从上层先行推演,就能预设价值边界:哪些功能是必须的,哪些功能即便能实现也不能做。这样一来,下层的技术开发才不会陷入盲目内卷,而是有清晰的采纳接口,知道自己要服务的目标是谁。 最后,上层的叙事能反哺技术生态。只有当叙事被建构起来,开发者、投资人和政策制定者才能形成合力。没有叙事的技术,社会往往冷漠以待;但一旦叙事先行,即使技术还不完善,也能迅速获得试点和落地机会。 因此,从上层出发,不仅是为了合法性,更是为了方向、价值和合力。没有上层逻辑的支撑,技术只能在自我封闭的循环中打转,最终被社会抛弃。 (4/n)
显示更多
0
14
68
14
转发到社区
夸克这次重新提了「超级框」的概念,就是因为现在的「框」能比以前做更多的事情了,统管阿里AI To C业务的吴嘉说夸克23年做用户细分需求产品很痛苦,因为基座模型能力不行,必须专门为写作文、写报告手搓工作流,但场景是无尽的,人力有时而穷,根本跟不上需求增长,但在深度思考的技术上来之后,终于可以实现「人用AI,AI用工具」的目标了,这时那个「框」能办成的事情也丰富起来了,不再需要每个环节都得人工干预,AI终于学会了「坐上来,自己动」。 Manus能火也是因为它让用户看到了AI真的有在干活,这种体验和DeepSeek当时开放思维链是一样的,Sam Altman说他最后悔的就是出于保密心态而决定隐藏o1的思维链,没想到观察AI的思考过程也能成为产品体验的一部分。 如果大家的共识是重做一个「框」出来,张宁比较关心生产关系会怎么变,毕竟科技史上不乏生产力的进步被生产关系的落后给破坏掉的例子——比如我们之前聊过的RSS——他对最近火得不行的MCP的担忧也在于此,说白了,不谈利益分配、只谈创新变革,对于被OTT的一方就是耍流氓,就像某外卖平台已经开始屏蔽AI Agent了,这是很合理的结果,你不能要求别人来为你的创新当祭品。 海外市场的几条线索包括:Google每个财季都会展示AI overview对广告业务的冲击,目前来看,是可控的,没有自残迹象;Satya Nadella带头起了「模型被商品化了」的调子,背景是微软和OpenAI开始同床异梦了;Sam Altman说在10亿用户级别的网站和SOTA级别的模型之间,他一定会选前者…… 是的,这些信号都在说明,应用很重要,得用户者得天下,这是移动互联网的逻辑延续,但在另一边,「模型即产品」的拥护者同样很多,在理论和证据的支持上也不多让,相信模型的演化的终局就是会把产品能做的事情都做了,并形成技术为王的新一代AI逻辑。(4/n)
显示更多
CZ提议比特币量子分叉冻结中本聪币?淡定,我来仔细说说 首先,我们要明确 @cz_binance 这个提议的具体的背景、细节和动机。 ┈➤BTC抗量子的技术背景 量子计算机的发展,理论上有可能破解BTC的私钥。 BTC目前的签名算法是椭圆曲线签名(ECDSA),而量子计算的Shor算法可以高效破解椭圆曲线签名,从BTC公钥计算出私钥。 目前,BTC的抗量子技术正在讨论和推动中。而BTC抗量子技术,主要是签名机制。新的签名机制之下,现有的量子计算也难以破解BTC私钥。 但是,原有BTC地址的脚本里,就包含了签名机制,所以无法直接升级到新的抗量子签名机制。 而在升级后的BTC网络中,只需要向新的支持抗量子签名的地址转账,就可以使这些BTC获得抗量子保护。 中本聪的钱包里持有100万枚BTC,大约占已经释放的BTC总量的5%。如果中本聪的100万枚BTC受到量子攻击后,私钥被破解,将会有5%的BTC抛压释放,这对于BTC短期价格的影响非常不利,对BTC长期的信仰和共识可能也会有一定程度的动摇。(有人说,如果创始人的BTC都被冻结了如何如何。可是,如果创始人的BTC都被量子攻击了,BTC的信仰和共识还怎么办?) ┈➤CZ的提议 CZ的提议是如果中本聪的这100万枚BTC在6个月~1年内没有发生移动,就对BTC网络进行分叉,冻结中本聪的这100万BTC,并将BTC总量变为2000万枚。 区块链升级其实是以分叉的形式进行的,CZ提到的分叉并不是说像当初分叉出BCH那样分叉BTC,而是对BTC进行升级。 ┈➤CZ的动机推测 有一部分人认为,应该任其发展,短期大抛压、信仰和共识动摇,才有抄底的机会。这部分是交易思维,是从交易的角度希望可以抄底更多的BTC,可以理解。 还有一部分认为,CZ的这个建议破坏了BTC区块链不可篡改的特征。这个有点像当初ETC社群的动机,这个动机可以理解。 而CZ是从行业的领袖角度,应该也有BTC Holder的角度出发。CZ的建议是更可能是为了BTC的信仰、共识、稀缺性以及价格,也是可以理解的。 ┈➤写在最后 我们大可不必为CZ的提议如此激动。 第一,中本聪留下的100万BTC到底是留着被黑客量子攻击?还是冻结,对中本聪本人来说,这两种情况在他的资产账本上没有什么不同。但是,从他的点对点现金系统的理想角度出发,我在思考的问题是,他是希望被黑客攻击还是冻结起来保护网络抗量子? 第二,CZ提出的分叉,本质上是BTC网络升级,区块链程序升级基本上被称为分叉。并不是为了分叉出一个新币来了。这和BTC分叉出BCH是两码事,所以我们不太需要被担心BTC分叉。 退一步说,矿工和全节点意见分歧,会分叉出一个冻结了中本聪100万枚的币,和另一个100万币被量子攻击的币。感觉这和当初ETH与ETC分叉有一点相似。 第三,CZ的这个建议并没有改变区块链的历史,所以我们不需要提心BTC区块链被篡改。 第四,CZ的建议可以从两个角度理解:一是冻结链上指定部分的资产,二是把冻结100万枚BTC,看成是消除了BTC的预挖矿部分。 第五,CZ只是提了个建议,能不能执行,最终还是要矿工和Bitcoin Core来博弈的。在利益面前,矿工和Bitcoin Core只有利益的博弈,根本不会受任何大人物一丝一毫的影响的。CZ其实也知道这一点,他只是提出一个有争议、但动机是正向的建议。 如果我是CZ,作为与整个加密行业利益深深绑定的人,作为一个在加密行业中赚钱最多的人,并且大概率会持续从这个行业中获利很多的人,应该没有人比我更希望这个行业长长久久的好下去吧? 回到我自已韭菜的角度,CZ也好、币安也好,肯定都不是完美的,遇到问题我也绝不客气,有问题就怼,有意见就提!(似乎币安经常会根据这些理性反馈去调整自身产品和管理,这样我可以获得好的交易体验)但作为用户或者加密市场参与者,不了解情况就怼,甚至没逻辑的骂人,这对我自己的心态和交易,有帮助吗? CZ的提议正确与否我们先不讨论,因这个事情最终是由矿工和全节点共同决策的,咱们讨论的意义相对不大。但理性思考我们会发现在这个事件里得到了一个新的消息——BTC通过技术更新,在一定程度上,甚至是大概率上,是可以抗量子攻击的。
显示更多
0
53
61
0
转发到社区
一群大神又在分析海力士了,2月份就按头安利了,推特也持续跟进中,这一波还是有高人指点,我愿称我股神大哥为最强股神! 2月22他就跟我说往死里研究海力士,让我用豆包,抽丝剥茧,深度思考。 于是我在市场上了解内存行情,发现内存实物极其稀缺,于是抄底,疯狂补仓,当时海力士40多块,20多块疯狂补,没有人深度研究他的技术,我说了几个月,海力士是最屌的HBM存储芯片,他的技术是16层,其他都是14层堆叠,就这么说,你买的服务器里如果是海力士的,就是高人一等。 当时群里的人还说不行,硬是把川沐分析的帖子发给他们看,不得不说,这个狗川沐真厉害🙂🙂又有钱又头铁又敢梭…… 好了,从今往后,我要更加认真研究股票,3个10倍就是1亿了,第一个5倍!
显示更多
0
14
25
0
转发到社区
字节对大厂 AI Coding 的反思,好真实。 字节技术副总裁洪定坤的分享,我来回看了好几遍,很有启发。 字节在 AI Coding 方面的实践还是很有代表性的,推荐所有做研发的同学都可以看看。应该会感同身受。 我看完记了一整页笔记,分享给大家。 我甚至觉得可以把这个分享理解为字节在 AI Coding 上的一些真实反思。 根据自己的理解,我把这个分享里对我有启发的几个判断展开来聊一聊。 其中会夹杂很多我自己的感触,想看原文的可以直接去找演讲全文。 反思一:AI 代码贡献率不该是 KPI AI Coding 基本上都已经逐步进入了各个公司的生产流程。 很多人都在说自己的业务有 90% 的代码是 AI 生成的,乍一听,感觉很恐怖。 但其实,AI 对研发的提效没有外界想象的那么高。 洪定坤举了 TRAE 团队的例子。TRAE 本身就是做 AI 工具的,所以这个团队对 AI Coding 的采用非常积极。 过去半年里,他们有 94% 的代码都是 AI 贡献的。但人均需求吞吐率只提升了 60%,也就是之前的 1.6 倍。 这就有疑惑了,AI 写代码的速度至少是人的 10 倍以上,如果 90% 以上的代码都是 AI 产出的,效率至少应该提升 5 倍或者 10 倍吧?为什么只提高了 1.6 倍? 字节得出来的结论是,单一的指标,比如 AI 代码占比,根本没有办法代表真实的生产力。 如果把 AI 代码贡献率当成 KPI,结果就是大家都去优化 AI 的生成量,而不是优化交付能力。 看起来 AI 用了很多,但系统的效率并没有真正变好。 那为什么 90% 的代码都是 AI 写的,人效才提了 1.6 倍?一个很重要的原因是,写代码只是整个研发流程的一个环节。 写之前要理解需求、写 Spec,写完之后要验证功能、提交发布,这些环节如果还是传统方式,光把写代码加速了,整体效率提不上去。 洪定坤把字节在这方面的尝试叫做系统化的 AI Development,核心意思就是 AI 不能只管写代码,得让它进入更多的研发环节,整条链路都跑通,效率才能真正上来。 前两天出去的时候还跟别人争论这件事。现在还有不少公司在追踪员工到底用了多少 Token,说白了,这是在追踪过程。 更应该关注的是,用了这个工具之后,从结果层面去看,交付到底有没有变得更快、更可靠。 一个团队天天说自己 AI 工具用得贼溜,消耗了多少 Token,但没有什么有效的产出,那这到底是好事还是坏事。我觉得这是一个值得每个管理者思考的新问题。 反思二:功能正确≠工程可用 Vibe Coding 的理想状态是就像聊天一样,用自然语言表达自己的需求,最后做出来想要的产品。 如果哪里不对,再用自然语言和 AI 沟通,让它修改。这是过去一年 Vibe Coding 风靡的思路。 对于不太复杂的应用,这种方式完全没问题。我自己做的一些项目基本上就是这个流程跑下来的。 但只要是做生产级的软件,无论公司大小,流程肯定不是这样。 因为公司里必然有老代码,有一套约束。怎么复用已有的组件,安全和权限怎么处理,性能怎么保证,还有兼容性、可维护性。 正经写过工程代码的人都清楚,Vibe Coding 描述的那个状态是比较理想化的,更适合做小项目和验证想法。 真正的程序员虽然也在 Vibe Coding,但流程跟理想状态不一样。 字节内部做了一个实验来验证这个判断:三个模型,三个 Agent 框架,两两组合成 9 种方案,针对同一个需求,每组跑 100 次,总共 900 次。 结果发现,AI 在功能正确率上表现还不错,所有组合都超过了 80%,也就是说,AI 把功能写对的能力已经过了及格线。 但无论哪个组合,生成代码的工程质量都不太好。比如 UI 不对,没有复用组件,性能有问题,结构不符合规范。 这些问题大家在用 AI 写代码的时候应该都碰到过。 现在所有上了牌桌的 Coding 模型,都已经过了 Opus 4.6 这个级别的临界点,模型可以自主写代码了。 这个时候影响 AI Coding 成败的绝对不是裸模型,而是裸模型加上 Harness 的能力。 这个判断本身不算新鲜。 但我最受触动的是字节对 Harness 的理解。 他们的反思是,整个行业好像还是把 Harness 等同于 Agent 框架,诸如用 single agent 还是 multi agent,包含哪些角色,角色之间怎么配合。 这些当然重要,但字节在实践中发现,真正决定 AI Coding 能不能落地的,反而是更基础、更工程化的东西。 洪定坤把它叫做基建。 比如上下文工程有没有做好,架构的约束够不够清晰,团队的知识能不能有效沉淀下来,过去的技术债有没有梳理清楚。 这些看起来不那么性感的工作,反而直接影响 AI Coding 的效果。 实验数据也验证了这一点。同样的模型和框架组合,把这些基建结合进去之后,功能正确率直接从 80% 提升到了接近 90%,工程质量得分,也从之前 40 到 60 分的不及格水平,普遍提升到了 80 分左右。 基建做不好的话,可能的后果是,Vibe Coding 感觉快了,但实际整体可能更慢。工程的债,迟早得还。 反思三:代码门槛下降之后,团队怎么协同 洪定坤分享里有一个例子让我印象很深刻。 产品经理有个需求,发现还得等研发排期,就说那我自己来吧,用 AI 三下五除二就把功能给实现了。 确实这个功能不复杂。做完之后产品经理把代码给到研发,说我已经把代码写完了,现在你只需要帮忙把功能上线就行。 研发一看,不行。你这代码能跑,但不符合上线的规范,有权限问题、安全问题。 产品经理就很委屈,你们没时间做这个需求,现在我都做完了又不让上线。可研发看到的其实是代码质量的问题。 所以这里面就有一个需要所有人正视的事情,虽然代码的生成门槛虽然下降了,这并不代表系统的复杂度也下降了。 真实的业务系统里,代码要放到已有的架构里,要跟已有的模块配合,还要考虑各种各样的问题。 绝对不是谁写出来就能直接上线的。不然肯定会出问题。 怎么让不同角色的人用同一套工具和规范做出符合要求的代码,这是接下来大家需要去解决的。 字节的思路是在内部尝试工具化。比如把内部实践直接产品化,沉淀到 TRAE 里面,开放给所有人。 其实说白了就是工具化。 我看朋友圈有好多大佬也都在转这篇文章,应该还是有挺多共鸣的。 我感觉这一次分享多少也是一些拨乱反正吧。因为过去一段时间确实有很多听起来很离谱的言论,有些人会疯狂地炫耀自己使用了多少 Token,会认为这就代表着 AI Native...... 强烈推荐大家看看原文。字节跳动的公众号就有。
显示更多
0
32
243
42
转发到社区
说实话 看完这次大表哥@cz_binance 的访谈 我最大的感受不是他讲了什么新观点 而是这大表哥进去了一趟出来以后明显没以前那么锋利了 没进去前CZ是什么格?从容自信 掌控感极强 对自身商业帝国极度自信 监管找上门 还是梭哈的劲 身上永远带着一种老子能干翻一切的劲儿 但这次访谈里 你能明显感觉到 他开始谈信任、谈反思、谈成长了 甚至开场第一句话就是:“我失去了很多信任” 这话如果放在认罪前 你很难想象会从大表哥嘴里说出来毕竟过去几年 他几乎就是加密行业最成功的那批人之一 结果呢?全球最大交易所创始人 身价几百亿美金 最后还是被美国监管狠狠干了一顿 不仅罚款还进去蹲了四个月 很多人觉得这是CZ人生最低谷 但我个人反而觉得 这四个月可能是他这些年学到东西最多的时候 因为在币圈待久了你会发现一个很现实的问题 赚100倍不难 难的是你赚了100倍以后 还觉得自己可能会犯错 绝大多数人到那个阶段 都会觉得自己是天选之子 CZ以前多少也有点这种味道 但现在没有了 他说自己对美国监管体系失去了信任 这其实一点都不意外 换谁进去蹲四个月还能满脸微笑感谢监管机构? 但有意思的是 他又转头开始夸美国宪法 说美国具备自我修复能力 很多人觉得这是场面话 我倒不这么看 我觉得他是真的看明白了一件事:你可以不喜欢规则 但你必须接受规则 尤其当美国还是全球资本市场老大的时候 币圈这些年最大的问题 从来不是技术 是规则一直没定下来 项目方不知道怎么玩 机构不知道怎么进 散户天天猜政策 交易所天天赌监管 整个行业活得跟开盲盒一样 所以为什么最近美国那边什么清晰法案、稳定币法案能炒那么猛 因为大家不是在赌法案 是在赌确定性 市场最怕的从来不是坏消息 而是不知道下一秒会不会来消息 至于AI和Crypto那部分 说实话 很多人现在已经快听吐了 什么AI+Crypto 什么Agent经济 什么链上智能体 一天能冒出八百个概念 但大表哥有句话我倒是认同AI和加密不是竞争关系 AI负责干活 Crypto负责结算 未来真有大量AI Agent自己赚钱、自己付钱、自己调用服务的时候,传统银行系统大概率是接不住的 你总不能让两个机器人跑去银行柜台开户吧 所以链上支付、稳定币、自动结算这些东西 未来确实有机会成为AI时代的底层基础设施 但问题也在这里 这个故事是真的 可大部分项目是假的 现在市场上99%的AI币 本质上跟AI没半毛钱关系 换个LOGO 接个API 套个Agent概念就开始融资 所以别把AI和Crypto融合理解成 买几个AI Meme等起飞 那大概率又是一轮韭菜教育 还有一个细节我印象特别深 他说监狱里狱警和狱友最爱问他的居然还是加密货币 这事听起来有点好笑 但仔细想想又特别真实 加密行业这些年天天被媒体骂 天天被监管打 天天被说归零 结果从华尔街到监狱 从总统候选人到出租车司机 所有人都知道比特币 这就很离谱 也是为什么我一直觉得 加密行业早就过了会不会消失的阶段 现在讨论的根本不是活不活 而是最后会以什么形式活下来 其实整场访谈最值得看的不是AI 不是监管 也不是监狱故事 而是CZ整个人状态变了 以前他像个创业者 现在更像个幸存者 以前他在证明自己能赢 现在他在思考赢了以后怎么办 很多人总喜欢问 CZ还看好加密吗 这不是废话吗?他几乎全部身家都还在BNB里 他肯定看好啊 但我觉得真正值得关注的不是他说什么 而是他做什么 经历监管铁拳、罚款、坐牢之后 依然没有离开这个行业 依然把主要财富放在加密资产里 这本身就已经是答案了 我的看法也很简单 2026年这个市场最大的问题从来不是大表哥 也不是币安 而是整个行业的流动性正在被AI和美股疯狂抽血 BTC越来越像机构资产 ETH在争夺金融基础设施的位置 山寨币越来越边缘化 所以未来加密一定不会消失 但是很多人熟悉的那个随便买个山寨十倍百倍的时代 可能真的回不来了 CZ说加密没有删除键 我认同 但是我还想说一句行业没有删除键 不代表你的仓位没有删除键
显示更多
0
20
28
2
转发到社区
我用 TRAE Work 测了 豆包 2.1 Pro:视觉还原和前端设计、交互能力,真的超出我的预期了! 字节跳动最新发布的 豆包2.1 系列模型,官方介绍整体在 Coding 和 Agent 能力上有显著提升,VLM 能力保持领先,能力介于 Claude Opus 4.6 和 4.8 之间,这在项目中就很有想象空间了。 在进入正式项目中使用体验之前,先找一个前端设计图还原实现的题目,结合它的 Coding 和 Agent 能力,特别是 VLM 对设计图的布局、设计要素、细节、场景的理解。 我把操作过程录屏,可以看到我让 豆包2.1 参考的设计图,和一句简单的要求,它在执行前,会先思考整个规划和实现过程,然后读取我的设计图、理解它的使用场景和设计细节等,再调用对应最合理的 Skill 来规划整体网页实现逻辑。分步骤实现网页编写后,使用本地预览和视觉验证等来验证实现符合规划预期。 整体实现完成后,输出在视觉还原、交互和技术实现方面的实现细节,可以看出,非常细节,包括设计图中的设计感、布局,甚至不同标题和字体选择,都很贴切,自适应布局也是默认就有且很丝滑。 最让我意外的是,它居然还给每个部分真的配了有实际意义的图,而不只是占位!
显示更多
0
24
17
4
转发到社区
推荐这篇文章,Flask 作者 Armin Ronacher 写了这两天我看到最诚实的 loops 反思。之前两篇都在讲 loop 怎么搭、工程怎么落地,这篇问了一个没人敢问的问题:loop 写出来的代码你真的喜欢吗?如果你在用 AI 写代码,这篇可能会让你停下来想一下。 即将到来的 Loop 我不再给 Claude 写 prompt 了。我跑着一些 loop,它们负责给 Claude 写 prompt 并决定做什么。我的工作是写 loop。 — Boris Cherny 过去几个月,我看到越来越多的人在 coding agent 之上构建一些感觉上跟"直接用 coding agent"有本质区别的东西。模式到处都一样:任务被放进某种队列,机器捡起来、尝试、停下来,然后 harness 判断那是不是真的结束。 如果不是,harness 继续同一个 session、注入另一条消息、用修改过的 context 启动一个新的 session、或者把任务发给另一台机器。任务在模型自己本该说"我做完了"的那个点之后,继续活着。 我想这种 loop 想到自己都不好意思承认。 每个 coding agent 内部已经有一个 agent loop 了。模型调用工具、整合结果、再调用工具、读文件、改文件、跑测试、最终生成答案。那个 loop 我们已经相当熟悉了。另一种 loop 是 harness 级别的 loop:agent loop 之外的 loop。那个 loop 也不是新的。从 Claude Code 早期我们就一直在做各种版本,但那个 loop 在 agentic engineering 中越来越重要,最近几周已经开始主导 Twitter discourse。 我还不擅长这个 我目前的状况是:对于我真正在意的代码,我还没怎么成功用过这种工作方式——而这恰好是我相当大一部分代码。 部分原因是品味,部分原因是控制。我对我想要的代码样子设了一个很高的标准,我想理解我交付的代码。在压力下,或者跟另一个人讨论时,我想能够解释清楚系统做了什么,而不是先让一个 clanker 解释给我听。显然,这种"想理解代码"的愿望是否会在几年后依旧存在,是一个问题。但现在,我还没有越过"理解对我来说很重要"这个阶段。 基于这个愿望,对于没有我关注时写出来的代码,尤其是由 loops 产生的代码,我感觉有些东西缺失了。当前模型倾向于产生过于防御性、过于复杂、推理过于局部的代码。它们避免强不变量。它们添加 fallback 而不是让坏状态变得不可能。它们重复代码、发明糟糕的抽象、用更多 machinery 掩盖不清晰的设计。更糟的是:我几乎看不到这方面有什么进步。如果有什么变化的话,我觉得我们可能还在往错误的方向走。至少以我的品味,当前像 Claude Code with ultracode 这样的无人值守 harness 产出的代码,比去年秋天我们产出的还要差。因为 Claude Code 加 Fable 会连续不停地在一个问题上工作 30 分钟甚至更久,而过去这个过程会有更多人参与。 此外,一个众所周知的问题是模型倾向于观察到某个局部失败然后添加局部防御。Karpathy 提到他们"对异常感到极度恐惧"。在具有重要不变量的系统中,尤其是持久化数据格式或核心基础设施,正确的修复不是"处理每个异常情况"。正确的修复是让异常情况一开始就无法被表达或写入。但即便有大量人工引导,LLM 也不会自然地产生那种代码,而且即使代码自然地像那样产生了,它们仍然会试图处理现在已不可能的错误。 当你把这种行为放到 loops 后面时,你往往会放大它。如果每次迭代都添加一个小防御,系统会慢慢变得更不透明,同时表面看起来更健壮。你越放手,这种情况就越严重。当这样的工具交给没有清晰指导的初级开发者时,它还会教给他们非常糟糕的实践。因为如果你问他们为什么做所有这些,他们会令人信服地论证自己的做法。 Loop 在哪里有效 但与此同时,假装 loop 模式不管用也是不诚实的——它在某些领域已经好得惊人。 代码移植就是其中之一。已经有令人印象深刻的大规模自动化移植案例,包括报道中把 Bun 的部分代码从 Zig 移植到 Rust 的工作。我自己也成功用它把 MiniJinja 移植到了 Go。性能探索是另一个效果惊艳的场景。机器可以尝试实验、跑 benchmark、丢弃失败、继续搜索。安全扫描也自然适合,几乎任何类型的研究也一样:让系统探索一个复杂的问题空间然后汇报回来,不一定要提交持久化的代码。 这些场景的共性是:它们要么不生成新代码,而是转换已有代码;要么产生的代码有意不需要长期存活。它们要么产出 PoC 或想法,要么呈现发现,或者更像机械性的转换。 我相信,产出不需要长寿的 artifacts 的 loop,或者产出某种可清晰验证的机械性翻译的 loop,比 harness 机械性地衡量某个目标的一般能力更重要。很多成功的 loop 应用用另一个 LLM 作为 judge 或 orchestrator。机械性翻译场景可以用二元测试用例验证,但它也可以用 LLM 来评判! Claude Code 在创建完整的实验性工作流并执行它们方面,变得越来越好。当然,它生成的代码是 slop,但那更多是模型的问题,而不是 harness 不能很好地判断工作流中的某一步是否带来了净改进或完成。 Harness 只需要一些信号让它能继续。不需要客观或二元——只需要足够有用来驱动下一次迭代。 我非常喜欢那些能把我日常中的无聊部分拿走的 loops——做实验、测量、给我灵感。 软件作为有机体 另一方面,用同样的 loop 方法来写持久化的代码,我还不觉得舒服。我喜欢的比喻是:从软件作为确定性机器,到软件作为有机体。 我成为一名软件工程师的环境鼓励我理解机器。总有一层你可以剥开来加深理解。不展现确定性可观测行为的机器也许被接受,但一般不被认为是最优的。在软件架构上,我认为追求更多的确定性而不是更少是可取的。同样,理解代码的能力一直是一个不可否认的目标。实践中并不总是可能,但我们仍然以写出好的代码为荣,使得即使是新工程师也能通过巧妙的架构在复杂的代码库中导航。在设计良好的系统上,总有一些工程师知道不变量在哪里,哪些部分是承重的,哪些改动是安全的。理想情况下所有这些都是有良好文档的。在缺乏这种理解的地方,通常被认为是需要改进的事情。 显然,那个理想一直都很紧张。许多软件系统,尤其是非常成功的系统,在工程师能让它保持干净的时期过后,常常变得太大、太动态、太依赖外部服务,无法装进任何人的脑袋。即使没有 LLM,我们在诊断分布式系统时也已经有点像医生了:观察症状、提出假设、"开更多检查"、尝试一些补救措施、再次观察。 但有了 LLM,我们正在沿着这个方向走得更远更快。我们用它们来写代码,也用它们来诊断和治疗。已经有大量工程师生活在这样一个世界里:生产问题发生后的第一步是让 clanker 读日志、提出根因、主动提出 patch。结果 patch 通常被另一台机器捡起来审查,有时甚至没有任何人工监督就合并到了 main。 显然这很强大,我不能否认它听起来很诱人。但屈服于这个想法,特别是随着人类监督越来越少,意味着接受我们可能无法再以同样的方式理解整个系统。我们治疗它、监控它、稳定它,但我们不一定理解它。 我毫不怀疑对于某些软件来说,这没问题。不是每一行代码都值得人类作者身份,而且过去也可能写过更差的代码。 但我希望所有软件都这样写吗? 你无法完全退出 非常令人不安的是,选择退出这个全机器驱动的未来可能不是一个选项。 安全是最清晰的例子。即使你不用 loops 来构建你的软件,别人也会用 loops 来攻击你的软件。攻击者会持续运行机器,即使不是攻击者,安全研究人员也会,而其中一些自动化工作会产生大量噪音但也会发现真正的问题。信号和噪音都会以如此大的规模涌向你,以至于你几乎不得不也扔一台机器来处理。 Daniel Stenberg 关于 curl 的 summer of bliss 的帖子是一个很好的例子,展示了维护者已经承受的压力。据我所知,AI 在 curl 的核心开发中并没有扮演重要角色。但尽管如此,维护者还是被报告淹没了——其中大部分是 AI 生成的。 如果攻击者和报告者都在 loop,防御者最终也需要 loop 才能跟上。也许不是直接写 patch,也许只是用来 triage 和复现——但压力会增加。 竞争也是一样。有些团队会通过原始速度超越其他团队。有些项目会突然加速,因为一个小团队搞清楚了如何有效编排机器。有些 startup 可以用五个人做到过去需要五十个人的事。有些人可能会直接把一台机器放在一个 loop 里对着你的产品,告诉它"把它做得像那个一样"。而如果他们的用户很开心,这真的重要吗? 不是所有软件都会受到同等影响。有些领域会惩罚草率,要求信任和责任,但很多软件生活在一个原始速度、快速实验和大面积覆盖至关重要的世界里。 建立新的依赖 最可怕的部分是,我们以新的方式变得依赖于这些新机器。软件一直依赖工具。我还记得我不得不为编译器付费的时候。这些新工具让人回想起那些创造软件需要真实成本的日子。但现在不再是一次性付款了——它是一种持续的依赖。不只是对钱包的依赖,还有认知依赖。 如果一个代码库由 loops 产生、由 loops 审查、由 loops 打补丁、由 loops 维护,当你不再能访问同等级别的系统时会发生什么?当某些贸易限制剥夺了对最强模型的访问时?如果只是成本变得不可接受呢?如果你和你的团队只是丧失了不用机器理解代码的最后一点能力呢? 我们可能会创建出不仅人类难以维护、而且把机器参与作为其维护模型前提的代码库。这已经在发生了!不是在所有地方都发生,甚至可能不是以被视为有问题的方式在发生,但我们看到越来越多。人们越来越多地合并他们不能完全解释的代码。人们失去了创建 issue 报告或在聊天中讨论事情的能力,而不借助 clanker 增强或改写他们的消息。太多人越来越依赖机器来总结或提供上下文。我越来越多地遇到通过 LLM 这个中间人与我交流的人。 再说一次,也许这甚至不一定是错的,但它对我们做事的方式是一个巨大的改变。 未来的 Harness 我毫不怀疑这就是方向,但朝着这个方向走需要我们在所有地方都改善我们的工具,而不只是在 coding agent 里。 仅仅编排更多的 loops 是不够的。更好的变更可视化或编排或 agent 不会恢复我们的理解。要么我们需要找到巧妙的方法把人拉回 loop,让 loop 的变更长期可读,要么我们需要找到更好的方法来组合这些越来越复杂的系统。 这也是我对 Pi 的角色的想法在变化的地方。Pi 一直很谨慎,我认为这种谨慎是好的。我不希望一个每一次交互都变成不受控制的机器 swarm、做出我无法跟上的变更的未来。我不希望 Pi 为了赢得"软件自己写自己"的竞赛而变成一个不可维护的混乱,我也不希望 Pi 推广这类工程。但与此同时,Pi 是一个 harness,而 harness 正处在人们运行这些新型实验的中心。 编码任务的任务队列、agent 编排、子 agent、持久化 session 会变得越来越重要。即使是我们这些有保留意见、没有盲目拥抱 loops 的人,也必须要开始做这些实验了。因为我们需要理解如何让这个未来有边界、可生存。 控制 Loop 正如你从这篇文章中读到的,我对这个未来非常不安。不是因为恐惧,而是因为基于对这项技术至今的经验而产生的谨慎。 采用 harness loop 的想法意味着 harness 决定工作何时完成。在 agent loop 中,模型最终说"完成"然后我审查。即使在那之前,我通常也在沿途引导。我参与其中,我喜欢在学习中前行。在 harness 操作的 loop 中,我不确定我的角色到底是什么。甚至"完成"信号也失去了所有意义,只是变成了传递给另一台机器进行评判的信息。我的角色被简化为一个信使。 今天,我不喜欢我看到的那种用这种方式构建的系统产生的代码,我也不喜欢与太多用 AI 辅助构建的软件交互。Loop 很强大,但它越来越多地移除责任,至少在当下它非常鼓励我们向机器投降。 然而,我毫不怀疑这个 loop 化的未来就是我们的未来——尽管我目前对此感到反感。我已经看到惊人小的团队以不可能的速度在构建,我看到代码库正在变成越来越模糊和混乱的有机体,只能由更多机器来诊断。这些代码库同时既有用又混乱。 所以我想我开始接受一个事实:问题不是我们会不会 loop——显然我们会的。也许问题是:在一个 loops 的未来里,我们如何不放弃判断,如何在其中保留良好工程的原则,如何确保负责任的人能够继续监督,如何重新思考我们架构代码的方式以在其中保持清醒。 原文:Armin Ronacher, "The Coming Loop", 2026-06-23 链接: #AI# #Loops# #软件工程# #反思#
显示更多