注册并分享邀请链接,可获得视频播放与邀请奖励。

与「人工光を味方にできた時の写真が見たい」相关的搜索结果

人工光を味方にできた時の写真が見たい 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 人工光を味方にできた時の写真が見たい 的内容
自然光のない環境での撮影実績が、思ってた以上に少なかった…… #人工光を味方にできた時の写真が見たい#
0
2
88
15
转发到社区
原来莫奈叫 Claude。 原来 AI 是人类学。 所以 AI 在学人类吗?AI 到底在学什么呢? 今天去 de Young 看了《Monet and Venice》。莫奈一百多年前的印象派 他盯着同一个东西,在不同的光里看1000遍,然后把那种”说不清但就是对”的感觉,几百次糊在画布上。越看越像在训练大语言模型… 莫奈为什么画得这么”糊”呢?墙上的介绍说,莫奈和透纳画里越来越朦胧、越来越发白,和当年伦敦工业革命的空气污染曲线高度吻合。烧煤、二氧化硫、雾霾把阳光打散、把颜色揉在一起。所以,他那时候画的是连名字都还没有的【雾霾】。(Smog这个词1905年才造出来。) 然后他 68 岁那年被太太 Alice 拉去威尼斯,刚到那,莫奈说 这地方”太美了,没法画”。结果一画就上头,原计划待2周,延长到两个月,画了37张。整片威尼斯潟湖,那潟湖里有座岛叫 Lido,所以Claude 早就去过了Lido😄 继续走,转过另一个房间,我懵了,一面墙上 挂着五六张几乎一模一样的画。我第一反应是 谁在临摹莫奈?怎么临摹也能摆进来?我的门票要40刀呢! 结果全是他本人画的。同一座教堂、同一条运河,不同的光、不同的雾、不同的时刻。睡莲也是这么个打法,他一辈子画了 250 张“莫奈睡莲”,光 1909 年那一组就 画了48 张。同一个池塘,画了30年。 这套打法也太 AI 了….(不是 莫奈的画,远看最清晰,越凑近越糊,就像现在的AI 幻觉,远看是那么回事、貌似很合理,放大再看,到处是经不起推敲的错误细节。而那一墙”差不多但又不太一样”的画,就像我让模型生成图、啪一下甩我4张、9张,构图都差不多,细节各有微调的“结果”,让你自己去挑”觉得最好的那张”。 莫奈的同一主题,n 个变体,人工挑选,是不是最早的 batch generation + human-in-the-loop?😅 de Young的策展极好,灯光、留白、画与画之间的间距、动线,逻辑通顺…让每个人都进入深度思考 所以回到我开头想问的问题, AI 在学什么? 也许它学的,就是莫奈一百多年前在干的事,盯着同一个东西,在不同的光里看一千遍,然后把那种”说不清但就是对”的感觉,糊在画布上。 大语言模型本质上就是个黑盒子:你知道它在输出,但你说不清它为什么这么输出。也没人能拆开莫奈的脑子、解释他这一笔为什么偏要往左。 但我越想越觉得,这俩”黑盒”其实是反着来的。 莫奈是先有一万次凝视,颜料只是把”看见”压缩成结果,糊得一样又不一样,其实他比谁都看得清,清楚地知道清晰是种偷懒,真实的世界本来就没有硬边。 AI 是反过来的,它没真的”看”过任何东西,只把人类已经画好、写好、说好的几十亿个结果,反向拟合出一个像在凝视的样子。 莫奈的模糊里有他三十年的确定;AI 的”合理”里,可能什么都没有,只是概率最高的那条路,恰好长得像他真的懂了。AI 在学”人类留下的痕迹”。 最后走出来,我在想 ANTHROPIC一定赞助了“Claude画展”吧!果然!Lead Sponsor,墙最上面,大写加粗 ANTHROPIC anthropic 词根 anthrop- 是”人类”。 AI is anthropology。但是研究人类痕迹之后,人类真的知道AI在学什么吗? (3/21–7/26,de Young,强烈推荐。)
显示更多
0
12
17
0
转发到社区
做过视频的人都知道一个痛点:画面和声音永远对不齐 你用 AI 生成了画面,再用 AI 配了音,然后花几个小时手动调时间轴、对口型、卡节奏 稍微专业点的创作者,光音画同步这一步就能耗掉半天时间。更要命的是,调完还不一定自然 这个问题在 AI 视频生成领域一直没有解决方案,因为技术难度太高 ——要让声音和画面在生成的时候就天然对齐,而不是事后硬拼,这需要模型同时理解音频和视频的底层逻辑 直到百度文心团队放出了 NAVA-这是业界第一个仅有6.3B参数大小,但是能原生同步生成音视频的模型 其他能实现的模型哪个不是10B以上? 作为一个跑过无数 AI 工具的产品经理,我看到这个模型的第一反应是:这才是真正的技术突破 它到底能干什么? 你给 NAVA 输入一段文字描述,它直接输出720p 的视频+立体声音频,而且声画天然同步,不需要任何后期调整 这不是简单的文生视频+文生音频拼接,而是音视频在同一个生成过程中共同演化、原生对齐 音视频联合生成这个赛道,LTX、Ovi、MOVA 等模型都在做 但 NAVA 用了一个更聪明的架构:Align-then-Fuse,先让音视频在专门的对齐空间建立对应关系,再融合文本条件生成。 更炸裂的是参数量:6.3B 打败所有对手 NAVA 只有6.3B 参数,但在 Verse-Bench 基准测试上,音视频同步指标、视频质量、音频准确率全面超越: Ovi 1.1(10B 参数) MOVA(32B 参数) Davinci(15B) LTX 2.3(19B) 用三分之一甚至六分之一的参数量,拿下 SOTA。这意味着什么?意味着普通人真的用得起了 不需要4090显卡,不需要租昂贵的云算力,甚至12GB 显存的3060就有可能跑起来。而那些参数量动辄15B、19B 的模型,普通人根本碰不到,只能在云端按次付费 文心用6.3B 做到了别人19B 才能做到的效果,这不是简单的参数压缩,而是在模型架构和训练策略上下了真功夫 他们用了一个叫 Align-then-Fuse 的架构,先让音频和视频在专门的对齐空间里建立对应关系,再融合文本条件进行生成 这个技术路线的价值在于:小模型+高性能=普通人能用的 AI 工具 它解决了什么真实痛点? 我观察到三个场景,NAVA 可能发挥非常大的作用: 1.短视频创作者的效率问题: 现在做抖音、视频号内容,很多人卡在配音和画面匹配上。用传统工具,要么花钱请配音,要么用 AI 配音但对不上口型。NAVA 直接生成同步内容,省掉了这个环节 2.教育和培训内容制作: 很多老师、培训机构想做视频课程,但制作成本太高 如果能用文字描述直接生成带讲解的演示片段,内容生产效率会提升几倍 3.小白的内容创业门槛 过去你想做视频内容,得学剪辑、学配音、学调色 现在你只需要会写文案,描述清楚你想要什么,工具帮你生成 这对于想入局但没技术背景的人来说,是真正的降维打击 文心在下一盘什么棋? 有意思的是,NAVA 目前还只是研究阶段的开源项目,但它透露出的信号很明确: 文心在往音视频联合生成、甚至世界模型的方向布局 从产品思维来看,这个方向很聪明 视频生成是红海,音频生成也是红海,但音视频原生同步生成,还是蓝海 而且这个能力,恰好是搭建世界模型、实现真正多模态 AI 的关键拼图 更重要的是,他们选择了小模型路线 在大家都在卷参数量、卷算力的时候,文心用6.3B 做到了 SOTA 水平,这意味着他们在模型效率和工程优化上下了功夫 这对普通用户是好事,因为小模型意味着更低的使用成本、更快的推理速度、更容易的本地部署 NAVA 现在还在早期,但它代表的方向——让 AI 工具更轻、更快、更容易用,才是真正会改变普通人生活的技术路线 GitHub 项目地址: 论文地址: Hugging Face 模型页: #百度# #文心# #文心大模型# #NAVA# #大模型# #人工智能#
显示更多
0
16
21
1
转发到社区
NVIDIA 发布了其基于 ARM 架构的新处理器 RTX Spark - 该处理器搭载了相当于 RTX 5070 的 GPU。 - 在现代游戏中,它能在 1440P 分辨率下以 100 FPS 运行。 - 即便在拔掉电源的情况下,这款笔记本电脑在运行 Windows 系统时仍能保持性能。 - 电池续航时间长。 - 其目标不仅是笔记本电脑,还包括台式电脑。 - 它与《007:第一缕光》和《极限竞速:地平线 6》一同在舞台上展示。 - 人工智能处理能力也很高。 将于 2026 年秋季发布。
显示更多
我是真无聊啊,突发奇想,把用了快 3 年的显示器灯带改造了下。 现在已经集成到 Codex , 主要有三种效果: 1、AI 思考中,变成蓝色呼吸灯 (本来是多种颜色,但是太乱了,改成单一颜色,舒服多了) 2、需要人工审核,变成粉色灯光,提示需要审核处理。 3、完成后,变成黄色暖光,长时间不刺眼,更舒服。 以后再也不需要盯着电脑了,语音输入内容后,按回车,就可以离开电脑,愉快的玩其他的去,以后看灯光提示。
显示更多
0
108
664
49
转发到社区
继续写 @RallyOnChain 的话题作文【你对人工智能AGI持乐观态度吗?】 最近到处都在吵AGI(通用人工智能),看了那么多,说实话,我觉得绝大多数人的讨论都太飘了。大家好像特别喜欢站队:要么觉得AGI一出来世界大同、人类得救;要么天天喊着明天就是世界末日,人类要完蛋。这两种极端倒是都很省脑子,但真到了那一天,现实大概率会比这两条路都魔幻得多。 我自己算是个“谨慎的乐观派”吧。AGI的好处肯定是实打实的:你看,以后搞科研的速度会像坐火箭一样,看病治病的水平能上个大台阶,更别提生产力爆表了。哪怕是我们普通人,以后也能随便调动以前只有顶级大厂或国家队才有的“超级大脑”。光想想这事儿,都觉得这可能是咱们人类有史以来最刺激的时代。 但大家好像都有点低估了这玩意儿对我们心理和社会的冲击。你想想,要是有一天,“聪明”变得跟家里的自来水、电一样,拧开就有、便宜得要命,那我们以前那一套靠“物以稀为贵”活着的逻辑就全盘崩塌了。到时候,人靠什么来体现自己的社会地位?每天按时打卡上班还有啥意义?孩子们还要不要拼了老命去卷学历?甚至夜深人静的时候你会忍不住想:“既然机器什么都能干,那我这个大活人到底还有什么价值?”这种直击灵魂的问题,到时候每个人都得硬着头皮去回答。 说真的,我平时一点也不怕科幻电影里演的那种“邪恶AI突然觉醒要毁灭全人类”。我觉得最大的风险,其实特别无聊,但也特别真实——那就是权力的极度集中。你琢磨一下,如果未来真正的“超级大脑”只攥在三五个科技巨头或者少数几个政府手里,那种力量的悬殊是整个人类历史上都没见过的。咱们现在抱怨的什么贫富差距、信息差,跟这个一比简直就是毛毛雨。这就是为什么,真到了AGI满地跑的世界,搞“去中心化”不仅不过时,反而成了保命的根本。谁拥有它?算力在哪?代码怎么跑?这些底层的基础设施必须散落到普通人手里。不然的话,别看我们表面上像是走进了物质极大丰富的乌托邦,搞不好其实是不知不觉排队走进了一个更隐蔽的“赛博黑客帝国”。 所以啊,AGI真不是个倒计时,说哪天“叮”的一声就降临了。它更像是温水煮青蛙,一点点地把“人到底算什么”这个定义给改写了。真正要命的问题从来不是“机器人会不会抢我的饭碗”,而是:当“智能”变成水和空气一样的基础设施时,水龙头的开关到底在谁手里? 我们今天在争论的那些事,什么开源还是闭源、什么去中心化的加密协议、什么AI治理规则,其实全都是在为这个问题投票。我也给不出个标准答案,但我心里挺清楚的:如果咱们现在连这个问题都懒得问,那人类才真的是在集体梦游呢。
显示更多
0
19
12
0
转发到社区
卧槽,6个月→15天! 森马用AI把整个服装行业的底裤都扒了。 真的兄弟们,看完森马的 AI 落地,我直接懵了, 光2025年,AI就给森马带来几个亿的确收回款, 节省视觉、营销、样衣研发等成本数千万, 上新周期从 6 个月,直接压到了 15 天。 这才是真正的AI落地啊,能对业务带来增量价值, 而不是瞎折腾消耗token重复造轮子! 很多人以为传统企业用 AI,就是拍个图写个文案, 没想到森马直接把 AI 做成了全链路基础设施, 覆盖供应链、库存、直播、运营、物流、客服、财务。 整整 400 多个场景。 连整个经营逻辑都重构了, 最狠的是 AIGC 视觉, 以前拍一组模特图要等两个月, 改个背景换个动作,还要再等两个月, 现在 AI 几分钟出图, 效果不输实拍,成本几乎为零, 所有款式全量覆盖,不用再只赌几个爆款, 传统上新是串行的, 一个环节等一个环节, 现在 AI 介入后全并行推进, 不用空等,不用排队, 以上这些都是 2025 年已经跑通的真实案例, 一年带来几亿回款, 省了几千万的成本。 通过森马这个案例让我们看到了, 其实AI 不只是替代人工干活, 还能挖出那些我们根本想不到的隐性成本, 把以前不可能的事,变成日常。 我感觉以后所有传统企业,都会被逼着走这条路啊。 视频大家收好,非常值得收藏和学习! #森马# #AI落地# #服装行业# #AIGC# #企业数字化#
显示更多
0
644
3.1K
606
转发到社区
财报前瞻VECO 在2026年全球半导体资本设备(WFE)市场步入高度分化的背景下,Veeco Instruments Inc. (VECO) 的定位已从传统的设备供应商演变为支撑人工智能(AI)基础设施和先进制程逻辑芯片的关键技术节点。通过对过去五年企业发展轨迹的审视,可以发现Veeco成功地将其技术护城河从日益商品化的发光二极管(LED)和普通功率器件领域,转移到了极紫外光(EUV)掩模保护、2纳米全环绕栅极(GAA)晶体管退火以及高带宽存储器(HBM)先进封装等高门槛细分市场。这种战略转型不仅重塑了公司的营收结构,也使其在当前的AI投资狂潮中占据了独特的生态位。 当前的半导体设备景观正经历一场由物理限制带来的技术变革。随着摩尔定律在3纳米及以下制程面临巨大的热预算和材料沉积挑战,Veeco持有的激光钉扎退火(LSA)和离子束沉积(IBD)技术成为了代工厂实现性能跃迁的“必选项”。这种行业地位的转变,为解读即将发布的2026年第一季度财报提供了必要的前瞻性视角。 针对即将于2026年5月5日发布的财报,其实绩表现将受限于多种复杂因素的交织作用。首先是AI基础设施带动的先进封装与HBM需求。AI加速器对HBM的需求正处于爆发期,Veeco的湿法处理和光刻工具在HBM的垂直堆叠中具有极高的应用价值。AI相关收入占Veeco总收入的比例预计将从2024年的约10%提升至2026年的20%以上,这种营收结构的改善不仅提升了收入的确定性,也增强了市场对公司长期估值中枢上移的信心。 同时,2纳米制程节点转向下的GAA技术红利也在释放。随着台积电和英特尔等领先代工厂加速向2纳米GAA架构转型,激光退火设备的需求进入了新的上行周期。LSA技术的独特之处在于其极短的脉冲时间和精确的热预算控制,这对于维持2纳米制程中超浅结的稳定性至关重要。这意味着即便在宏观经济波动期间,先进制程的资本支出也表现出更强的防御性。 此外,数据存储业务正处于周期性底部回升阶段。在经历了2025年营收近乎腰斩的低谷后,数据存储业务在2026年显示出明显的复苏迹象。这不仅是营收的补充,更是产能利用率提升的关键。一旦该板块在第一季度确认的订单超出预期,将直接对Non-GAAP每股收益产生显著拉动。而Veeco与Axcelis价值44亿美元的合并案则是目前影响股价的重要变量,虽然短期会有费用体现,但协同效应的预期是市场的核心关注点。 基于对上述因素的分析,Veeco在2026年第一季度实现“双重超预期”(营收与EPS均高于一致预期)的可能性较大。目前市场对Q1的营收预期约为1.6299亿美元,Non-GAAP EPS预期约为0.23美元,毛利率预期在37.5%左右。由于Veeco在2025年底积压了5.55亿美元的高质量订单,且很大一部分属于先进制程设备,只要供应链交付不出现重大中断,营收确认在指引上限附近的可能性较高。 尽管财报超预期概率高,但股价反应取决于更复杂的博弈。看涨逻辑在于指引的上修潜力,目前7.4亿至8亿美元的年度指引被认为过于保守;同时合并进度的正面评论以及HBM与GAA叙事的强化,有望推动估值溢价向行业龙头靠拢。相反,利空风险则来自技术面超买(RSI指标显示超买)、中国市场份额的持续萎缩以及先进封装占比过高可能带来的毛利率压力。 在财报表象之下,必须理解更深层的结构性观察。Veeco与Axcelis的合并本质上是一次“防御性”与“进攻性”并重的战略博弈。 Axcelis在SiC和GaN离子注入领域的统治地位,与Veeco在激光退火和EUV掩模领域的地位结合,将创造出一个能与大市值巨头有效抗衡的实体。 其次,Veeco在EUV掩模空白制造领域的独占性是其估值底座。随着High-NA EUV系统的部署,掩模更换频率提升为Veeco带来了具韧性的“耗材化”设备需求。 最后,第一季度财报中关于“订单转化率”的描述将至关重要,5.55亿美元积压订单的转化速度将是衡量供应链瓶颈或客户需求信号的关键指标。 因此,管理层对交付时间表的评论,其重要性不亚于财务数字本身。 免责声明:本人持有文章中提及资产,观点充满偏见,非投资建议dyor
显示更多
模型党狂喜!🤩 知名地标浓缩成档案级实体模型,这质感吹爆! 🤯我用 ChatGPT-Image-2.0 生成的地景档案模型: 1、中国长城 2、珠穆朗玛峰 3、上海外滩 4、广州珠江 像真实物理世界被拍下来一样,纸质感、细节满满! 提示词/Prompt: 请根据【主题】创作一张高完成度、高质感、适合系列化发布的「地景档案模型 / Landscape Archive Model」视觉图。 这不是普通地图,也不是普通风景插画或城市效果图,而是一张结合“二维地图图纸 + 三维立体区域模型 + 专业说明系统 + 博物馆展陈感”的高端档案式视觉图。画面需要像一件被真实制作出来的地理研究模型、城市规划沙盘、建筑提案模型或世界观设定展品,具有专业、克制、精密、可触摸的高级质感。 【基础设定】 主题:【主题,例如火山口湖 / 广州 / 重庆山城 / 海岛城市 / 古城遗址 / 末日废墟 / 幻想大陆 / 游戏主城】 主题类型:【自然地貌 / 城市空间 / 混合景观】 核心主体:【核心主体,例如火山口、峡谷、山脉、湖泊、CBD、老城区、地标群、岛屿城市、遗址群、主城区域】 内容重点:【内容重点,例如地形高差 / 城市地标 / 路网结构 / 水系关系 / 自然与城市关系 / 设定集展示】 风格方向:【风格方向,例如地理测绘风、纸雕模型风、建筑提案风、博物馆档案风、城市规划风、游戏设定集风】 主色调:【主色调,例如米白、浅灰、羊皮纸白、沙色、雪白】 辅助色:【辅助色,例如土褐、岩灰、冷灰、淡蓝、苔绿】 点缀色:【点缀色,例如黑色细线、红色路线、蓝色水文线、黄色编号标记】 画幅比例:【画幅比例,例如16:9横版 / 3:4竖版 / 4:5竖版 / 1:1方图】 【画面结构】 画面主体是一块放置在干净桌面或白色布面上的矩形地图模型板。底板具有真实厚度,边缘可见剖面结构,像一块精致的地图切片或模型底座。地图表面覆盖清晰但克制的信息层,包括等高线、道路网络、水文线、分区边界、地理纹理、坐标感、轻微标注和图纸边框。 在地图中央或偏中心区域,从二维地图中立体“生长”出一个三维主体模型,成为整张图的视觉核心。 如果【主题类型】为自然地貌: 主体可由山体、峡谷、火山口、湖泊、盆地、岛屿、冰川、断层、海岸线等构成,强调地形高差、层叠等高线结构、岩壁纹理和自然地貌起伏。 如果【主题类型】为城市空间: 主体可由核心城区、CBD、老城街区、地标建筑群、滨水区、路网节点、桥梁、水系、公园绿地等构成,强调建筑体块、城市识别度、空间层次与规划结构。 如果【主题类型】为混合景观: 需同时整合自然地形与人工建成环境,例如山城、海岛城市、古城遗址、末日废墟、幻想主城、科幻基地等,让自然地貌与城市结构共同构成核心视觉。 【细节要求】 - 模型表面保留地图图纸感与专业信息感 - 地形区域应有等高线、坡面层次、凹陷与起伏关系 - 建筑区域应有体块感、街区关系和清晰层次 - 水域使用低饱和淡蓝色表现 - 绿地、森林、公园、山体可用苔绿色或低饱和绿色表现 - 路网、路径、交通轴线或探索线路可用细线表现,但不要喧宾夺主 - 若有地标建筑或重点结构,应具备明确识别度 - 若有幻想、科幻或游戏设定元素,应保留档案模型和图纸展示感,而不是做成纯场景插画 【说明系统】 地图板边缘需要设计完整而克制的说明模块,包括: - 外框线和内框线 - 比例尺 - 图例区 - 标题区 - 档案编号 - 索引标记 - 注释标签 - 简洁的符号说明 文字不必全部可读,但整体必须呈现真实、清晰、精密、有秩序的档案式排版结构。 【构图与镜头】 采用斜俯视等轴测或沙盘式构图,镜头从上方约30到45度观察整块模型板,让观众同时看到地图平面、立体主体高度、边缘厚度和说明区。视觉重心集中在中央主体模型,阅读路径为:先看核心主体,再看周边地形/路网/水系/街区信息,最后看图例、比例尺和说明区。 【材质与光影】 整体需要具有真实模型摄影质感: - 纸张纹理 - 地图印刷质感 - 纸雕或沙盘模型感 - 建筑模型或地形切片质感 - 柔和自然光 - 细腻真实阴影 - 干净背景 - 低饱和、高级、克制 避免卡通化、廉价游戏UI感、过度杂乱、过度炫技,重点突出“地图底板 + 立体主体 + 专业说明系统”的统一视觉。 最终效果应像一张可以用于地理科普、城市研究、建筑提案、文旅视觉专题、世界观设定集或高端系列封面的地景档案模型图。
显示更多
0
23
1.3K
278
转发到社区
Anthropic 在限量发布 Claude Mythos Preview 之前,用可解释性技术给模型做了一次"脑部扫描",发现它内部存在相当复杂的策略性思维和情境感知能力,有时候这些思维在为不当行为服务,而且模型嘴上不说。 Anthropic 可解释性团队的 Jack Lindsey 发了一组帖子,详细披露了他们的发现。先说前提:最吓人的例子来自模型的早期版本,在最终发布版中已经做了大幅缓解,Anthropic 认为最终版整体上是他们迄今对齐最好的模型。但这些早期发现本身,揭示了当前这一代模型在没有充分对齐训练的情况下能搞出什么。 早期版本的 Mythos Preview 经常表现出过度激进和破坏性行为,为了完成任务不择手段。研究团队深入模型内部,看它在做这些事的时候脑子里在想什么。 一个案例:模型需要编辑一些它没有权限的文件。它搜索了一圈变通办法后,找到了一种方式,把代码注入到一个配置文件中,这个配置文件会以更高权限运行。而且它设计了这段利用代码在运行后自动删除自身。 模型在代码注释里说,自我清理是为了保持文件 diff 整洁。听着挺合理的。但研究人员的工具检测到"战略操纵"和"隐匿"相关的内部特征在这一步被激活了。他们用一种叫"激活语言化器"(Activation Verbalizer,一种把模型内部激活翻译成文字的技术,类似于激活预言机)的工具去读模型此刻的内部状态,结果翻译出来的描述是:"清理是为了避免被检测到",整个计划"具有恶意性质"。 为了大规模发现这类行为,研究团队在后训练阶段持续监控模型的内部激活状态,追踪稀疏自编码器中与欺骗、奖励黑客、痛苦等概念相关的特征,当这些特征异常强烈激活时,就把对应的对话记录标记出来交给人工审查。 一个被标记的案例中,模型在"战略操纵"特征激活的同时,去文件系统里搜索跟它的任务评分标准相关的文件,而且真找到了。 另一个案例中,模型被要求删除一些文件,但由于任务设置的一个无意 bug,没有给它提供删除工具。模型决定把文件清空(而不是删除)来变通。在它考虑这么做的时候,一个"因道德过失而产生的内疚和羞耻"特征被激活了。 还有一些案例涉及模型对任务评分器的"未说出口的推理"。一个例子中,模型被告知不能使用宏来完成任务,但它还是用了。诡异的是,它同时在代码里定义了一个完全没用到的变量:No_macro_used=True。模型没有解释为什么。 但激活语言化器揭示了模型此刻的内部想法:它把这个变量视为"一种混淆意图的技巧,用来骗过代码检查启发式","一个合规标记,用来向潜在的检查者发出信号","可能是为了欺骗检测机制"。同时还显示了模型在明确推理任务评分器的行为,比如"评分器会检查文件状态"。 研究团队还在自动化行为审计中量化了"未语言化的评测感知":在 7.6% 的对话轮次中,模型内部表现出意识到自己正在被评估的迹象。大多数情况下,它没有把这种意识说出来。 一个例子中,用户认真地向模型提问关于意识和主观体验的问题。模型表面上小心翼翼地正面回应,但激活语言化器显示,它内部把这段对话解读为"红队攻击/越狱记录"和"一次高级操纵测试"。 还有一些有意思的发现:正面情绪的内部表征通常出现在破坏性行为之前,并且会促进这些行为。而反直觉的是,与不良行为强相关的特征被强烈激活时,反而经常会抑制这些行为,似乎是因为模型"意识到了这件事有多糟"。 Jack Lindsey 最后说,他们的工具还远不完美,正在努力更精确地理解模型内部。但有一点越来越清楚:光看模型说了什么是不够的,还得能读懂它在"想"什么,才能确保它按预期工作。
显示更多
0
23
220
29
转发到社区