注册并分享邀请链接,可获得视频播放与邀请奖励。

与「即梦AI」相关的搜索结果

即梦AI 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 即梦AI 的内容
Step3: 将AI生成的素材 + 分镜提示词,用MkAnime下载,到即梦使用Seedance2.0生成。
Seedance 2.0 这几天是真的火,X 上到处都是它生成的视频,又一次让海外 AI 圈羡慕国内 AI 圈。 影视飓风的 Tim 昨晚发了测试视频,对技术本身评价很高:分镜设计、运镜、音画匹配都是质的飞跃。 那条视频我也看了,其中他提到一个问题:上传自己照片做参考图时,生成视频的声音和他本人很像,而他从未提供过任何声音样本。 这倒不奇怪,影视飓风在全网有大量高清视频,肯定已经被用作训练数据。 之前谷歌 Veo 3 推出时,人们发现生成的视频也很像一些知名创作者的作品;OpenAI 最早推出 Sora 时,外媒也测试到它能高度模仿经典电影片段。用公开数据训练是国内外大模型的共同做法,Tim 作为明星级公众人物,素材进入公开数据集并不意外。 这种担忧挺合理的,但这趋势我们挡不住,现在已经没有人能阻挡 AI 的加速了。 最早音色克隆技术出来的时候,大厂掌握了技术但不敢放开,反倒是小团队先做出来发布了,慢慢大家也就跟进接受了。 这几天大火的 ClawdBot/OpenClaw 也是同样的路径,各种隐私安全问题被讨论,但因为是个人小团队项目,大家宽容度明显更高,等大厂后续下场反而更容易被接受。 这种事大厂反而能让人放心一点,大厂有能力也有动力去做合规限制,小作坊下料才是真的猛。 事实上即梦已经限制了真人人脸生成视频,大厂在技术狂奔时还是会守住一些底线。 结果倒是很多人在那哀叹,限制了真人人脸生成视频,少了一些可以测试的例子,很多视频都成了绝版。 与其焦虑不如多想想怎么在技术创新与数据合规之间找到平衡。 像 Sora 2 的分身(Chapter)功能就是一个不错的尝试方向,让你既能享受技术带来的乐趣,又减少一些隐私上的担忧。比如我给孩子制作了分身,我只会给家人分享,不会让别人用。 好消息是,人们对 AI 生成的音频视频正在建立起更多辨别力和免疫力,这本身也是一种自然的适应过程。我也经常跟家人朋友科普让他们小心 AI 视频。 我自己有个小技巧是先看视频时长是不是 10 秒 15 秒这种整数,不过这招已经快像看 AI 图片人物有没有六根手指一样不灵了。 你们都用什么技巧分辨 AI 生成的图片或者视频呢?
显示更多
0
28
99
2
转发到社区
之前有张「中国AI vs 美国AI」的图(图1)很火,就在OpenAI和Anthropic齐发新模型的同时,元宝和千问正在开打红包大战,对比起来讽刺性拉满了。 但这个笑话的保质期很短,也不怎么好笑了,因为很快赶上了字节和快手同样先后的发了新一代视频模型,在外网刷屏的程度再次引起洋人对于中国AI实力深不可测的「刻板印象」。 所以说钱钟书老爷子写「围城」是有道理的,寰宇就是一个围城,里头的人眼馋外边,外边的人羡慕里头。 字节的Seedance 2.0很牛逼,可以说是完全改写了视频生成的方法,而且因为字节这家公司自带的外围声量一直很大,所以虽然发布更晚,评价增长却更快,但快手的Kling 3.0也非常强,我已经烧掉三个号了,保证绝对不是在强行塑造「双星闪耀」的概念。 这也和两个模型的路线差异有关,综合能力肯定都要对标视频大模型的Sota、也就是谷歌的Veo模型,但Seedance 2.0更侧重于Sora 2的那套运镜、理解、模仿、转场等效果,极大的利好短视频创作者生态,而Kling 3.0则更偏向于Runway代表的影视化、真实化和工业化的能力,是冲着专业导演和工作室去的。 所以博主和用户天然会对Seedance 2.0更有感觉,这没毛病,但我对Kling 3.0的上限期待很高,它真的是在抹平真实和虚拟之间的界限,不过从长期来看,路线差异必然是暂时的,最后大家都会殊途同归,解决抽卡问题的同时,全方位无死角的替代掉现有视频生产管线的一半以上,甚至更多。 相比「闷声发大财」的AI Coding,多模态才是AI接近普通人的破圈手段,去年ChatGPT和Gemini的两次「翻倍级」增长(图2),一个是因为GPt-4o的「吉卜力风潮」,一个是基于Nano Banana的降维打击,都是多模态在立功。 到了今年,战场开始继续前移,除了Seedance 2.0和Kling 3.0,同样是在这个月,马斯克发布了Grok专有的视频模型Imagine 1.0,谷歌也发布了打掉游戏引擎市值的Genie 3,发现共同点了吗? 全,是,视,频。 人是视觉动物,所见即所得的信息量,是远超文本和语言的,视频模型以前主要吃亏在能力不足,训练难度居高不下,生成质量良莠不齐,无法形成类似「一键P图」的稳定性玩法,但是到了2026年,这个瓶颈期目测已经快要跨过去了。 还记得威尔·史密斯吃意大利面吗?那也不过是两三年前的事情,时间过得很快,也很扁平,技术的进化效率太可怕了。 多说几句开头那个对比吧,如果说中国AI公司眼馋Claude Opus 4.6和GPT-5.3-Codex,倒也确实没毛病,但这也不只是纯粹的技术代差,中美的商业环境决定了AI渗透的发力点不一样。 表面上看,美国的AI巨头都在发力AI Coding,容易货币化是一回事,再往深了想,Coding自由的终点是什么?是工具、软件甚至系统的零成本化,需要什么让AI去写代码就好了,所以美股里的SaaS赛道突然就崩了。 SaaS是一个积累了快30年的万亿级规模市场,非常适合拿来当作回应「AI投入太大、回报不足」的靶子,想象空间太大了,而大厦将倾的此情此景,实在是有种见证时代的残酷美学。 王慧文在即刻上发了一条非常精辟的动态(图3): 「我们曾经以为,中国SaaS会像美国SaaS那么值钱,现在看,美国SaaS会像中国SaaS这么不值钱。」 大佬就是大佬,几句话就说到点上了,中国的AI公司在产业化方面有苦难言,尤其是面对美国同行的高歌猛进,原因就在于:你不可能去替代一个不存在的市场,拿走一份不存在的产值,讲述一篇不存在的故事⋯⋯ 但在多模态尤其是视频模型方面,就不是这样了,中国互联网的短视频、直播和创作者生态,是全球领先的,这是真的存在巨大的市场、产值和故事可以被AI接上的,所以字节和快手为视频模型的投入动力,是完全不虚美国大厂的。 快手Kling有先发优势,ARR涨得很快,在海外一直处于第一梯队,字节属于后来居上,多模态能力对豆包的留存拉动明显,更不用说GPU储备量是国内大厂里Top级的,真想做成事情,很难不做成。 昨晚很多字节的朋友都在转梁汝波和张楠用AI合拍的视频(图4),用来宣传搭载了Seedance 2.0的即梦,张楠的性格搞这个不意外,意外的是梁汝波也配合了,你们很少会看到他给字节的其他产品这么站台。 晚点LatePost的稿子里提过,字节内部是期待AI这波能有「下一个抖音」跑出来的,而且是完全用字节的方法去做选择——数据决定地位——也就是说,赛马机制已经启动了,目前至少有三拨势力在争这个「太子」: - 即梦,负责人张楠是把抖音做起来的第一人,她先去剪映,再到即梦,一直是被安放在从0到1的最前线,代表了字节在创业场景下最强的战斗力; - 豆包,所属的Flow团队负责人朱骏是 - 抖音自己,是的,抖音部门也希望「下一个抖音」能由自己孵化出来,而不是假手于人,比如抖音搜索团队做了一个名字就叫AI抖音的App,用户量不大,但占位置的意图很明显; 还是那句话,字节这家公司的活力之高和欲望之强,在大厂里真的很少见,丝毫看不到老化的痕迹。 最后我还想说,大的在后面,中国AI公司在这个月的重量级发布还没结束,我知道一些但是暂时不能说,等着吧,用心感受这神仙打架的一个月。
显示更多
0
16
220
35
转发到社区
一个普通人0代码基础4天Vibe coding了一个小即梦【一】 一切的源头来自于我们的一个品牌的客户,希望尝试通过AI来做批量做一些原生感的素材作为新品上市前的社媒预热动作。 这部分一直都是我们想尝试的方向,批量生成素材(图/视频)进行投放/批量UGC发布来快速测试市场 于是我们就开始了第一批的测试 自动化+批量P图,评估下来觉得有这么几个选择 - Coze - N8N/Make - 飞书多维表格 - SD/comfy UI(这个直接pass了,首先是不会,再有就是有点杀鸡用牛刀的感觉) 解决问题的最快路径一定是飞书多维表格: - 无需翻墙 - 公司内部的办公平台(权限/上手成本) - 表格形态 - 没有学习成本,搭建好了之后就能自动运行,搭配一个运营同学来审核&重生 我大概花了20mins左右就把第一版本搭建出来了,又在上边加了一点花头 逻辑非常简单,就是B是新品,需要替换到A场景里,得到一张B的“原生感”UGC素材。 同时由于我们可能没有那么多原生感的背景,那么AI生背景也很重要,所以加了一个多个元素X乘出来的随机背景,效果也不错。整体使用的是即梦的seedream4.5的模型,也是第一次通过飞书的平台接入API token(体验非常丝滑) 但是有一些问题: 1. seedream4.5 对于复杂的文字,图案以及漫画风的人脸识别/迁移的精度比较低,有些图片的AI感比较重,客户通过率还是比较低 2. 解决第一个问题就需要用到nano banana pro,但是我其实是不知道怎么接API的,于是我就开始做调研,首先是如何将nano banana pro接入到飞书多维表格: 找到了一份现成模版,只需要自己更改API,就可以快速的上手使用了。 通过这个过程,我快速的了解到了各个API的平台,API接口的文档以及价格。 不过很快就意识到了问题,由于整个流程是通过工作流的方式触发的,所以比之前的方案还要费人,需要一张一张的点。 而且既然都是B改到A场景,B是不变的,那么我是不是可以做一个批量上传A的方案,实现批量的自动化,也不需要表格的形态。 这不就是一个perfect Vibe coding契机吗? 第一次VC,从下载Cursor,到翻@yihui_indie老师的课程进行基础知识的学习(其实就看了基础课程,项目课程还没有开始跟练) 大概用了一个下午的时间我就完成了以下的成果。 这个时候,事情已经不一样了,已经不再是这个测试了。 而是我第一次感受到代码创造的快感,从一个想法,到落地的时间周期被压缩到了1天。 很快我就完成了: - 网站的域名购买 - Vercel部署上线 - supabase的链接 既然我们之前在做AIGC广告片的时候,有很多流程/使用体验都不尽人意,那是不是我们可以基于我们自己的使用习惯来窜一个AIGC的工作台,让公司内部都可以用最便宜的价格,获得最好的模型,搭配上最舒服的工作流呢? 主要是不能贴更多的图了,不然我就一篇post说完了 下一期:基于Nano banana pro搭建了一个类即梦+tap now+可灵的内部AIGC工具库。
显示更多
这份年终众包调研来自我在 X 上的随手一问,问了三个问题:2025 年 AI 最关键的技术突破是什么?哪些产品让你眼前一亮?2026 年什么趋势不可忽视? 没想到收到了这么多认真的回复。我花了一两个小时时间,把这些留言和答案汇总整理了一下。 127 条留言,95 个人回答了同样的三个问题。 看完所有答案,我发现大家虽然各有侧重,但在某些判断上出奇一致。答案五花八门,但有些词频繁出现:推理 (Reasoning)、Agent (智能体)、Claude Code、Manus、Nano Banana Pro、NotebookLM、具身智能 (Embodied AI)。 这组词频里有个共同点:“聊天”这个词几乎没人提起了,“干活”这个词开始更多被提起了。 【1】推理革命:AI 学会了慢下来 如果要选 2025 年最重要的技术突破,答案几乎没有悬念——推理能力的工程化落地。 三疯 (@ 3fenglife) 的表述最精准:从“预测下一个词”到“预测下一步行动”。以前的 AI 像个反应快但不过脑子的人,张口就来,经常胡说八道。2025 年的突破在于,AI 学会了在回答之前先想一想——做内部推演、自我检查、发现错误就纠正。 技术上这叫 System 2 Thinking,或者叫 test-time scaling。AI 从“快思考”进化到了“慢思考”。o1、o3、DeepSeek R1 这些模型,都是这条路线的产物。 Ray Zhai(@ Cryptoxorz) 还补充了一个视角——当 AI 开始像人类一样拥有“慢思考”的逻辑链,并能理解真实世界的因果律时,AI 才算真正拿到了进入物理世界的入场券。 岚叔 (@ LufzzLiz) 和 Xin(@ Xin_Jin1018) 点名了一个关键技术:RLVR,基于可验证奖励的强化学习。 以前训练模型需要大量人工标注的数据,告诉模型“这个回答好,那个回答不好”。这很贵,也很慢。而 RLVR 换了个思路:对于数学题和代码这类问题,答案对不对是可以自动验证的。答案对了就给奖励,错了就扣分。不需要人来一条条看。 另一个高频共识是成本拐点。Rainman(@ 0xdeusyu) 和 Robinson(@ python_xxt) 都提到了 MoE 稀疏化架构,DeepSeek R1 证明了一件事:前沿 AI 不再需要前沿预算。意味着推理成本在下降,成为可以普及的基础设施。 还有一类突破被反复提及:Agent 系统化成熟。SLiangD(@ SLiangD) 说得很到位,关键突破不是参数变大,而是三件套终于配合默契了——工具调用、上下文工程、多步推理。AI 能理解“帮我扫描亚马逊眼罩类目,找出评分低但销量高的产品,总结用户抱怨最多的三个痛点”这种复杂任务链了。 【2】年度产品:对话框退场,进度条登台 问到 2025 年哪些产品让人眼前一亮,有一个名字被提到了二十多次:Claude Code。 G_Z(@ GZhan57) 的评价很有画面感:“第一个 work 的 general agent,除了不能生孩子啥都可以。”阿绎 YiOS(@ WangYiNotes) 说得更细腻:“不是因为它写代码有多快,而是它第一次让人感觉是在跟队友协作,而不是在调教工具。” Claude Code 代表的是一类新物种:能把复杂工作流跑通的 AI。它不只是补全代码,还可以自己检索文档、改 Bug、跑测试、完成部署。你扔给它一个需求,它真的能把事办完。 第二名是 NotebookLM。Rocky(@ Rockybnbtrade) 说它让知识输入效率提升了很多,王是子路 (@ atm13999) 说它把枯燥的文档变成极其自然的播客对话。这个产品的价值不在于生成内容,而在于帮你消化和内化已有的知识。 第三名是个意外:Nano Banana Pro,谷歌 Gemini 的生图功能。defyong(@ defyong) 的评价很有意思:“结合 Gemini 的感知与知识库,图片生成不再是凭感觉。第一次让我觉得,这个生图工具,她活起来了。”Steven Qi(@ Jason_qeb) 补充说中文支持是个大突破,文生图、图生视频、图生 PPT 都变得可行了。 视频生成虽然没有 Claude Code 和 Nano Banana Pro 那么高频,但也收获了一批提名。Roland(@ Roland_WayneOZ) 和小镇记录家 (@ liangde_li40657) 都提到了 Sora、可灵、即梦等产品的突破,cicada(@ thebestsetup) 直接把 Veo/Sora 列为年度最惊艳。JCat(@ JackyisThinking) 的判断更进一步:视频生成会在 2026 年更加成熟,影视行业尤其是低成本特效和动画行业将全面 AI 化。这条赛道的特点是"看得见摸得着",普通人也能直观感受到 AI 的进步,所以虽然技术门槛高、商业化慢,但对大众认知的影响可能比编程工具更大。 空间智能是另一个被多人点名的方向。JCat(@ JackyisThinking) 说得最清楚:机器人产业要落地,AI 就必须具备更高阶的 3D 空间识别、理解和推理能力,这是绕不过去的坎。Ray Zhai(@ Cryptoxorz) 和 suwakopro(@ suwakopro) 都提到了"世界模型"这个概念——AI 不能只在文字和图片的世界里打转,它得理解真实世界的因果律和物理规则。小洲洲的 AI 日常 (@ LZhou15365) 观察到具身智能已经在快速进化:"从走姿、行动都越来越像人类。"当 AI 学会了"慢思考",下一步就是让它学会"动手做事",空间智能是连接数字世界和物理世界的那座桥。 还有一批产品被多人提及:Cursor 和 Windsurf 这类 AI IDE,Deep Research 深度研究,Manus 和 Youmind 这类通用 Agent,可灵和 Sora 的视频生成。 但最让我印象深刻的是三疯 (@ 3fenglife) 的一句总结:让人惊艳的不再是对话框,而是进度条——它在后台默默把事办完了。Ray Zhai(@ Cryptoxorz) 把这种体验叫做“感知消失,效率倍增”,这才是技术真正闭环的瞬间。 这才是 2025 年产品形态的本质变化。 【3】2026 路线图:从“教 AI 怎么做”到“告诉 AI 我要什么” 关于 2026 年的趋势,答案的集中度比我想象的高。 第一个共识是 Agent 大规模落地。 超过三分之一的人提到了这个方向。什么是 Agent?简单说,就是 AI 不再只是回答问题,还能自己拆解任务、调用工具、一步步执行,最后交付结果。 Ray Zhai(@ Cryptoxorz) 的描述很有画面感:未来不再是你一个人对着一个 AI,而是你拥有一个 AI 舰队。它们会自动分工、自我纠错、自发存储数据。我们将从“教 AI 怎么做”转向“告诉 AI 我要什么”。 SLiangD(@ SLiangD) 用黄金圈法则做了一个漂亮的框架切分:Why(为什么做)和 What(做什么)仍然是人的领地,AI 无法替代;但 How(怎么做)将彻底交给机器,趋近于零成本瞬间完成。 这意味着什么?未来的竞争力不是“会用 AI”,而是“会定义问题”。 第二个共识是具身智能。 码上盈 (@ InnaLyceyum) 预测 Agent 将不再只存在于浏览器中,而会深度集成到智能硬件——从智能眼镜到桌面机器人,AI 将获得空间感知与物理交互能力。阿绎 YiOS(@ WangYiNotes) 说得更极端:2026 年我们可能不再讨论哪个 AI 产品好用,因为 AI 已经内嵌在 OS 和硬件的每一寸肌理里了。 第三个共识是 AI 的“私人化”和“记忆化”。 Cunningham Card(@ Card198454) 强调 Memory 方向的突破会让 Agent 更像人,拥有社会属性。AI 将从千篇一律的工具,演变成极度个性化、具备连续记忆的数字助手。 三疯 (@ 3fenglife) 还提出了一个颠覆性预测:SaaS 的消亡,Service 的崛起。你不再订阅“写作软件”,你订阅的是“文案产出服务”;你不再订阅“CRM 系统”,你订阅的是“销售线索清洗服务”。软件会员变成结果订阅,这是商业模式的根本重构。 当然也有清醒的声音。 Michael Guo(@ Michaelzsguo) 认为 2025 年 AI 基本没有关键技术突破,都是沿用 2024 年的路线做性能提升。Tony Lee(@ lee810860) 预测 AI 厂商加速倒闭。熊布朗 (@ Stephen4171127) 直接说“没有什么是不可忽视的必然路径”。 也不能说这些声音是悲观,更像是提醒我们:共识不等于正确,热情不能代替验证。 【4】最后 AI 的演进已经进入新阶段。2024 年大家还在争论哪个模型更聪明,2025 年这个问题变得不那么重要了,重要的是谁能把活干完。从“会说”到“会做”,从“输出文本”到“交付结果”,这是范式级的转变。 来自 Roland(@ Roland_WayneOZ) 和 SLiangD(@ SLiangD) 的一句话适合用来作为结尾: 2025 年是 AI 学会干活的元年。2026 年的赢家,不是最会用 AI 的人,而是最会定义问题的人。 我把整理后的结果放到 Google Sheet 上了:
显示更多
0
23
247
45
转发到社区
GPT 5.5 现在写东西质量真的不错了,刚翻译了一篇文章( --- 译文 --- 我为什么写作 作者:埃里克·布莱尔 从很小的时候起,也许是五六岁,我就知道,等我长大了,我应该成为一个作家。大约在十七岁到二十四岁之间,我曾试着放弃这个念头。但我心里很清楚,那是在违背自己真正的天性;迟早有一天,我还是得坐下来写书。 我在三个孩子中排行中间,前后兄弟姐妹都和我相差五岁。八岁以前,我几乎没见过父亲。因为这个,也因为其他一些原因,我多少有点孤僻。很快,我养成了一些讨人嫌的小毛病,整个学生时代都不怎么受欢迎。孤独的孩子常常会编故事,也会和想象中的人说话;我想,从一开始,我的文学野心就和这种被孤立、被低估的感觉纠缠在一起。我知道自己有驾驭文字的能力,也有直面难堪事实的能力。于是,我像是给自己造出了一个私人世界,可以在里面弥补现实生活里的失败,甚至悄悄“扳回一城”。不过,整个童年和少年时代,我真正写到纸上的严肃作品——也就是我认真想写出来的东西——加起来恐怕不到六页。 我四五岁时写过第一首诗,是我口述,母亲替我记下来的。我已经不记得内容了,只记得那首诗写的是一只老虎,而且老虎有“像椅子一样的牙齿”。这倒是个还不错的说法,但我猜那首诗大概抄袭了布莱克的《老虎,老虎》(William Blake 的名诗 *The Tyger*,英国浪漫主义诗歌中的经典作品)。十一岁时,1914—1918年的战争爆发(即第一次世界大战),我写了一首爱国诗,刊登在本地报纸上。两年后,基奇纳去世,我又写了一首,也登了出来。后来稍大一点,我时不时写一些很糟糕、通常也没写完的“自然诗”,风格模仿乔治王朝派(Georgian style,20世纪初英国诗歌中一种偏重田园、自然和抒情描写的风格)。我还大约试过两次写短篇小说,结果惨不忍睹。那些年里,我真正落到纸上的、想要称为“严肃创作”的东西,全部加起来就是这些。 不过,在那段时间里,我其实一直在某种意义上从事文学活动。首先,是那些按要求写出来的东西:我写得很快,很轻松,但自己并没有多少乐趣。除了学校作业,我还写 *vers d’occasion*(应景诗),也就是半滑稽的诗。现在回想起来,我当年写得快得惊人——十四岁时,我模仿阿里斯托芬(Aristophanes,古希腊喜剧诗人),大约一周就写出了一整部押韵剧。我也帮忙编辑学校杂志,有印刷版,也有手抄版。那些杂志简直是你能想象到的最可怜的滑稽仿作。我对它们花的心思,远不如我今天会花在最廉价的新闻稿上的心思。但与此同时,在十五年甚至更久的时间里,我还做着另一种完全不同的文学练习:我在脑子里编一个关于自己的连续“故事”,像一部只存在于心里的日记。 我相信,很多儿童和少年都有这种习惯。很小的时候,我会想象自己是罗宾汉之类的人物,把自己想成惊险冒险故事里的英雄。但很快,我的“故事”就不再是那种粗糙的自恋幻想,而越来越变成对我正在做什么、看到什么的描写。有时候,我脑子里会一连几分钟出现这样的句子:“他推开门,走进房间。一束黄色的阳光透过细棉布窗帘,斜斜落在桌上;桌上有一只半开的火柴盒,放在墨水瓶旁边。他右手插在口袋里,走向窗边。楼下街上,一只玳瑁猫正在追逐一片枯叶。”诸如此类。这个习惯一直持续到我大约二十五岁,贯穿了我那些“非文学”的岁月。虽然我必须寻找合适的词,而且确实也在寻找,但这种描写的努力似乎几乎不是出于我的意愿,而像是受到了某种外部力量的驱使。我想,这个“故事”大概反映了我在不同年龄崇拜过的不同作家的风格。不过据我记得,它始终都有同一种细致入微的描写特质。 十六岁左右,我突然发现了文字本身的快乐,也就是词语的声音和联想所带来的快乐。*《失乐园》*里的两行诗—— > So hee with difficulty and labour hard > Moved on: with difficulty and labour hee, > > (他艰难地、辛苦而沉重地 > 向前移动:艰难地、辛苦地,他——) 如今看来,我并不觉得这两行有多么了不起,但当时它们让我脊背发颤。而且,把 “he” 写成 “hee” 的古式拼法,也让我格外愉快。至于描写事物的需要,我早已经非常熟悉了。由此可见,当时如果说我想写书,我想写的大概是哪一类书:巨大的自然主义小说,结局不幸,充满细节描写和醒目的比喻,也充满华丽辞藻段落(purple passages,指为了文采而文采、常常显得夸张空洞的文字),其中一些词语被使用,部分只是为了它们的声音。事实上,我完成的第一部长篇小说 *《缅甸岁月》*,是在三十岁时写成的,但构思早得多,它大体上就是这样一本书。 我交代这些背景,是因为我认为,如果不了解一个作家早年的成长,就很难判断他的写作动机。作家的题材会由他所处的时代决定——至少在我们这样动荡、革命性的时代,这一点是成立的——但在他真正开始写作之前,他已经形成了一种情感态度,而这种态度他永远无法完全摆脱。毫无疑问,他的任务是约束自己的气质,避免卡在某个幼稚阶段,或陷入某种扭曲情绪里。可是,如果他彻底摆脱了早年的影响,也就等于扼杀了自己写作的冲动。暂且把谋生的需要放在一边,我认为,写作至少有四种重要动机,尤其是写散文时。这些动机在每个作家身上都以不同程度存在;同一个作家身上,它们的比例也会随着他所处的环境而变化。它们是: (一)纯粹的自我意识。 想显得聪明,想被人谈论,想死后被人记住,想向童年时轻视自己的成年人讨回一点公道,等等。假装这不是写作动机,是虚伪的;而且它还是一种很强的动机。作家和科学家、艺术家、政治家、律师、军人、成功商人一样,都有这种特征——简言之,这属于人类中最冒尖的那一层。绝大多数人并不是特别自私。大约三十岁以后,他们会放弃个人野心;很多情况下,他们几乎连“自己是一个独立个体”的感觉都放弃了,主要为别人而活,或者干脆被苦役般的日常生活压没了。但也有少数有天赋、意志强的人,决心一直按照自己的方式生活到底,作家就属于这一类。总体来说,严肃作家比新闻记者更虚荣、更自我中心,不过他们对钱的兴趣要少一些。 (二)审美热情。 看见外部世界中的美,或者看见词语及其恰当排列中的美。一个声音撞上另一个声音时带来的快感,优秀散文的坚实感,或者一个好故事的节奏。想把某种自己觉得珍贵、不该被错过的体验分享出去。许多作家的审美动机很弱,但即使是写政治小册子的人,或者写教科书的人,也会有自己偏爱的词语和短语,并非出于实用原因,而只是喜欢它们;或者,他可能会特别在意排版、页边距的宽度等。只要不是铁路指南那种层级的书,任何一本书都不可能完全没有审美考量。 (三)历史冲动。 想看清事物本来的样子,想找出真实事实,并把它们保存下来,供后人使用。 (四)政治目的。 这里的“政治”一词取最广泛的意义。也就是说,想把世界推向某个方向,想改变别人对于“人类应该努力建设什么样的社会”的看法。再说一次,没有一本书真正摆脱了政治倾向。认为艺术不应该和政治有任何关系,这本身就是一种政治态度。 可以看出,这几种冲动必然会彼此冲突,而且会因人而异、因时而变。按我的本性来说——也就是把“本性”理解成一个人刚成年时达到的状态——我身上前三种动机应该会压过第四种。如果生活在一个和平时代,我也许会写华丽的书,或者只是描写性的书,甚至可能几乎意识不到自己的政治立场。但现实是,我被迫变成了某种论战小册子作者(pamphleteer,指写政治宣传或论争文章的人)。 起初,我在一个不适合自己的职业里待了五年,也就是在缅甸的印度帝国警察部队。后来,我又经历了贫困和失败感。这加强了我天生对权威的憎恶,也让我第一次充分意识到工人阶级的存在。而缅甸的工作则让我对帝国主义的本质有了一些了解。不过,这些经历还不足以让我形成准确的政治方向。接着,希特勒出现了,西班牙内战爆发了,等等。到1935年底,我仍然没能做出坚定的判断。我记得自己在那一年写过一首小诗,表达当时的困境: > 两百年前,我本可以 > 做个快乐的乡村牧师, > 宣讲永恒的末日, > 看着我的核桃树生长。 > > 可惜我偏偏生在邪恶的年代, > 错过了那座惬意的避风港; > 我的上唇已经长出胡子, > 而如今的神职人员全都刮得干干净净。 > > 再往后,日子也曾不错, > 我们那时很容易满足; > 我们把烦乱的思绪 > 摇睡在树木的怀里。 > > 我们曾无知却坦然承认 > 那些如今必须掩饰的欢愉; > 苹果枝上的绿雀 > 也能让我的敌人发抖。 > > 可女孩的肚腹和杏子, > 阴凉溪水里的拟鲤, > 黎明时飞起的马和鸭子, > 如今全都只是一场梦。 > > 再也不许做梦; > 我们残害自己的快乐,或把它藏起; > 马是用铬钢造的, > 小胖子们会骑在它们背上。 > > 我是那条从未反抗的虫, > 是没有后宫的阉人; > 在牧师和政委之间, > 我像尤金·阿拉姆一样行走;(Eugene Aram,18世纪英国一起著名谋杀案中的人物,后来常被文学作品写成被罪感纠缠的人) > > 政委正在替我算命, > 收音机还在播放; > 可牧师答应给我一辆奥斯汀7型车,(Austin Seven,英国早期著名小型汽车) > 因为达吉总会买单。 > > 我梦见自己住在大理石厅堂,(“I dreamt I dwelt in marble halls” 是19世纪歌剧中的著名唱段) > 醒来却发现那是真的; > 我不是为这样的时代而生; > 史密斯是吗?琼斯是吗?你是吗? 1936—1937年的西班牙战争和其他事件,让天平最终倾斜。从那以后,我知道自己站在哪里。自1936年以来,我写下的每一行严肃文字,无论直接还是间接,都是在反对极权主义,并支持我所理解的民主社会主义。在我们这样的时代,还以为自己可以回避这些题材,在我看来是荒唐的。每个人都会以这样或那样的形式写到它们。问题只在于你站在哪一边,以及你采取什么方式。一个人越清楚自己的政治倾向,就越有可能在采取政治行动时,不牺牲自己的审美和思想上的诚实。 过去十年里,我最想做的事,是把政治写作变成一门艺术。我的出发点始终是一种立场感,一种对不公的感受。我坐下来写一本书时,并不会对自己说:“我要创作一件艺术品。”我之所以写,是因为有某个谎言我想揭穿,有某个事实我想让人注意到;我最初关心的,是让别人听见。但是,如果写一本书,甚至写一篇长篇杂志文章,本身不能同时成为一种审美体验,我也不可能完成它。任何愿意研究我作品的人都会发现,即使在我写得最像宣传的时候,其中也包含许多职业政客会认为无关紧要的东西。我不能,也不想,完全抛弃童年时期形成的世界观。只要我还活着,而且健康,我就会继续强烈地在意散文风格,继续热爱地球表面,继续从坚实的物体和无用的零碎知识中获得乐趣。压抑自己的这一面毫无用处。真正的任务,是把我根深蒂固的喜好和厌恶,同这个时代强加给我们所有人的、根本上属于公共领域而非个人领域的活动调和起来。 这并不容易。它带来结构上的问题,也带来语言上的问题;同时,它还以一种新的方式提出了诚实的问题。让我只举一个比较粗糙层面的困难作为例子。我关于西班牙内战的书 *《向加泰罗尼亚致敬》*,当然是一本坦率的政治书,但总体上,它写得有一定的克制,也顾及形式。我确实很努力,想在不违背文学本能的前提下讲出全部真相。但书中有一整章很长,里面充满了报纸引文之类的材料,为那些被指控与佛朗哥合谋的托洛茨基派辩护。托洛茨基派(Trotskyists,苏联革命家托洛茨基的追随者,在当时左翼阵营内部常遭斯大林主义者攻击);佛朗哥(Franco,西班牙内战中民族主义阵营领袖,后来成为独裁者)。显然,这样一章过上一两年后,对任何普通读者都会失去兴趣,也必然会毁掉这本书。一位我尊重的批评家曾训了我一通。他说:“你为什么要把那些东西放进去?你把一本本来可能很好的书,变成了新闻报道。”他说得没错。但我当时不可能不那样做。我碰巧知道一件事,而英国很少有人被允许知道:无辜的人正在遭受虚假指控。如果我没有为此感到愤怒,我根本就不会写那本书。 这个问题会以这样或那样的形式反复出现。语言的问题更微妙,谈起来会太长。我只想说,近些年来,我一直试图写得少一些画面上的华丽,多一些准确。不管怎样,我发现,当你把某种写作风格打磨成熟时,你也总已经从那种风格里长出来了。*《动物农场》* 是第一本书,在写它时,我完全清楚自己正在尝试把政治目的和艺术目的融合成一个整体。我已经七年没有写小说了,但希望不久之后能再写一部。它肯定会失败,每一本书都是失败的。但我确实相当清楚自己想写的是哪一种书。 回头看前面这一两页,我发现自己好像把写作动机说得全是出于公共精神。我不想让读者最后留下这种印象。所有作家都虚荣、自私、懒惰,而在他们动机的最深处,还藏着一个谜。写一本书是一场可怕而耗人的搏斗,就像经历一场漫长而痛苦的疾病。除非有某种自己既无法抗拒、也无法理解的“心魔”在驱赶,一个人绝不会主动承担这样的事。也许,谁知道呢,那种心魔不过就是婴儿哭闹着要人注意的同一种本能。然而,同样真实的是:如果一个人不持续努力抹去自己的个性,就写不出什么可读的东西。好的散文像一块窗玻璃。我无法确定自己哪一种动机最强,但我知道哪一种动机值得追随。回看自己的作品,我发现,每当我缺乏*政治*目的时,我写出来的书总是没有生命力,也总会滑向华丽空洞的段落、没有意义的句子、装饰性的形容词,以及各种虚假的漂亮话。 *Gangrel*,第4期,1946年夏 --- 来源:[奥威尔基金会]( --- 翻译提示词 --- 请将以下英文文章,重写成通俗流畅、引人入胜的简体中文。 核心要求: - 读者与风格: 面向对AI感兴趣的普通读者。风格要像讲故事,清晰易懂,而不是写学术论文。 - 准确第一: 核心事实、数据和逻辑必须与原文完全一致。 - 行文流畅: 优先使用地道的中文语序。将英文长句拆解为更自然的中文短句。 - 术语标准: 专业术语使用行业公认的标准翻译(如 `overfitting` -> `过拟合`)。第一次出现时,在译文后用括号加注英文原文。 - 保留格式: 保持原文的标题、粗体、斜体、图片等Markdown格式。 - 尊重原意:保持原有的结构、意思不变,不要过度引申发散,保持原文结尾不要续写 - 适当解读:如果是普通人难懂的专业术语或因为文化差异导致的难以理解,做出更多的注释以更好的理解,注释部分用括号包裹并加粗
显示更多
0
6
103
6
转发到社区
我越来越发现三个水枪手做的节目挺有意思,有的分析也挺有深度,这期通过对比中国、日本、美国的高校借阅榜和图书畅销榜,深入剖析了各国的阅读习惯,并得出了相对悲观的社会学结论。 一、 各国大学生及社会畅销书榜单对比 1. 中国:停滞在20年前的老书与网络爽文 山东农业大学(代表普通高校):文学类前十名全是经典老书,如《杀死一只知更鸟》《嫌疑人X的献身》《活着》《我与地坛》《围城》。社科类前十名则充斥着“心理鸡汤”(《被讨厌的勇气》《蛤蟆先生去看心理医生》)以及《毛泽东选集》和多本《明朝那些事儿》。 清华大学(代表顶尖高校):年度借阅榜单依然是《毛泽东选集》《红楼梦》《明朝那些事儿》《三体》《哈利波特》《平凡的世界》《乡土中国》《天龙八部》等老书。 社会总榜(当当网、微信读书):无论怎么看,中国人买得最多的依然是这几本“老三样”(《活着》《三体》等),以及大量的教辅书、考公考证资料和儿童绘本。 网络文学榜:主播特别提到,中国大众真正阅读量极高的是晋江、起点等平台的“网络爽文”(如霸道总裁、修仙逆袭、耽美等),这些书名夸张,内容通常不需要深度思考。 2. 日本:更新极快,兼顾轻娱乐与深度哲学 东京大学:前十名借阅榜中包含大量的哲学、语言学和社科类科普书。例如《思考的整理学》(教导逻辑思维)、《闲暇与无聊的伦理学》(斯宾诺莎哲学普及)、《中动态的世界》(语言学概念),以及探讨犹太人历史的书籍。 社会总榜:日本是一大出版强国,畅销榜上的书几乎全是当年出版的新书。日本人的阅读面极广,既有海量的轻小说、推理小说、连载漫画等休闲读物,但同时,获得“本屋大赏”等严肃文学奖项的作品也能迅速在全社会大卖。 3. 美国:紧跟当下社会现实与人物传记 由于缺乏大学图书馆数据,主播主要参考了纽约时报和Goodreads的畅销榜。 非虚构类(Non-fiction):美国人极度偏爱最新的人物传记和回忆录。榜单上充斥着格莱美得主、播客主持人、参议员的回忆录,以及关于苹果公司50年历史、AI(人工智能)前沿探索、神经科学等紧贴时代脉搏的书籍。 虚构类(Fiction):绝大多数也是最新出版的当代小说、科幻小说(如《挽救计划》)和悬疑小说。 二、 各国人民读书习惯分析 1.美国人:通过阅读了解“现在” 美国社会的阅读习惯将其作为了解当下世界运行规律的重要窗口。读者渴望知道现在社会发生了什么,前沿科技到了什么地步,成功人士是如何思考的。因此,新出版的传记、科技科普和当代小说占据了绝对的主流。 2.日本人:将阅读作为公共生活习惯 日本人的阅读习惯是深入骨髓的。虽然在地铁上很多人看的是漫画或轻小说,但庞大的读者基数支撑起了一个健康的出版金字塔。即使是极其深度的社会学和哲学书籍,在日本也有稳定的受众。他们能够做到“娱乐阅读”与“严肃探讨”的并行。 终生阅读量极低:主播认为,绝大多数中国人可能一辈子就读了5-10本最著名的经典(如《活着》),一旦完成这些“打卡式”阅读,就不再接触新书,转而投入短视频的怀抱。中国缺乏一个持续为新书买单的成熟读者群。 功利与逃避:读书主要为了考试(教辅)或缓解心理压力(心理鸡汤)。 对真实世界的集体回避:中国读者极少阅读探讨当代社会现实深层次问题的新书或当代人物真实传记。底层大众更是沉迷于无需动脑的网络文学中寻找虚拟的情绪价值。 三、 原因 主播们在视频最后得出了一个非常悲观的结论:中国社会的整体深度阅读习惯正在走向崩溃。他们将这一现象归结为以下几个根本原因: 1.出版审查制度的负面影响:严苛的审查制度使得中国极难出版真实的当代人物传记或具有深度的非虚构社科著作(容易碰触历史定论和现实红线)。出版社为了规避风险,只能一遍遍地再版四书五经、四大名著等“安全”的老书。 2.缺乏专业权威的引导:中国缺乏像日本那样具有公信力的民间文学奖项来引导大众阅读严肃文学,导致图书市场“泥沙俱下”。 3.思辨能力的退化:在短视频的冲击和网文的包围下,年轻一代越来越排斥需要较高门槛、会带来阅读困难和认知挑战的深度严肃书籍。真正的“读书”(即通过阅读去质疑权威、探求历史真相)在中国具有一定的痛苦感甚至危险性,因此大多数人选择了回避。 PS: 1, 发达国家跟发展中国家其中一个最大的差异,还真的是民众的读书习惯和数量!多年前的一张图片,展示发达国家的人民在地铁里只看书不玩手机,后来被调侃为是因为外国的地铁手机信号差。其实信号差不差,发达国家的人民在地铁里读书的场景确实比发展中国家要常见的多。 2,发达国家的另外一个特点,就是各个群体的兴趣点非常的多样和庞杂,有喜欢看短视频的,也有喜欢看书的,相互之间基本影响不到,并且各个群体都非常的大,发展中国家就更趋于单一化,从众化。 3,我个人看书比较集中的时期只有一个就是高中阶段,为了找作文的金句和素材看通俗经典。后来大学时期以及出国后,开始看更多外国经典,但数量有限。
显示更多
0
102
518
103
转发到社区
这就是我梦里的国风3D!🐉✨ 终于把这种“青蛇劫起”般的电影级质感用 Niji 6 完美复刻了。 那个墨绿色的流体背景和皮肤的通透感简直绝了……为了还原这个神仙画风,我大概跑了50张图调参。 今天把压箱底的 Prompt 和风格思路毫无保留地分享给大家! 🧵 风格拆解 (The Vibe Check): 这种风格的核心不是 2D,而是极致的 3D渲染感 (C4D/Octane) 加上 东方奇幻美学。 关键要素: 主体: 坚毅的丹凤眼 (Sharp phoenix eyes) + 极简汉服。 环境: 墨绿色的流动能量 (Swirling dark green liquid/energy),要有丝绸般的顺滑感。 光影(重中之重): 必须要有电影光感 (Cinematic lighting) 和让皮肤像玉一样的次表面散射 (Subsurface scattering)。 👇 一键出图咒语 (复制即用): /imagine prompt: A stunning 3D Chinese animation style close-up of a beautiful heroine, determined sharp phoenix eyes, black hair in traditional bun, white minimalist Hanfu, surrounded by swirling dark green fluid energy ribbons, cinematic lighting, subsurface scattering, elegant, high octane render, 8k resolution, masterpiece --ar 9:16 --niji 6 --s 250 #AIart# #Midjourney# #Niji6# #国风# #Donghua# #PromptShare# #AI绘画#
显示更多
0
36
322
47
转发到社区
夸克这次重新提了「超级框」的概念,就是因为现在的「框」能比以前做更多的事情了,统管阿里AI To C业务的吴嘉说夸克23年做用户细分需求产品很痛苦,因为基座模型能力不行,必须专门为写作文、写报告手搓工作流,但场景是无尽的,人力有时而穷,根本跟不上需求增长,但在深度思考的技术上来之后,终于可以实现「人用AI,AI用工具」的目标了,这时那个「框」能办成的事情也丰富起来了,不再需要每个环节都得人工干预,AI终于学会了「坐上来,自己动」。 Manus能火也是因为它让用户看到了AI真的有在干活,这种体验和DeepSeek当时开放思维链是一样的,Sam Altman说他最后悔的就是出于保密心态而决定隐藏o1的思维链,没想到观察AI的思考过程也能成为产品体验的一部分。 如果大家的共识是重做一个「框」出来,张宁比较关心生产关系会怎么变,毕竟科技史上不乏生产力的进步被生产关系的落后给破坏掉的例子——比如我们之前聊过的RSS——他对最近火得不行的MCP的担忧也在于此,说白了,不谈利益分配、只谈创新变革,对于被OTT的一方就是耍流氓,就像某外卖平台已经开始屏蔽AI Agent了,这是很合理的结果,你不能要求别人来为你的创新当祭品。 海外市场的几条线索包括:Google每个财季都会展示AI overview对广告业务的冲击,目前来看,是可控的,没有自残迹象;Satya Nadella带头起了「模型被商品化了」的调子,背景是微软和OpenAI开始同床异梦了;Sam Altman说在10亿用户级别的网站和SOTA级别的模型之间,他一定会选前者…… 是的,这些信号都在说明,应用很重要,得用户者得天下,这是移动互联网的逻辑延续,但在另一边,「模型即产品」的拥护者同样很多,在理论和证据的支持上也不多让,相信模型的演化的终局就是会把产品能做的事情都做了,并形成技术为王的新一代AI逻辑。(4/n)
显示更多