搜索图片生成视频相关的推文与用户

2025.03.14 06:11

玩了下Gemini 2.0 Flash Experimental模型直达地址：出来的图片不是很满意，又用平替软件image-fx重新做图，两者结合能出来一致性的故事内容，如果需要变成视频，用即梦里面的图片生成视频+分镜描述就可以。重点是都免费，可以无限制生成，做做还蛮费时间的

显示更多

0

12

49

9

转发到社区

穆尼@MooenyChu

2024.07.09 01:40

简单用图片生成视频来做视频分镜，基本上输入分镜头语言描述就可以出来视频，多生成几个拼接在一起就是一个小短片。可灵【高表现】模式下细节和画质上还是能用用的，可惜每天只能用3次。@Kling_ai 提示词：黑色跑车以300码速度疾驰在街道上，大幅度动作，速度感，电影级画面 #图片生成视频# #可灵AI工具# #KlingCreativeSpace#

显示更多

0

2

13

1

转发到社区

穆尼@MooenyChu

2024.07.06 00:55

快手可灵AI图片生成视频➕ElevenLabs的Video to Sounds Effects组合，可以说一步到位了。视频和音效都是AI自动生成。视频制作工具见图三app，免费内测中，随便用，直达地址：或者你也可以使用luma来生成（免费用户体验不佳）。音效制作工具直达地址：视频往里面丢就可以了 Kuaishou Keling's AI-powered video generation, paired with ElevenLabs' AI-generated sound effects, provides a comprehensive solution. Both the videos and sound effects are fully automated by AI.

显示更多

0

3

56

13

转发到社区

穆尼@MooenyChu

2024.07.05 09:32

#AI将老照片复活了# 免费试用过两个工具后，我发现快手的可灵AI比LUMA更好用。LUMA生成的等待时间太长，不知道付费用户是否无需等待。我用快影基本4分钟内就能生成一张图，效果不满意可以立即重新生成，还能多次添加后续图片，效率很高。生成出色的视频关键是提示词要清晰表达。现在内测阶段都是免费使用，玩玩挺不错的。由于LUMA生成的视频效果不理想，我没有放LUMA生成的视频。这个视频都是用可灵AI生成，音效由#ElevenLabs# 生成。我之前推文中有介绍过自动生成音效的工具，视频扔进去就会出来匹配音效，好用推荐，感兴趣的推友关注下，供大家参考。 #可灵AI# #图片生成视频# #LumaDreamMachine# #老照片变视频工具# #AI工具#

显示更多

0

7

1

转发到社区

穆尼@MooenyChu

2024.06.15 23:52

图片生成视频的多种玩法，让老照片变成视频真的太棒了，感受下。5秒镜头其实可以拼接出很多故事了，学起来

0

6

46

5

转发到社区

穆尼@MooenyChu

2024.05.23 00:58

做封面神器哈，封面尺寸不够AI工具来凑。之前PS的自动生图扩展功能出来就很喜欢，可惜国内用户用不了。用这个网站做平替挺好。画质也是高清，目前是免费体验使用，喜欢的收藏吧。👍好用推荐直达传送门： #AI工具# #图生图工具# #图片生成# #视频自动生成#

显示更多

0

26

5

转发到社区

穆尼@MooenyChu

2023.09.03 13:22

图片生成视频效果演示，只有前面3秒是 #PIKALABS# 完成的，后面是我自己拼接的，来看效果。图片由AI工具自动生成视频由pikalabs自动生成音效来自YouTube，视频通过剪映制作。测试了多张图片，这3秒我觉得是最完美的@pika_labs @youseememiami @madpencil_ @op7418 @xiaohuggg @iesselaunz @dotey

显示更多

0

6

43

10

转发到社区

Emerald🔆@Emerald713661

2026.05.28 02:27

xBubble VS 其他AI生图：同一句简单提示，古风山水人物图差得有点明显～最近看到很多人都在用@dappOS_com 的xBubble @xBubble_ai 生成各种好玩的图和视频对比图，我感觉很好玩挺有趣，就也想玩玩看。平时每次在gemini生图，为了出好效果，我都要花好多时间琢磨，加这个加那个，改来改去，反复好几次，但最终效果老是不如我意，想要的关键元素经常缺斤少两。比如明明就是一个简单封面图，我却经常要生成好几次，才能勉强挑出一张自己满意的。有时候忙活半天，但还是觉得整体感觉差点意思～其实，我挺喜欢那种古典优雅的古风山水人物图，就想试着用AI生图试试看效果。这次，我特意用完全一样的简单提示词“生成古风山水人物”，让xBubble和Gemini各自跑了一次，结果就是下面这张对比图。扪心自问，大家更喜欢下面的哪幅图呢？？上方是xBubble生成的：人物站在山巅衣带飘飘，整个画面特别有古典国画的味道，一次就让我眼前一亮，优雅又舒服。下方是Gemini生成的：基础还可以，但整体氛围和层次感跟xBubble 一比，还是差了一些距离。老实讲，我更喜欢图一，可能因为有帅哥？其实发展到现在，AI画图能力已经很强了，但怎么用一句话就稳定出好看的图，才是最实用的。我发现xBubble在这点上做得特别好。它不用你写很长的提示词，也不用你研究各种设置。你只要说一句简单的话，它就能帮你把后面的事情都处理好。里面有个叫SOP的功能特别贴心，就像一个已经打包好的专业小助手。比如古风山水、仕女图、品牌素材这种，它都提前准备好了最合适的画法。你一句话过去，它自动挑最好的方式来画，出来的效果稳定又好看。我身边很多做Web2的朋友，还有不少一人公司的小伙伴都在用Bubble。那些团队做营销海报、产品图时，效率高了很多；一个人做短视频封面、IP形象、日常素材时，也不用再花钱找外包，省时又省力。用得越多，它就越懂你的风格，后面出图越来越顺。实际用起来很简单： •直接简单一句话说需求，它就给你优化后的好结果 •如果是第一次遇到的类型，它也能正常完成 •同样的需求多提几次，它还会越变越聪明还有两种使用模式： -需要复杂操作时用Bubble Computer，一次性能把研究、设计、检查全搞定； -想在自己电脑上安全操作文件时，就用Bubble Personal，很放心。以前我总把时间花在反复调整AI生图上，现在有了xBubble，我可以把精力放在真正想做的事情上。生成图片这件事，真的轻松不少～ AI应该学习AI，AI应该使用AI，用户只需说清楚自己想要什么。另外，实测一句话也能稳定生成视频噢，更有想象力更有趣，欢迎来体验DappOS xBubble： #xBubble# #DappOS# #Bubble# #LowPromptAI#

显示更多

0

42

33

0

转发到社区

阑夕@foxshuo

2026.05.17 06:07

阿里前几天刚发季报，破天荒的第一次披露了模型与应用服务——其实就是MaaS——的经常性年化收入：截至今年3月超过80亿人民币，预计6月达到100亿，年底突破300亿。相当于半年3.75x的增长速度，大概也是基于如此乐观的势头，阿里才会难得的公布这个数字，向资本市场构建叙事。所以你以为我要开始吹阿里了？错了。阿里的AI收入，建立在阿里云这个中国最大的云计算平台上，阿里云拥有现成的客户群体、销售网络和算力资源，用配套升级的方式去叠一层AI服务收入，是很容易的。所以真正要吹的，不是阿里的AI业绩凭什么增长这么快，而是如果连主要靠存量用户增加预算就能做到半年3.75x的增速，那么原生AI公司今年在同样的市场环境下，增速会飙到什么地步？要知道，原生AI公司赚的每一块钱都是从零开始、靠着模型能力兑现而来的，除了更加纯粹的增长之外，因为不必承担其他业务的成本转移，ROI的负担也更小。比如摩根士丹利测算发现MiniMax平均每分钟进账1美金，同时成本低于0.3美金，而行业平均收入只有约0.5美元/分钟，相当于MiniMax仅凭利润就跑赢了大盘。这就是Pure-play的价值，算清楚这笔账，对于理解走向拐点时刻的AI行业，非常重要。在研报里，摩根大通认为中国在2026年的企业端需求，很大概率会复制美国2025年至今的来路，也就是从试点到规模化投入再到AI成为固定支出的三级跳。简而言之，就是Anthropic的那条离谱曲线。 Anthropic创造了AI行业还是商业史上的创收奇迹，300亿美金的经常性年化收入，让它成为了全球瞩目的新王，甚至让OpenAI的股份交易在一级市场失去了吸引力。毫无疑问，Coding是一个回报路径极其明确的赛道，根据The Information的报道，在企业级市场，Anthropic展现了空前强势的定价权，从它用按量计费替换订阅套餐，到上线导致Token费用上涨的分词器，都让企业找不到商量余地，只能拿着超标的账单去找老板加大预算。没办法，品质和稀缺绑在一起，就是硬通货。摩根大通也是这么判断的，在AI行业，拥有强大模型的公司某种程度上可以豁免于成本战争，而且它想进入「下沉市场」的难度，要远低于低价模型打入「高端市场」。但Coding是一个已经实现预期的赛道，下一个大的是什么？目前来看，几天之后的Google I/O大会非常重要，从已经被剧透的Gemini Omni来看，「All In One」的全栈模型要给多模态打翻身仗了。那个教授在黑板上写公式讲课的片段，之所以艳惊四座，是因为它并非简单的视频生成，这个新的Gemini Omni模型同时搞对了三件事：手持粉笔的空间关系、板书撰写的画面关系、推导过程的逻辑关系。更直白的说，这绝对不是三个模型合在一起的结果，而是基座模型已经就在全模态信息上完成了训练，也就是，世界模型的雏形。像是杨立昆、李飞飞这些不属于Transform派别的行业大佬，都对语言模型颇有微词，认为这条路线跑不出真正的世界模型，所以都选择了另辟蹊径，但Google、OpenAI甚至字节跳动都在证明，即使语言模型确实有局限之处，只要坚持Scaling Laws、在同一个基座模型上训练全模态能力，同样能够渐进式的通向世界模型。如果只看Coding的叙事，中国的原生AI公司都在扮演「一个更便宜的Anthropic」，杀成一片红海。但在找出「一个更本土的Google」这件事情上，就会发现阿里、字节和MiniMax都在这么干，只有它们的模型迭代方向与Google完全一致：在一个系统内完成文本理解、图片生成、视频生成和音频输出。王慧文在即刻上说，一家新兴公司的估值，是由相信它的资本定价的，不是不相信它的人定价的，「好吧，这是句废话。」多模态的生成是语言模型理解世界的硬验证信号，且大部分底层能力与核心模型复用，多个模态并不等同于多份研发投入，有限的成本提升，能够极具经济性的帮助AI构建世界，并让每一代模型的更新不断放大效率差，并打开更高的智能上限。我想吹的和期待看到的，其实就是这个。

显示更多

0

8

115

18

转发到社区

宝玉@dotey

2025.12.31 00:48

这份年终众包调研来自我在 X 上的随手一问，问了三个问题：2025 年 AI 最关键的技术突破是什么？哪些产品让你眼前一亮？2026 年什么趋势不可忽视？没想到收到了这么多认真的回复。我花了一两个小时时间，把这些留言和答案汇总整理了一下。 127 条留言，95 个人回答了同样的三个问题。看完所有答案，我发现大家虽然各有侧重，但在某些判断上出奇一致。答案五花八门，但有些词频繁出现：推理 (Reasoning)、Agent (智能体)、Claude Code、Manus、Nano Banana Pro、NotebookLM、具身智能 (Embodied AI)。这组词频里有个共同点：“聊天”这个词几乎没人提起了，“干活”这个词开始更多被提起了。【1】推理革命：AI 学会了慢下来如果要选 2025 年最重要的技术突破，答案几乎没有悬念——推理能力的工程化落地。三疯 (@ 3fenglife) 的表述最精准：从“预测下一个词”到“预测下一步行动”。以前的 AI 像个反应快但不过脑子的人，张口就来，经常胡说八道。2025 年的突破在于，AI 学会了在回答之前先想一想——做内部推演、自我检查、发现错误就纠正。技术上这叫 System 2 Thinking，或者叫 test-time scaling。AI 从“快思考”进化到了“慢思考”。o1、o3、DeepSeek R1 这些模型，都是这条路线的产物。 Ray Zhai(@ Cryptoxorz) 还补充了一个视角——当 AI 开始像人类一样拥有“慢思考”的逻辑链，并能理解真实世界的因果律时，AI 才算真正拿到了进入物理世界的入场券。岚叔 (@ LufzzLiz) 和 Xin(@ Xin_Jin1018) 点名了一个关键技术：RLVR，基于可验证奖励的强化学习。以前训练模型需要大量人工标注的数据，告诉模型“这个回答好，那个回答不好”。这很贵，也很慢。而 RLVR 换了个思路：对于数学题和代码这类问题，答案对不对是可以自动验证的。答案对了就给奖励，错了就扣分。不需要人来一条条看。另一个高频共识是成本拐点。Rainman(@ 0xdeusyu) 和 Robinson(@ python_xxt) 都提到了 MoE 稀疏化架构，DeepSeek R1 证明了一件事：前沿 AI 不再需要前沿预算。意味着推理成本在下降，成为可以普及的基础设施。还有一类突破被反复提及：Agent 系统化成熟。SLiangD(@ SLiangD) 说得很到位，关键突破不是参数变大，而是三件套终于配合默契了——工具调用、上下文工程、多步推理。AI 能理解“帮我扫描亚马逊眼罩类目，找出评分低但销量高的产品，总结用户抱怨最多的三个痛点”这种复杂任务链了。【2】年度产品：对话框退场，进度条登台问到 2025 年哪些产品让人眼前一亮，有一个名字被提到了二十多次：Claude Code。 G_Z(@ GZhan57) 的评价很有画面感：“第一个 work 的 general agent，除了不能生孩子啥都可以。”阿绎 YiOS(@ WangYiNotes) 说得更细腻：“不是因为它写代码有多快，而是它第一次让人感觉是在跟队友协作，而不是在调教工具。” Claude Code 代表的是一类新物种：能把复杂工作流跑通的 AI。它不只是补全代码，还可以自己检索文档、改 Bug、跑测试、完成部署。你扔给它一个需求，它真的能把事办完。第二名是 NotebookLM。Rocky(@ Rockybnbtrade) 说它让知识输入效率提升了很多，王是子路 (@ atm13999) 说它把枯燥的文档变成极其自然的播客对话。这个产品的价值不在于生成内容，而在于帮你消化和内化已有的知识。第三名是个意外：Nano Banana Pro，谷歌 Gemini 的生图功能。defyong(@ defyong) 的评价很有意思：“结合 Gemini 的感知与知识库，图片生成不再是凭感觉。第一次让我觉得，这个生图工具，她活起来了。”Steven Qi(@ Jason_qeb) 补充说中文支持是个大突破，文生图、图生视频、图生 PPT 都变得可行了。视频生成虽然没有 Claude Code 和 Nano Banana Pro 那么高频，但也收获了一批提名。Roland(@ Roland_WayneOZ) 和小镇记录家 (@ liangde_li40657) 都提到了 Sora、可灵、即梦等产品的突破，cicada(@ thebestsetup) 直接把 Veo/Sora 列为年度最惊艳。JCat(@ JackyisThinking) 的判断更进一步：视频生成会在 2026 年更加成熟，影视行业尤其是低成本特效和动画行业将全面 AI 化。这条赛道的特点是"看得见摸得着"，普通人也能直观感受到 AI 的进步，所以虽然技术门槛高、商业化慢，但对大众认知的影响可能比编程工具更大。空间智能是另一个被多人点名的方向。JCat(@ JackyisThinking) 说得最清楚：机器人产业要落地，AI 就必须具备更高阶的 3D 空间识别、理解和推理能力，这是绕不过去的坎。Ray Zhai(@ Cryptoxorz) 和 suwakopro(@ suwakopro) 都提到了"世界模型"这个概念——AI 不能只在文字和图片的世界里打转，它得理解真实世界的因果律和物理规则。小洲洲的 AI 日常 (@ LZhou15365) 观察到具身智能已经在快速进化："从走姿、行动都越来越像人类。"当 AI 学会了"慢思考"，下一步就是让它学会"动手做事"，空间智能是连接数字世界和物理世界的那座桥。还有一批产品被多人提及：Cursor 和 Windsurf 这类 AI IDE，Deep Research 深度研究，Manus 和 Youmind 这类通用 Agent，可灵和 Sora 的视频生成。但最让我印象深刻的是三疯 (@ 3fenglife) 的一句总结：让人惊艳的不再是对话框，而是进度条——它在后台默默把事办完了。Ray Zhai(@ Cryptoxorz) 把这种体验叫做“感知消失，效率倍增”，这才是技术真正闭环的瞬间。这才是 2025 年产品形态的本质变化。【3】2026 路线图：从“教 AI 怎么做”到“告诉 AI 我要什么” 关于 2026 年的趋势，答案的集中度比我想象的高。第一个共识是 Agent 大规模落地。超过三分之一的人提到了这个方向。什么是 Agent？简单说，就是 AI 不再只是回答问题，还能自己拆解任务、调用工具、一步步执行，最后交付结果。 Ray Zhai(@ Cryptoxorz) 的描述很有画面感：未来不再是你一个人对着一个 AI，而是你拥有一个 AI 舰队。它们会自动分工、自我纠错、自发存储数据。我们将从“教 AI 怎么做”转向“告诉 AI 我要什么”。 SLiangD(@ SLiangD) 用黄金圈法则做了一个漂亮的框架切分：Why（为什么做）和 What（做什么）仍然是人的领地，AI 无法替代；但 How（怎么做）将彻底交给机器，趋近于零成本瞬间完成。这意味着什么？未来的竞争力不是“会用 AI”，而是“会定义问题”。第二个共识是具身智能。码上盈 (@ InnaLyceyum) 预测 Agent 将不再只存在于浏览器中，而会深度集成到智能硬件——从智能眼镜到桌面机器人，AI 将获得空间感知与物理交互能力。阿绎 YiOS(@ WangYiNotes) 说得更极端：2026 年我们可能不再讨论哪个 AI 产品好用，因为 AI 已经内嵌在 OS 和硬件的每一寸肌理里了。第三个共识是 AI 的“私人化”和“记忆化”。 Cunningham Card(@ Card198454) 强调 Memory 方向的突破会让 Agent 更像人，拥有社会属性。AI 将从千篇一律的工具，演变成极度个性化、具备连续记忆的数字助手。三疯 (@ 3fenglife) 还提出了一个颠覆性预测：SaaS 的消亡，Service 的崛起。你不再订阅“写作软件”，你订阅的是“文案产出服务”；你不再订阅“CRM 系统”，你订阅的是“销售线索清洗服务”。软件会员变成结果订阅，这是商业模式的根本重构。当然也有清醒的声音。 Michael Guo(@ Michaelzsguo) 认为 2025 年 AI 基本没有关键技术突破，都是沿用 2024 年的路线做性能提升。Tony Lee(@ lee810860) 预测 AI 厂商加速倒闭。熊布朗 (@ Stephen4171127) 直接说“没有什么是不可忽视的必然路径”。也不能说这些声音是悲观，更像是提醒我们：共识不等于正确，热情不能代替验证。【4】最后 AI 的演进已经进入新阶段。2024 年大家还在争论哪个模型更聪明，2025 年这个问题变得不那么重要了，重要的是谁能把活干完。从“会说”到“会做”，从“输出文本”到“交付结果”，这是范式级的转变。来自 Roland(@ Roland_WayneOZ) 和 SLiangD(@ SLiangD) 的一句话适合用来作为结尾： 2025 年是 AI 学会干活的元年。2026 年的赢家，不是最会用 AI 的人，而是最会定义问题的人。我把整理后的结果放到 Google Sheet 上了：

显示更多

0

23

247

45

转发到社区

与「图片生成视频」相关的搜索结果