注册并分享邀请链接,可获得视频播放与邀请奖励。

与「图片生成视频」相关的搜索结果

图片生成视频 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 图片生成视频 的内容
玩了下Gemini 2.0 Flash Experimental模型 直达地址: 出来的图片不是很满意,又用平替软件image-fx重新做图,两者结合能出来一致性的故事内容,如果需要变成视频,用即梦里面的图片生成视频+分镜描述就可以。 重点是都免费,可以无限制生成,做做还蛮费时间的
显示更多
0
12
49
9
转发到社区
简单用图片生成视频来做视频分镜,基本上输入分镜头语言描述就可以出来视频,多生成几个拼接在一起就是一个小短片。可灵【高表现】模式下细节和画质上还是能用用的,可惜每天只能用3次。@Kling_ai 提示词:黑色跑车以300码速度疾驰在街道上,大幅度动作,速度感,电影级画面 #图片生成视频# #可灵AI工具# #KlingCreativeSpace#
显示更多
快手可灵AI图片生成视频➕ElevenLabs的Video to Sounds Effects组合,可以说一步到位了。 视频和音效都是AI自动生成。 视频制作工具见图三app,免费内测中,随便用, 直达地址: 或者你也可以使用luma来生成(免费用户体验不佳)。 音效制作工具直达地址: 视频往里面丢就可以了 Kuaishou Keling's AI-powered video generation, paired with ElevenLabs' AI-generated sound effects, provides a comprehensive solution. Both the videos and sound effects are fully automated by AI.
显示更多
0
3
56
13
转发到社区
#AI将老照片复活了# 免费试用过两个工具后,我发现快手的可灵AI比LUMA更好用。LUMA生成的等待时间太长,不知道付费用户是否无需等待。我用快影基本4分钟内就能生成一张图,效果不满意可以立即重新生成,还能多次添加后续图片,效率很高。生成出色的视频关键是提示词要清晰表达。现在内测阶段都是免费使用,玩玩挺不错的。 由于LUMA生成的视频效果不理想,我没有放LUMA生成的视频。这个视频都是用可灵AI生成,音效由#ElevenLabs# 生成。我之前推文中有介绍过自动生成音效的工具,视频扔进去就会出来匹配音效,好用推荐,感兴趣的推友关注下,供大家参考。 #可灵AI# #图片生成视频# #LumaDreamMachine# #老照片变视频工具# #AI工具#
显示更多
图片生成视频的多种玩法,让老照片变成视频真的太棒了,感受下。5秒镜头其实可以拼接出很多故事了,学起来
做封面神器哈,封面尺寸不够AI工具来凑。之前PS的自动生图扩展功能出来就很喜欢,可惜国内用户用不了。用这个网站做平替挺好。画质也是高清,目前是免费体验使用,喜欢的收藏吧。👍好用推荐 直达传送门: #AI工具# #图生图工具# #图片生成# #视频自动生成#
显示更多
图片生成视频效果演示,只有前面3秒是 #PIKALABS# 完成的,后面是我自己拼接的,来看效果。 图片由AI工具自动生成 视频由pikalabs自动生成 音效来自YouTube,视频通过剪映制作。 测试了多张图片,这3秒我觉得是最完美的@pika_labs @youseememiami @madpencil_ @op7418 @xiaohuggg @iesselaunz @dotey
显示更多
0
6
43
10
转发到社区
xBubble VS 其他AI生图:同一句简单提示,古风山水人物图差得有点明显~ 最近看到很多人都在用@dappOS_com 的xBubble @xBubble_ai 生成各种好玩的图和视频对比图,我感觉很好玩挺有趣,就也想玩玩看。 平时每次在gemini生图,为了出好效果,我都要花好多时间琢磨,加这个加那个,改来改去,反复好几次,但最终效果老是不如我意,想要的关键元素经常缺斤少两。 比如明明就是一个简单封面图,我却经常要生成好几次,才能勉强挑出一张自己满意的。有时候忙活半天,但还是觉得整体感觉差点意思~ 其实,我挺喜欢那种古典优雅的古风山水人物图,就想试着用AI生图试试看效果。 这次,我特意用完全一样的简单提示词“生成古风山水人物”,让xBubble和Gemini各自跑了一次,结果就是下面这张对比图。 扪心自问,大家更喜欢下面的哪幅图呢?? 上方是xBubble生成的:人物站在山巅衣带飘飘,整个画面特别有古典国画的味道,一次就让我眼前一亮,优雅又舒服。 下方是Gemini生成的:基础还可以,但整体氛围和层次感跟xBubble 一比,还是差了一些距离。 老实讲,我更喜欢图一,可能因为有帅哥? 其实发展到现在,AI画图能力已经很强了,但怎么用一句话就稳定出好看的图,才是最实用的。 我发现xBubble在这点上做得特别好。它不用你写很长的提示词,也不用你研究各种设置。 你只要说一句简单的话,它就能帮你把后面的事情都处理好。 里面有个叫SOP的功能特别贴心,就像一个已经打包好的专业小助手。比如古风山水、仕女图、品牌素材这种,它都提前准备好了最合适的画法。 你一句话过去,它自动挑最好的方式来画,出来的效果稳定又好看。 我身边很多做Web2的朋友,还有不少一人公司的小伙伴都在用Bubble。 那些团队做营销海报、产品图时,效率高了很多;一个人做短视频封面、IP形象、日常素材时,也不用再花钱找外包,省时又省力。 用得越多,它就越懂你的风格,后面出图越来越顺。 实际用起来很简单: •直接简单一句话说需求,它就给你优化后的好结果 •如果是第一次遇到的类型,它也能正常完成 •同样的需求多提几次,它还会越变越聪明 还有两种使用模式: -需要复杂操作时用Bubble Computer,一次性能把研究、设计、检查全搞定; -想在自己电脑上安全操作文件时,就用Bubble Personal,很放心。 以前我总把时间花在反复调整AI生图上,现在有了xBubble,我可以把精力放在真正想做的事情上。生成图片这件事,真的轻松不少~ AI应该学习AI,AI应该使用AI,用户只需说清楚自己想要什么。 另外,实测一句话也能稳定生成视频噢,更有想象力更有趣,欢迎来体验DappOS xBubble: #xBubble# #DappOS# #Bubble# #LowPromptAI#
显示更多
0
42
33
0
转发到社区
阿里前几天刚发季报,破天荒的第一次披露了模型与应用服务——其实就是MaaS——的经常性年化收入: 截至今年3月超过80亿人民币,预计6月达到100亿,年底突破300亿。 相当于半年3.75x的增长速度,大概也是基于如此乐观的势头,阿里才会难得的公布这个数字,向资本市场构建叙事。 所以你以为我要开始吹阿里了?错了。 阿里的AI收入,建立在阿里云这个中国最大的云计算平台上,阿里云拥有现成的客户群体、销售网络和算力资源,用配套升级的方式去叠一层AI服务收入,是很容易的。 所以真正要吹的,不是阿里的AI业绩凭什么增长这么快,而是如果连主要靠存量用户增加预算就能做到半年3.75x的增速,那么原生AI公司今年在同样的市场环境下,增速会飙到什么地步? 要知道,原生AI公司赚的每一块钱都是从零开始、靠着模型能力兑现而来的,除了更加纯粹的增长之外,因为不必承担其他业务的成本转移,ROI的负担也更小。 比如摩根士丹利测算发现MiniMax平均每分钟进账1美金,同时成本低于0.3美金,而行业平均收入只有约0.5美元/分钟,相当于MiniMax仅凭利润就跑赢了大盘。 这就是Pure-play的价值,算清楚这笔账,对于理解走向拐点时刻的AI行业,非常重要。 在研报里,摩根大通认为中国在2026年的企业端需求,很大概率会复制美国2025年至今的来路,也就是从试点到规模化投入再到AI成为固定支出的三级跳。 简而言之,就是Anthropic的那条离谱曲线。 Anthropic创造了AI行业还是商业史上的创收奇迹,300亿美金的经常性年化收入,让它成为了全球瞩目的新王,甚至让OpenAI的股份交易在一级市场失去了吸引力。 毫无疑问,Coding是一个回报路径极其明确的赛道,根据The Information的报道,在企业级市场,Anthropic展现了空前强势的定价权,从它用按量计费替换订阅套餐,到上线导致Token费用上涨的分词器,都让企业找不到商量余地,只能拿着超标的账单去找老板加大预算。 没办法,品质和稀缺绑在一起,就是硬通货。 摩根大通也是这么判断的,在AI行业,拥有强大模型的公司某种程度上可以豁免于成本战争,而且它想进入「下沉市场」的难度,要远低于低价模型打入「高端市场」。 但Coding是一个已经实现预期的赛道,下一个大的是什么? 目前来看,几天之后的Google I/O大会非常重要,从已经被剧透的Gemini Omni来看,「All In One」的全栈模型要给多模态打翻身仗了。 那个教授在黑板上写公式讲课的片段,之所以艳惊四座,是因为它并非简单的视频生成,这个新的Gemini Omni模型同时搞对了三件事: 手持粉笔的空间关系、板书撰写的画面关系、推导过程的逻辑关系。 更直白的说,这绝对不是三个模型合在一起的结果,而是基座模型已经就在全模态信息上完成了训练,也就是,世界模型的雏形。 像是杨立昆、李飞飞这些不属于Transform派别的行业大佬,都对语言模型颇有微词,认为这条路线跑不出真正的世界模型,所以都选择了另辟蹊径,但Google、OpenAI甚至字节跳动都在证明,即使语言模型确实有局限之处,只要坚持Sc­a­l­i­ng La­ws、在同一个基座模型上训练全模态能力,同样能够渐进式的通向世界模型。 如果只看Coding的叙事,中国的原生AI公司都在扮演「一个更便宜的Anthropic」,杀成一片红海。 但在找出「一个更本土的Google」这件事情上,就会发现阿里、字节和MiniMax都在这么干,只有它们的模型迭代方向与Google完全一致:在一个系统内完成文本理解、图片生成、视频生成和音频输出。 王慧文在即刻上说,一家新兴公司的估值,是由相信它的资本定价的,不是不相信它的人定价的,「好吧,这是句废话。」 多模态的生成是语言模型理解世界的硬验证信号,且大部分底层能力与核心模型复用,多个模态并不等同于多份研发投入,有限的成本提升,能够极具经济性的帮助AI构建世界,并让每一代模型的更新不断放大效率差,并打开更高的智能上限。 我想吹的和期待看到的,其实就是这个。
显示更多
0
8
115
18
转发到社区
这份年终众包调研来自我在 X 上的随手一问,问了三个问题:2025 年 AI 最关键的技术突破是什么?哪些产品让你眼前一亮?2026 年什么趋势不可忽视? 没想到收到了这么多认真的回复。我花了一两个小时时间,把这些留言和答案汇总整理了一下。 127 条留言,95 个人回答了同样的三个问题。 看完所有答案,我发现大家虽然各有侧重,但在某些判断上出奇一致。答案五花八门,但有些词频繁出现:推理 (Reasoning)、Agent (智能体)、Claude Code、Manus、Nano Banana Pro、NotebookLM、具身智能 (Embodied AI)。 这组词频里有个共同点:“聊天”这个词几乎没人提起了,“干活”这个词开始更多被提起了。 【1】推理革命:AI 学会了慢下来 如果要选 2025 年最重要的技术突破,答案几乎没有悬念——推理能力的工程化落地。 三疯 (@ 3fenglife) 的表述最精准:从“预测下一个词”到“预测下一步行动”。以前的 AI 像个反应快但不过脑子的人,张口就来,经常胡说八道。2025 年的突破在于,AI 学会了在回答之前先想一想——做内部推演、自我检查、发现错误就纠正。 技术上这叫 System 2 Thinking,或者叫 test-time scaling。AI 从“快思考”进化到了“慢思考”。o1、o3、DeepSeek R1 这些模型,都是这条路线的产物。 Ray Zhai(@ Cryptoxorz) 还补充了一个视角——当 AI 开始像人类一样拥有“慢思考”的逻辑链,并能理解真实世界的因果律时,AI 才算真正拿到了进入物理世界的入场券。 岚叔 (@ LufzzLiz) 和 Xin(@ Xin_Jin1018) 点名了一个关键技术:RLVR,基于可验证奖励的强化学习。 以前训练模型需要大量人工标注的数据,告诉模型“这个回答好,那个回答不好”。这很贵,也很慢。而 RLVR 换了个思路:对于数学题和代码这类问题,答案对不对是可以自动验证的。答案对了就给奖励,错了就扣分。不需要人来一条条看。 另一个高频共识是成本拐点。Rainman(@ 0xdeusyu) 和 Robinson(@ python_xxt) 都提到了 MoE 稀疏化架构,DeepSeek R1 证明了一件事:前沿 AI 不再需要前沿预算。意味着推理成本在下降,成为可以普及的基础设施。 还有一类突破被反复提及:Agent 系统化成熟。SLiangD(@ SLiangD) 说得很到位,关键突破不是参数变大,而是三件套终于配合默契了——工具调用、上下文工程、多步推理。AI 能理解“帮我扫描亚马逊眼罩类目,找出评分低但销量高的产品,总结用户抱怨最多的三个痛点”这种复杂任务链了。 【2】年度产品:对话框退场,进度条登台 问到 2025 年哪些产品让人眼前一亮,有一个名字被提到了二十多次:Claude Code。 G_Z(@ GZhan57) 的评价很有画面感:“第一个 work 的 general agent,除了不能生孩子啥都可以。”阿绎 YiOS(@ WangYiNotes) 说得更细腻:“不是因为它写代码有多快,而是它第一次让人感觉是在跟队友协作,而不是在调教工具。” Claude Code 代表的是一类新物种:能把复杂工作流跑通的 AI。它不只是补全代码,还可以自己检索文档、改 Bug、跑测试、完成部署。你扔给它一个需求,它真的能把事办完。 第二名是 NotebookLM。Rocky(@ Rockybnbtrade) 说它让知识输入效率提升了很多,王是子路 (@ atm13999) 说它把枯燥的文档变成极其自然的播客对话。这个产品的价值不在于生成内容,而在于帮你消化和内化已有的知识。 第三名是个意外:Nano Banana Pro,谷歌 Gemini 的生图功能。defyong(@ defyong) 的评价很有意思:“结合 Gemini 的感知与知识库,图片生成不再是凭感觉。第一次让我觉得,这个生图工具,她活起来了。”Steven Qi(@ Jason_qeb) 补充说中文支持是个大突破,文生图、图生视频、图生 PPT 都变得可行了。 视频生成虽然没有 Claude Code 和 Nano Banana Pro 那么高频,但也收获了一批提名。Roland(@ Roland_WayneOZ) 和小镇记录家 (@ liangde_li40657) 都提到了 Sora、可灵、即梦等产品的突破,cicada(@ thebestsetup) 直接把 Veo/Sora 列为年度最惊艳。JCat(@ JackyisThinking) 的判断更进一步:视频生成会在 2026 年更加成熟,影视行业尤其是低成本特效和动画行业将全面 AI 化。这条赛道的特点是"看得见摸得着",普通人也能直观感受到 AI 的进步,所以虽然技术门槛高、商业化慢,但对大众认知的影响可能比编程工具更大。 空间智能是另一个被多人点名的方向。JCat(@ JackyisThinking) 说得最清楚:机器人产业要落地,AI 就必须具备更高阶的 3D 空间识别、理解和推理能力,这是绕不过去的坎。Ray Zhai(@ Cryptoxorz) 和 suwakopro(@ suwakopro) 都提到了"世界模型"这个概念——AI 不能只在文字和图片的世界里打转,它得理解真实世界的因果律和物理规则。小洲洲的 AI 日常 (@ LZhou15365) 观察到具身智能已经在快速进化:"从走姿、行动都越来越像人类。"当 AI 学会了"慢思考",下一步就是让它学会"动手做事",空间智能是连接数字世界和物理世界的那座桥。 还有一批产品被多人提及:Cursor 和 Windsurf 这类 AI IDE,Deep Research 深度研究,Manus 和 Youmind 这类通用 Agent,可灵和 Sora 的视频生成。 但最让我印象深刻的是三疯 (@ 3fenglife) 的一句总结:让人惊艳的不再是对话框,而是进度条——它在后台默默把事办完了。Ray Zhai(@ Cryptoxorz) 把这种体验叫做“感知消失,效率倍增”,这才是技术真正闭环的瞬间。 这才是 2025 年产品形态的本质变化。 【3】2026 路线图:从“教 AI 怎么做”到“告诉 AI 我要什么” 关于 2026 年的趋势,答案的集中度比我想象的高。 第一个共识是 Agent 大规模落地。 超过三分之一的人提到了这个方向。什么是 Agent?简单说,就是 AI 不再只是回答问题,还能自己拆解任务、调用工具、一步步执行,最后交付结果。 Ray Zhai(@ Cryptoxorz) 的描述很有画面感:未来不再是你一个人对着一个 AI,而是你拥有一个 AI 舰队。它们会自动分工、自我纠错、自发存储数据。我们将从“教 AI 怎么做”转向“告诉 AI 我要什么”。 SLiangD(@ SLiangD) 用黄金圈法则做了一个漂亮的框架切分:Why(为什么做)和 What(做什么)仍然是人的领地,AI 无法替代;但 How(怎么做)将彻底交给机器,趋近于零成本瞬间完成。 这意味着什么?未来的竞争力不是“会用 AI”,而是“会定义问题”。 第二个共识是具身智能。 码上盈 (@ InnaLyceyum) 预测 Agent 将不再只存在于浏览器中,而会深度集成到智能硬件——从智能眼镜到桌面机器人,AI 将获得空间感知与物理交互能力。阿绎 YiOS(@ WangYiNotes) 说得更极端:2026 年我们可能不再讨论哪个 AI 产品好用,因为 AI 已经内嵌在 OS 和硬件的每一寸肌理里了。 第三个共识是 AI 的“私人化”和“记忆化”。 Cunningham Card(@ Card198454) 强调 Memory 方向的突破会让 Agent 更像人,拥有社会属性。AI 将从千篇一律的工具,演变成极度个性化、具备连续记忆的数字助手。 三疯 (@ 3fenglife) 还提出了一个颠覆性预测:SaaS 的消亡,Service 的崛起。你不再订阅“写作软件”,你订阅的是“文案产出服务”;你不再订阅“CRM 系统”,你订阅的是“销售线索清洗服务”。软件会员变成结果订阅,这是商业模式的根本重构。 当然也有清醒的声音。 Michael Guo(@ Michaelzsguo) 认为 2025 年 AI 基本没有关键技术突破,都是沿用 2024 年的路线做性能提升。Tony Lee(@ lee810860) 预测 AI 厂商加速倒闭。熊布朗 (@ Stephen4171127) 直接说“没有什么是不可忽视的必然路径”。 也不能说这些声音是悲观,更像是提醒我们:共识不等于正确,热情不能代替验证。 【4】最后 AI 的演进已经进入新阶段。2024 年大家还在争论哪个模型更聪明,2025 年这个问题变得不那么重要了,重要的是谁能把活干完。从“会说”到“会做”,从“输出文本”到“交付结果”,这是范式级的转变。 来自 Roland(@ Roland_WayneOZ) 和 SLiangD(@ SLiangD) 的一句话适合用来作为结尾: 2025 年是 AI 学会干活的元年。2026 年的赢家,不是最会用 AI 的人,而是最会定义问题的人。 我把整理后的结果放到 Google Sheet 上了:
显示更多
0
23
247
45
转发到社区