搜索说话视频相关的推文与用户

2026.06.23 01:45

30 个感觉「非法」却合法的 AI 网站 1. — 免费无限 AI 生图，质量直逼 Midjourney 2. — 实时 AI 生图，边画边出图 3. — AI 无限放大图片，细节自动补全 4. — AI 一键去背景/补光/擦除 5. — AI 语音克隆，5 秒模仿任何声音 6. — 输入歌词自动生成完整歌曲 7. — AI 视频生成先驱，Gen-3 免费试 8. — 快手可灵 AI，中文视频生成最丝滑 9. — 一张照片+一段语音=说话的数字人 10. — 静态照片变说话视频 11. — AI 写代码，免费额度够日常用 12. — 说话就能建网站，零代码 13. — Vercel AI 前端生成器，描述即页面 14. — 浏览器里写代码+AI 辅助+一键部署 15. — 粘贴文字自动生成信息图 16. — AI 一键生成 PPT，告别 PPT 地狱 17. — Notion AI 写作、总结、翻译 18. — 画草图 AI 自动生成真实网页 19. — AI 搜索引擎，问任何问题秒给答案+来源 20. — 开发者专属 AI 搜索，代码问题一搜即解 21. — 会议实时转文字，免费每月 300 分钟 22. — AI 剪辑短视频，自动找高光片段 23. — 一个网站用 GPT-4o / Claude / Gemini 24. — 开源 AI 模型免费试玩场 25. — 一键 AI 去背景，1 秒出图 26. — AI 擦除照片中任何物体 27. — AI 换脸，1 分钟出片 28. — AI 音乐标签+推荐 29. — AI 写作助手，免费版够日常 30. — Anthropic 免费 AI 助手，长文处理天花板

显示更多

0

94

1.6K

308

转发到社区

Denzii 🕊️@denziideng

2026.06.17 09:50

🚀 一张照片 + 一段音频，照片直接“开口说话”还能动全身，惊掉下巴了！😱🔥 一直苦恼于如何让静态照片变成会说话、表情自然、动作协调的视频？😭 开源神器 InfiniteTalk 直接实现：上传照片/视频 + 音频，就能生成无限时长的说话视频，嘴型同步超准，头部、身体姿态、微表情全协调，效果自然惊艳，简直了！😱 📌 无限时长生成：不像很多工具限时长，想做多长做多长（取决于显卡） 📌 全身协调驱动：不止动嘴，还同步头部转动、身体姿态、表情变化，减少手部/身体扭曲 📌 双模式支持：Image-to-Video（照片变视频） + Video-to-Video（已有视频重配音） 📌 多人对话也行：支持多段音频，多人同时说话不乱 📌 开源易用：提供 Gradio 界面 + ComfyUI 支持，本地运行，模型权重已开源用这玩意真正让照片“活”过来，特别适合做短视频、Vlog、数字人、教学视频、内容创作的朋友们！❤️ 🔗 GitHub地址：（6.9k+ Stars） #开源工具# #工具分享# #AI工具# #InfiniteTalk# #说话视频# #数字人# #视频生成# #AI视频# --

显示更多

0

19

77

34

转发到社区

Vincent | 信号＞噪音@VincentLogic

2026.06.08 06:54

美团 LongCat 团队刚发布了 LongCat-Video-Avatar 1.5，一个开源的音频驱动虚拟人生成框架。输入一张照片和一个音频文件，就能生成对口型的说话视频。解决了现有 AI 头像工具的几个常见问题： - 面孔变形 - 口型不同步 - 身份漂移 - 长视频生成不稳定支持新闻播报、教育、娱乐、电商等场景，中英文都可以，有写实和动画两种风格。 MIT 许可证，可以商用。 1.5 版本升级了 Whisper-Large 模型，口型同步更准确，推理速度也更快。之前做这种视频需要摄制组、工作室和后期剪辑，现在一个开源工具就能搞定。对于那些收费几千美元的工具来说，这相当于来了个免费竞争对手。 GitHub 仓库链接在评论区。

显示更多

0

1

8

0

转发到社区

心灵书舫 | SoulSloop@SoulSloop99

2026.05.27 16:42

30 个感觉「非法」却合法的 AI 网站 1. — 免费无限 AI 生图，质量直逼 Midjourney 2. — 实时 AI 生图，边画边出图 3. — AI 无限放大图片，细节自动补全 4. — AI 一键去背景/补光/擦除 5. — AI 语音克隆，5 秒模仿任何声音 6. — 输入歌词自动生成完整歌曲 7. — AI 视频生成先驱，Gen-3 免费试 8. — 快手可灵 AI，中文视频生成最丝滑 9. — 一张照片+一段语音=说话的数字人 10. — 静态照片变说话视频 11. — AI 写代码，免费额度够日常用 12. — 说话就能建网站，零代码 13. — Vercel AI 前端生成器，描述即页面 14. — 浏览器里写代码+AI 辅助+一键部署 15. — 粘贴文字自动生成信息图 16. — AI 一键生成 PPT，告别 PPT 地狱 17. — Notion AI 免费写+总结+翻译 18. — 画草图 AI 自动生成真实网页 19. — AI 搜索引擎，问任何问题秒给答案+来源 20. — 开发者专属 AI 搜索，代码问题一搜即解 21. — 会议实时转文字，免费每月 300 分钟 22. — AI 剪辑短视频，自动找高光片段 23. — 一个网站用 GPT-4 o/Claude/Gemini 全免费 24. — 开源 AI 模型免费试玩场 25. — 一键 AI 去背景，1 秒出图 26. — AI 擦除照片中任何物体 27. — AI 换脸，1 分钟出片 28. — AI 音乐标签+推荐 29. — AI 写作助手，免费版够日常 30. — Anthropic 免费 AI 助手，长文处理天花板全部合法。全部免费。在它消失前收藏这个。

显示更多

0

42

4.4K

556

转发到社区

阿泽 AZe@Chenzeze777

2026.05.26 14:47

30 个感觉「非法」却合法的 AI 网站 1. — 免费无限 AI 生图，质量直逼 Midjourney 2. — 实时 AI 生图，边画边出图 3. — AI 无限放大图片，细节自动补全 4. — AI 一键去背景/补光/擦除 5. — AI 语音克隆，5 秒模仿任何声音 6. — 输入歌词自动生成完整歌曲 7. — AI 视频生成先驱，Gen-3 免费试 8. — 快手可灵 AI，中文视频生成最丝滑 9. — 一张照片+一段语音=说话的数字人 10. — 静态照片变说话视频 11. — AI 写代码，免费额度够日常用 12. — 说话就能建网站，零代码 13. — Vercel AI 前端生成器，描述即页面 14. — 浏览器里写代码+AI 辅助+一键部署 15. — 粘贴文字自动生成信息图 16. — AI 一键生成 PPT，告别 PPT 地狱 17. — Notion AI 免费写+总结+翻译 18. — 画草图 AI 自动生成真实网页 19. — AI 搜索引擎，问任何问题秒给答案+来源 20. — 开发者专属 AI 搜索，代码问题一搜即解 21. — 会议实时转文字，免费每月 300 分钟 22. — AI 剪辑短视频，自动找高光片段 23. — 一个网站用 GPT-4 o/Claude/Gemini 全免费 24. — 开源 AI 模型免费试玩场 25. — 一键 AI 去背景，1 秒出图 26. — AI 擦除照片中任何物体 27. — AI 换脸，1 分钟出片 28. — AI 音乐标签+推荐 29. — AI 写作助手，免费版够日常 30. — Anthropic 免费 AI 助手，长文处理天花板全部合法。全部免费。在它消失前收藏这个。

显示更多

0

54

5.6K

1.1K

转发到社区

Bill The Investor@billtheinvestor

2026.04.24 06:56

AI歌唱对口型视频必备开源库！ ✅ 超长序列无长度限制 ✅ 精准唇同步 + 全身动作驱动 ✅ 保留身份、背景和镜头运动 ✅ 支持 Gradio 和 ComfyUI 从一张图或一段视频 + 音频，就能生成自然流畅的说话视频！🚀

显示更多

0

2

38

8

转发到社区

小喜AI@FndAdn4409

2026.05.12 06:00

渣狗！# 爆笑哈士奇 # 二哈说话搞笑视频 # 二哈 # 美女与狗的搞笑日常 #AI真人#

0

2

0

转发到社区

小互@xiaohu

2026.05.06 08:29

一张图生成一个实时回应你的对话视频角色 Runway 推出 Runway Characters 你给它一张参考图，它就能生成一个可以和用户实时说话的视频角色。 • 角色能实时对话，官方称支持 HD、24fps • 它能看摄像头，也能看屏幕共享 • 声音、性格、开场白可以配置，也能生成或克隆自定义声音 • 可以接文本或 Markdown 知识库，让角色按资料回答 • 可以调用工具，比如高亮网页按钮、滚动页面、打开弹窗，或去后端查订单和库存 • 可以通过 API、React SDK、网页 Widget 接进自己的产品。你可能觉得，这不就是“数字人”吗。上传一张脸，让它眨眼、张嘴、读稿，过去几年大家已经看过很多。但 Runway Characters 不是在重复这件事。它想把视频生成从“等模型出片”，往前推到“现场接话”。用户不是等一段生成好的视频，而是在和屏幕里的角色说话。这个角色要能听懂你、看见你正在看的东西、按资料回答，还能在产品里做一点动作。

显示更多

0

16

48

7

转发到社区

Vincent | 信号＞噪音@VincentLogic

10hours ago

以前的视频 AI，都是你先问，它再看。京东刚开源的 JoyAI-VL-Interaction，把这个顺序反了过来：它会一直看着摄像头或直播流，每秒自己判断一次——现在该说话、保持沉默，还是把任务交给后台 Agent。火灾出现就提醒，比分变化就解说，画面触发条件才行动。这听起来只是“实时了一点”，实际却是 AI 从被动工具变成了持续在场的观察者。问题也随之来了：当 AI 可以24小时看着家庭、老人、工厂和公共空间，便利与监控之间的边界应该画在哪里？视频里看实测效果。👇

显示更多

0

5

2

0

转发到社区

Vincent | 信号＞噪音@VincentLogic

2026.06.26 12:55

🚨阿里巴巴发布实时视频语音模型：Wan Streamer 这不是普通数字人。它更像是让你和 AI 打一通“实时视频电话”：你说话，它看着你听。你打断，它能接住。你表情变了，它也能反应。半秒内接话，几乎没有冷场。真正的重点是：以前虚拟人是拼流水线：语音识别 → 转文字 → 大模型思考 → 语音合成 → 表情驱动 → 视频生成每一步都要排队，所以延迟高、互动僵硬。 Wan Streamer 直接把听、看、想、说、表情生成，塞进一个端到端大模型里。一个 Transformer 直接处理实时音视频交互。模型端响应约 0.2 秒，整体延迟约 0.55 秒。这意味着 AI 不再只是“回复你”，而是开始像一个能实时交流的视频对象。

显示更多

0

8

6

2

转发到社区

与「说话视频」相关的搜索结果