注册并分享邀请链接,可获得视频播放与邀请奖励。

与「说话视频」相关的搜索结果

说话视频 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 说话视频 的内容
30 个感觉「非法」却合法的 AI 网站 1. — 免费无限 AI 生图,质量直逼 Midjourney 2. — 实时 AI 生图,边画边出图 3. — AI 无限放大图片,细节自动补全 4. — AI 一键去背景/补光/擦除 5. — AI 语音克隆,5 秒模仿任何声音 6. — 输入歌词自动生成完整歌曲 7. — AI 视频生成先驱,Gen-3 免费试 8. — 快手可灵 AI,中文视频生成最丝滑 9. — 一张照片+一段语音=说话的数字人 10. — 静态照片变说话视频 11. — AI 写代码,免费额度够日常用 12. — 说话就能建网站,零代码 13. — Vercel AI 前端生成器,描述即页面 14. — 浏览器里写代码+AI 辅助+一键部署 15. — 粘贴文字自动生成信息图 16. — AI 一键生成 PPT,告别 PPT 地狱 17. — Notion AI 写作、总结、翻译 18. — 画草图 AI 自动生成真实网页 19. — AI 搜索引擎,问任何问题秒给答案+来源 20. — 开发者专属 AI 搜索,代码问题一搜即解 21. — 会议实时转文字,免费每月 300 分钟 22. — AI 剪辑短视频,自动找高光片段 23. — 一个网站用 GPT-4o / Claude / Gemini 24. — 开源 AI 模型免费试玩场 25. — 一键 AI 去背景,1 秒出图 26. — AI 擦除照片中任何物体 27. — AI 换脸,1 分钟出片 28. — AI 音乐标签+推荐 29. — AI 写作助手,免费版够日常 30. — Anthropic 免费 AI 助手,长文处理天花板
显示更多
0
94
1.6K
308
转发到社区
🚀 一张照片 + 一段音频,照片直接“开口说话”还能动全身,惊掉下巴了!😱🔥 一直苦恼于如何让静态照片变成会说话、表情自然、动作协调的视频?😭 开源神器 InfiniteTalk 直接实现:上传照片/视频 + 音频,就能生成无限时长的说话视频,嘴型同步超准,头部、身体姿态、微表情全协调,效果自然惊艳,简直了!😱 📌 无限时长生成:不像很多工具限时长,想做多长做多长(取决于显卡) 📌 全身协调驱动:不止动嘴,还同步头部转动、身体姿态、表情变化,减少手部/身体扭曲 📌 双模式支持:Image-to-Video(照片变视频) + Video-to-Video(已有视频重配音) 📌 多人对话也行:支持多段音频,多人同时说话不乱 📌 开源易用:提供 Gradio 界面 + ComfyUI 支持,本地运行,模型权重已开源 用这玩意真正让照片“活”过来,特别适合做短视频、Vlog、数字人、教学视频、内容创作的朋友们!❤️ 🔗 GitHub地址: (6.9k+ Stars) #开源工具# #工具分享# #AI工具# #InfiniteTalk# #说话视频# #数字人# #视频生成# #AI视频# --
显示更多
0
19
77
34
转发到社区
美团 LongCat 团队刚发布了 LongCat-Video-Avatar 1.5,一个开源的音频驱动虚拟人生成框架。 输入一张照片和一个音频文件,就能生成对口型的说话视频。 解决了现有 AI 头像工具的几个常见问题: - 面孔变形 - 口型不同步 - 身份漂移 - 长视频生成不稳定 支持新闻播报、教育、娱乐、电商等场景,中英文都可以,有写实和动画两种风格。 MIT 许可证,可以商用。 1.5 版本升级了 Whisper-Large 模型,口型同步更准确,推理速度也更快。 之前做这种视频需要摄制组、工作室和后期剪辑,现在一个开源工具就能搞定。 对于那些收费几千美元的工具来说,这相当于来了个免费竞争对手。 GitHub 仓库链接在评论区。
显示更多
30 个感觉「非法」却合法的 AI 网站 1. — 免费无限 AI 生图,质量直逼 Midjourney 2. — 实时 AI 生图,边画边出图 3. — AI 无限放大图片,细节自动补全 4. — AI 一键去背景/补光/擦除 5. — AI 语音克隆,5 秒模仿任何声音 6. — 输入歌词自动生成完整歌曲 7. — AI 视频生成先驱,Gen-3 免费试 8. — 快手可灵 AI,中文视频生成最丝滑 9. — 一张照片+一段语音=说话的数字人 10. — 静态照片变说话视频 11. — AI 写代码,免费额度够日常用 12. — 说话就能建网站,零代码 13. — Vercel AI 前端生成器,描述即页面 14. — 浏览器里写代码+AI 辅助+一键部署 15. — 粘贴文字自动生成信息图 16. — AI 一键生成 PPT,告别 PPT 地狱 17. — Notion AI 免费写+总结+翻译 18. — 画草图 AI 自动生成真实网页 19. — AI 搜索引擎,问任何问题秒给答案+来源 20. — 开发者专属 AI 搜索,代码问题一搜即解 21. — 会议实时转文字,免费每月 300 分钟 22. — AI 剪辑短视频,自动找高光片段 23. — 一个网站用 GPT-4 o/Claude/Gemini 全免费 24. — 开源 AI 模型免费试玩场 25. — 一键 AI 去背景,1 秒出图 26. — AI 擦除照片中任何物体 27. — AI 换脸,1 分钟出片 28. — AI 音乐标签+推荐 29. — AI 写作助手,免费版够日常 30. — Anthropic 免费 AI 助手,长文处理天花板 全部合法。全部免费。 在它消失前收藏这个。
显示更多
0
42
4.4K
556
转发到社区
30 个感觉「非法」却合法的 AI 网站 1. — 免费无限 AI 生图,质量直逼 Midjourney 2. — 实时 AI 生图,边画边出图 3. — AI 无限放大图片,细节自动补全 4. — AI 一键去背景/补光/擦除 5. — AI 语音克隆,5 秒模仿任何声音 6. — 输入歌词自动生成完整歌曲 7. — AI 视频生成先驱,Gen-3 免费试 8. — 快手可灵 AI,中文视频生成最丝滑 9. — 一张照片+一段语音=说话的数字人 10. — 静态照片变说话视频 11. — AI 写代码,免费额度够日常用 12. — 说话就能建网站,零代码 13. — Vercel AI 前端生成器,描述即页面 14. — 浏览器里写代码+AI 辅助+一键部署 15. — 粘贴文字自动生成信息图 16. — AI 一键生成 PPT,告别 PPT 地狱 17. — Notion AI 免费写+总结+翻译 18. — 画草图 AI 自动生成真实网页 19. — AI 搜索引擎,问任何问题秒给答案+来源 20. — 开发者专属 AI 搜索,代码问题一搜即解 21. — 会议实时转文字,免费每月 300 分钟 22. — AI 剪辑短视频,自动找高光片段 23. — 一个网站用 GPT-4 o/Claude/Gemini 全免费 24. — 开源 AI 模型免费试玩场 25. — 一键 AI 去背景,1 秒出图 26. — AI 擦除照片中任何物体 27. — AI 换脸,1 分钟出片 28. — AI 音乐标签+推荐 29. — AI 写作助手,免费版够日常 30. — Anthropic 免费 AI 助手,长文处理天花板 全部合法。全部免费。 在它消失前收藏这个。
显示更多
0
54
5.6K
1.1K
转发到社区
AI歌唱对口型视频必备开源库! ✅ 超长序列无长度限制 ✅ 精准唇同步 + 全身动作驱动 ✅ 保留身份、背景和镜头运动 ✅ 支持 Gradio 和 ComfyUI 从一张图或一段视频 + 音频,就能生成自然流畅的说话视频!🚀
显示更多
渣狗!# 爆笑哈士奇 # 二哈说话搞笑视频 # 二哈 # 美女与狗的搞笑日常 #AI真人#
一张图生成一个实时回应你的对话视频角色 Runway 推出 Runway Characters 你给它一张参考图,它就能生成一个可以和用户实时说话的视频角色。 • 角色能实时对话,官方称支持 HD、24fps • 它能看摄像头,也能看屏幕共享 • 声音、性格、开场白可以配置,也能生成或克隆自定义声音 • 可以接文本或 Markdown 知识库,让角色按资料回答 • 可以调用工具,比如高亮网页按钮、滚动页面、打开弹窗,或去后端查订单和库存 • 可以通过 API、React SDK、网页 Widget 接进自己的产品。 你可能觉得,这不就是“数字人”吗。上传一张脸,让它眨眼、张嘴、读稿,过去几年大家已经看过很多。 但 Runway Characters 不是在重复这件事。 它想把视频生成从“等模型出片”,往前推到“现场接话”。 用户不是等一段生成好的视频,而是在和屏幕里的角色说话。这个角色要能听懂你、看见你正在看的东西、按资料回答,还能在产品里做一点动作。
显示更多
0
16
48
7
转发到社区
以前的视频 AI,都是你先问,它再看。 京东刚开源的 JoyAI-VL-Interaction,把这个顺序反了过来:它会一直看着摄像头或直播流,每秒自己判断一次——现在该说话、保持沉默,还是把任务交给后台 Agent。 火灾出现就提醒,比分变化就解说,画面触发条件才行动。 这听起来只是“实时了一点”,实际却是 AI 从被动工具变成了持续在场的观察者。 问题也随之来了:当 AI 可以24小时看着家庭、老人、工厂和公共空间,便利与监控之间的边界应该画在哪里? 视频里看实测效果。👇
显示更多
🚨阿里巴巴发布实时视频语音模型:Wan Streamer 这不是普通数字人。 它更像是让你和 AI 打一通“实时视频电话”: 你说话,它看着你听。 你打断,它能接住。 你表情变了,它也能反应。 半秒内接话,几乎没有冷场。 真正的重点是: 以前虚拟人是拼流水线: 语音识别 → 转文字 → 大模型思考 → 语音合成 → 表情驱动 → 视频生成 每一步都要排队,所以延迟高、互动僵硬。 Wan Streamer 直接把听、看、想、说、表情生成,塞进一个端到端大模型里。 一个 Transformer 直接处理实时音视频交互。 模型端响应约 0.2 秒,整体延迟约 0.55 秒。 这意味着 AI 不再只是“回复你”,而是开始像一个能实时交流的视频对象。
显示更多