注册并分享邀请链接,可获得视频播放与邀请奖励。

LinearUncle (@LinearUncle) “推荐一家叫模思的中国公司的开源声音克隆仓库: MOSS-TTS 你朗读一段文字,它克隆你的” — TopicDigg

LinearUncle 的个人资料封面
LinearUncle 的头像
LinearUncle
@LinearUncle
👑 AI coding - 职业工程师 💻 只分享硬核AI编程工具,技巧等
加入 March 2020
1.1K 正在关注    10.2K 粉丝
推荐一家叫模思的中国公司的开源声音克隆仓库: MOSS-TTS 你朗读一段文字,它克隆你的声音,然后就可以用你的声音朗读任意文本,查看帖子详情看我实战如何使用,效果很好,可以以假乱真。 模型下载: 实战过程: 1. 在codex里输入如下提示词帮我安装和运行: ``` read 在我本地安装和运行 ``` 2. code开始下载模型,但是非常慢,需要提示它用aria2来下载 3. 下载完毕后,让它给出如何克隆我的声音的步骤,按照步骤操作 4. 克隆声音后,让它根据我的声音生成朗读李白的《静夜思》的音频文件 我听了下效果非常好!非常像我的声音! 关注我,永远有实战,而不是简单转发!!
显示更多
🤗 MOSS-TTS-Local Transformer v1.5 is now open source. Built with a pure autoregressive Audio Tokenizer + LLM paradigm: >MOSS-Audio-Tokenizer-v2, 2B params >Qwen3-4B backbone >Native 48 kHz stereo audio >Streaming output with theoretical sub-100 ms TTFT >Zero-shot voice cloning >Inline [pause] control >🇺🇸 🇯🇵 🇰🇷 31 language synthesis >SGLang-Omni Day0 support 🎉 @sgl_project @lmsysorg Designed for voice agents, digital humans, game NPCs, audiobooks, and real-time speech generation. 👇
显示更多
0
5
73
15
转发到社区