注册并分享邀请链接,可获得视频播放与邀请奖励。

mousepotato (@iluciddreaming) “NVIDIA 丟了一個只有 0.6B 的語音辨識模型。 叫 Nemotron-3.5-ASR。 支援 40 種以上語” — TopicDigg

mousepotato 的个人资料封面
mousepotato 的头像
mousepotato
@iluciddreaming
🇺🇸 硅谷 Builder|AI 产品|独立开发|技术管理 👨🏻‍💻 写代码,也写产品、增长和团队管理 🚀 Build | Ship | Grow 👇 咨询合作注明来意
加入 April 2010
324 正在关注    7.9K 粉丝
NVIDIA 丟了一個只有 0.6B 的語音辨識模型。 叫 Nemotron-3.5-ASR。 支援 40 種以上語言,即時串流輸出。 純 CPU 就能跑,不需要 GPU。 速度是官方 Nemo runtime 的 2.5 倍,辨識結果卻完全一致。 離線環境直接用,還能無縫整進你的 agent pipeline。 語音這塊,本地 agent 又多了一個又小又快的選擇。
显示更多
0
63
4.7K
634
转发到社区