MetaVoice-1B

  • 高度真实和自然的文本到语音(TTS)转换模型-MetaVoice-1B

    该模型拥有1.2亿个参数,经过了10万小时的语音数据训练。 * 专注于英语情感演讲* 跨语言语音克隆* 支持美国和英国声音的零样本克隆* 支持长篇内容语音合成 主要特点: 1、情感语音节奏和音调:MetaVoice-1B专注于英语语音的情感表达,提供流畅、自然的语音输出,无幻觉现象。 2、跨语言语音克隆:支持通过微调实现跨语言的声音克隆。例如,对于印度说话者,仅需1分钟的训练数…

    模型 2024年2月10日