CosyVoice 是阿里通义实验室开发的多语言语音生成模型,支持自然语音生成、音色和情感控制。它在多语言语音生成、零样本语音生成、跨语言声音合成和指令执行方面表现出色。
https://github.com/v3ucn/CosyVoice_For_Windows
https://www.modelscope.cn/studios/iic/CosyVoice-300M https://fun-audio-llm.github.io/#App-E-chat
主要特点:
多语言支持:支持中、英、日、粤、韩五种语言的合成。
音色克隆:只需3-10秒的原始音频即可生成模拟音色,包括韵律和情感。
情感控制:可以根据需要调整生成语音的情感。
跨语言合成:在不同语言之间进行语音合成。
使用场景:
https://www.modelscope.cn/studios/iic/CosyVoice-300M https://fun-audio-llm.github.io/#App-E-chat
CosyVoice
百度云盘 | 提取码: 42cg
CosyVoice-win
123盘 | 提取码: 无