ChatTTS-ui是一个与文本到语音(TTS)相关的项目,它是ChatTTS的一个分支。ChatTTS是一个开源的文本到语音合成项目,让您可以将文本转换为自然流畅的语音。这里有一些关于ChatTTS-ui的重要信息:
项目简介:ChatTTS-ui整理和汇总了ChatTTS项目的常见问题和相关资源,是ChatTTS的最佳入门指南。
亮点:ChatTTS-ui提供了不同版本的体验,包括Web版、Colab版、Forge版、OpenVoice版等,适合不同用户需求。
参数控制:ChatTTS-ui增加了更多控制参数,方便用户进行更细致的测试,例如音频速度、情感波动性、情感相关性等。
固定音色:您可以根据音色种子值选择不同的音色,或者使用ChatTTS_Speaker项目中的打标音色。
如果您对文本到语音合成感兴趣,ChatTTS-ui是一个值得尝试的项目!
GitHub地址: https://github.com/jianchang512/ChatTTS-ui/releases
Text Seed : 配置情感种子值,不同种子对应不同情感,不同种子间差异性较小
Prompt:口语化 :[oral] 笑声:[laugh] 停顿:
[break] oral : 控制文本口语化程度,范围为 0-9,数字越大,添加的“就是”、“那么”之类的连接词越多
laugh : 控制文本是否添加笑声,范围为 0-9,数字越大,笑声越多
break : 控制文本是否添加停顿,范围为 0-9,数字越大,停顿越多
数字转文本:文档中有数字的勾选
Refine text : 控制是否对文本进行口语化处理,取消勾选则后面三个选项无效
infer token:推理最大token默认2048
refine token:refine text最大token,默认384,未跳辽refine text时有效
语速:控制音频速度,范围为 0-9,数字越大,速度越快
temperature:控制音频情感波动性,范围为 0-1,数字越大,波动性越大
top_p:控制音频的情感相关性,范围为 0.1-0.9,数字越大,相关性越高
top_k:控制音频的情感相似性,范围为 1-20,数字越小,相似性越高
云盘下载
https://www.alipan.com/s/gfrrH1942Hx