VoxCPM-0.5B 很小但很棒的音色克隆一键整合包

VoxCPM：无需标记器的 TTS，用于上下文感知语音生成和逼真的语音克隆

下载地址：https://pan.baidu.com/s/1CvM_3E5YqE5s8zTHHvjSSw?pwd=hj7b

使用方法

下载解压
双击双击启动.bat，第一次启动将从 modelscope.cn 下载 SenseVoiceSmall 模型，该模型用于将参考音频转录为对应文本。

启动成功后会自动在浏览器中打开操作界面，如果未打开，请手动在浏览器中访问 http://127.0.0.1:7860

启动中界面

如果最终窗口底部显示如下图，说明成功.

如果最终出现Error: 如下图字样，则失败，请关闭窗口重新打开

成功后，将自动在浏览器中打开地址http://127.0.0.1:7860

上传3-10s的参考音频用于克隆它的音色，上传后会自动识别生成对应的文本内容，也可以手动修改，然后填写要合成语音的文字。

注意：

整合包已含模型，但可能仍会检测模型更新，如果使用时出现网络连接失败，报错有类似HTTPConnection字符串，并且你不会科学上网，可右键编辑双击启动.bat，将rem set HF_ENDPOINT=https://hf-mirror.com 这行前的rem删掉，然后保存，重新双击启动该文件。
如果你会科学上网并知道你所用工具的代理端口，可不必进行上一步操作，而是rem set https_proxy=http://127.0.0.1:10808 将改行前的rem删掉，并将10808端口改为你的代理端口，保存，重新启动，将能确保连接更加稳定，不易出现连接错误。