声音克隆教程-GPT-SoVITS

用户4870

24499

25951

GPT-SoVITS 是目前市面上最好的语音克隆工具，且开源，虽然用到的所有技术不是最新的，但它开创性的加入了 GPT 模型的机制，并以参考语音作为提示，非常好的解决了语音克隆的声音泄漏问题，生成的语音无论在音质还是真实度上，综合表现都非常不错，也可根据提示语音直接克隆， 就是不需要训练模型，目前支持中、英、日三种语言。特征： ​

•
零样本 TTS：输入 5 秒语音样本并体验即时文本到语音转换。 ​

•
Few-shot TTS：仅用 1 分钟的训练数据即可微调模型，以提高语音相似度和真实感。 ​

•
跨语言支持：用与训练数据集不同的语言进行推理，目前支持英语、日语和中文。 ​

•
WebUI 工具：集成工具包括语音伴奏分离、自动训练集分割、中文 ASR 和文本标注，帮助初学者创建训练数据集和 GPT/SoVITS 模型。​

我们可以克隆自己的声音，减少后续的制作成本，也能克隆一些影视剧角色声音，增加视频的趣味性以及观看性，由于我这台电脑的显卡限制，我导入训练的素材只有四十秒，所以语音的还原度不是很高，但是我看了很多其他博主的测试，如果是原声情况下，自己的声音还原度基本可以以假乱真。​

最重要的是，它可以在本地运行，一键部署，在声音训练上面非常简单，几乎可以说是傻瓜式操作，虽然它也有一些弊端和缺点，但是无疑在目前市面上，免费开源能做到这个程度的还是屈指可数！​

✅

配置要求

1、Windows系统

需Windows 10/11 系统

支持 CUDA 的 nVIDIA 显卡，每张拥有至少 6G 以上显存

常见的不能使用的显卡：10系以前的所有卡、1060以下，1660以下，2060以下、3050 4G​

2、MAC系统

搭载Apple芯片（M系列芯片）或AMD GPU的Mac（如2019款Mac Pro）

macOS 12.3或更高版本

已通过运行xcode-select --install安装Xcode command-line tools

一、下载整合包

打开网址，下载整合包，解压即可用。

网址：https://github.com/RVC-Boss/GPT-SoVITS

下滑到这个选项即可下载：

common.docs_name - LarkCCM_Docs_Menu_Image

文件大小有 4.3GB，下载好后解压即可，解压后双击这个文件即可运行：​

不要关闭运营窗口，保持这个窗口一直运行，你也可以在窗口看到运行的指令以及执行细节：​

声音克隆教程-GPT-SoVITS​

声音克隆教程-GPT-SoVITS