分享
声音克隆教程-GPT-SoVITS
输入“/”快速插入内容
声音克隆教程-GPT-SoVITS
用户4870
用户4870
24499
25951
4
0
GPT-SoVITS
是目前市面上最好的语音克隆工具,且开源
,虽然用到的所有技术不是最新的,但它开创性的加入了
GPT 模型
的机制,并以参考语音作为提示,非常好的解决了语音克隆的
声音泄漏问题
,生成的语音无论在
音质
还是
真实度
上,综合表现都非常不错,也可根据提示语音直接克隆, 就是不需要训练模型,目前支持
中、英、日三种语言
。
特征:
•
零样本 TTS:
输入 5 秒语音样本并体验即时文本到语音转换。
•
Few-shot TTS:
仅用 1 分钟的训练数据即可微调模型,以提高语音相似度和真实感。
•
跨语言支持:
用与训练数据集不同的语言进行推理,目前支持英语、日语和中文。
•
WebUI 工具:
集成工具包括语音伴奏分离、自动训练集分割、中文 ASR 和文本标注,帮助初学者创建训练数据集和 GPT/SoVITS 模型。
我们可以
克隆自己的声音
,减少后续的制作成本,也能
克隆一些影视剧角色声音
,增加视频的趣味性以及观看性,由于我这台电脑的显卡限制,我导入训练的素材只有四十秒,所以语音的
还原度不是很高
,但是我看了很多其他博主的测试,如果是原声情况下,自己的声音还原度基本可以以假乱真。
最重要的是,它可以在
本地运行,一键部署
,在声音训练上面非常简单,几乎可以说是傻瓜式操作,虽然它也有一些弊端和缺点,但是无疑在目前市面上,
免费开源
能做到这个程度的还是屈指可数!
✅
配置要求
1、Windows系统
需Windows 10/11 系统
支持 CUDA 的 nVIDIA 显卡,每张拥有至少 6G 以上显存
常见的不能使用的显卡:10系以前的所有卡、1060以下,1660以下,2060以下、3050 4G
2、MAC系统
搭载Apple芯片(M系列芯片)或AMD GPU的Mac(如2019款Mac Pro)
macOS 12.3或更高版本
已通过运行xcode-select --install安装Xcode command-line tools
一、下载整合包
打开网址,下载整合包,解压即可用。
网址:
https://github.com/RVC-Boss/GPT-SoVITS
下滑到这个选项即可下载:
文件大小有 4.3GB,下载好后解压即可,解压后双击这个文件即可运行:
不要关闭运营窗口
,保持这个窗口一直运行,你也可以在窗口看到运行的指令以及执行细节: