使用GPT-SoVITS训练语音模型

devtools/2024/11/8 2:24:00/

1.项目演示

阅读单句话

1725352713141

读古诗

1725353700203


2.项目环境

开发环境:linux

机器配置如下:实际使用率百分之二十几,

3.开发步骤

1.首先是准备数据集,要求是wav格式,一到两个小时即可, 

2.配置GPT-SoVITS需要的环境,

这里要注意,如果是windows直接下载整合包,linux用户则需要先把项目克隆到本地,然后再将模型下载下来放进去,才能继续成功运行。

整合包及模型下载链接 (yuque.com)

 Linux的步骤在下面,

2.1 克隆项目

进入项目地址,点击code,再点击复制按钮将链接复制下来。

 之后到自己的服务器里去,执行即可,(ps:可以先创建一个文件夹,git初始化这些老生常谈的事情,再放进去。不过我们的主要目的是用而不是修改。)

git clone https://github.com/RVC-Boss/GPT-SoVITS.git

github项目链接如下: 

RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning) (github.com)

2.2 安装运行所需的库

进入服务器,创建虚拟环境

2.3 将下载好的模型放入对应的位置

3.进行数据的初步处理

4.进行所需模型数据的提取

5.开始训练模型

6.训练完成!开始推理。


http://www.ppmy.cn/devtools/132190.html

相关文章

webrtc前端播放器完整案例

https://download.csdn.net/download/jinhuding/89961792

【再谈设计模式】原型模式~复制的魔法师

一、引言 在软件工程、软件开发中,创建对象的过程常常涉及复杂的初始化和配置。在某些情况下,直接复制现有对象比从头开始创建新对象更为高效。原型模式(Prototype Pattern)是一种创建型设计模式,允许我们通过复制现有…

【LeetCode】【算法】208. 实现 Trie (前缀树)

LeetCode 208. 实现 Trie (前缀树) 题目描述 Trie(发音类似 “try”)或者说 前缀树 是一种树形数据结构,用于高效地存储和检索字符串数据集中的键。这一数据结构有相当多的应用情景,例如自动补全和拼写检查。 请你实现 Trie 类&…

【大模型系列】Video-XL(2024.10)

Paper:https://arxiv.org/pdf/2409.14485Github:https://github.com/VectorSpaceLab/Video-XLHuggingface:https://huggingface.co/sy1998/Video_XLAuthor:Yan Shu et al. 上交,北京智源人工智能研究院 核心1&#xf…

使用 GPT-4V 全面评估泛化情绪识别 (GER)

概述 由于情绪在人机交互中扮演着重要角色,因此情绪识别备受研究人员关注。目前的情感识别研究主要集中在两个方面:一是识别刺激物引起的情感,并预测观众观看这些刺激物后的感受。另一个方面是分析图像和视频中的人类情绪。在本文中&#xf…

k8s和docker的区别及各自的应用场景

Kubernetes(简称为K8s)和Docker是容器化技术领域中的两个重要工具,,但它们在构建、部署和管理容器化应用程序方面发挥着不同的作用。 Docker是一种开源的容器引擎,可以帮助开发者将应用程序和其依赖项打包成独立的容器…

设计模式之责任链的通用实践思考

责任链模式通常一般用在方法的拦截、监控、统计方面,比较典型的就是Spring的AOP拦截。 但写一些小的基础能力框架的时候,用AOP比较中,所以一般都是自己针对特定的功能写一些定制的责任链工具类,不太喜欢总是做一些定制化的东西&am…

LLMs之PDF:zeroX(一款PDF到Markdown 的视觉模型转换工具)的简介、安装和使用方法、案例应用之详细攻略

LLMs之PDF:zeroX(一款PDF到Markdown 的视觉模型转换工具)的简介、安装和使用方法、案例应用之详细攻略 目录 zeroX的简介 1、支持的文件类型 zeroX的安装和使用方法 T1、Node.js 版本: 安装 使用方法 使用文件 URL: 使用本地路径&…