使用 F5 TTS 文字转音频

embedded/2024/11/26 7:12:08/

F5 TTS 支持 ZeroShot 音频克隆,只有将需要音频传给模型,模型既可以生成以对应声音生成的音频,F5 最强大的地方就是可以使用定制的人声。F5 使用了 DIT 架构进行训练,结构如下:

在这里插入图片描述

TTS_3">本地使用 F5 TTS

F5 使用很简单,本地进行安装,我使用 ModelScope 的镜像,免去了一些环境的配置与安装。通过命令行生成音频,这里使用了默认的系统的人声,如果需要使用定制人声添加两个参数即可 --ref_audio "ref_audio.wav" \ --ref_text "The content, subtitle or transcription of reference audio." \, ref_text 不是必须的。

## 安装 F5
pip install git+https://github.com/SWivid/F5-TTS.git## 运行
f5-tts_infer-cli --model "F5-TTS"   --gen_text "新疆阿尔金山作为中国四大无人区之一,平均海拔四千五百八十米,那里人烟稀少,却有一群维护着格库铁路通信畅通的年轻通信工。二十四岁的辛晓雨常年工作在浩渺无垠的戈壁上,用认真负责 的态度悉心维护着通信基站的设施设备,保障着铁路安全运行。"

总结

F5 TTS 效果还不错,可以使用定制的人声,不需要进行训练,中文无法识别数字,可以先通过LLM 进行转换将数字转为中文。


http://www.ppmy.cn/embedded/140570.html

相关文章

HTML密码小眼睛

<!DOCTYPE html> <html lang"zh_cn"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>密码小眼睛</title><style>body {fon…

java dfs 详解

深度优先搜索&#xff08;DFS&#xff09;详解 深度优先搜索&#xff08;DFS, Depth-First Search&#xff09;是一种常见的图或树的搜索算法&#xff0c;它尝试从起点开始&#xff0c;一直沿着一个方向搜索到尽可能深的位置&#xff0c;然后回溯&#xff0c;尝试其他路径&…

Chrome离线安装包下载

1、问Chrome的官网&#xff1a;https://www.google.cn/chrome/ 直接下载的是在线安装包&#xff0c;安装需要联网。 2、如果需要在无法联网的设备上安装Chrome&#xff0c;需要在上面的地址后面加上?standalone1。 Chrome离线安装包下载地址&#xff1a;https://www.google.c…

Python入门(16)--自动化测试教程

自动化测试教程 &#x1f50d; 1. 单元测试编写 ✅ 1.1 unittest框架介绍 Python的unittest框架提供了编写和运行测试的完整工具集&#xff1a; import unittestclass TestStringMethods(unittest.TestCase):def setUp(self):"""测试前的准备工作"&quo…

【eNSP】ISIS动态路由协议实验

和OSPF一样&#xff0c;IS-IS也是一种基于链路状态并使用最短路径优先算法进行路由计算的一种IGP协议。IS-IS最初是国际化标准组织ISO为它的无连接网络协议CLNP设计的一种动态路由协议。 为了提供对IP的路由支持&#xff0c;IETF在RFC1195中对IS-IS进行了扩充和修改&#xff0c…

大规模历史数据如何管理?(附解决方法)

随着企业业务规模拓展&#xff0c;数据呈爆炸性增长&#xff0c;面对不断增长的数据&#xff0c;显然传统的数据存储和管理方式已经无法满足企业对大规模数据的要求。那么如何有效和存储大规模的历史数据&#xff0c;以满足企业数据查询和分析的需求&#xff1f; 一、数据库系…

UE5 Switch Has Authority 节点

在 Unreal Engine 5 (UE5) 中&#xff0c;Switch Has Authority 节点用于在蓝图中根据当前操作是否具有 Authority 来切换逻辑。这个节点常用于处理 网络同步 和 多玩家 环境中的客户端与服务器之间的不同逻辑。具体而言&#xff0c;它允许你根据当前执行代码的实体&#xff08…

Redis(非关系型数据库)详细介绍

Redis&#xff08;Remote Dictionary Server&#xff09;是一个开源的、高性能的、基于内存的数据结构存储系统。它通常被用于缓存、消息队列、会话存储等场景。由于其强大的功能和卓越的性能&#xff0c;Redis 被广泛应用于现代互联网企业中&#xff0c;是大多数分布式系统中不…