几款AI语音克隆使用分享(未完成)

server/2024/10/21 7:45:03/

近期在看AI语音克隆,发现很多的语音克隆对于原始的音频或者朗读者要求过高,不知各位懂的有没有能给推荐个靠谱的。
1、剪映
语音克隆,2个字1积分,600积分6元。贵,多充并没有优惠。
声音相似度高,但是,高音较低,好处是没有破音,低音比较高,声音润色起伏不大。总体很好。没有电子杂音。
1-1、4月16日客服电话核对我留在官网的信息。

2、蓝藻AI
初级,需要录制20段音频。高级,需要录制100段音频
录制原始录音要求吐字清晰,每句话都要有较高的语调和感情。(一两句还行,20句难度有点大)
录制完成后,生成语音有破音,电子杂音开头没有,中段有。我给了个300字左右的段落。实际使用我需要500字每段的生成。
测试了几次,都不能去除电音问题(可能我普通话太不达标了吧)
2-1、4月15日购买会员,测试本人录音3次初级,1次高级,同事3人各测一次初级,都有电子杂音。

3、魔塔社区
开源,需要录制20段音频。
注册即可使用,但是声音克隆不相似。
断句有点奇怪,从第一句开始就有电子杂音,声音润色不统一,忽高忽低。
3-1、4月15日,本人测试3次,朋友测试1次,声音忽高忽低,带电子杂音。

4、海螺AI
语音克隆
生成声音方式简单,仅需要几句话就可以。
缺点:声音太相似,不同的人录制后,播放出来的声音,比较相似。
操作界面不是很合理。关联功能,切换功能缺失。
4-1、4月16日,本人测试1次,同事D测试3次,同事L测试1次。总体还可以,但是,声音和原始真人发声还有差距。语调波动不大。

5、sora
离线版本还没试过

6、GPT-soVITS+Colab
准备搭建试试效果,再更体验说明

(仅代表个人体验和观点,如有不同意见欢迎相互交流)


http://www.ppmy.cn/server/4903.html

相关文章

什么是IIoT?

什么是IIoT? IIoT,即工业物联网(Industrial Internet of Things),是指将物联网技术应用到工业领域,通过微型低成本传感器、高带宽无线网络等技术手段,实现工业设备、系统和服务的互联互通,从而提高生产效率、降低能耗和成本,实现智能化和自动化生产。 IIoT的应用范围…

5_vscode+valgrind+gdb调试程序

需求 项目程序, 读取串口数据, 出现程序崩溃问题valgrind 可以调试定位内存问题: 内存泄漏,非法地址访问,越界访问等内存问题vscode gdb 可视化调试效果, 比命令行简单快捷很多期望使用vscode valgrind gdb 调试程序内存异常, 崩溃退出的问题 环境准备 sudo apt install v…

面试经典150题——H指数

面试经典150题 day11 题目来源我的题解方法一 排序从后往前遍历方法二 计数排序后缀和方法三 排序从左到右遍历 题目来源 力扣每日一题;题序:274 我的题解 方法一 排序从后往前遍历 先将数组升序排序,然后h从n到0开始遍历,计算…

2024-04-14 问AI: 在深度学习中,为什么需要激活函数?

文心一言 在深度学习中,激活函数起着至关重要的作用,主要有以下几个原因: 引入非线性特性:深度学习的目标之一是模拟人脑的复杂功能和决策过程。然而,线性模型的组合仍然是线性的,这限制了模型的表示能力…

Linux的学习之路:9、冯诺依曼与进程(1)

摘要 本章主要是说一下冯诺依曼体系结构和进程的一部分东西。 目录 摘要 一、冯诺依曼体系结构 二、操作系统的概念 三、设计OS的目的 四、管理 五、进程的基本概念 六、PCB 七、在Linux环境下查看进程 八、使用代码创建进程 九、思维导图 一、冯诺依曼体系结构 如…

基于SpringBoot+Vue的便利店管理系统 免费获取源码

项目源码获取方式放在文章末尾处 项目技术 数据库:Mysql5.7/8.0 数据表:11张 开发语言:Java(jdk1.8) 开发工具:idea 前端技术:vue 后端技术:SpringBoot 功能简介 (有文档) 项目获取关键字&#…

二维码门楼牌管理应用平台建设:智慧化网格巡查的新篇章

文章目录 前言一、二维码门楼牌管理应用平台的建设背景与意义二、网格巡查功能的优势三、网格巡查在实际工作中的应用价值四、结语 前言 随着信息技术的飞速发展,二维码门楼牌管理应用平台的建设已成为城市管理的重要创新。通过该平台,民警和网格员能够…

Linux中进程和计划任务

一.程序 1.什么是程序 (1)是一组计算机能识别和执行的指令,运行于电子计算机上,满足人们某种需求的信息化工具 (2)用于描述进程要完成的功能,是控制进程执行的指令集 二.进程 1.什么是进程…