微软语音合成助手 v1.5+版本,新增火山与阿里接口

news/2024/12/29 16:53:26/

微软语音合成助手

By:bill3k

这款工具由bill3k使用易语言开发,虽然界面比较简陋,但在功能及使用体验上都是非常优秀的

软件调用官方接口,全部支持ssml,将文字转语音大部分功能都给集成了

虽然用的都是免费接口,原本有字数限制

但合成助手会自动分段提交文字进行转换,目前可以绕过这个限制

同时也支持配置正版key,非常赞!

在这里插入图片描述

接口切换

不少小伙伴找不到设置选项,在主界面中也没有任何提示

其实右键点击任务栏托盘图标,便可以看到软件设置了

在这里支持切换语音合成及图像识别引擎、更新语音列表、配置Key等等,比较方便

在这里插入图片描述

发言人

工具切换为不同语音引擎后,程序界面颜色会有变化,同时它们的发言人也是不同的

微软引擎发言人有24位,效果其实是最好的,有多种语音风格,语气也比较自然

不过免费接口1分钟内不能超过5次提交,在大段文字转换上会有些问题

Edge引擎发言人有19位,类型与效果上与微软差不多,但没什么限制,比较适合大段文字识别

在这里插入图片描述

火山引擎有39位发言人,包含相当多的国内特色声音,比较有趣

阿里引擎则仅有14位发言人,语气比较生硬,不过转换速度倒是挺快的

总的来说在转换速度上:Edge>阿里>火山>微软

效果则是:微软>Edge>火山>阿里

大家可以按需选择使用

在这里插入图片描述

语音风格

默认风格其实还差些意思,如果想让声音听起来更生动、更加适合不同情景

可以选择不同的语音风格

像生气、开心、不满、害怕等语气风格,助理、聊天、客服、新闻等情景风格,都可以让我们的配音更加自然真实

不过只有微软与Edge引擎可以配置语音风格,另外两款只有默认的~

在这里插入图片描述

SSML多人语音混合编辑

如果能实现多人物、多语气的情景对话效果,是不是就更完美了~

这就需要用到SSML语音合成标记语言来进行编辑了,它可以为每段话都设置不同的配音员及语音风格

在这里插入图片描述

最后

链接:https://pan.quark.cn/s/1d340050527b

这款工具Win7无法直接使用,可以在设置中安装修复补丁试一下,小编没做测试,不确定是否有效

然后工具是易语言编写,部分杀软可能报毒,误报的话需要添加信任后才能使用

今天的分享就到这里啦

如果对您有用,可以帮小编来个三连,怎么连都可以滴~


http://www.ppmy.cn/news/701605.html

相关文章

文件的下载与保存,以及mp3文件的播放

这里只是说说异步 单线程下载与文件的保存 以下载一个mp3文件并保存为例:-(void)loading {//设置文件下载地址 NSString *urlString [NSString stringWithFormat:"http://zhangmenshiting2.baidu.com/data2/music/14893666/14893666.mp3?xcodef7e142418de081…

使用Lame库实现wav、pcm转mp3

文章目录 前言 一、Lame库是什么? 二、使用步骤 0.创建native项目 1.下载Lame库 2.pcm转MP3 3.wav转MP3 4、native方法如下 三、注意 总结 前言 因为使用android录音后生成的文件是wav或者pcm格式,项目要求最后的文件需要是mp3格式,于…

WinPcap学习(九)发送数据包

原始的libcap库是不支持发送数据包的,因此,这是属于WinPcap的扩展。 使用pcap_sendpacket()发送单个数据包 打开适配器以后,调用pcap_sendpacket()来发送手工制作的数据包。pcap_sendpacket()的参数有一个要包涵发送…

android内置mp3文件下载,Android下载mp3文件并播放它

我试图从Dropbox下载一些音频文件供用户下次没有互联网时使用,所以代码实际上下载文件,但我有麻烦播放该音频我不知道如果我要解析下载的文件什么的,希望你能帮助Android下载mp3文件并播放它 下载文件,并发挥它的类,它…

WinCE 下播放MP3代码

//我成功运行过的代码: #include "stdafx.h"#include <dshow.h>#include <streams.h> #pragma comment (lib,"Ole32.lib")#pragma comment (lib,"Strmiids.lib") void TestMP3(void); int WINAPI WinMain(HINSTANCE hInstance,H…

(三)ChatGLM-6B 的 DeepSpeed/P-Tuning v2微调

文章目录 模型文件和相关代码准备ChatGLM6B部署解决ninja报错 训练开始 模型文件和相关代码准备 安装日期&#xff1a;2023-04-19 模型文件地址&#xff1a;https://huggingface.co/THUDM/chatglm-6b/tree/main Hash: 35ca523 相对上一篇文章&#xff08;04-09&#xff09;&am…

WAV文件的频谱图显示——总结篇

前言 绘制频谱图需要纯音频数据&#xff0c;WAV就是纯音频&#xff0c;如果要用mp3等其他压缩格式的音频还需先进行解码&#xff08;解码自行查找资料&#xff09;&#xff0c;这里只讲WAV文件绘制&#xff1b; 频谱是什么&#xff1f;频谱的全称是频率谱密度。一般信号都是用…

利用WMPLib在Windows mobile下播放Mp3

程序示例(C#智能设备应用程序): 必须添加对wmp.dll的引用(项目->添加引用->windows/system32/wmp.dll)。 源文件: CMediaControl.cs