华为语音合成服务,为用户提供实时、可替换、多音调的语音播放体验

news/2024/11/29 3:40:28/

在不能操作手机或总盯着手机看的情况下,如何及时获取资讯信息、方便阅读呢?用耳朵听不失为一种好方法。华为机器学习服务的语音合成服务,采用深度神经网络技术,提供高度拟人、流畅自然的语音合成服务。开发者可以在小说阅读、智能硬件、地图导航类应用中集成该能力,为用户提供实时、可替换、多音调的语音播放体验。

语音合成,助力及时性内容送达

语音合成服务支持在线将文字信息转换为语音输出,已在全球部署。该服务的优势有——

  • 多语言、多音色:支持中文、英语、法语、西班牙语、德语、意大利语、俄语、波兰语、泰语、马来语语音合成,更有2种标准男声发音、6种标准女声发音可供选择。

  • 语速、音量可调节:支持多种参数配置,可根据场景需求对发音人的语速、音量进行调整。

  • 集成方式灵活丰富:提供离线SDK、在线SDK快速集成,充分满足不同场景下的语音合成需求。

语音合成服务可以应用于阅读播报、新闻播报、虚拟播报、地图播报、信息通知等及时性较强的场景。比如,用户在骑车、驾车使用地图导航时,路上不方便一直看手机。语音合成广播可以保证表达清晰,准确到达目的地;在司机端打车软件、餐饮叫号、排队软件等场景下,通过语音合成进行订单播报,让用户便捷获取通知信息;市场上很火的电子阅读类应用,提供语音播报和收听功能。用户可以很容易地实现“听书”。即使在锁屏状态下,也可以通过语音播报继续收听,消除地铁、公交、跑步等阅读环境的限制。一些不方便阅读的老人和小孩,同样可以通过“听书”,解决看不清、情绪陪伴等问题。

在智能硬件领域,语音合成服务则可以集成到儿童故事机、智能机器人、平板设备等智能设备上,使人机交互更加自然、亲切。对于短视频App的内容创作者来说,在视频应用中指定文字就可以合成一些语音效果,加快了短视频制作流程。

定制音色,满足用户个性化需求

近期,华为语音合成服务即将上线定制音色功能。用户可以录制并合成自己的声音到应用中,让平日里听小说、导航等生活学习场景更加有趣、亲切。家里有小朋友的父母还可以用自己的声音给孩子们讲故事,释放育儿疲劳的同时加深亲子互动陪伴。

开发实战

开发准备
Maven仓和SDK的配置步骤可以参考开发者网站中的应用开发介绍:
https://developer.huawei.com/consumer/cn/doc/development/hiai-Guides/ml-tts-0000001050068169?ha_source=hms1

  1. 配置集成的SDK包
在应用的build.gradle文件中,dependencies内添加TTS的SDK依赖:
// 引入基础SDK
implementation 'com.huawei.hms:ml-computer-voice-tts:3.3.0.274'
// 引入离线语音合成bee语音包
implementation 'com.huawei.hms:ml-computer-voice-tts-model-bee:3.3.0.274'
// 引入离线语音合成eagle语音包
implementation 'com.huawei.hms:ml-computer-voice-tts-model-eagle:3.3.0.274'
  1. 配置AndroidManifest.xml
打开main文件夹中的AndroidManifest.xml文件,可以根据场景和使用需要,配置网络和读写权限,在<application>前添加
<uses-permission android:name="android.permission.INTERNET" />
<uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" />
<uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" />
  1. 代码开发(在线TTS)

3.1创建应用自定义的activity界面,用于选择在线或者离线TTS,并通过api_key或者Access Token设置应用鉴权信息

public class MainActivity extends AppCompatActivity {@Overrideprotected void onCreate(@Nullable Bundle savedInstanceState) {super.onCreate(savedInstanceState);MLApplication.getInstance().setAccessToken("your access token");
}
}

3.2 创建TTS配置及TTS 引擎,可以根据需要配置不同参数

MLTtsEngine mlTtsEngine;
MLTtsConfig mlConfigs;mlConfigs = new MLTtsConfig()// Setting the language for synthesis..setLanguage(MLTtsConstants.TTS_ZH_HANS)// Set the timbre..setPerson(MLTtsConstants.TTS_SPEAKER_FEMALE_ZH)// Set the speech speed. Range: 0.2–4.0 1.0 indicates 1x speed..setSpeed(1.0f)// Set the volume. Range: 0.2–4.0 1.0 indicates 1x volume..setVolume(1.0f)// set the synthesis mode..setSynthesizeMode(MLTtsConstants.TTS_ONLINE_MODE);mlTtsEngine = new MLTtsEngine(mlConfigs);
//Sets the volume of the built-in player.
mlTtsEngine.setPlayerVolume(20);
设置回调(回调见3.3)
// Pass the TTS callback to the TTS engine.
mlTtsEngine.setTtsCallback(callback);

3.3 配置TTS回调,接收处理语音合成的结果

MLTtsCallback callback = new MLTtsCallback() {String task = "";String fileName = "audio_" + task;@Overridepublic void onError(String taskId, MLTtsError err) {String str = taskId + " " + err;sendMsg(str);}@Overridepublic void onWarn(String taskId, MLTtsWarn warn) {String str = taskId + " 提示:" + warn;sendMsg(str);}@Overridepublic void onRangeStart(String taskId, int start, int end) {String str = taskId + " onRangeStart [" + start + "," + end + "]";// + temp.get(taskId).substring(start);sendMsg(taskId + " onRangeStart[" + start + "," + end + "]");sendMsg1(taskId, start, end);}@Overridepublic void onAudioAvailable(String taskId, MLTtsAudioFragment audioFragment, int offset,Pair<Integer, Integer> range, Bundle bundle) {if (!task.equals(taskId)) {task = taskId;fileName = "/sdcard/audio_" + task + ".pcm";}writeTxtToFile(audioFragment.getAudioData(), fileName, true);}@Overridepublic void onEvent(String taskId, int eventId, Bundle bundle) {StringBuffer stringBuffer = new StringBuffer();stringBuffer.append(taskId + " ");switch (eventId) {case MLTtsConstants.EVENT_PLAY_START:stringBuffer.append("onPlayStart ");break;case MLTtsConstants.EVENT_PLAY_STOP:stringBuffer.append("onPlayStop ");stringBuffer.append(bundle.getBoolean(MLTtsConstants.EVENT_PLAY_STOP_INTERRUPTED));break;case MLTtsConstants.EVENT_PLAY_RESUME:stringBuffer.append("onPlayResume ");break;case MLTtsConstants.EVENT_PLAY_PAUSE:stringBuffer.append("onPlayPause ");break;case MLTtsConstants.EVENT_SYNTHESIS_COMPLETE:stringBuffer.append("onSynthesisComplete ");PCMCovWavUtil.convertWaveFile(fileName);break;case MLTtsConstants.EVENT_SYNTHESIS_START:stringBuffer.append("onSynthesisStart ");break;case MLTtsConstants.EVENT_SYNTHESIS_END:stringBuffer.append("onSynthesisEnd ");break;}Log.d(TAG, "onEvent: " + stringBuffer.toString());}
};

3.4 调用speak合成请求,及播放控制

String id = mlTtsEngine.speak(text, MLTtsEngine.QUEUE_APPEND));mlTtsEngine.pause();
mlTtsEngine.resume();
mlTtsEngine.stop();调用完毕后,释放引擎
if (mlTtsEngine != null) {mlTtsEngine.stop();mlTtsEngine.shutdown();
}
  1. 离线TTS

4.1 离线功能需要新增下载发音人模型包的步骤

private MLLocalModelManager mLocalModelManager;
mLocalModelManager = MLLocalModelManager.getInstance();
MLTtsLocalModel mLocalModel = new MLTtsLocalModel.Factory('发音人'
).create();
mLocalModelManager.isModelExist(mLocalModel).addOnSuccessListener(new OnSuccessListener<Boolean>() {@Overridepublic void onSuccess(Boolean aBoolean) {if (aBoolean) {mlTtsEngine.speak(text, MLTtsEngine.QUEUE_APPEND)} else {downloadModel(true); }}
}).addOnFailureListener(new OnFailureListener() {@Overridepublic void onFailure(Exception e) {Log.e(TAG, e.getMessage());}
});

下载模型方法为:

private void downloadModel(final boolean needSpeak) {MLModelDownloadStrategy request = new MLModelDownloadStrategy.Factory().needWifi().create();MLModelDownloadListener modelDownloadListener = new MLModelDownloadListener() {@Overridepublic void onProcess(long alreadyDownLength, long totalLength) {showProcess(alreadyDownLength, "Model download is complete", totalLength);}};mLocalModelManager.downloadModel(mLocalModel, request, modelDownloadListener).addOnSuccessListener(new OnSuccessListener<Void>() {@Overridepublic void onSuccess(Void aVoid) {Log.i(TAG, "downloadModel: " + mLocalModel.getModelName() + " success");showToast("downloadModel Success");updateconfig();if (needSpeak) {speak();}}}).addOnFailureListener(new OnFailureListener() {@Overridepublic void onFailure(Exception e) {Log.e(TAG, "downloadModel failed: " + e.getMessage());showToast(e.getMessage());}});
}

其他使用和在线TTS一致

了解更多详情>>

访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址:GitHub、Gitee

关注我们,第一时间了解 HMS Core 最新技术资讯~


http://www.ppmy.cn/news/753579.html

相关文章

Redis常用数据类型

Redis 哈希(Hash)&#x1f349; Redis hash 是一个 string 类型的 field&#xff08;字段&#xff09; 和 value&#xff08;值&#xff09; 的映射表&#xff0c;hash 特别适合用于存储对象。 Redis 中每个 hash 可以存储 232 - 1 键值对&#xff08;40多亿&#xff09; 它…

简洁清新后台模板推荐(光年)

目录 前言一、后台模板介绍1.作者介绍2.模板介绍 二、界面展示1.登录2.首页3.UI元素4.表单5.工具类6.示例页面7.主题选择 三、入口总结 前言 作为后端开发人员&#xff0c;前端技术确实不精通&#xff0c;也没有太多的精力搞前端。所以一直在搜寻一些现成的模板。最近发现一个…

华硕 Zenbook 17 Fold 评测

Zenbook 17 Fold 配备一块 17.3 英寸 4&#xff1a;3 2.5K 大触摸屏&#xff0c;可在中间折叠以创建两个 12.5 英寸 3&#xff1a;2 19201280 显示屏。该显示屏还通过了 TV 莱茵护眼认证&#xff0c;支持 100% DCI-P3 色域和杜比视界 HDR 认证。华硕 Zenbook 17 Fold怎么样这些…

ASUS华硕天选3笔记本电脑FX507ZR12700H原装出厂Win11系统恢复原厂OEM系统

ASUS华硕天选3笔记本电脑FX507ZR12700H原装出厂Windows11系统恢复原厂OEM系统 系统自带所有驱动、办公软件、奥创控制中心等预装软件 链接&#xff1a;https://pan.baidu.com/s/1SltJD81zB7YPx2Xk0U19Dg?pwdmiw2 提取码&#xff1a;miw2

【Unity开发小技巧】UnityWebGL移动端和电脑端调起输入法,中文输入处理

目录 一.TextMesh Pro中文显示问题 1.PC端和移动端中文显示异常乱码&#xff08;解决方案&#xff09; 1.制作TextMesh Pro字体 方式一 2.制作TextMesh Pro字体 方式二 3.通用字体资源 2.web端中文不能输入窗口模式&#xff08;解决方案&#xff09; 二.移动端Inputfile调…

JavaWeb Cookie

1.Cookie 介绍 Cookie是一种用于在Web浏览器和Web服务器之间传递数据的机制。 它是由服务器发送给浏览器的小型文本文件&#xff0c;存储在浏览器的本地计算机上。 浏览器在后续请求中会自动将Cookie发送回服务器&#xff0c;以便服务器可以识别用户并提供个性化的服务。 C…

【AJAX】跨域问题笔记

跨域 一、同源策略&#xff08;Same-Origin Policy&#xff09; 是浏览器的安全机制。 同源&#xff1a;协议、域名、端口号必须完全相同 客户端 服务端 违背同源策略就是跨域 二、如何解决跨域 1、JSOPN &#xff08;1&#xff09;JSONP是什么 JSONP(JSON with Padding…

iOS知识梳理之移动开发网络篇TCP/IP

1.OSI七层 TCP/IP五层 1.1 OSI七层参考模型 应用层 表示层 会话层 传输层 网络层 数据链路层 物理层对于OSI七层参考模型,我想说只有这七个词条.任何与实际生产脱钩的东西都需要硬性记忆.而TCP/IP五层模型我不需要硬性记忆,就可以根据应用逻辑复述出来. 1.2 TCP/IP五层模型 TCP…