百度智能云千帆部署流程---语音识别和合成

ops/2024/11/29 11:43:01/

目录

一、前期准备

二、语音合成

三、语音识别


 

 实现整个流程如下图,但是我们的工作量并不是很多,我们可以在官网找到示例代码

一、前期准备

         这里我们使用到3个代码

API_KEY.py     填写我们的API

 xzarm_asr.py       语音识别

 xzarm_tts.py     语音合成

python"># API_KEY.py
# 小智-学长 2024-10-19# 百度智能云千帆AppBuilder-SDK
#https://console.bce.baidu.com/ai_apaas/secretKey
APPBUILDER_TOKEN = "bce-v3/ALTAK-zQsH6******"#语音合成# 百度智能云千帆ModelBuilder
# https://console.bce.baidu.com/ai/#/ai/speech/overview/index
APPBUILDER_token = "25.548acf45ed740******"#语音识别

        后期我们可能用到这两个网站,我们先暂时放置在这里,分别使用到百度智能云千帆AppBuilder-SDK、ModelBuilder,对应着语音合成和语音识别。

百度智能云千帆AppBuilder-SDKicon-default.png?t=O83Ahttps://console.bce.baidu.com/ai_apaas/secretKey

语音合成:百度智能云千帆AppBuilder-SDK

百度智能云千帆ModelBuildericon-default.png?t=O83Ahttps://console.bce.baidu.com/ai/#/ai/speech/overview/index

语音识别:百度智能云千帆ModelBuilder

我们先安装用到的库 

python">pip install --upgrade appbuilder-sdk

下载速度慢可能是由于网络连接不稳定或者与 PyPI 的服务器距离较远。你可以尝试以下几种方法来加快下载速度:

国内的 PyPI 镜像源速度通常更快,可以通过指定源来加速下载。例如,使用阿里云镜像

python">pip install --upgrade nodezator -i https://mirrors.aliyun.com/pypi/simple/

其他常见的国内镜像源:

  • 清华大学:https://pypi.tuna.tsinghua.edu.cn/simple/
  • 豆瓣:https://pypi.doubanio.com/simple/

将以上 URL 替换到 -i 后即可。

二、语音合成

        打开我们的网址百度智能云千帆AppBuilder,点击“密钥管理”,没有密钥的话就新建一个

 记录这个值,填写到API_KEY.py 的APPBUILDER_TOKEN

需要填写:xzarm_tts_tts(TEXT='  ', tts_wav_path = '  ')

运行代码将保存语音文件wav到指定的文件夹下 

python"># xzarm_tts.py
# 小智-学长 2024-5-23
# 语音合成print('导入语音合成模块')import os
import appbuilder
from API_KEY import *
os.environ["APPBUILDER_TOKEN"] = APPBUILDER_TOKEN
tts_ab = appbuilder.TTS()def xzarm_tts_tts(TEXT='我是小智大模型AI机械臂,您可以说出你的要求,我会一一完成要求', tts_wav_path = 'temp/xzarm_tts_tts.wav'):'''语音合成TTS,生成wav音频文件'''inp = appbuilder.Message(content={"text": TEXT})out = tts_ab.run(inp, model="paddlespeech-tts", audio_type="wav")with open(tts_wav_path, "wb") as f:f.write(out.content["audio_binary"])print("TTS语音合成,导出wav音频文件至:{}".format(tts_wav_path))
xzarm_tts_tts(TEXT='我是大模型AI机械臂,您可以说出你的要求,我会一一完成要求哦', tts_wav_path = 'temp/xzarm_tts_tts.wav')

三、语音识别

打开我们的网址语音技术 - 百度智能云控制台,点击“应用列表” “创建应用” 

 我们点击“API在线调试”,找到refresh_token的值,填到API_KEY.py 的APPBUILDER_token

  记录这个值,填写到API_KEY.py 的APPBUILDER_token

 

运行代码将显示出识别的结果,如果不是,请查看错误码对应的问题。

python"># xzarm_asr.py
# 小智-学长 2024-10-19
# 录音+语音识别print('导入录音+语音识别模块')
import os,json,base64,requests
from API_KEY import *def xzarm_asr_recognition(audio_path='temp/speech_record.wav'):"""录音文件的语音识别,返回识别结果:param audio_path: 需要识别的音频文件路径:return: 语音识别结果文本"""url = "https://vop.baidu.com/server_api"# 读取音频文件并进行Base64编码with open(audio_path, "rb") as f:content = base64.b64encode(f.read()).decode("utf8")size = os.path.getsize(audio_path)# 准备请求数据payload = json.dumps({"format": "pcm","rate": 16000,"channel": 1,"cuid": "Hy5qg1neIBkl8ltIHWefF6uwTtNBmF49","token": APPBUILDER_token,"speech": content,"len": size})headers = {'Content-Type': 'application/json','Accept': 'application/json'}# 发起POST请求response = requests.post(url, headers=headers, data=payload)response_data = response.json()# 解析并返回识别结果if 'result' in response_data:                text = response_data['result'][0]print('语音识别结果::', text)return textelse:print("识别失败:", response_data)return None
xzarm_asr_recognition(audio_path='temp/xzarm_tts_tts.wav')

 结果:


http://www.ppmy.cn/ops/137640.html

相关文章

第 35 章 - Go语言 容器化应用

第 35 章 - 容器化应用 本章将介绍如何使用Docker来容器化Go语言的应用程序。我们将从Docker的基础开始,学习如何编写Dockerfile来构建镜像,以及如何使用Docker Compose来管理多容器应用。通过一系列的实践案例,您将能够掌握使用Docker和Doc…

scxml editor插件在vscode中无法使用的问题

I had the same issue, I’m running it on Linux and looking at the Developer Tools console it said it could not find “./editorglue” and would fail to load the extension. “EditorGlue.js” indeed exists and I presume this works in Windows as it does not ca…

SpringBoot集成ESAPI

官网地址&#xff1a;https://github.com/ESAPI/esapi-java-legacy 一、POM依赖 <dependency><groupId>org.owasp.esapi</groupId><artifactId>esapi</artifactId><version>2.6.0.0</version> <!-- Preferably the latest ver…

单片机 WiFi 手机 APP

目录 一、引言 二、连接原理 1. 关键模块选择 2. 硬件连接方式 3. 编程实现通信 三、创建服务器 1. 服务器编程 四、开发手机 APP 1. 平台选择 2. 开发工具介绍 3. 网络通信实现 五、测试与调试 1. 单元测试 2. 集成测试 六、部署与维护 1. 发布 APP 2. 用户反…

【如何提升代码工程质量】code review篇

应该对于基本上所有软件相关的公司来说&#xff0c;都有committer机制&#xff0c;即代码写好之后会提交合并请求&#xff0c;待相关人员code review通过后再进行合入&#xff0c;所以code review就是代码合入代码仓库的最后一道关卡&#xff0c;对于代码质量的影响也是不容忽视…

大电流PCB设计

随着工业自动化、新能源汽车、以及高性能计算领域的不断发展,现代电子系统对大电流PCB设计的需求越来越高。在某些应用中,电流需求甚至可能达到100A或更高,这对PCB的设计提出了巨大的挑战。如何有效地应对这些挑战,确保PCB在高电流环境下的安全性、稳定性与高效性,是当今电…

黑马程序员Java项目实战《苍穹外卖》Day01

苍穹外卖-day01 课程内容 软件开发整体介绍苍穹外卖项目介绍开发环境搭建导入接口文档Swagger 项目整体效果展示&#xff1a; ​ 管理端-外卖商家使用 ​ 用户端-点餐用户使用 当我们完成该项目的学习&#xff0c;可以培养以下能力&#xff1a; 1. 软件开发整体介绍 作为一…

Qt桌面应用开发 第八天(读写文件 文件编码 文件流)

目录 1.读文件 2.写文件及编码格式 2.1写文件 2.2编码格式 3.文件信息读取 4.文件流 4.1QTextStream 4.2QDataStream 1.读文件 需求&#xff1a;一个pushButton&#xff0c;点击之后可以选择一个txt文件的路径&#xff0c;路径会显示在lineEdit上&#xff0c;txt文件的…