讯飞语音听写WebApi(流式)【React Native版】

embedded/2024/12/27 23:45:04/

假设已有 Base64 编码的音频文件(16kHz, s16le, pcm)

1、获取websocket url

import * as CryptoJS from 'crypto-js';/*** 获取websocket url*/
const getWebSocketUrl = () => {const config = {// 请求地址hostUrl: "wss://iat-api.xfyun.cn/v2/iat",host: "iat-api.xfyun.cn",//在控制台-我的应用-语音听写(流式版)获取appid: '',apiSecret: '',  // 替换为你的 APISecretapiKey: '',		// 替换为你的 APIKeyfile: "./16k_10.pcm", //请填写您的音频文件路径uri: "/v2/iat",highWaterMark: 1280}const date = new Date().toUTCString()// 鉴权签名let signatureOrigin = `host: ${config.host}\ndate: ${date}\nGET ${config.uri} HTTP/1.1`let signatureSha = CryptoJS.HmacSHA256(signatureOrigin, config.apiSecret);let signature = CryptoJS.enc.Base64.stringify(signatureSha)let authorizationOrigin = `api_key="${config.apiKey}", algorithm="hmac-sha256", headers="host date request-line", signature="${signature}"`let authStr = CryptoJS.enc.Base64.stringify(CryptoJS.enc.Utf8.parse(authorizationOrigin))let wssUrl = `${config.hostUrl}?authorization=${authStr}&date=${encodeURIComponent(date).replace(/%2C/g, ',').replace(/%3A/g, ':')}&host=${config.host}`return wssUrl
}

2、建立连接并发送数据

需要注意的是如果 base64 数据很大不能一次发送完成,就需要将 base64 重新转为二进制数据后按需要的大小切割,然后将切割后的二进制片段再重新转为 base64 编码后发送,否则服务端无法正确读取数据。

import { Buffer } from 'buffer'; // 导入 Buffer// 如果有socket地址
const url = getWebSocketUrl();
const ws = new WebSocket(url);
ws.onopen = () => {console.log("🚀 ~ 连接成功")const params = {common: { app_id: '' },//appIdbusiness: {language: "zh_cn",domain: "iat",accent: "mandarin",vad_eos: 5000,dwa: "wpgs",},data: {status: 0,format: "audio/L16;rate=16000",encoding: "raw",},};ws.send(JSON.stringify(WebApiSocketStore.params));try {// 解码 Base64 字符串为二进制数据const audioPcmData = Buffer.from(data.base64Pcm, 'base64');let offset = 0;while (offset < audioPcmData.length) {const subString = audioPcmData.slice(offset, offset + 1280)offset += 1280const isEnd = offset >= audioPcmData.length;const btoa = Buffer.from(subString, 'utf-8').toString('base64');const dataAudio = JSON.stringify({data: {status: isEnd ? 2 : 1,format: "audio/L16;rate=16000",encoding: "raw",audio: `${btoa}`, // 将二进制字符串转换为 Base64},})ws?.send(dataAudio);}} catch (error) {console.log('🚀 ~ Error reading file:', error);}
};
ws.onmessage = (e) => {// a message was receivedconsole.log("🚀 ~ e.data:", e.data)const jsonData = JSON.parse(e?.data || {});// 处理返回结果renderResult(e?.data || {});if (jsonData.code === 0 && jsonData.data.status === 2) {setVoiceText(resultText.current);ws.close();}if (jsonData.code !== 0) {ws.close();}
};ws.onerror = (e) => {// an error occurredconsole.log("🚀 ~ e.error", e.message)
};ws.onclose = (e) => {// connection closedconsole.log("🚀 ~ e.code:", e.code, e.reason)
};

3、处理语音返回结果

const resultText = React.useRef<string>('');
const resultTextTemp = React.useRef<string>('');
// 识别结束 处理返回结果
const renderResult = (resultData: string) => {let jsonData = JSON.parse(resultData);if (jsonData.data && jsonData.data.result) {let data = jsonData.data.result;let str = "";let { ws } = data;for (let i = 0; i < ws.length; i++) {str = str + ws[i].cw[0].w;}// 开启wpgs会有此字段(前提:在控制台开通动态修正功能)// 取值为 "apd"时表示该片结果是追加到前面的最终结果;取值为"rpl" 时表示替换前面的部分结果,替换范围为rg字段if (data.pgs) {if (data.pgs === "apd") {// 将resultTextTemp同步给resultTextresultText.current = resultTextTemp.current;}// 将结果存储在resultTextTemp中resultTextTemp.current = resultText.current + str;} else {resultText.current = resultText.current + str;}}
}

http://www.ppmy.cn/embedded/149300.html

相关文章

springboot477基于vue技术的农业设备租赁系统(论文+源码)_kaic

摘 要 使用旧方法对农业设备租赁系统的信息进行系统化管理已经不再让人们信赖了&#xff0c;把现在的网络信息技术运用在农业设备租赁系统的管理上面可以解决许多信息管理上面的难题&#xff0c;比如处理数据时间很长&#xff0c;数据存在错误不能及时纠正等问题。这次开发的农…

Move AI技术浅析(五):动作识别与分类

一、动作识别与分类模块概述 动作识别与分类 的主要任务是从提取到的运动特征中&#xff0c;识别出具体的动作类型&#xff0c;并对动作进行分类。该模块包括 动作识别 和 动作分类 。 动作识别&#xff1a;从运动特征中识别出具体的动作类型&#xff0c;如走路、跑步、跳跃等…

vue2前端导出pdf文件

目录 1、安装依赖 ?2、demo 2.1 demo1导出效果 2.2?demo2导出效果 2.3?demo3导出效果 3、源码? 3.1 demo1 3.2 demo2 3.3 demo2 1、安装依赖 导出PDF通常涉及将HTML内容转换为图片&#xff08;截图&#xff09;&#xff0c;然后将这些图片插入到PDF文档中。这个过…

.NET重点

B/S C/S B/S&#xff1a; 浏览器端&#xff1a;JavaScript&#xff0c;HTML&#xff0c;CSS 服务器端&#xff1a;ASP&#xff08;.NET&#xff09;PHP/JSP 优势&#xff1a;维护方便&#xff0c;易于升级和扩展 劣势&#xff1a;服务器负担沉重 C/S java/.NET/VC系列 …

c#多线程之生产者-消费者模型

在 C# 中实现 生产者-消费者模式&#xff0c;通常需要多个线程来处理数据的生产和消费。我们可以使用 Queue<T> 来作为存储数据的队列&#xff0c;并使用 Thread、Mutex 或 Monitor 来确保线程安全。BlockingCollection<T> 是 C# 提供的一个线程安全的集合&#xf…

分布式协同 - 分布式事务_2PC 3PC解决方案

文章目录 导图Pre2PC&#xff08;Two-Phase Commit&#xff09;协议准备阶段提交阶段情况 1&#xff1a;只要有一个事务参与者反馈未就绪&#xff08;no ready&#xff09;&#xff0c;事务协调者就会回滚事务情况 2&#xff1a;当所有事务参与者均反馈就绪&#xff08;ready&a…

循环神经网络(RNN)入门指南:从原理到实践

目录 1. 循环神经网络的基本概念 2. 简单循环网络及其应用 3. 参数学习与优化 4. 基于门控的循环神经网络 4.1 长短期记忆网络&#xff08;LSTM&#xff09; 4.1.1 LSTM的核心组件&#xff1a; 4.2 门控循环单元&#xff08;GRU&#xff09; 5 实际应用中的优化技巧 5…

【Linux】查看实时网络流量的几种方法

1. nethogs sudo apt install nethogs nethogs eth0 ##网卡名称 2. ethstatus sudo apt-get install ethstatus ethstatus -i eth0 bmon 安装 sudo apt-get install bmon 查看网络 bmon -p eth0 输入g控制流量面板的显示和隐藏 输入d控制详情信息的显示和隐藏 输入q退…