如何利用大模型将语音转文字

news/2024/12/21 9:40:45/

如何利用大模型将语音转文字

OpenAI支持将语音转文字,调用接口可以直接将语音文件转为文字。

这个例子是调用了一个私有部署的Belle-whisper-large-v2-zh,使用OpenAI的客户端。

测试代码如下:

from openai import OpenAIclient = OpenAI(base_url='http://127.0.0.1:9922/v1',api_key='EMPTY'
)models = client.models.list()print(models)

可以从下面的输出中,确认大模型的名称。

SyncPage[Model](data=[Model(id='Belle-whisper-large-v2-zh', created=0, object='model', 
owned_by='xinference', model_type='audio', address='0.0.0.0:36445', accelerators=['0'], 
model_name='Belle-whisper-large-v2-zh', model_family='whisper', model_revision='ec5bd5d78598545b7585814edde86dac2002b5b9', replica=1),Model(id='bge-reranker-large', created=0, object='model', owned_by='xinference', model_type='rerank', address='0.0.0.0:46201', accelerators=['0'], type='normal', model_name='bge-reranker-large', language=['en', 'zh'], model_revision='v0.0.1', replica=1), Model(id='bge-base-zh-v1.5', created=0, object='model', owned_by='xinference', model_type='embedding', address='0.0.0.0:40537', accelerators=['0'], model_name='bge-base-zh-v1.5', dimensions=768, max_tokens=512, language=['zh'], model_revision='v0.0.1', replica=1)], object='list')

选择一个声音文件,将文件内容提交给大模型。

file_name = r'C:\Temp\四年级英语听力.mp3'audio_file = open(file_name, 'rb')transcription = client.audio.transcriptions.create(model="Belle-whisper-large-v2-zh",file=audio_file
)print(transcription.text)

输出结果为:

四年级英语听力部分ALookListenandChoose听音选图 writing he is a famous writer to Galway's brother is 
a policeman Galway's brother is a policeman three this is my classmate Li Yan she's good at reading books 
this is my classmate Li Yan she is good at reading books My uncle is a taxi driver. He drives well
听录音填写 I'm eleven She is twelve We are in the same class Her father is a teacher Her mother i
s a TV reporter of class two grade five.听录音用钩叉判断 I'm a new student I'm in class 2 five. 
Here is a picture of my family. This is my father. He's a writer. This is my mother. She's a singer. 
The girl is my sister. The boy is me. We love our father and mother and they love us. 
We are a happy family听力结束请同学们继续答题

看上去还不错。


http://www.ppmy.cn/news/1556892.html

相关文章

OpenEuler 22.03 安装 flink-1.17.2 集群

零:规划 本次计划安装三台OpenEuler 22.03 版本操作系统的服务器,用于搭建 flink 集群。这里使用flink1.17.2 的原因,是便于后续与springboot的整合 服务器名IP地址作用其他应用flink01192.168.159.133主jdk11、flink-1.17.2flink02192.168.…

Mybatis分页插件的使用问题记录

项目中配置的分页插件依赖为 <dependency><groupId>com.github.pagehelper</groupId><artifactId>pagehelper</artifactId><version>5.1.7</version></dependency>之前的项目代码编写分页的方式为&#xff0c;通过传入的条件…

RCNN系列是如何逐步改善的

1、R-CNN的缺点&#xff1a; 1&#xff09;计算效率低下&#xff1a;RCNN需要为每一个候选框都提取特征&#xff0c;会导致大量重复的工作&#xff0c;因为候选框是原始图片的一部分&#xff0c;肯定是存在交集的。2&#xff09;需要大量的磁盘空间&#xff1a;在训练阶段&…

基于Spring Boot的雅苑小区管理系统

一、系统背景与意义 随着信息化技术的快速发展&#xff0c;传统的小区物业管理方式已经难以满足现代居民对于高效、便捷服务的需求。因此&#xff0c;开发一款基于Spring Boot的小区管理系统显得尤为重要。该系统旨在通过信息化手段&#xff0c;实现小区物业管理的智能化、自动…

麒麟操作系统服务架构保姆级教程(三)NGINX中间件

如果你想拥有你从未拥有过的东西&#xff0c;那么你必须去做你从未做过的事情 想要在网页上访问到代码那么就需要用到应用服务类中间件&#xff0c;国外的有Nginx&#xff0c;Tomcat等&#xff0c;国内的有金蝶web&#xff0c;东方通的服务中间件&#xff08;Tongweb&#xff0…

Docker基础命令实战

问题&#xff1a;Error response from daemon: Get "https://index.docker.io/v1/search?qmysql&n25": dial tcp 199.59.148.9:443: connect: connection refused 在pull nginx时出现的报错&#xff0c;可能原因是镜像源过期了&#xff0c;我们需要更换镜像源 …

初学stm32 --- PWM输出

目录 STM32 PWM工作过程​编辑 STM32 PWM工作过程&#xff08;通道1为例&#xff09; PWM模式1 & PWM模式2 向上计数配置说明​编辑 STM32 定时器3输出通道引脚 自动重载的预装载寄存器 ​编辑 PWM输出相关库函数 输出比较初始化函数&#xff1a; 设置比较值函数&a…

web3跨链桥协议-Nomad

项目介绍 Nomad是一个乐观跨链互操作协议。通过Nomad协议&#xff0c;Dapp能够在不同区块链间发送数据&#xff08;包括rollups&#xff09;&#xff0c;Dapp通过Nomad的合约和链下的代理对跨链数据、消息进行验证、传输。其安全通过乐观验证机制和欺诈证明制约验证者实现&…