通过Python的speech_recognition库将声音转为文字

news/2024/11/17 1:07:46/

文章目录

  • 前言
  • 一、PortAudio
    • 1.PortAudio是什么?
    • 2.安装PortAudio
  • 二、使用方法
    • 1.引入库
    • 2.创建一个Recognizer对象
    • 3.使用麦克风录音,从麦克风录制音频
    • 4.将音频转换为文字
    • 5.转换结果
  • 总结


前言

大家好,我是空空star,本篇给大家分享一下通过Python的speech_recognition库将声音转为文字。
之前已经介绍了将音频文件转为文字,只依赖speech_recognition库,本篇将声音转为文字,除了speech_recognition库,还要依赖pyaudio库,而且mac用户需要安装PortAudio

Python-语音转文字相关库介绍


一、PortAudio

1.PortAudio是什么?

PortAudio是一种跨平台的音频I/O库,用于实现音频输入和输出功能。它提供了一种简单、一致的跨平台API,可以让开发者在不同操作系统上编写音频应用程序,如音频录制和播放器。PortAudio支持多种音频设备,包括音频接口、音频文件、网络流等,并且可以在各种操作系统上使用,如Windows、Mac OS X、Linux、Unix等。同时,PortAudio还提供了一些高级特性,如流控制、同步、缓冲管理、音频格式转换等。

2.安装PortAudio

macOS下:

brew install portaudio  

二、使用方法

1.引入库

import speech_recognition as sr

2.创建一个Recognizer对象

r = sr.Recognizer()

3.使用麦克风录音,从麦克风录制音频

# 使用麦克风录音
with sr.Microphone() as source:print("请说话...")# 从麦克风录制音频audio = r.listen(source)print("录音结束")

4.将音频转换为文字

try:# 将音频转换为文字text = r.recognize_google(audio, language='zh-CN')print("你说的是:", text)
except sr.UnknownValueError:print("Google Speech Recognition could not understand audio")
except sr.RequestError as e:print("Could not request results from Google Speech Recognition service; {0}".format(e))

5.转换结果

声音:深度神经网络模型部署

请说话...
录音结束
你说的是: 深度神经网络模型部署Process finished with exit code 0

总结


http://www.ppmy.cn/news/73392.html

相关文章

召回/粗排阶段 负样本常见构造方法

文章目录 1、曝光未点击2、全局随机选择负例3、batch内随机选择负例4、曝光数据随机选择负例5、基于popularity随机选择负例6、基于hard选择负例大佬的总结:大佬的名言:“如果精排是特征的艺术,那么召回就是样本的艺术(负样本为王)”。负样本的构造对于召回阶段来说非常非…

Oracle 19C 单机环境升级RU(19.3升级至19.12)

📢📢📢📣📣📣 哈喽!大家好,我是【IT邦德】,江湖人称jeames007,10余年DBA及大数据工作经验 一位上进心十足的【大数据领域博主】!😜😜😜 中国DBA联盟(ACDU)成员,目前服务于工业互联网 擅长主流Oracle、MySQL、PG、高斯及GP 运维开发,备份恢复,安装迁移…

C++基础语法——模板

1. 泛型编程 在平常的编写中,对于一个实现固定作用的函数,如交换两变量的值的Swap函数,对于不同类型只能编写相对应的重载函数,即 void Swap(int& left, int& right) {int temp left;left right;right temp; }void S…

1.Buffer_Overflow-2.Stack_Overflow / 写入字符串

这道题虽然简单 但是却给我了另一个解题的看法 我们先进行运行 我们看看保护 发现只有NX保护 反汇编看看 发现有shellcode 但是我们没有办法执行shellcode 因为v5 不会等于后面的 这里我原本没有想法 后面进行看看他的汇编 这里其实就很清楚了 .text:00000000004011BB …

如何让你的 Jmeter+Ant 测试报告更具吸引力?

目录 引言 一、安装apache-Ant 二、Jmeter准备 3、生成测试报告 4、JMeter动态参数处理逻辑是什么? 5、JMeter是怎么做API自动化测试的? 结语 引言 想象一下,你辛苦搭建了一个复杂的网站,投入了大量的时间和精力进行开发和…

Linux 安装MySQL-5.7.30

本文总结在Linux上安装mysql数据库的方法以及遇到的问题。使用的环境信息 MySQL 5.7.30CentOS Linux release 7.6.1810 (Core) 1.官网下载MySQL 进入官网https://www.mysql.com/ 从下载页面下载社区版本其中社区版本免费,免费的午餐不提供技术支持. 页面中MySQL E…

第三十七章 弹灵守则第三十七条

“要不要一起玩?”那个跳来跳去的小男孩冲巴哥奔嘻嘻一笑。 “唔~” “很简单,这叫做玛丽的房间。”小男孩突然从她头顶跃过,脚尖点到她身后一块灰色方格。 “亮灰。” “D3D3D3。” “哈哈,你错了!”头顶扎着一根小辫…

RK3568平台开发系列讲解(驱动基础篇)RK平台RTC的使用

🚀返回专栏总目录 文章目录 一、HYM8563模块二、HYM8563模块三、接口使用3.1 sysfs 接口3.2 procfs 接口3.3 ioctl 接口沉淀、分享、成长,让自己和他人都能有所收获!😄 📢本篇将对RK RTC的使用进行学习。 一、HYM8563模块 ROC-RK3568-PC开发板采用HYM8563作为RTC(Rea…