阿里达摩院:FunASR语音识别

news/2024/9/19 9:54:04/ 标签: 语音识别, 人工智能

阿里达摩院:FunASR语音识别

github:
https://github.com/modelscope/FunASR/

1 clone 代码到本地,切换到 FunASR/

git clone https://github.com/alibaba/FunASR.git && cd FunASR

2 虚拟环境

conda create -p ./venv python=3.12
conda activate ./venv

1 安装依赖

pip install torch
pip install torchaudio

2 安装 funasr

pip install -U funasr

或者

pip install -e ./

3 安装其它模块

pip install -U modelscope huggingface_hub

测试

1 下载模型
modelscope download --model iic/SenseVoiceSmall  --local_dir ./SenseVoiceSmall
modelscope download --model iic/speech_fsmn_vad_zh-cn-16k-common-pytorch  --local_dir ./speech_fsmn_vad_zh-cn-16k-common-pytorch
2 代码测试

在 FunASR/ 目录下创建 wmx_test 文件夹
FunASR/wmx_test/test.py :

from funasr import AutoModel
from funasr.utils.postprocess_utils import rich_transcription_postprocess# model_dir = "iic/SenseVoiceSmall"
model_dir = "./SenseVoiceSmall"
vad_model_dir = "./speech_fsmn_vad_zh-cn-16k-common-pytorch"# input_path="/media/wmx/soft1/AI-model/FunASR/asr_example_en.wav"
input_path="/media/wmx/soft1/AI-model/FunASR/vad_example.wav"model = AutoModel(model=model_dir,# vad_model="fsmn-vad",vad_model=vad_model_dir,vad_kwargs={"max_single_segment_time": 30000},# device="cuda:0",device="cpu",disable_update=True
)# en
res = model.generate(input=input_path,cache={},language="auto",  # "zn", "en", "yue", "ja", "ko", "nospeech"use_itn=True,batch_size_s=60,merge_vad=True,  #merge_length_s=15,
)
text = rich_transcription_postprocess(res[0]["text"])
print(text)

识别输出 :

试错的过程很简单而,且特别是今天报名仓雪卡的同学,你们可以。听到后面的有专门的活动课,他会大大降低你的试绸成本。其实你也可以过来听课,为什么你自己写嘛?我先今天写5个点,我就试试试验一下,反正这5个点不行,我再写5个点,这试再不行,那再写5个点嘛。你总会所谓的活动搭神和所谓的高手,都是只有一个把所有的错,所有的坑全部趟一遍,留下正确的你就是所谓的搭神。明白吗?所以说关于活动通过这块,我只送给你们四个字啊,换位思考。如果说你要想降低你的试错成本,今天来这里你们就是对的。因为有畅畅血卡这个机会,所以说关于活动过于不过这个问题,或者活动很难通过这个话题呃,如果真的要坐下来聊的话,要聊一天。但是我觉得我刚才说的四个字足够。好,谢谢。好,非常感谢那个三茂老师的回答啊。三茂老师说,我们在整个店铺的这个活动当中,我们要学会换位思考。其实


http://www.ppmy.cn/news/1518942.html

相关文章

LeetCode Hot100:15、三数之和

题目:三数之和 给你一个整数数组 nums ,判断是否存在三元组 [nums[i], nums[j], nums[k]] 满足 i ! j、i ! k 且 j ! k ,同时还满足 nums[i] nums[j] nums[k] 0 。请你返回所有和为 0 且不重复的三元组。 注意:答案中不可以包…

深度学习100问28:什么是RNNLM(RNN语言模型)

嘿,你知道 RNNLM 是啥不?简单来说,它就像是一个语言小魔法师。 想象一下,RNNLM 是一个特别会猜词的小伙伴。它的任务呢,就是预测一个句子出现的概率,或者当你给它一些上文的时候,它能猜出下一…

【Qt】Qt 网络 | UDP Socket

文章目录 核心API代码示例服务器客户端 要使用 Qt 网络编程,需要在项目中的 .pro 文件中添加 network 模块 核心API Qt 的 UDP Socket 主要的类有两个 QUdpSocket 和 QNetworkDatagram 因为是 UDP 是面向数据报的,QNetworkDatagram 就是对 数据报的封…

深度学习100问43:什么是过拟合

嘿,咱来聊聊过拟合是什么。 想象一下,有个机器学习的模型就像一个学生在准备考试。如果这个模型对训练数据就像学生把课本上的题目背得超级熟,在训练数据上表现得那叫一个棒,就像学生在做课本上的题时成绩超高。但是呢&#xff…

酒店业的新宠:普渡清洁机器人提升服务品质

酒店业的新宠:普渡清洁机器人提升服务品质 在日新月异的酒店业中,每一次科技的融入都如同为传统服务披上了一袭华丽的新装,不仅提升了顾客体验,更重新定义了服务的边界。而今,普渡清洁机器人正以其独特的魅力&#xff…

Ansible自动化运维项目

Ansible自动化运维项目是一个复杂而强大的解决方案,它利用Ansible这一开源自动化平台来简化IT基础设施的配置管理、应用部署和任务自动化过程。以下是一个关于Ansible自动化运维项目的详细探讨,包括其基本概念、架构、优势、应用场景、实施步骤、最佳实践…

什么是链接建设?怎么做来获取出色的链接?

什么是链接建设? 链接建设是一种从其他网站获取指向你网站的链接的方法,是 SEO 的一个重要方面。它可以帮助搜索引擎找到你的网页并对其进行排名。你可以撰写完美的博客,但如果搜索引擎无法跟踪至少一个链接,它很可能会永远徒劳地…

机器学习/数据分析案例---糖尿病预测

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 前言 这是一篇数据分析/机器学习很好的入门案例,对糖尿病的影响进行预测和分析通过随机森林预测,平均准确率和召回率都不错不足&#x…

Datawhale X 李宏毅苹果书 AI夏令营-深度学入门task2:线性模型

1.线性模型 把输入的特征 x 乘上一个权重,再加上一个偏置就得到预测的结果,这样的模型称为线性模型(linear model) 2.分段线性模型 线性模型也许过于简单,x1 跟 y 可能中间有比较复杂的关系。线性模型有很大的限制&…

Python-MNE-源空间和正模型07:修复BEM和头表面

有时在创建BEM模型时,由于可能出现的一系列问题(例如,表面之间的交叉),表面需要手动校正。在这里,我们将看到如何通过将表面导出到3D建模程序blender,编辑它们,并重新导入它们来实现这一点。我们还将给出一…

网络安全售前入门05安全服务——渗透测试服务方案

目录 1.服务概述 2.测试内容 2.1网络层安全 ​​​​​​​2.2系统层安全 ​​​​​​​2.3应用层安全 3.测试范围 4.漏洞分级 5.渗透用例 6.测试风险 6.1风险说明 ​​​​​​​6.2风险规避 ​​​​​​​​​​​​​6.3数据备份 7.服务输出 1.服务概述 渗透…

从0到DevOps(1)-初步了解DevOps和容器

DevOps从提出以来陆续成为行业普遍实践,目前是数字化生产普遍不可或缺的信息底座。本系列文章旨在系统性的阐述与认识DevOps, 了解企业实践里DevOps的实际面貌。 什么是DevOps? DevOps 是一套实践、工具和文化理念,为实现用户不断的软件功能和可用性要…

使用Python写贪吃蛇游戏

贪吃蛇游戏是一款经典的小游戏,玩家通过控制蛇的移动来吃食物,蛇的身体会随着吃到的食物越来越多而变长。本文将介绍如何使用Python来创建一个简单的贪吃蛇游戏。 代码解析 1. 设置窗口 首先,我们需要设置游戏窗口。使用 turtle.Screen() 创…

streamlit+wordcloud使用pyinstaller打包遇到的一些坑

说明 相比常规的python程序打包,streamlit应用打包需要额外加一层壳,常规app.py应用运行直接使用 python app.py就可以运行程序了,但streamlit应用是需要通过streamlit命令来运行 streamlit app.py所以使用常规的pyinstaller app.py打包是…

(备份)常用ASCII 8*8 点阵 以及查询显示字符的点阵

图片 #include "driver/spi_master.h" #include "driver/gpio.h" #include "freertos/FreeRTOS.h" #include "freertos/task.h" #include "string.h" #include "driver/i2c.h" #include "esp_rom_sys.h"…

Java分布式架构知识体系及知识体系图

Java分布式架构整体知识体系是一个庞大而复杂的领域,它涵盖了多个方面,旨在帮助开发者构建高性能、高可用、可扩展的分布式系统。以下是对Java分布式架构整体知识体系的概述: 一、分布式理论基础 CAP理论: 一致性(Con…

Java算法之Gnome 排序

简介 Gnome 排序,又称为双向插入排序或鸡尾酒排序,是一种改进的插入排序算法。它在每次迭代中不仅将最小的元素移动到前面,同时也将最大的元素移动到后面。这种排序算法在每次迭代中同时向两个方向进行移动,因此得名。 算法步骤…

如何开发针对不平衡分类的成本敏感神经网络 python

如何开发针对不平衡分类的成本敏感神经网络 深度学习神经网络是一类灵活的机器学习算法,可以在各种问题上表现良好。 神经网络使用误差反向传播算法进行训练,该算法涉及计算模型在训练数据集上产生的误差,并根据这些误差的比例更新模型权重…

240831-Qwen2-VL-7B/2B部署测试

A. 运行效果 B. 配置部署 如果可以执行下面就执行下面: pip install githttps://github.com/huggingface/transformers accelerate否则分开执行 git clone https://github.com/huggingface/transformers cd transformers pip install . accelerate随后&#xff0…

k8s-pod 实战一 (创建pod,启动命令,参数,pod故障排除,拉取命令)

1. 创建一个Pod Pod 是 Kubernetes 中最小的部署单元。它可以包含一个或多个容器。下面是一个简单的 YAML 文件,用于创建一个包含 Nginx 容器的 Pod。 示例 YAML 文件 (nginx-pod.yaml) apiVersion: v1 kind: Pod metadata:name: nginx-pod spec:containers:- name: nginx-…