第一课.声纹识别

news/2024/11/24 3:05:59/

示波器与语谱图[From wareform(oscillograph) to Spectrogram]

oscillograph 示波器

示波器是一种用途十分广泛的电子测量仪器。它能把肉眼看不见的电信号变换成看得见的图像,便于人们研究各种电现象的变化过程。示波器利用狭窄的、由高速电子组成的电子束,打在涂有荧光物质的屏面上,就可产生细小的光点(这是传统的模拟示波器的工作原理)。在被测信号的作用下,电子束就好像一支笔的笔尖,可以在屏面上描绘出被测信号的瞬时值的变化曲线。利用示波器能观察各种不同信号幅度随时间变化的波形曲线,还可以用它测试各种不同的电量,如电压、电流、频率、相位差、调幅度等等。

示波器的简单入门教学视频

spectrogram 语谱图

spectrogram是一个MATLAB函数,使用短时傅里叶变换得到信号的频谱图。当使用时无输出参数,会自动绘制频谱图;有输出参数,则会返回输入信号的短时傅里叶变换。

 语谱图涉及到了一个数学概念傅里叶系列。

让·巴普蒂斯·约瑟夫·傅里叶_百度百科

傅里叶变换_百度百科

软件下载地址:

Download | Audacity ®

分析音频,注意在对时频谱图进行可视化的时候,需要将频谱范围限制在0至8000赫兹之间。因为8000赫兹以上的频谱并不包含有价值的语音信息。

SpeakerRecognitionCourseChinese/male_audio.wav at main · wq2012/SpeakerRecognitionCourseChinese · GitHub

SpeakerRecognitionCourseChinese/female_audio.wav at main · wq2012/SpeakerRecognitionCourseChinese · GitHub

GitHub - wq2012/SpeakerRecognitionCourseChinese

频谱比较,不太明显:

增强自相关比较-差异看起来比较明显:

语音识别方法的历史发展

1、人工阅读法

2、模式匹配

3、统计学

4、高斯混合模型(Gaussian Mixture Models) GMM [高斯分布]

5、因子分析时代

6、深度学习[化繁为简-神经网络]

波大体分两类,机械波和电磁波,机械波又分横波与纵波。

机械波:纵波和横波

声强

 专题讲座:语音识别与声纹识别 - 百度文库

 


http://www.ppmy.cn/news/773117.html

相关文章

声纹识别知识整理

关于声纹识别的算法及知识层出不穷,一文带你了解声纹识别: 一、算法总览 1. 最早的GMM-UBM i-vector 利用GMM高斯混合模型提取特征i-vector;克服训练数据不多的情况,引入UBM;将语音分为说话人空间和环境空间&#x…

声纹识别的发展综述

声纹识别的发展综述 综述声纹概念与用于识别的优势声纹识别工作方式声纹识别三大部分:特征,模型,得分语音特征介绍声纹模型的演进基于深度学习的声纹技术 其他语音技术介绍 综述 声纹概念与用于识别的优势 声纹的概念:声音就是一…

声纹识别概述(1)初识

声纹识别 1. 声纹概念2. 声纹识别的分类3. 声纹识别的原理4. 声纹识别的关键特征提取模式识别 5. 声纹识别的技术指标6. 影响声纹识别水平的因素 初识声纹 1. 声纹概念 声波频谱 声纹(Voice print)是用电声学仪器现实的携带言语信息的声波频谱, 是由波长频率以及强度…

声纹识别技术

语音识别、声纹识别、语义识别的区别 很多除接触AI的小伙伴, 不清楚语音识别和声纹识别的区别,经常混淆概念,以为语音识别、声纹识别、语义识别是同一回事,其实不然。 声纹识别和语音识别在原理上一样,都是通过对采集…

声纹识别2

声纹识别,也称作说话人识别,是一种通过声音判别说话人身份的技术。从直觉上来说,声纹虽然不像人脸、指纹的个体差异那样直观可见,但由于每个人的声道、口腔和鼻腔也具有个体的差异性,因此反映到声音上也具有差异性。如…

声纹识别(说话人识别)技术

说话人识别(Speaker Recognition,SR),又称声纹识别(Voiceprint Recognition,VPR),顾名思义,即通过声音来识别出来“谁在说话”,是根据语音信号中的说话人个性信息来识别说…

声纹识别概述

转载自https://blog.csdn.net/weixin_44278406/article/details/103787143 声纹识别绪论 前言 指纹信息、人脸信息和声纹(voice-print)信息作为人体固有的生物信息,是智能电子设备私有化部署及辅助辨认个体的媒介。目前,指纹和…

声纹识别与声源定位(一)

针对目前智能计算机及大规模数据的发展,依据大脑处理语音、图像数据方法的deep learning技术应运而生。deep learning技术是应用于音频信号识别,模仿大脑的语音信号学习、识别的模式。在音频信号处理的过程中,运用deep learning进行音频数据的…