声纹识别的发展综述

news/2024/11/24 3:12:30/

声纹识别的发展综述

  • 综述
    • 声纹概念与用于识别的优势
    • 声纹识别工作方式
    • 声纹识别三大部分:特征,模型,得分
      • 语音特征介绍
      • 声纹模型的演进
      • 基于深度学习的声纹技术
    • 其他语音技术介绍

综述

声纹概念与用于识别的优势

声纹的概念:声音就是一段波,声纹就是携带了信息的声波频谱。
为什么可以用于识别?

  1. 声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变,因此,它同指纹一样,独特的生物学特征,可用于身份识别。
    在这里插入图片描述
  2. 声纹特征对比其他生物学特征更有优势。在这里插入图片描述

声纹识别工作方式

声纹识别在产品上的本质主要就是以下两种工作方式: 1比1 和 1比N
在这里插入图片描述
工作流程大致如下:

  1. 提取语音,预处理,提取特征
  2. 利用训练好的模型,计算该语音对应的声纹模型或者声纹特征
  3. 最后进行相似度打分,得到结果
    在这里插入图片描述
    由此我们可以看出声纹识别主要就是三大部分:特征,模型,得分。下面根据这三大要素分别阐述

声纹识别三大部分:特征,模型,得分

首先看下这三大部分的整体技术流派和技术发展路线
在这里插入图片描述

语音特征介绍

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

声纹模型的演进

传统的声纹识别 主要是基于统计思想和概率论,结合声学,信号学,机器学习等算法

2012年,跨入了以deep learning 为主线的算法,DNN-based系统陆续出现,并基于深度学习领域的新思想持续改良

近两年发展起来的End-to-End 端到端系统,代表:2018年谷歌百度的相关论文
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

基于深度学习的声纹技术

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
上面的网络结构中,有一个Statistics Pooling Layer,负责将Frame-level Layer,Map到Segment-Level Layer,计算frame-level Layer的Mean和standard deviation。TDNN是时延架构,Output Layer可以学习到Long-Time特征,所以x-vector可以利用短短的10s左右的语音,捕捉到用户声纹信息,在短语音上拥有更强的鲁棒性。
在这里插入图片描述

其他语音技术介绍

在这里插入图片描述
在这里插入图片描述
摘自知乎“巧克力工厂的查理”,用作学习总结。


http://www.ppmy.cn/news/773115.html

相关文章

声纹识别概述(1)初识

声纹识别 1. 声纹概念2. 声纹识别的分类3. 声纹识别的原理4. 声纹识别的关键特征提取模式识别 5. 声纹识别的技术指标6. 影响声纹识别水平的因素 初识声纹 1. 声纹概念 声波频谱 声纹(Voice print)是用电声学仪器现实的携带言语信息的声波频谱, 是由波长频率以及强度…

声纹识别技术

语音识别、声纹识别、语义识别的区别 很多除接触AI的小伙伴, 不清楚语音识别和声纹识别的区别,经常混淆概念,以为语音识别、声纹识别、语义识别是同一回事,其实不然。 声纹识别和语音识别在原理上一样,都是通过对采集…

声纹识别2

声纹识别,也称作说话人识别,是一种通过声音判别说话人身份的技术。从直觉上来说,声纹虽然不像人脸、指纹的个体差异那样直观可见,但由于每个人的声道、口腔和鼻腔也具有个体的差异性,因此反映到声音上也具有差异性。如…

声纹识别(说话人识别)技术

说话人识别(Speaker Recognition,SR),又称声纹识别(Voiceprint Recognition,VPR),顾名思义,即通过声音来识别出来“谁在说话”,是根据语音信号中的说话人个性信息来识别说…

声纹识别概述

转载自https://blog.csdn.net/weixin_44278406/article/details/103787143 声纹识别绪论 前言 指纹信息、人脸信息和声纹(voice-print)信息作为人体固有的生物信息,是智能电子设备私有化部署及辅助辨认个体的媒介。目前,指纹和…

声纹识别与声源定位(一)

针对目前智能计算机及大规模数据的发展,依据大脑处理语音、图像数据方法的deep learning技术应运而生。deep learning技术是应用于音频信号识别,模仿大脑的语音信号学习、识别的模式。在音频信号处理的过程中,运用deep learning进行音频数据的…

声纹识别概述(3)声纹识别系统

文章目录 1. 声纹识别系统框架1.0 声纹识别系统1.0.1 不太清晰的两个阶段:训练阶段和测试阶段1.0.2 只讲了一个阶段:测试/应用阶段(包括注册和验证)1.0.3 声纹识别系统的三个阶段 1.1 特征提取1.2 模型建立1.3 打分判决1.3.1 判决…

声纹识别

声纹识别还是一个比较窄的学科,应用也相对较少,在此之前,先给大家看几个声纹的例子。 1个月大婴儿的哭声声纹 男人的口哨声声纹 下雨打雷声声纹 接吻声声纹 人声和枪声声纹 每个例子都代表了不同的声音特征,从表面上来看还是非常容…