音频筑基:巴克谱和梅尔谱辨析

news/2024/11/30 20:40:20/

音频筑基:巴克谱和梅尔谱辨析

    • 是什么
    • 深入了解
    • 相关参考

在音频信号处理中,巴克谱和梅尔谱是我们经常遇到的概念,也是语音处理中常用到的频域特征,这里谈谈自己对它们的理解。

是什么


巴克谱又称Bark Spectrum,梅尔谱又称Mel Spectrum,其中异同梳理如下:

  • 相同点:
    • Bark谱和Mel谱都是将线性频谱映射到非线性谱上的表征,根据不同频带的感知能力来划分,但它们的核心思想不同。
    • 这两种谱都是语音信号处理中常用的特征提取方法,它们可以用于基频、降噪、编解码、特殊声音检测等领域。
  • 不同点:
    • 机理不同:
      • BFCC(Bark-Frequency Cepstral Coefficents),人耳对响度感知灵敏度确定的频带划分方法, amplitude/loudness
      • MFCC(MelScale-Frequency Cepstral Coefficents),人耳对音高感知灵敏度确定的频带划分方法, pitch
    • 映射函数不同:
      • Bark谱将线性频谱映射到Bark域上,以符合人耳听觉机理。在Bark域上分布是非线性的。Bark谱通常基于MDCT弄的,常用于编解码领域。
      • Mel谱将线性频谱映射到Mel频率域(对数log)上,以模拟人类听觉系统机理。在Mel频域上,分布是线性的。Mel谱通常基于STFT弄的,使用更广泛。
    • 两者的区别在于映射函数不同,Bark谱的映射函数是非线性的,而Mel谱的映射函数是线性的。

深入了解


巴克谱/bark刻度具体如何解释?

  • bark刻度指的是频点分带策略按人耳听觉感知特性,对0-15500Hz频点从听感上进行等间距划分24个带,低于500Hz的bark刻度近似线性,高于500Hz的bark刻度近似对数尺度。
  • bark谱划分最高到15.5kHz,若到20kHz需增加为25个带(15.5-20k)
  • bark谱的关键在于临界带的宽度,而非具体位置

相关参考


  1. 语音特征小结 - 知乎 (zhihu.com)],link
  2. 音频处理中的尺度–Bark尺度与Mel尺度_bark(巴克)频率尺度-CSDN博客,link
  3. Bark谱维基百科,link

http://www.ppmy.cn/news/1290552.html

相关文章

智能化校园:深入探讨云端管理系统设计与实现(二)

系列文章目录 智能化校园:深入探讨云端管理系统设计与实现(一) 文章目录 系列文章目录功能开发登录功能分析验证码功能实现登录校验功能登录后跳转功能 系统管理器实现验证码响应图片功能实现异步图片上传头像功能实现全局修改密码功能实现 …

28、商城系统(十):ElasticSearch的映射,nginx下载安装,es分词器,springboot整合es

目录 一、Mapping映射 1.es7删除类型 2.es给字段设置字段类型,即映射 (1)创建映射

python弹奏《起风了》

代码是很大的! 其实就是python用ctypes调用Win API import ctypes import threading import time winmm = ctypes.windll.winmmclass Scale:Rest = 0C8 = 108B7 = 107A7s = 106A7 = 105G7s = 104G7 = 103F7s = 102F7 = 101E7 = 100D7s = 99D7 = 98C7s = 97C7 = 96B6 = 95A6s…

4.Unity中向量相关

向量 //三维向量 - Vector3 //Vector3有两种几何意义 //1.位置 -- 代表一个点 print(this.transform.position);//2.方向 -- 代表一个方向 print(this.transform.forward); print(this.transform.up); 两点决定一个向量 //A和B此时 几何意义 是两个点Vector3 A new Vector3(…

elasticsearch操作索引库

目录 一、创建索引库 二、查询索引库 三、删除索引库 四、修改索引库 mapping映射属性 mapping是对索引库中文档的约束,常见的mapping属性包括: type:字段数据类型,常见的简单类型有: 字符串:text&…

【论文阅读】Self-Paced Curriculum Learning

论文下载 代码 Supplementary Materials bib: INPROCEEDINGS{,title {Self-Paced Curriculum Learning},author {Lu Jiang and Deyu Meng and Qian Zhao and Shiguang Shan and Alexander Hauptmann},booktitle {AAAI},year {2015},pages {2694--2700} }1. 摘…

Linux下查看CPU信息

#lscpu Architecture: x86_64,表示系统的处理器架构为x86-64。CPU op-mode(s): 32-bit, 64-bit,表示处理器支持32位和64位操作系统。Byte Order: Little Endian,表示系统使用的字节序为小端序。CPU(s): 96,表示系统中有96个CPU核…

【Mybatis】Mybatis如何防止sql注入

🍎个人博客:个人主页 🏆个人专栏: Mybatis ⛳️ 功不唐捐,玉汝于成 目录 前言 正文 1、使用参数化的 SQL 语句: 2、使用动态 SQL 标签: 3、禁止拼接 SQL: 4、限制参数类…