音视频基础之音频编码原理简介

news/2024/11/15 3:52:24/

一:隐蔽信号

数字音频信号如果不加压缩地直接进行传送,将会占用极大的带宽。例如,一套双声道数字音频若取样频率为44.1KHz,每样值按16bit量化,则其码率为:
244.1kHz16bit=1.411Mbit/s

如此大的带宽将给信号的传输和处理都带来许多困难和成本(阿里云服务器带宽大于5M后,每M价格是100元/月),
因此必须采取音频压缩技术对音频数据进行处理,才能有效地传输音频数据。

数字音频压缩编码在保证信号在听觉方面不产生失真的前提下,对音频数据信号进行尽可能大的压缩,降低数据量。数字音频压缩编码采取去除声音信号中冗余成分的方法来实现。所谓冗余成分指的是音频中不能被人耳感知到的信号,它们对确定声音的音色,音调等信息没有任何的帮助。

冗余信号包含人耳听觉范围外的音频信号以及被掩蔽掉的音频信号等。例如,人耳所能察觉的声音信号的频率范围为20Hz~20KHz,除此之外的其它频率人耳无法察觉,都可视为冗余信号。

此外,根据人耳听觉的生理和心理声学现象,当一个强音信号与一个弱音信号同时存在时,弱音信号将被强音信号所掩蔽而听不见,这样弱音信号就可以视为冗余信号而不用传送。这就是人耳听觉的掩蔽效应,主要表现在频谱掩蔽效应和时域掩蔽效应。

一个频率的声音能量小于某个阈值之后,人耳就会听不到。当有另外能量较大的声音出现的时候,该声音频率附近的阈值会提高很多,即所谓的掩蔽效应。如下图所示:
在这里插入图片描述
由图中我们可以看出人耳对2KHz~5KHz的声音最敏感,而对频率太低或太高的声音信号都很迟钝,当有一个频率为0.2KHz、强度为60dB的声音出现时,其附近的阈值提高了很多。由图中我们可以看出在0.1KHz以下、1KHz以上的部分,由于离0.2KHz强信号较远,不受0.2KHz强信号影响,阈值不受影响;而在0.1KHz~1KHz范围,由于0.2KHz强音的出现,阈值有较大的提升,人耳在此范围所能感觉到的最小声音强度大幅提升。如果0.1KHz~1KHz范围内的声音信号的强度在被提升的阈值曲线之下,由于它被0.2KHz强音信号所掩蔽,那么此时我们人耳只能听到0.2KHz的强音信号而根本听不见其它弱信号,这些与0.2KHz强音信号同时存在的弱音信号就可视为冗余信号而不必传送。

当强音信号和弱音信号同时出现时,还存在时域掩蔽效应。即两者发生时间很接近的时候,也会发生掩蔽效应。时域掩蔽过程曲线如图所示,分为前掩蔽、同时掩蔽和后掩蔽三部分。
在这里插入图片描述
时域掩蔽效应可以分成三种:前掩蔽,同时掩蔽,后掩蔽。前掩蔽是指人耳在听到强信号之前的短暂时间内,已经存在的弱信号会被掩蔽而听不到。同时掩蔽是指当强信号与弱信号同时存在时,弱信号会被强信号所掩蔽而听不到。后掩蔽是指当强信号消失后,需经过较长的一段时间才能重新听见弱信号,称为后掩蔽。这些被掩蔽的弱信号即可视为冗余信号。

二:音频编码–压缩编码方法

当前数字音频编码领域存在着不同的编码方案和实现方式, 但基本的编码思路大同小异, 如图所示。
在这里插入图片描述
对每一个音频声道中的音频采样信号:
1.将它们映射到频域中,这种时域到频域的映射可通过子带滤波器实现。每个声道中的音频采样块首先要根据心理声学模型来计算掩蔽门限值;
2.由计算出的掩蔽门限值决定从公共比特池中分配给该声道的不同频率域中多少比特数,接着进行量化以及编码工作;
3.将控制参数及辅助数据加入数据之中,产生编码后的数据流。


http://www.ppmy.cn/news/251456.html

相关文章

音视频基本概念

音视频的几个率 帧率fps 游戏中都有这个属于&#xff0c;大都指的是每秒显示的图像帧数&#xff0c;或者说图形处理器每秒更新的次数>24fps 电影基本这个帧率<30fps 游戏卡顿>60fps 流畅>75fps 肉眼不容易察觉出变化码率&#xff1a;又称比特率&#xff0c;指每秒传…

机器视觉:基于压缩方式的视频采集卡的两大类别

机器视觉&#xff1a;基于压缩方式的视频采集卡的两大类别 视频采集即将视频源的模拟信号通过处理转变成数字信号&#xff08;0和1&#xff09;&#xff0c;并将这些数字信息存储在电脑硬盘上的过程。视频采集卡的压缩方式可分为软压缩与硬压缩&#xff0c;两者的区别主要在于压…

音视频处理中的硬压缩与软压缩

视音频的压缩是视音频处理中的核心部分&#xff0c;压缩通常分两种途径来实现&#xff0c;1.嵌入式CPU进行软压缩&#xff0c;2. 采用硬件芯片进行硬压缩。 软压缩的图像采集通过图像采集芯片完成。即以若干个图像采集芯片为核心&#xff0c;配合周边电路和元件&#xff0c;完成…

监控视频存储

在现代安防中&#xff0c;监控设备是一种必需品&#xff0c;以前各行业在监控上的竞争主要集中在摄像头的技术更新上&#xff0c;而随着监控技术的不断发展&#xff0c;与监控息息相关的存储设备竞争也随之火热&#xff0c;技术的进步对监控存储的要求也在不断的提高&#xff0…

【读书笔记】《数据压缩入门·下》——柯尔特·麦克安利斯

数据压缩入门汇总 读书笔记——数据压缩入门&#xff08;柯尔特麦克安利斯&#xff09;上 读书笔记——数据压缩入门&#xff08;柯尔特麦克安利斯&#xff09;中 读书笔记——数据压缩入门&#xff08;柯尔特麦克安利斯&#xff09;下 第九章 数据建模 多上下文编码算法背后…

华光昱能分析图像压缩中的4:4:4到底是咋回事

近年来&#xff0c;业界朋友经常有看到或听到过4:4:4等概念&#xff0c;好多人却一头雾水搞不清内在含义。咱们今天就来说说4:4:4这些事。 在视觉上&#xff0c;视频信号会分解为亮度和色度两个信号元素。色彩取样方式是指从4像素区域中(2个垂直像素和2个水平像素)分别使用多少…

视频压缩标准的技术原理及其发展

1多媒体及视讯技术 随着互联网的飞速发展&#xff0c;消费类电子、通信、影视及广播、计算机技术日益紧密地结合起来&#xff0c;使得基于互联网的多媒体产业成为本世纪初发展最快、规模最大的产业之一。 多媒体是建立在计算机图形学、人机接口技术、传感技术和人工智能等学科…

常用视频接口线头介绍

目前常用视频接口共分为四种&#xff1a;VGA、DVI、DP、HDMI&#xff0c;其中最流行的是HDMI&#xff0c;小编之前发布过关于视频接口的文章&#xff0c;文中详细分析了目前各大视频输出和显示设备的接口配置&#xff0c;这些设备上都出现了HDMI身影。那作为IBM在1987年视频传输…