音频处理——音频处理的基本概念

news/2025/2/11 23:23:10/

目录

  • 声音的本质
  • 声音的物理性质
    • 波形
    • 频率
    • 一个例子
  • 数字音频
    • 采样率
    • 采样量化(采样精度、采样深度)
    • 音频帧
  • 常见名词解释
    • 举例

声音的本质

声音是一种由物体震动引发的物理现象,如小提琴的弦声等。物体的震动使其四周空气的压强产生变化,这种护墙沪弱变化以波的形式向四周传播,当被人耳锁接收时,我们就听见了声音。

声音的物理性质

波形

声音是由物体的振动产生的,这种震动引起了周围空气压强的震荡,我们称这种震荡的函数表现形式为波形
在这里插入图片描述
振幅——音量调整

频率

声音的频率是周期的倒数,它表示的是声音再1秒时间内的周期数,单位是赫兹(Hz)、千赫(kHz),即1000Hz,表示每秒震动一千次。
声音按频率可做如下划分
在这里插入图片描述
声音信号采集转为数字信号,参考的原理就是人耳能听见的声音。如果要采集频率非常高的声音信号,那么对采集设备的要求就非常高

一个例子

这是我做的采样率16k,16bit,1kHz的音源
在这里插入图片描述
放大后效果如下
在这里插入图片描述
这就是音频数据再计算机中的存储方式——数字音频

数字音频

主要从采样率、采样量化、编码来进行讲解

为什么需要采样?
计算机并不直接使用连续平滑的波形来表示声音,他是每隔固定的时间对波形的幅值进行采样,用得到的一系列数字量来表示声音,如下图
在这里插入图片描述
PCM(Pluse Code Modulaton)脉冲编码调制。
人耳听到的是模拟信号,PCM是把声音从模拟信号转化为数字信号的技术
在这里插入图片描述

采样率

采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,单位用赫兹(Hz)来表示。
采样频率的倒数是采样周期(也称为采样时间),它表示采样之间的时间间隔。这里要注意不要将采样率与位速相混淆。

根据Nyguist(耐奎斯特)采样定律,要从采样中完全回复原始信号波形,采样频率必须至少是信号中最高频率的两倍。

人耳能听到的是[20, 20k]Hz频率的声音,所以采样率一般为40kHZ,为了不使其造成低频失真,所以CD质量采样率使用44.1KHz,z这样就能保证声音到达20kHz也能被数字化,从而使得经过数字化处理之后,人耳听到的声音质量不会被降低
在这里插入图片描述

采样量化(采样精度、采样深度)

采样是再离散的时间点上进行的,而采样值本身再计算机中夜视离散的。
采样的精度取决于它用多少位来表示,这就是量化。

如8bit量化可以表示256个不同的值,而CD质量的16bit量化可以表示65536个值,范围为[-32768,32767]

下图是一个3bit量化的示意图,可以看出3bit量化只能表示8个值:0.75,0.5,0.25,0,-0.25,-0.5,-0.75和-1,因而量化位数比较少,波形就很难辨认,还原后的声音质量也就越差(可能除了嗡嗡声之外什么都没有)
在这里插入图片描述

音频帧

音频和视频不一样,视频每一帧都是一张图像,音频数据是流式的,不同的编码格式各自不同的编码标准,拿PCM和MP3做一个对比。PCM因为没有压缩,根据采样率位宽等数据可以得到每秒的音频数据,并不需要帧的概念;MP3是因为压缩后信息比较多,则有了类似H264的帧概念,每一个帧都有帧头。

每帧的采样点 = 采样率 / 帧率
帧率是我们自己定义的

MP3原理(待更)

常见名词解释

在这里插入图片描述
5.1声道常用于电影院,是环绕的立体声
在这里插入图片描述
码率就是单位时间内的音频数据量(bit)
在这里插入图片描述
在这里插入图片描述
以上的两个模式就是左右声道存储的方式
如果是四声道

  • 交错存储方式就是1234 1234 1234 1234
  • 非交错存储方式是1111 2222 3333 4444

举例

在这里插入图片描述
如上图
采样频率4410,采样精度16bit,2通道(声道),采集4分钟的数据

4410 x 16 x 2 x 4 x 60 = 338688000 bit
338688000 / 8 / 1024 / 1024 = 40M byte比特率:采样频率 x 采样精度 x 通道数= 44100 x 16 x2 = 1411200 bit/s

可以看到,如果不做压缩,站控空间还是很多的


http://www.ppmy.cn/news/639913.html

相关文章

Power Query 系列 (13) - 自定义函数

本篇博客介绍 Power Query 自定义函数的技巧,在 PQ 中计算个税。 以工资类所得应交个税为例,最新的个税起征点为 5000 并按下表的级次进行缴税(假设没有其它扣除项)。 对照税率表,我们先看看手工如何计算。比如 xxx…

Tiny4412 LCD驱动(FB)

0 前言 本文重点分析Tiny4412官方内核linux-3.5.0中的LCD驱动,其中关键内核配置如下: CONFIG_FB=y CONFIG_FB_S3C=y CONFIG_FB_S3C_NR_BUFFERS=3 相关:《SMDK2440 LCD驱动(FB)》、《SMDK6410 LCD驱动(FB)》、《Tiny4412 LCD驱动(DRM)》、《NanoPC-T4 LCD驱动(eDP)…

【MySQL Shell】8.4 部署 InnoDB ClusterSet

按照以下步骤部署沙盒或生产 InnoDB ClusterSet 部署。沙盒部署是所有 MySQL 服务器实例和其他软件在一台机器上运行的地方。对于生产部署,服务器实例和其他软件位于不同的计算机上。 此过程假设您已经拥有 第 8.1 节 “InnoDB ClusterSet 的要求” 中列出的以下组…

Tiny 4412 lcd 驱动分析

1. 和其它内核代码类似。 显示驱动的分析都是由 drivers/video/fbmem.c开始,fbmem.c是显示驱动的抽象,实际只是一个框架性的东西。 fbmem_init 中实现了一个字符设备驱动,并创建了class,但是没有生成设备文件。 这个字符设备驱动的…

普华永道调查显示,近四分之三的CEO认为未来12个月全球经济增长将会放缓 | 美通社头条...

美通社消息:普华永道(PwC)第26次年度全球CEO调查显示,近四分之三(73%)的CEO认为未来12个月全球经济增长将会放缓。这是在2022年10月和11月对105个国家和地区的4410名CEO进行的调查。 此次CEO看衰经济前景是…

4410 吃鸡蛋(模拟)

1. 问题描述: 小明家里有 n 个鸡蛋,每天早上,小明都要吃 1 个鸡蛋作为早餐。小明家里还有一个母鸡。母鸡会在第 m,2m,3m ... 天的晚上下蛋,每次只下 1 个蛋,请问连续多少天以后,小明…

马化腾2021年薪为4410万元,同比下降25%;淘宝支持修改账号名;Rust 1.60.0发布|极客头条

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&…

2018年个人所得税Excel计算公式

iamlaosong文 虽然抵扣方案还没有出来,但10月份开始个税起征点提高到5000,各档税率如下: 级数征税工资税率速算(%)扣除数10-30003023000-1200010210312000-25000201410425000-35000252660535000-550003044…