音视频学习(十二、AAC格式介绍)

news/2024/11/30 1:46:47/

每次都普及这些基础的时候,都是要转载别人的文章,因为我也不熟,也是一边学习一边记录学习的过程,这些基础知识都是需要补的。

转载链接:AAC ADTS格式分析

12.1 AAC基本介绍

AAC音频格式:Advanced Audio Coding(高级音频解码),是一种由MPEG—4标准定义的有损音频压缩格式,由Fraunhofer发展,Dolby,Sony和AT&T是主要贡献者。

AAC音频格式有ADIF和ADTS:
ADIF:Audio Data Interchange format音频数据交换格式。这种格式的特征是可以确定的找到这个音频数据的开始,不需要进行在音频数据流中间开始解码,即它的解码必须在明确定义的开始处进行。故这种格式常用在磁盘文件中。

ADTS:Audio Data Transport Stream 音频数据传输流。这种格式的特征是它是一个有同步字的比特流,解码可以在这个流中任何位置开始。它的特征类似于mp3数据流格式。

简单说:ADTS可以在任意帧解码,也就是说它每一帧都有头信息。ADIF只有一个统一的头,所以必须得到所有的数据后解码。且这两种的header的格式也是不同的,目前一般编码后和抽取出来的都是ADTS格式的音频流。

在这里插入图片描述

有的时候当你编码AAC裸流的时候,会遇到写出来的AAC文件并不能在PC和手机上播放,很大的可能就是AAC文件的每一帧里缺少了ADTS头信息文件的包装拼接。

只需要加入头文件ADTS即可。一个AAC原始数据块长度是可变的,对原始帧加上ADTS头进行ADTS的封装,就形成了ADTS帧。

12.2 ADTS介绍

AAC音频文件的每一帧由ADTS Header和AAC Audio Data组成。结构体如下:
在这里插入图片描述

每一帧的ADTS的头文件都包含了音频的采样率,声道,帧长度等信息,这样解码器才能解析读取。
一般情况下ADTS的头信息都是7个字节,分为2部分:

  1. adts_fixed_header();
  2. adts_variable_header();

其一为固定头信息,紧接着是可变头信息。固定头信息中的数据每一帧都相同,而可变头信息则在帧与帧之间可变。
在这里插入图片描述

syncword :同步头 总是0xFFF, all bits must be 1,代表着一个ADTS帧的开始

ID:MPEG标识符,0标识MPEG-4,1标识MPEG-2

Layer:always: ‘00’

protection_absent:表示是否误码校验。Warning, set to 1 if there is no CRC and 0 if there is CRC

profile:表示使用哪个级别的AAC,如01 Low Complexity(LC)— AAC LC。有些芯片只支持AAC LC 。

MPEG-2 AAC中定义了3种:
在这里插入图片描述
profile的值等于 Audio Object Type的值减1
profile = MPEG-4 Audio Object Type - 1
在这里插入图片描述

#define FF_PROFILE_AAC_MAIN 0
#define FF_PROFILE_AAC_LOW  1
#define FF_PROFILE_AAC_SSR  2
#define FF_PROFILE_AAC_LTP  3
#define FF_PROFILE_AAC_HE   4
#define FF_PROFILE_AAC_HE_V2 28
#define FF_PROFILE_AAC_LD   22
#define FF_PROFILE_AAC_ELD  38
#define FF_PROFILE_MPEG2_AAC_LOW 128
#define FF_PROFILE_MPEG2_AAC_HE  131

sampling_frequency_index:表示使用的采样率下标,通过这个下标在 Sampling Frequencies[ ]数组中查找得知采样率的值。
在这里插入图片描述

channel_configuration: 表示声道数,比如2表示立体声双声道
在这里插入图片描述

0: Defined in AOT Specifc Config
1: 1 channel: front-center
2: 2 channels: front-left, front-right
3: 3 channels: front-center, front-left, front-right
4: 4 channels: front-center, front-left, front-right, back-center
5: 5 channels: front-center, front-left, front-right, back-left, back-right
6: 6 channels: front-center, front-left, front-right, back-left, back-right, LFE-channel
7: 8 channels: front-center, front-left, front-right, side-left, side-right, back-left, back-right, LFE-channel
8-15: Reserved

接下来看下adts_variable_header();
在这里插入图片描述

frame_length : 一个ADTS帧的长度包括ADTS头和AAC原始流.
frame length, this value must include 7 or 9 bytes of header length:
aac_frame_length = (protection_absent == 1 ? 7 : 9) + size(AACFrame)
protection_absent=0时, header length=9bytes
protection_absent=1时, header length=7bytes

adts_buffer_fullness:0x7FF 说明是码率可变的码流。

number_of_raw_data_blocks_in_frame:表示ADTS帧中有number_of_raw_data_blocks_in_frame + 1个AAC原始帧。所以说number_of_raw_data_blocks_in_frame == 0 表示说ADTS帧中有一个AAC数据块。

12.2 AAC实例解析

下面是ADTS的AAC文件部分:
在这里插入图片描述
第一帧的帧头7个字节为:0xFF 0xF1 0x4C 0x40 0x20 0xFF 0xFC
分析各个关键数值:
111111111111 (syncword)
0 (ID: 0:MPEG-4)
00 (Layer: 总是00)
1 (protection_absent:表示是否误码校验)
01 (profile: 01:ACC LC)
0011 (sampling_frequency_index:采样频率)
0 (private_bit)
001 (channel_configuration:声道)
0 (original_copy)
0 (home)
0 (copyright_id_bit)
0 (copyright_id_start)
0000100000111 (帧长度)
11111111111 (adts_buffer_fullness:0x77表示可变码流)
00 (number_of_raw_data_blocks_in_frame )

计算帧长度:将二进制 0000100000111 转换成十进制为263。观察第一帧的长度确实为263个字节。

计算方法:(帧长度为13位,使用unsigned int来存储帧长数值)

unsigned int getFrameLength(unsigned char* str)
{if ( !str ){return 0;}unsigned int len = 0;int f_bit = str[3];int m_bit = str[4];int b_bit = str[5];len += (b_bit>>5);len += (m_bit<<3);len += ((f_bit&3)<<11);return len;
}

还是大神分析的比较详细,今天又学习到了,音视频学习后面的路还很长。


http://www.ppmy.cn/news/805864.html

相关文章

货仓选址----贪心1 (爱思创)

题目描述 在一条数轴上有 N 家商店&#xff0c;它们的坐标分别为 A1​∼AN​。 现在需要在数轴上建立一家货仓&#xff0c;每天清晨&#xff0c;从货仓到每家商店都要运送一车商品。 为了提高效率&#xff0c;求把货仓建在何处&#xff0c;可以使得货仓到每家商店的距离之和最小…

LinuxCP插件virtio与内核vhost

以下为LCP创建的接口对&#xff0c;VPP侧为物理接口port7&#xff0c;映射到Linux侧的为虚拟接口hostap1&#xff0c;接口hostap1作为vhost的后端存在。VPP侧接口tap1为前端的virtio接口。 vpp# show lcp itf-pair: [0] port7 tap1 hostap1 24 type tap vdp# vdp# show interf…

HTML特殊符号表示方法

个人总结&#xff0c;不便记忆&#xff0c;便于查找&#xff0c;希望帮到大家 &#xff08; &#xff09;空格符&#xff1a;&nbsp&#xff1b; &#xff08;<&#xff09;小于号: &It&#xff1b; &#xff08;>&#xff09;大于号&#xff1a; &gt&#…

‘font-weight’属性

字体粗细&#xff1a;‘font-weight’属性 名称&#xff1a; font-weight 取值&#xff1a; normal | bold | bolder | lighter | 100 | 200 | 300 | 400 | 500 | 600 | 700 | 800 | 900 初始&#xff1a; normal 适用于&#xff1a; 所有元素 继承&#xff1a; 是 百分比&a…

Latex符号对照表

感谢博主的总结&#xff0c;这里转载方便自己平时快速找到。 一些基本符号大全&#xff1a;https://blog.csdn.net/zgj926503/article/details/52757631?ops_request_misc%257B%2522request%255Fid%2522%253A%2522160189222519724836739518%2522%252C%2522scm%2522%253A%25222…

Html 中的特殊符号表示

Html 中的特殊符号表示 字符十进制转义字符"&quot;&&amp;<<<>>>不断开空格(non-breaking space) HTML特殊转义字符对照表 字符十进制转义字符字符十进制转义字符字符十进制转义字符?¡¡&Aacute;&aacute;&#xffe0;&#…

各种透明玻璃厚度测量,双边对射厚度测量,玻璃测厚传感器

深圳立仪科技有限公司成立于 2014 年&#xff0c;现位于深圳市国际低碳城&#xff0c;是一家以精密光学检测为主业的民营高科技企业&#xff0c;光谱共焦位移传感器及其应用配套为主推产品 立仪科技的关键研发人员在激光位移测量、3D 扫描领域有十几年的经验&#xff0c;发现光…