每次都普及这些基础的时候,都是要转载别人的文章,因为我也不熟,也是一边学习一边记录学习的过程,这些基础知识都是需要补的。
转载链接:AAC ADTS格式分析
12.1 AAC基本介绍
AAC音频格式:Advanced Audio Coding(高级音频解码),是一种由MPEG—4标准定义的有损音频压缩格式,由Fraunhofer发展,Dolby,Sony和AT&T是主要贡献者。
AAC音频格式有ADIF和ADTS:
ADIF:Audio Data Interchange format音频数据交换格式。这种格式的特征是可以确定的找到这个音频数据的开始,不需要进行在音频数据流中间开始解码,即它的解码必须在明确定义的开始处进行。故这种格式常用在磁盘文件中。
ADTS:Audio Data Transport Stream 音频数据传输流。这种格式的特征是它是一个有同步字的比特流,解码可以在这个流中任何位置开始。它的特征类似于mp3数据流格式。
简单说:ADTS可以在任意帧解码,也就是说它每一帧都有头信息。ADIF只有一个统一的头,所以必须得到所有的数据后解码。且这两种的header的格式也是不同的,目前一般编码后和抽取出来的都是ADTS格式的音频流。
有的时候当你编码AAC裸流的时候,会遇到写出来的AAC文件并不能在PC和手机上播放,很大的可能就是AAC文件的每一帧里缺少了ADTS头信息文件的包装拼接。
只需要加入头文件ADTS即可。一个AAC原始数据块长度是可变的,对原始帧加上ADTS头进行ADTS的封装,就形成了ADTS帧。
12.2 ADTS介绍
AAC音频文件的每一帧由ADTS Header和AAC Audio Data组成。结构体如下:
每一帧的ADTS的头文件都包含了音频的采样率,声道,帧长度等信息,这样解码器才能解析读取。
一般情况下ADTS的头信息都是7个字节,分为2部分:
- adts_fixed_header();
- adts_variable_header();
其一为固定头信息,紧接着是可变头信息。固定头信息中的数据每一帧都相同,而可变头信息则在帧与帧之间可变。
syncword :同步头 总是0xFFF, all bits must be 1,代表着一个ADTS帧的开始
ID:MPEG标识符,0标识MPEG-4,1标识MPEG-2
Layer:always: ‘00’
protection_absent:表示是否误码校验。Warning, set to 1 if there is no CRC and 0 if there is CRC
profile:表示使用哪个级别的AAC,如01 Low Complexity(LC)— AAC LC。有些芯片只支持AAC LC 。
在MPEG-2 AAC中定义了3种:
profile的值等于 Audio Object Type的值减1
profile = MPEG-4 Audio Object Type - 1
#define FF_PROFILE_AAC_MAIN 0
#define FF_PROFILE_AAC_LOW 1
#define FF_PROFILE_AAC_SSR 2
#define FF_PROFILE_AAC_LTP 3
#define FF_PROFILE_AAC_HE 4
#define FF_PROFILE_AAC_HE_V2 28
#define FF_PROFILE_AAC_LD 22
#define FF_PROFILE_AAC_ELD 38
#define FF_PROFILE_MPEG2_AAC_LOW 128
#define FF_PROFILE_MPEG2_AAC_HE 131
sampling_frequency_index:表示使用的采样率下标,通过这个下标在 Sampling Frequencies[ ]数组中查找得知采样率的值。
channel_configuration: 表示声道数,比如2表示立体声双声道
0: Defined in AOT Specifc Config
1: 1 channel: front-center
2: 2 channels: front-left, front-right
3: 3 channels: front-center, front-left, front-right
4: 4 channels: front-center, front-left, front-right, back-center
5: 5 channels: front-center, front-left, front-right, back-left, back-right
6: 6 channels: front-center, front-left, front-right, back-left, back-right, LFE-channel
7: 8 channels: front-center, front-left, front-right, side-left, side-right, back-left, back-right, LFE-channel
8-15: Reserved
接下来看下adts_variable_header();
frame_length : 一个ADTS帧的长度包括ADTS头和AAC原始流.
frame length, this value must include 7 or 9 bytes of header length:
aac_frame_length = (protection_absent == 1 ? 7 : 9) + size(AACFrame)
protection_absent=0时, header length=9bytes
protection_absent=1时, header length=7bytes
adts_buffer_fullness:0x7FF 说明是码率可变的码流。
number_of_raw_data_blocks_in_frame:表示ADTS帧中有number_of_raw_data_blocks_in_frame + 1个AAC原始帧。所以说number_of_raw_data_blocks_in_frame == 0 表示说ADTS帧中有一个AAC数据块。
12.2 AAC实例解析
下面是ADTS的AAC文件部分:
第一帧的帧头7个字节为:0xFF 0xF1 0x4C 0x40 0x20 0xFF 0xFC
分析各个关键数值:
111111111111 (syncword)
0 (ID: 0:MPEG-4)
00 (Layer: 总是00)
1 (protection_absent:表示是否误码校验)
01 (profile: 01:ACC LC)
0011 (sampling_frequency_index:采样频率)
0 (private_bit)
001 (channel_configuration:声道)
0 (original_copy)
0 (home)
0 (copyright_id_bit)
0 (copyright_id_start)
0000100000111 (帧长度)
11111111111 (adts_buffer_fullness:0x77表示可变码流)
00 (number_of_raw_data_blocks_in_frame )
计算帧长度:将二进制 0000100000111 转换成十进制为263。观察第一帧的长度确实为263个字节。
计算方法:(帧长度为13位,使用unsigned int来存储帧长数值)
unsigned int getFrameLength(unsigned char* str)
{if ( !str ){return 0;}unsigned int len = 0;int f_bit = str[3];int m_bit = str[4];int b_bit = str[5];len += (b_bit>>5);len += (m_bit<<3);len += ((f_bit&3)<<11);return len;
}
还是大神分析的比较详细,今天又学习到了,音视频学习后面的路还很长。