音频-WAV数据格式

news/2024/11/2 2:23:30/

(转:https://www.jianshu.com/p/947528f3dff8)

(转多媒体文件格式(五):PCM / WAV 格式 - 灰色飘零 - 博客园)

(读取wave文件配置信息 - stdtrekman - 博客园)

1.概述

Waveform Audio File FormatWAVE,又或者是因为WAV后缀而被大众所知的),它采用RIFF(Resource Interchange File Format)文件格式结构。通常用来保存PCM格式的原始音频数据,所以通常被称为无损音频。但是严格意义上来讲,WAV也可以存储其它压缩格式的音频数据。

2.格式解析

WAV文件遵循RIFF规则,其内容以区块(chunk)为最小单位进行存储。WAV文件一般由3个区块组成:RIFF chunkFormat chunkData chunk。另外,文件中还可能包含一些可选的区块,如:Fact chunkCue points chunkPlaylist chunkAssociated data list chunk等。
本文将只介绍RIFF chunkFormat chunkData chunk

(1--若Format Chunk的size大小为18,则该模块的最后两个字节为附加信息)

(WAVE文件一般有四种块,它们依次是:RIFF块、格式块、附加块(可选),数据块)

2.1 RIFF区块

名称偏移地址字节数端序内容
ID0x004Byte大端'RIFF' (0x52494646)
Size0x044Byte小端fileSize - 8
Type0x084Byte大端'WAVE'(0x57415645)

****

  • 'RIFF'为标识
  • Size是整个文件的长度减去IDSize的长度
  • TypeWAVE表示后面需要两个子块:Format区块和Data区块

***

2.2 FORMAT区块

名称偏移地址字节数端序内容
ID0x004Byte大端'fmt ' (0x666D7420)
Size0x044Byte小端16
AudioFormat0x082Byte小端音频格式
NumChannels

0x0A

2Byte小端声道数
SampleRate0x0C4Byte小端采样率
ByteRate0x104Byte小端每秒数据字节数
BlockAlign0x142Byte小端数据块对齐
BitsPerSample0x162Byte小端采样位数

****

  • 'fmt '为标识
  • Size表示该区块数据的长度(不包含IDSize的长度)
  • AudioFormat表示Data区块存储的音频数据的格式,PCM音频数据的值为1
  • (展开讨论:)
  • NumChannels表示音频数据的声道数,1:单声道,2:双声道
  • SampleRate表示音频数据的采样率
  • ByteRate每秒数据字节数 = SampleRate * NumChannels * BitsPerSample / 8
  • BlockAlign每个采样所需的字节数 = NumChannels * BitsPerSample / 8
  • BitsPerSample每个采样存储的bit数,8:8bit,16:16bit,32:32bit


***

2.3 DATA区块

名称偏移地址字节数端序内容
ID0x004Byte大端'data' (0x64617461)
Size0x044Byte小端N
Data0x08N_Byte小端音频数据
  • 'data'为标识
  • Size表示音频数据的长度,N = ByteRate * seconds
  • Data音频数据
  • (ByteRate ===每秒数据字节数 )

 ********************

所谓的大端模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;
所谓的小端模式,是指数据的低位保存在内存的低地址中,而数据的高位保存在内存的高地址中。

 ********************

PCM数据在WAV文件中的bit位排列方式

PCM数据类型采样采样
8Bit 单声道声道0声道0
8Bit 双声道声道0声道1
16Bit 单声道声道0低位,声道0高位声道0低位,声道0高位
16Bit 双声道声道0低位,声道0高位声道1低位,声道1高位

(上表似乎有问题,不确定,看下图,应该更准确)
 

如果是单声道的文件,采样数据按时间的先后顺序依次存入。如果是单声道的音频文件,采样数据按时间的先后顺序依次存入(也可能采用 LRLRLR 方式存储,只是另一个声道的数据为 0)。

如果是双声道的话通常按照 LRLRLR 的方式存储,存储的时候还和机器的大小端有关。(关于字节序大小端的相关内容可参考《字节序问题之大小端模式讲解》进行了解)

PCM的存储方式为小端模式,存储Data数据排列如下图所示:

描述 PCM 音频数据的参数的时候有如下描述方式:
44100HZ 16bit stereo: 每秒钟有 44100 次采样, 采样数据用 16 位(2 字节)记录, 双声道(立体声)
22050HZ 8bit  mono: 每秒钟有 22050 次采样, 采样数据用 8 位(1 字节)记录, 单声道
48000HZ 32bit 51ch: 每秒钟有 48000 次采样, 采样数据用 32 位(4 字节浮点型)记录, 5.1 声道

44100Hz 指的是采样率,它的意思是每秒取样 44100 次。采样率越大,存储数字音频所占的空间就越大。

16bit 指的是采样精度,意思是原始模拟信号被采样后,每一个采样点在计算机中用 16 位(两个字节)来表示。采样精度越高越能精细地表示模拟信号的差异。

Stereo 指的是声道数,也即采样时用到的麦克风的数量,麦克风越多就越能还原真实的采样环境(当然麦克风的放置位置也是有规定的)

***********************************************

WAV 是 Microsoft 和 IBM 为 PC 开发的一种声音文件格式,它符合 RIFF(Resource Interchange File Format)文件规范,用于保存 Windows 平台的音频信息资源,被 Windows 平台及其应用程序所广泛支持。WAVE 文件通常只是一个具有单个 “WAVE” 块的 RIFF 文件,该块由两个子块(”fmt” 子数据块和 ”data” 子数据块),它的格式如下图所示:

****

WAV 格式定义

该格式的实质就是在 PCM 文件的前面加了一个文件头,每个字段的的含义如下:

typedef struct 
{char          ChunkID[4]; //内容为"RIFF"unsigned long ChunkSize;  //存储文件的字节数(不包含ChunkID和ChunkSize这8个字节)char          Format[4];  //内容为"WAVE“
} WAVE_HEADER;
typedef struct 
{char           Subchunk1ID[4]; //内容为"fmt"unsigned long  Subchunk1Size;  //存储该子块的字节数(不含前面的Subchunk1ID和Subchunk1Size这8个字节)unsigned short AudioFormat;    //存储音频文件的编码格式,例如若为PCM则其存储值为1。unsigned short NumChannels;    //声道数,单声道(Mono)值为1,双声道(Stereo)值为2,等等unsigned long  SampleRate;     //采样率,如8k,44.1k等unsigned long  ByteRate;       //每秒存储的bit数,其值 = SampleRate * NumChannels * BitsPerSample / 8unsigned short BlockAlign;     //块对齐大小,其值 = NumChannels * BitsPerSample / 8unsigned short BitsPerSample;  //每个采样点的bit数,一般为8,16,32等。
} WAVE_FMT;

typedef struct 
{char          Subchunk2ID[4]; //内容为“data”unsigned long Subchunk2Size;  //接下来的正式的数据部分的字节数,其值 = NumSamples * NumChannels * BitsPerSample / 8
} WAVE_DATA;

*******************

WAV 文件头解析

这里是一个 WAVE 文件的开头 72 字节,字节显示为十六进制数字:

52 49 46 46 | 24 08 00 00 | 57 41 56 45
66 6d 74 20 | 10 00 00 00 | 01 00 02 00 
22 56 00 00 | 88 58 01 00 | 04 00 10 00
64 61 74 61 | 00 08 00 00 | 00 00 00 00 
24 17 1E F3 | 3C 13 3C 14 | 16 F9 18 F9
34 E7 23 A6 | 3C F2 24 F2 | 11 CE 1A 0D

 字段解析如下图:***

*********** 


http://www.ppmy.cn/news/361264.html

相关文章

WAV文件格式

WAV为微软公司(Microsoft)开发的一种声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持,该格式也支持MSADPCM,…

Wave(.wav)文件格式

Wave文件格式主要是用来存储音频PCM数据的,其实也可以存储非PCM音频数据,这种情况我们就不考虑了。文件的扩展名为“.wav”,采用RIFF文件结构。 一、RIFF文件格式简介 1、RIFF文件是由一个一个的chunk组成的,并且chunk之间可以嵌…

WAV格式详解

概述 WAV即WAVE,是经典的Windows音频数据封装格式,由Microsoft开发。数据本身格式为PCM,也可以支持一些编码格式的数据,比如最近流行的AAC编码。如果是PCM,则为无损格式,文件会比较大,并且大小…

音频存储格式wav介绍与解析

音频格式 音频格式中 规定了使用多少 bits 来对信号进行编码。 无压缩的格式无损压缩有损压缩 1. wav 音频格式介绍 微软 和 IBM 于 1991 年 提出的资源交换的文件格式 RIFF( resource interchange File Format); wav 是 属于RIFF 中的一…

wav音频文件格式

在做音频信号采集或音频信号分析时会经常遇到wav格式的文件,本章将介绍wav文件的格式。wav是基于资源交换文件格式(RIFF(Resource Interchange File Format))的应用之一。RIFF是一种带标签的文件结构,其可以…

wav数据格式详解

1. 音频简介 经常见到这样的描述: 44100HZ 16bit stereo 或者 22050HZ 8bit mono 等等. 44100HZ 16bit stereo: 每秒钟有 44100 次采样, 采样数据用 16 位(2字节)记录, 双声道(立体声); 22050HZ 8bit mono: 每秒钟有 22050 次采样, 采样数据用 8 位(1字节)记录, 单声道; 当然…

WAV音频文件

WAV音频文件 象棋小子 1048272975 WAV是一种保存音频信息的文件格式,广泛应用于Windows及其应用程序中,如今主流的音频播放器都支持WAV音频文件的播放。 1. WAV音频格式 WAV是录音时用的标准Windows文件格式,文件扩展名为”.wav”&…

WAV格式文件分析

WAV格式文件分析 目录 WAV格式文件分析概述一、WAV格式文件1、波形声音文件格式 WAV2、音频文件参数简介 二、文件结构1、WAV文件的文件头2、WAV文件的数据体 三、WAV格式文件数据体结构1、RIFF Chunk区块2、Format Chunk区块3、DATA区块 总结 参考及引用材料 概述 WAV格式目前…