WAV文件格式分析

news/2024/11/2 4:34:43/

一. RIFF概念

在Windows环境下,大部分的多媒体文件都依循着一种结构来存放信息,这种结构称为"资源互换文件格式"(Resources lnterchange File Format),简称RIFF。例如声音的WAV文件、视频的AV1文件等等均是由此结构衍生出来的。RIFF可以看做是一种树状结构,其基本构成单位为chunk,犹如树状结构中的节点,每个chunk由"辨别码"、"数据大小"及"数据"所组成。

块的标志符(4BYTES)

数据大小 (4BYTES)

数据

                               图一、 块的结构示意图

辨别码由4个ASCII码所构成,数据大小则标示出紧跟其后数据的长度(单位为Byte),而数据大小本身也用掉4个Byte,所以事实上一个chunk的长度为数据大小加8。一般而言,chunk本身并不允许内部再包含chunk,但有两种例外,分别为以"RIFF"及"L1ST"为辨别码的chunk。而针对此两种chunk,RIFF又从原先的"数据"中切出4个Byte。 此4个Byte称为"格式辨别码",然而RIFF又规定文件中仅能有一个以"RIFF"为辨别码的chunk。

RIFF/LIST标志符

数据1大小

数据1

格式/列表类型

数据

                               图二、RIFF/LIST块结构

只要依循此一结构的文件,我们均称之为RIFF档。此种结构提供了一种系统化的分类。如果和MS一DOS文件系统作比较,"RIFF"chunk就好比是一台硬盘的根目录,其格式辨别码便是此硬盘的逻辑代码(C:或D:),而"L1ST"chunk即为其下的子目录,其他的chunk则为一般的文件。至于在RIFF文件的处理方面,微软提供了相关的函数。视窗下的各种多媒体文件格式就如同在磁盘机下规定仅能放怎样的目录,而在该目录下仅能放何种数据。

二. WAV文件格式

WAVE文件是非常简单的一种RIFF文件,它的格式类型为"WAVE"。RIFF块包含两个子块,这两个子块的ID分别是"fmt"和"data",其中"fmt"子块由结构PCMWAVEFORMAT所组成,其子块的大小就是sizeofof(PCMWAVEFORMAT),数据组成就是PCMWAVEFORMAT结构中的数据。

标志符(RIFF)

数据大小

格式类型("WAVE")

"fmt"

Sizeof(PCMWAVEFORMAT)

PCMWAVEFORMAT

"data"

声音数据大小

声音数据

图三、WAVE文件结构

PCMWAVEFORMAT结构定义如下:

Typedef struct
... {
     WAVEFORMAT wf;       
/
波形格式;
     WORD wBitsPerSample;   
//WAVE文件的采样大小;

}
PCMWAVEFORMAT;

//WAVEFORMAT结构定义如下:

typedef struct
... {
     WORD wFormatag;       
//编码格式,包括WAVE_FORMAT_PCM,WAVEFORMAT_ADPCM等

     WORD nChannls;        //声道数,单声道为1,双声道为2;
     DWORD nSamplesPerSec;    //采样频率;
     DWORD nAvgBytesperSec;    //每秒的数据量;
      WORD nBlockAlign;        //块对齐;
}
WAVEFORMAT;

"data"子块包含WAVE文件的数字化波形声音数据,其存放格式依赖于"fmt"子块中wFormatTag成员指定的格式种类,在多声道WAVE文件中,样本是交替出现的。如16bit的单声道WAVE文件和双声道WAVE文件的数据采样格式分别如图四所示:

16位单声道:

采样一

采样二

……

低字节

高字节

低字节

高字节

……

16位双声道:

采样一

……

左声道

右声道

……

低字节

高字节

低字节

高字节

……

                             图四、WAVE文件数据采样格式

WAV文件格式实例分析:

0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F

00000000H

00000010H

00000020H

00000030H

00000040H

52  49  46  46  0A 06  01  00  57  41  56  45  66  6D 74  20

12  00  00  00  01  00  02  00  44  AC 00 00  10  B1  02  00

04  00  10  00  00  00  66  61  63  74  04  00  00  00  76  41

00  00  64  61  74  61  D8  05  01  00 00  00  00  00  FF  FF

00  00  FE FF FE FF  00  00  00  00 FE  FF FE FF  00  00

偏移地址

字节数

数据类型

内容

文件头

00H

4

char

“RIFF”;   RIFF标志

04H

4

long int

0x00 01 06 0A(注意数据存储顺序);   文件长度

08H

4

char

“WAVE”;   WAVE标志

0CH

4

char

“fmt ”;   fmt标志,最后一位为空

10H

4

long int

0x12;   sizeof(PCMWAVEFORMAT)

14H

2

int

1WAVE_FORMAT_PCM格式类别,1表示为PCM形式的声音数据

16H

2

int

2;  通道数,单声道为1,双声道为2

18H

2

int

44100;  采样频率(每秒样本数)

1CH

4

long int

0x10B10000;   每秒数据量;其值为通道数×每秒数据位数×每样本的数据位数/8。播放软件利用此值可以估计缓冲区的大小。

20H

2

int

数据块的调整数(按字节算的),其值为通道数×每样本的数据位值/8。播放软件需要一次处理多个该值大小的字节数据,以便将其值用于缓冲区的调整。

22H

2

每样本的数据位数,表示每个声道中各个样本的数据位数。如果有多个声道,对每个声道而言,样本大小都一样。

50H

4

char

“data”;   数据标记符

54H

4

long int

0x00 01 05 D8;   语音数据大小


http://www.ppmy.cn/news/361251.html

相关文章

音频之WAV格式编码解析

学习目标: 音频之WAV格式编码解析 学习内容: 介绍 WAV是最常见的声音文件格式之一,wav文件分为两个部分,第一个部分是wav头文件,第二个部分是PCM编码的音频数据部分。是微软公司专门为Windows开发的一种标准数字音频…

【计算摄影学】总目录

1.数码相机 《数码相机中的图像传感器和信号处理》和《光与赢的魔幻乐园有趣的透镜》 1.1 数码相机概览 1.2 数码相机中光学系统 2.图像传感器 《数码相机中的图像传感器和信号处理》和《智能cmos图像传感器与应用》 2.1 图像传感器基础知识 2.2 CCD图像传感器 2.3 CMOS图像…

Java中的动态链接VS操作系统动态链接

在操作系统OS中为了优化内存的使用会采用一种动态链接方式,一个文件想要在操作系统中运行必须经过编译、汇编译、链接、装载等步骤。可以参考Java程序是怎么跑起来的。本篇主要讲解Java栈帧中动态链接部分与操作系统的的动态链接的区别与联系 操纵系统为什么需要动态…

防雷抗浪涌插排插座推荐,同为科技(TOWE)防雷桌面PDU安全可靠

同为科技TOWE双排防雷抗浪涌桌面PDU插座 随着夏天天气越来越热,强对流天气增多,雷雨天气频发。在雷电季节,通常影响家用电器安全的主要原因是由于雷电感应的侵入,特别是对绝缘强度低、过电压耐受力差的微电子产品影响甚大。而所谓…

遍历JSON将字符放入数组中

处理JSON:function traverseJSON(obj, arr) {for (var key in obj) {if (typeof obj[key] string) {arr.push(obj[key]);} else if (typeof obj[key] object) {traverseJSON(obj[key], arr);}} }traverseJSON({}, [])遍历数组查找下标: function compa…

大数据技术Flink详解

一、有状态的流式处理 Apache Flink 是一个分布式流处理器,具有直观和富有表现力的API,可实现有状态的流处理应用程序。它以容错的方式有效地大规模运行这些应用程序。Flink 于2014 年4 月加入Apache 软件基金会作为孵化项目,并于2015 年1 月成为顶级项目。从一开始,Flink …

Google 程序员都是怎么研究 AI 的?

作者 | 赵敏 责编 | 郭芮 9 月 20 日-10 月 7 日,谷歌AI体验展在上海龙美术馆(西岸馆)展出。谷歌总共展出了 17 个互动项目,和九月底人工智能大会上谷歌介绍的项目有一些重叠,也有一些区别。这次体验展没有背后的技术原…

思科九年(转载自Internet)

第1节:思科九年(1) 序 南半球的二月是盛夏。这里白天的阳光炽烈而持久,四处都是耀眼的惨白。电视里的广告说皮肤癌是这个国家的国癌,提醒人们小心这厉害的阳光:要穿长袖的衣服待在阴凉的地方,要戴墨镜涂防晒霜。即便如…