搜索
您的当前位置:首页正文

多媒体文件格式分析

来源:知库网
多媒体技术基础作业

引言

随着多媒体信息处理技术的发展,计算机数据处理能力的增强,音频处理技术受到重视,语音文件的应用也越来越广泛。而语音文件的存储格式又是多种多样的,为了充分利用各种语音工具的特点,以及在开发软件中使用语音技术,就需要了解它们的格式,从而进行语音格式的相互转换,对语音数据进行处理和播放。在多媒体计算机中,存储声音信息的文件格式主要有WAV文件、VOC文件、MIDI文件、AIF文件、SNO文件及RMI文件等。本文对WAV文件和MIDI文件进行了分析。

1 WAV文件

WAV文件是微软公司(Microsoft)开发的一种声音文件格式,也是多媒体计算机获得声音最直接、最方便的方式。WAV文件是Windows所使用的标准数字音频文件,文件的拓展名是.WAV,记录了对实际声音进行采样的数据。该格式也支持MSADPCM,CCITT A LAW等多种压缩运算法,支持多种音频数字,取样频率和声道,标准格式化的WAV文件和CD格式一样,也是44.1K的取样频率,16位量化数字,因此在声音文件质量和CD相差无几。WAV文件符合RIFF文件规范,用于保存Windows平台的音频信息资源,被Window平台及其应用程序所广泛支持。

1.1 WAV文件的文件头

表1-1 WAV文件的文件头 偏移地址 00H ~03H 04H~07H 08H~0BH 0CH~0FH 10H~13H 14H~15H 16H~17H 18H~1BH 1CH~1FH 20H~21H 22H~23H

字节数 4 4 4 4 4 2 2 4 4 2 2

类型 字符 长整数 字符 字符 整数 整数 整数 长整数 长整数 整数 整数

内容

资源交换文件标志

从下个地址开始到文件尾的总字节数 WAV文件标志 波形格式标志

过滤字节,一般为00000010H

格式种类,值为1,表示数据PCMμ律编码的数据 通道数,单声道为1,双声音为2 采样频率

波形数据传输速率/每秒平均字节数 数据的调整数/按字节计算 样本数据位数

1

多媒体技术基础作业

1.2 WAV文件的数据

WAV文件数据块包含以脉冲编码调制(PCM)格式表示的样本。WAV文件是由样本组织而成的。在单声道WAV文件中,声道0代表左声道,声道1代表右声道。再多声道WAV文件中,样本是交替出现的。

WAV文件的每个样本值包含在一个整数i中,i的长度为容纳指定样本长度所需的最小字节数。首先存储低有效字节,表示样本幅度的位放在i的高有效位上,剩下的位置为0,这样8位和16位的PCM波形样本的数据格式。

WAV文件在压缩后的文件体积过大,相对其他音频格式而言是一个缺点,其文件大小的计算方方式为:

WAV文件每秒的存储量(字节)=取样频率(Hz)X量化位数(位)X声道数/8每一分钟WAV格式的音频文件的大小为10MB,其大小不随音量大小及清晰度的变化而变化。

1.3 WAV文件的特点

WAV音频格式的优点包括:简单的编/解码(几乎直接存储来自模/数转换器(ADC)的信号)、普遍的认同/支持以及无损耗存储。

WAV格式的主要缺点是需要音频存储空间。对于小的存储限制或小带宽应用而言,这可能是一个重要的问题。WAV格式的另外一个潜在缺陷是在32位WAV文件中的2G限制,这种限制已在为SoundForge开发的W64格式中得到了改善。

常见的WAV文件使用PCM无压缩编码,这使WAV文件的质量极高,体积也出奇大,对于PCM WAV,恐怕也只有无损压缩的音频才能和其有相同的质量,平时我们见的什么MP3,WMA(不含 wmalossless)和WAV的质量都是差很远的。这点可以通过频谱看出,即使320kbps的MP3和WAV一比,也要自卑了。

2 MIDI文件

MIDI文件是存放MIDI信息的标准文件格式。MIDI音频是多媒体计算机产生声音的另一种方式,可以满足长时间音乐的需要。由于MIDI文件记录的不是声音本省,因此它比较节省时间。与WAV文件相比,MIDI文件小得多,它并不对音乐进行采样,而是将每个音符记录为一个数字,MIDI标准规定了各种音调的混合及发音,通过输出装置就可以将这些数字重新合成为音乐。

2

多媒体技术基础作业

2.1 MIDI文件的文件头

表2-1 MIDI文件结构

类型 4个字节 类型是的是“MThd”或“MTrk”,长度指的是出去类型和长度两部分外,其他数据占的字节数,数据描述部分是主体,我们现在来一起分析它的结构: 在每个MIDI文件的开头都有如下内容,它们的十六进制代码为: “4d 54 86 64 00 00 00 06 ff ff nn nn dd dd” 前四个是ASCII字符“MThd”是用来鉴别是否是MIDI文件,而随后的四个字节是指明文件头描述部分的字节数,它总是6,所以一定是“00 00 00 06”,以下是剩余部分的含义: ff ff

指定MIDI的格式

00 00单音轨

00 01多音轨,且同步。这是最常见的 00 02多音轨,但不同步

nn nn

指定轨道数

指定基本时间格式类型

dd dd

实际音轨数加上一个全局的音轨

类型1:定义一个四分音符的tick数,tick是MIDI中的最小时间单位

类型2:定义每秒中SMTPE帧的数量及每个SMTPE帧的tick

长度 4个字节 数据 4个字节 2.2 MIDI文件的特点

MIDI文件的优点在于:文件小,易编辑,且节省存储空间,便于储存和携带。MIDI文件不是直接记录乐器的发音,而是记录了演奏乐器的各种信息或指令,如用哪一种乐器,什么时候按某个键,力度怎么样等等,至于播放时发出的声音,那是通过播放软件或者音源的转换而成的。因此MIDI文件通常比声音文件小得多,一首乐曲,只有十几K或几十K,只有声音文件的千分之一左右。

MIDI格式的主要限制是它缺乏重现自然声音的能力,因此不能用在需要语音的场合(这是要与WAV文件合用)。此外,MIDI只能记录标准所规定的有限种乐器的组合,而切回放质量受声卡上芯片的严重限制,难以产生真实的音乐演奏效果。近年国外流行

3

多媒体技术基础作业

的声卡普遍采用波表法进行音乐合成,使MIDI音乐的质量大大提高(效果接近CD音质),但波表卡仍较昂贵,在我国还未普及。

结论

通过对WAV文件及MIDI文件的分析与比较,我对这两种文件格式有了更深入的了解。WAV文件的应用最为广泛,音质也最好,但是压缩后体积过大,需要的存储容量比较大,不适合长时间记录。MIDI 格式记录下的不是声音本身,而是一些描述乐曲演奏过程的指令,通过合成器解释播放,它所占的空间相对WAV非常小,大约只有 1/200-1/1000,MIDI 也更加易于修改和处理,因而比较适合于电脑音乐创作。

随着计算机网络的高速发展,世纪的社会信息化已使社会的经济与发展依赖于信息,多媒体是集文字、图形、图像、声音和影视动画于一体的,具有交互特性的传媒展示综合技术。它是在原有的计算机运算能力的基础上,扩充了数字信号处理器、大容量光盘、触摸屏和其它的外围设备作为系统的基本配置,以多种形式表达、存储和处理信息,充分调动人们耳闻、口述、目睹、手触等多种感觉器官与计算机交互作用,交流信息,使人与计算机的交流更加方便、更加友好。

参考文献

[1] 张力,赵文靖 《山西电子技术》 2007第3期 维普资讯网 [2] 祝谷乔 《多媒体世界》 2000第8期 维普资讯网

[3] 钟玉琢,沈洪等 《多媒体技术基础与应用》 2008年11月 清华大学出版社 [4] 陈学煌 刘永志 《MIDI原理与开发应用》 2008年3月29日 国防工业出版社 [5] 王其云 《媒体与学习》 2003年12月 中国教育出版

4

因篇幅问题不能全部显示,请点此查看更多更全内容

Top