|
【原文来自Billboard中国,原地址已失效】
大多数人的硬盘空间都是有限的,所以部分人选择压缩来节省空间。这里谈到的压缩是指从WAV转换为FLAC、APE、WV,或者从无损(WAV、FLAC、APE、WV)转换为有损(MP3、WMA、AAC、OGG、MP3pro) 。我们不鼓励大家有损转为有损,因为这样会加倍损失音质,得不偿失。
本人的硬盘就属于相对紧缺型,所以个人一般下的无损都要转换成有损的。为了解决我一向对哪个有损格式最好的疑问,今天终于抽出时间,亲自对几大流行编码格式进行简单的比较。
参考素材,我使用了Garth Brooks的Ultimate Hits中的"Ain't Going Down ('Till The Sun Comes Up)"作为参考素材,长度为4:34。
以下所有格式均通过CD转制而成。
下面是WAV即原始CD品质 1411K 41.6M
接下来是无损格式APE
fast编码 960K 31.3M
insane编码 936K 30.6M
接下来是无损格式FLAC
V0编码 1030K 33.5M
V8编码 969K 31.6M
接下来是无损格式WV
正常编码 970K 31.6M
高品质编码 953K 31.1M
个人对无损格式的总结
首先从频谱上面来看,无损格式当真都是无损!波形无任何变化,也完全没有衰竭和失真。基本上可以说WAVE、APE、FLAC、WV的音质相同。
1.WAVE 无疑是最原始的格式,也是本次对比的终极参考物。但是既然能压缩成无损格式,节约20%-50%的大小而音质没有任何损失,那么还是有压缩必要的!
2.APE APE是无损格式中的先驱,也无疑是音乐发烧友的象征,电驴上面很多无损专辑也大多是APE。然而,它没有容错,所以很可能因为小段编码错误造成整条音轨废掉,而且小部分发烧友反应APE有时还会爆音。
3.FLAC 与APE相比,FLAC格式的文件稍微偏大2%-3%,但FLAC优势在于更快的编解码速度,对CPU的运算能力要求也相当低,而且该格式的容错性也很强,即使有小段音乐损坏,也不影响后面的音乐播放。国外音乐论坛一般提供的也都是FLAC。
4.WV WavePack是新兴的无损格式,压缩比介于ape和flac之间,也有容错。在把扩展名改为EXE后双击,可以直接解压出一条WAVE音轨,而不需要任何编码器转换,很神奇。缺点是也只有千千、Foobar等几家微机播放器支持,移动播放器则更貌似是没有一家支持。
无损格式目前来说 个人推荐FLAC
Plus: 关于无损格式的压缩程度问题
大家可以清楚的看到无论编码模式是APE的insane和fast,还是Flac的V0或者V8,生成的文件音质完全相同,只是文件的大小和压缩时间稍微不同而已。
有损格式 MP3 CBR篇
MPEG Layer-3(MP3)是大家熟知的一种数字音频格式,它是VCD的孪生兄弟,相同长度的音乐文件,用MP3格式来存储,一般只有WAV文件的1/10并且音质大体接近CD的水平(指128K的mp3)。其文件尺寸小音质好,在它问世之初没有别种格式可与之匹敌,因此这种格式作为主流音频格式的地位难以被撼动。但是在WMA、AAC、OGG等格式出现后,128K的mp3基本上已经没有人听了,大家更多的是直接要320K的mp3了。
320K 10.4M
256K 8.36M
224K 7.31M
192K 6.27M
128K 4.18M
96K 3.13M
64K 2.08M
有损格式 MP3 VBR篇
所谓MP3 VBR只是mp3 CBR的一个优化版,并非根本上提高了mp3的质量。说白了,就是把声音频率高的地方用高比特率处理,低的地方用低比特率处理。低比特率的地方用的码率小,占的空间自然小,也让媒体大小略小于CBR的文件。
v0编码 实际码率273K 最高码率320K 8.93M
v2编码 实际码率221K 最高码率320K 7.23M
v4编码 实际码率159K 最高码率224K 5.22M
v6编码 实际码率130K 最高码率224K 4.26M
v8编码 实际码率100K 最高码率160K 3.29M
有损格式 WMA篇
WMA的全称是Windows Media Audio,它是微软公司推出的与MP3格式齐名的一种新的音频格式。由于WMA在压缩比和音质方面都超过了MP3,更是远胜于RA(Real Audio),即使在较低的采样频率下也能产生较好的音质。缺点在于码率越低,声音越硬,64K以下出现明显的金属音。
320K 10.4M
256K 8.39M
224K 未压缩成功 暂缺
192K 6.3M
128K 4.2M
96K 3.16M
64K 2.11M
有损格式 AAC篇
AAC是Adpative Audio Coding的缩写,即高级音频编码。目前主要是苹果的MP3支持这一种格式。AAC的主要优点在于它最高支持96KHz的采样频率,还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质。
LC448K编码 实际码率443K 14.5M
LC320K编码 实际码率316K 10.4M
LC256K编码 实际码率253K 8.35M
LC224K编码 实际码率221K 7.31M
LC192K编码 实际码率190K 6.27M
LC128K编码 实际码率126K 4.19M
HE96K编码 实际码率94K 3.13M
HE64K编码 实际码率63K 2.1M
由于此次对比主要是64K以上,下面2个隔开处理
HE48K编码 实际码率47K 1.59M
HE32K编码 实际码率31K 1.06M
有损格式 OGG篇
Ogg全称应该是OGG Vobis,其最出众的特点就是支持多声道。随着它的流行,以后用随身听来听DTS编码的多声道作品将不会是梦想。Ogg Vorbis文件的扩展名是.OGG。这种文件的设计格式是非常先进的。现在创建的OGG文件可以在未来的任何播放器上播放,因此,这种文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。目前大多游戏的配乐,音效很多就是OGG编码的。
q10编码 实际码率499K 16.3M
q9编码 实际码率334K 10.9M
q8编码 实际码率257K 8.41M
q7编码 实际码率225K 7.38M
q6编码 实际码率194K 6.35M
q4编码 实际码率133K 4.35M
q2编码 实际码率93K 3.04M
q0编码 实际码率64K 2.05M
有损格式 Mp3pro篇
mp3PRO就是升级版的mp3 CBR。其本身最大的技术亮点就在于SBR技术,它提供了改善低位率情况下音频和语音编码的性能的可能。这种方法可在指定的位率下增加音频的带宽或改善编码效率。有关资料显示,SBR技术可以改善低数据流量下的高频音质,改善程度约为30%,我们不管这个30%是如何得来的,但可以测试发现这种改善可以让64kbps的mp3达到128kbps的mp3的音质水平。
之所以把Mp3pro放到最后是因为mp3Pro在有损格式中是受支持最差的。Foobar,千千也都要另外下插件才能播放,移动播放器也是没有一家支持。别看扩展名是mp3,貌似所有的播放器都支持。但是由于他们不支持mp3Pro内在的SBR技术,因此只能播放出CBR的效果。
96K 3.13M
64K 2.09M
将上面的频谱图总结一下
个人对有损格式的感觉:
任何有损格式,码率当然都是越高越好。码率高,不仅波形失真小,而且频率的衰减也小。
如果说一定要按照频谱衰竭程度,把有损音频格式排个名的话:(mp3指CBR,AAC指LC)
同等码率下
大于320K OGG、AAC都基本快接近无损
320K OGG=AAC>MP3>WMA
256K OGG>AAC>MP3>WMA
224K OGG>MP3>AAC>WMA
192K OGG>MP3>WMA>AAC
128K OGG>WMA>AAC>MP3
96K AAC(HE)>OGG>WMA>MP3 (OGG此时失真严重,所以听觉上可能AAC(HE)>WMA>OGG>MP3)
64K AAC(HE)>OGG>WMA>MP3 (OGG此时失真严重,所以听觉上可能AAC(HE)>WMA>OGG>MP3)
不等码率下请参照上表交叉对比
另外各种格式都有自己的优势码率范围:
OGG的优势范围:96K以上(OGG)
AAC的优势范围:AAC LC应高于(包含)256K AAC HE 48K-96K(AAC HE真强)
MP3的优势范围:192K(包含)以上
WMA的优势范围:128K(包含)以下
如果你的机器支持,128K(包含)以上请用OGG,64K-96K请用AAC(HE)。
如果你的机器只支持WMA和mp3,192K以上(包含)请用mp3,128K以下(包含)请用WMA。
64K以下什么格式都很衰,所以请至少保留64K以上的码率。
特别说明下:
iTunes商店目前贩卖的是256K VBR的AAC LC
我取了5首做实验
3首的高频超过22Khz
2首的高频在21.5-22Khz之间
也就是说itunes AAC的音质基本上是全线高于320K CBR的Mp3的
单从频率范围来讲:
对于1个理论上的正常人来说,听觉范围大约为50hz-20Khz。那么你的选择为
mp3 CBR 码率高于(包含)224K
wma 码率高于(包含)224K
AAC LC 码率高于(包含)256K AAC HE 码(包含)率高于48K
OGG 码率高于(包含)192K
mp3 Pro 码率高于(包含)80K
mp3 VBR 高频不合格
对于1个普通音乐迷来说,听觉范围大约为1Khz-16Khz。那么你的选择为
mp3 CBR 码率高于(包含)192K
mp3 VBR 码率高于V6编码 即高于128K
wma 码率高于(包含)128K
AAC LC 码率高于(包含)128K AAC HE 码率高于(包含)48K
OGG 码率高于(包含)96K
mp3 Pro 码率高于(包含)56K
当然还有金耳朵们,听觉范围大约为20hz-22Khz。那么你的选择为
首先当然是无损,然后有损里面可以试试:
mp3 CBR 码率高于(包含)224K
wma 码率高于(包含)224K
AAC LC 码率高于(包含)256K AAC HE 码率高于(包含)48K
OGG 码率高于(包含)192K
mp3 Pro 码率高于(包含)80K
mp3 VBR 高频不合格
当然,每个人都有自己的感觉
例如mp3 CBR的低频有点差 所以听古典音乐觉得很生硬等等
这个感觉问题就只有大家自己慢慢体会了!
附:各频率对人耳的刺激即听觉感受
16K~20KHz频率:这段频率范围实际上对于人耳的听觉器官来说,已经听不到了,因为人耳听觉的最高频率是15.1KHz。但是,人可以通过人体和头骨、颅骨将感受到的16~20KHz频率的声波传递给大脑的听觉脑区,因而感受到这个声波的存在。这段频率影响音色的韵味、色彩、感情味。如果音响系统的频率响应范围达不到这个频率范围,那么音色的韵味将会失落;而如果这段频率过强,则给人一种宇宙声的感觉,一种幻觉,一种神秘莫测的感觉,使人有一种不稳定的感觉。因为这些频率大多数是基音的不谐和音频率,所以会产生一种不安定的感受。这段频率在音色当中强度很小,但是很重要,是音色的表现力部分,也是常常被人们忽略的部分,甚至有些人根本感觉不到它的存在。
12K~16KHz频率:这是人耳可以听到的高频率声波,是音色最富于表现力的部分,是一些高音乐器和高音打击乐器的高频泛音频段,例如镲、铃、铃鼓、沙锤、铜刷、三角铁等打击乐器的高频泛音,可给人一种"金光四射"的感觉,强烈地表现了各种乐器的个性。如果这段频率成分不足,则音色将会会失掉色彩,失去个性;而如果这段频率成分过强,如激励器激励过强,音色会产生"毛刺"般尖噪、刺耳的高频噪声,对此频段应给予一定的适当的衰减。
10K~12KHz频率:这是高音木管乐器的高音铜管乐器的高频泛音频段,例如长笛、双簧管、小号、短笛等高音管乐器的金属声非常强烈。如果这段频率缺乏,则音色将会失去光泽,失去个性;如果这段频率过强,则会产生尖噪,刺耳的感觉。
8K~10KHz频率:这段频率s音非常明显,影响音色的清晰度和透明度。如果这频率成分缺少,音色则变得平平淡淡;如果这段频率成分过多,音色则变得尖锐。
6K~8KHz频率:这段频率影响音色的明亮度,这是人耳听觉敏感的频率,影响音色清晰度。如果这段频率成分缺少,则音色会变得暗淡;如果这段频率成分过强,则音色显得齿音严重。
5K~6KHz频率:这段频率最影响语音的清晰度、可懂度。如果这段频率成分不足,则音色显得含糊不清;如果此段频率成分过强,则音色变得锋利,易使人产生听觉上的疲劳感。
4K~5KHz频率:这段频率对乐器的表面响度有影响。如果这段频率成分幅度大了,乐器的响度就会提高;如果这段频率强度变小了,会使人听觉感到这种乐器与人耳的距离变远了;如果这段频率强度提高了,则会使人感觉乐器与人耳的距离变近了。
4KHz频率:这个频率的穿透力很强。人耳耳腔的谐振频率是1K~4KHz所以人耳对这个频率也是非常敏感的。如果空虚频率成分过少,听觉能力会变差,语音显得模糊不清了。如果这个频率成分过强了,则会产生咳声的感觉,例如当收音机接收电台频率不正时,播音员常发出的咳音声。
2K~3KHz频率:这段频率是影响声音明亮度最敏感的频段,如果这段频率成分丰富,则音色的明亮度会增强,如果这段频率幅度不足,则音色将会变得朦朦胧胧;而如果这段频率成分过强,音色就会显得呆板、发硬、不自然.
1K~2KHz频率:这段频率范围通透感明显,顺畅感强。如果这段频率缺乏,音色则松散且音色脱节;如果这段频率过强,音色则有跳跃感。
800Hz频率:这个频率幅度影响音色的力度。如果这个频率丰满,音色会显得强劲有力;如果这个频率不足,音色将会显得松弛,也就是800Hz以下的成分特性表现突出了,低频成分就明显;而如果这个频率过多了,则会产生喉音感。人人都有一个喉腔,人人都有一定的喉音,如果音色中的喉音成分过多了,则会失掉语音的个性、失掉音色美感。因此,音响师把这个频率称为"危险频率",要谨慎使用。
500Hz~1KHz频率:这段频率是人声的基音频率区域,是一个重要的频率范围。如果这段频率丰满,人声的轮廓明朗,整体感好;如果这段频率幅度不足,语音会产生一种收缩感;如果这段频率过强,语音就会产生一种向前凸出的感觉,使语音产生一种提前进人人耳的听觉感受。
300Hz~500Hz频率:这段频率是语音的主要音区频率。这段频率的幅度丰满,语音有力度。如果这段频率幅度不足,声音会显得空洞、不坚实;如果这段频率幅度过强,音色会变得单调,相对来说低频成分少了,高频成分也少了,语音会变成像电话中声音的音色一样,显得很单调。
150Hz~300Hz频率:这段频率影响声音的力度,尤其是男声声音的力度。这段频率是男声声音的低频基音频率,同时也是乐音中和弦的根音频率。如果这段频率成分缺乏,音色会显得发软、发飘,语音则会变得软绵绵;如果这段频率成分过强,声音会变得生硬而不自然,且没有特色。
100Hz~150Hz频率:这段频率影响音色的丰满度。如果这段频率成分增强,就会产生一种房间共鸣的空间感、混厚感;如果这段频率成分缺少,音色会变得单薄、苍白;如果这段频率成分过强,音色将会显得浑浊,语音的清晰度变差。
60Hz~100Hz:这段频率影响声音的混厚感,是低音的基音区。如果这段频率很丰满,音色会显得厚实、混厚感强。如果这段频率不足,音色会变得无力;而如果这段频率过强,音色会出现低频共振声,有轰鸣声的感觉。
20Hz~60Hz频率:这段频率影响音色的空间感,这是因为乐音的基音大多在这段频率以上。这段频率是房间或厅堂的谐振频率。如果这段频率表现的充分,会使人产生一种置身于大厅之中的感受;如果这段频率缺乏,音色会变得空虚;而如果这段频率过强,会产生一种嗡嗡的低频共振的声音,严重地影响了语音的清晰度和可懂度。
|
|