处理器 发表于 2021-10-15 21:55

聊个比较硬核的话题吧,解释一部分“hifi玄学”疑问

本帖最后由 处理器 于 2021-10-15 23:46 编辑

玩hifi避免不了开脑放,但脑放也得方向开对{:4_94:},经常看到各种讨论:mp3和无损CD没区别、17000hz频率以上老烧听不见、高采样率没有意义。。。很早玩hifi时候也有类似疑问,有一次和朋友在车上调系统,发现自己15000hz以上频率确实听不见(朋友年轻点可以听到),瞬间沮丧,听力不行已经没法玩hifi了。于是做功课查料也做了一些测试,写出来分享交流,太学术的长篇大论就不转了,内容有点硬,理解了应该不会再纠结人耳能听到多少高频。
20kHz通常被认为是人耳听觉的上限,而事实上,大部分人成年之后,都会失去能听到如此高频声音的听觉。44.1kHz的CD标准采样率,已经足够覆盖人耳的听觉范围,那为何我们还要采用更高的采样率呢?
一、24bit44.1 VS 24bit96khz
奈奎斯特采样定理告诉我们:在数字系统中,当采样率大于信号本身频率的两倍时,便可以“完整地”保留原始信号中的所有信息。(注意是“完整地保留”)
因为20kHz,比CD的标准44.1kHz的一半小,所以CD的音质标准,足够还原一个20kHz的正弦波。如果提高采样率,比如96kHz,就能记录最高48khz的声音,但20kHz的正弦波,并不会因此变得更加精准!
测试:如果把一个12khz正弦波24bit48k、一个12khz正弦波24bit96k Wav文件导入StudioOne工程,把其中一个音轨反相,最终两个音轨混音出来没有任何声音,说明这两个文件生成的12khz正弦波没有任何差异,相位抵消。
二、混叠失真
数字系统可以在使用低于采样率一半的频率时(这称为奈奎斯特限制 - 例如,44.1kHz的音频的奈奎斯特限制是22.05kHz)依然保证音频的准确性。如果乐器/效果器产生的谐波高于此频率 - 例如是40kHz - 您听到的不会是40kHz的声音,您将听到的是频率降低到低于时钟频率时(在这种情况下为4.1kHz)产生的混叠失真。因此,混叠失真就会出现在可听范围,但是却与原始信号没有关联,而且听起来通常都相当的糟糕。
测试:这个原理类似我们人眼看到自行车轮幅,自行车静止的时候,可以明显看到轮毂上的钢丝,一旦自行车骑行,人眼看到的轮幅不见了,速度越快可能看到轮幅是在倒转的,这说明人眼采样率低于轮幅转动速率,产生混叠失真。
三、提高采样率
根据奈奎斯特采样定律,提高采样率会采集到更多的高频,对于录音采样“抗混叠失真”有帮助。但采集到更多高于20Khz的高频人耳不但听不到(由于互调失真的影响,带外高频信号会影响带内,产生人耳可听的带内谐波)。超高频会对于大部分播放系统会带来麻烦,除非播放系统是百分百线性,并且没有任何失真,否则只要加入超过20kHz的信号,就会调制出可听范围内的谐波,如果你直接过滤掉20kHz以上的不可闻信号,理论上你可能会得到一个更干净,音质更好的声音(关键在于怎么切除)。
小结,还原20-20k以内模拟音频信号,44.1khz采样率足够用,更高的采样率并不会增加任何“带内”可听的内容,20Khz“带外”高频会通过互调失真影响“带内”。高采样率意义在于,抗混叠失真和数字滤波(包括采样和回放),直接切掉高频,会进一步增加混叠失真(有损音质),并影响低通滤波器。另外,大部分现代解码器都是数字+模拟滤波器设计,通过升频+超采样+数字滤波技术,把数字音频信号中超高频及量化失真推到更高的频段去滤波/切。



chaos_xie 发表于 2021-10-15 22:09

能加几张图就更好了:)

charmania 发表于 2021-10-15 23:12

写得好,确实是核心干货,混叠失真影响很大因此滤波设计在DS解码中很关键

江南我最帅 发表于 2021-10-15 23:19

学习了

genius_xp 发表于 2021-10-15 23:26

过滤掉20kHz以上声音,会导致带内的声音产生的高阶谐波消失,进而影响声音的通透感,虽然超声波听不到,但是有基音的时候是能被感受到的。

genius_xp 发表于 2021-10-15 23:28

导入工程相位抵消是因为程序加了插值处理,而不是原始对比,精度不同还原还是有差异,软件插值算法让你误解完全抵消了。

hcb0000424 发表于 2021-10-15 23:30

技术性好文 ,言简意赅

genius_xp 发表于 2021-10-15 23:30

更高采样,获取的信息更多,声音密度更高,楼主误人子弟,冒充专业,其实半桶水。如果无效索尼就不会发布高采样。

alanhell 发表于 2021-10-16 00:10

其实24/96这种高码率的文件,重点在24 bit而不是96Khz。用楼主的话来说,就是把12Khz的正反两个正玄波分别用24bit和16bit播放,然后递减音量,就会发现有时候是会有杂音的。

高清文件的24bit会有更精确的动态范围,如果处理得当的话,底噪和瞬态表现都要远高于16bit的文件。在听大编制的现场录音时,这些动态的细节是直接和声场还有音源定位有关的,所以听起来会更加真实。一般DS类的解码,动态范围都能到20bit,所以24bit算是给足了空间给解码发挥,而16bit的文件有时候是需要开Dither的。

魔神Z 发表于 2021-10-16 00:30

我打一个比方在5寸的屏内 1080P和4K 分辨率 可能视觉感知没有质的飞越,但是观感还是好很多的,如果在5寸屏幕内用720P 那么就是大果粒了

耳朵的上限其实相当于把耳朵给限制死了。类似于就只有5寸屏幕大小。虽然5寸1080P绝大多数人就已经足够了,但是采样率越高,就好比屏幕像素点越多,声音就越细腻

吉大宝 发表于 2021-10-16 00:34

44.1与96的区别我理解是时域采样相同时间内的点数增加吧{:4_104:}不过其实我听不出来我是木耳

魔神Z 发表于 2021-10-16 00:34

LZ的观点有一点还是很赞同的,就是高采样的实际性能,拿屏幕对比虽然分辨率上去了,但是延迟上升了,造成了拖影 掉帧,实际感受可能还不如1080P。很多机器在播放192K或者DSD的时候,总觉得哪里有问题,个人感觉48-96K 是一个比较好的平衡点

endgame 发表于 2021-10-16 05:04

谢谢分享

处理器 发表于 2021-10-16 07:55

genius_xp 发表于 2021-10-15 23:30
更高采样,获取的信息更多,声音密度更高,楼主误人子弟,冒充专业,其实半桶水。如果无效索尼就不会发布高 ...

欢迎讨论。

高采样率会多什么信息?声音密度是什么?

处理器 发表于 2021-10-16 08:09

本帖最后由 处理器 于 2021-10-16 09:22 编辑

alanhell 发表于 2021-10-16 00:10
其实24/96这种高码率的文件,重点在24 bit而不是96Khz。用楼主的话来说,就是把12Khz的正反两个正玄波分别 ...
理解有偏差。

24bit是位深,记录频率的振幅,16bit足够用,你想啊黑胶只有12bit,不会影响声音的动态范围还原,24bit为量化误差留出了更多余地。deltasigma解码器实际运算精度只有6bit,更多的信息是调制出来的。

声音的本质是震动频率,采样率最重要。

林zw502 发表于 2021-10-16 08:16

奈奎斯特采样定理不是这么理解的!

低于并接近1/2采样频率的信号是存在,而不是完全保留。
就是说,44.1kHz采样率下,20kHz的信号还有能部分还原,因为至少20kHz信号的一个周期内至少有2个采样值,至于还原1%还是30%看概率分布。如果采样率96kHz,20kHz的信号一个周期中会有至少4个,平均4.8个采样点,信号可以还原的概率大大高于30%,可以说是50~90%。

处理器 发表于 2021-10-16 08:19

魔神Z 发表于 2021-10-16 00:34
LZ的观点有一点还是很赞同的,就是高采样的实际性能,拿屏幕对比虽然分辨率上去了,但是延迟上升了,造成了 ...

是。大部分观点赞成,不需要从头到尾都用高采样率,录音采样率48-96比较适宜,效果器内部/还原再升频超采样+数字滤波。

林zw502 发表于 2021-10-16 08:22

楼主你把测试文件的正弦波信号频率改为20kHz再试验一次,应该就明白了。

alanhell 发表于 2021-10-16 09:38

处理器 发表于 2021-10-16 08:09
理解有偏差。

24bit是位深,16bit足够用,你想啊黑胶只有12bit,不会影响记录声音的动态范围,24bit为量 ...

不同于普遍烧友,我真心没觉得黑胶比CD音质要好。所谓的模拟味,在我感觉就是缺动态,缺细节,整体就是一个“糊”;P

我觉得很多时候DAC要和ADC一起来看。比如用12bit录出来的东西放到录音工程里回放,是能明显听出底噪的。这是因为在录音受到到SNR的限制(12bit的SNR最优能到72dB),在达到一定音量的时候,设备的底噪也就被放大到人耳能听到的范围了。而且因为录音位深的关系,这些噪音也很难在不影响录音本身的情况下被移除。再者,在DS解码进行转换的时候,不管多少的位深,都是会出量化噪声的。而这个噪声量是一定的,也就是说,你的位深越高,噪声相对于原始音源的影响就越小。16bit的理论SNR是96dB,而24bit是144db。鉴于市面上大部分的解码都是大于120db的SNR,说明16bit的文件带来的底噪,对这些解码还是有影响的。也许你会说没有人能听到-96dB的底噪。但是所谓的信噪比只是一个对比的量,当你的音量开到足够大,或者你的耳机足够灵敏的时候,在很多情况下,-100dB的底噪都是能被听到的。


综上所述,黑胶的底噪本来就很高,就算是在高端的黑胶机,也没法逃过碟片的灰尘和磨损,所以爆音和杂音是很常见的事情。那么黑胶的底噪用12bit都算高了,毕竟我听到的黑胶大部分底噪都是非常明显的。同理,大部分CD的录音,在安静的部分,也是可以明显听到录音底噪的。如果有一首歌,在人声部分有清唱的环节,很多时候,你都可以听到人声音轨插入瞬间的录音底噪。又或者在听交响现场录音的时候,在安静的部分也能听到出录音的底噪。这些情况在真正制作的好的24bit录音里,就没有。


P.S.
现在的流行乐的动态都是被压缩过的,而且声场特效也是数字模拟出来的,所以其实16bit已经绰绰有余了,毕竟所有的声音都被压到了60-100db之间,4db的噪音很容易就被该过去了。但是如果你喜欢听现场录音的话(大部分的古典和爵士),特别是在大编制的录音里,是能听到很多细节的,这时候高清录音的优势才能完全被发挥出来。当你的音量是0-110db的时候,4db的底噪在0db的录音部分,还是很明显的。


处理器 发表于 2021-10-16 09:55

alanhell 发表于 2021-10-16 09:38
不同于普遍烧友,我真心没觉得黑胶比CD音质要好。所谓的模拟味,在我感觉就是缺动态,缺细节,整体就是一 ...
现在解码器很少是16bit 纯粹Nos吧,大部分DS解码器内部都是超采样+噪声整形+数字滤波,量化噪声推到更高频段滤除掉,原始24bit相对采样率没有那么重要。声音中底噪是正常的,没有底噪的声音不自然,这个问题不是很纠结。
页: [1] 2 3 4
查看完整版本: 聊个比较硬核的话题吧,解释一部分“hifi玄学”疑问