聊个比较硬核的话题吧，解释一部分“hifi玄学”疑问

处理器 发表于 2021-10-15 21:55

聊个比较硬核的话题吧，解释一部分“hifi玄学”疑问

本帖最后由处理器于 2021-10-15 23:46 编辑

玩hifi避免不了开脑放，但脑放也得方向开对{:4_94:}，经常看到各种讨论：mp3和无损CD没区别、17000hz频率以上老烧听不见、高采样率没有意义。。。很早玩hifi时候也有类似疑问，有一次和朋友在车上调系统，发现自己15000hz以上频率确实听不见（朋友年轻点可以听到），瞬间沮丧，听力不行已经没法玩hifi了。于是做功课查料也做了一些测试，写出来分享交流，太学术的长篇大论就不转了，内容有点硬，理解了应该不会再纠结人耳能听到多少高频。
20kHz通常被认为是人耳听觉的上限，而事实上，大部分人成年之后，都会失去能听到如此高频声音的听觉。44.1kHz的CD标准采样率，已经足够覆盖人耳的听觉范围，那为何我们还要采用更高的采样率呢？
一、24bit44.1 VS 24bit96khz
奈奎斯特采样定理告诉我们：在数字系统中，当采样率大于信号本身频率的两倍时，便可以“完整地”保留原始信号中的所有信息。（注意是“完整地保留”）
因为20kHz，比CD的标准44.1kHz的一半小，所以CD的音质标准，足够还原一个20kHz的正弦波。如果提高采样率，比如96kHz，就能记录最高48khz的声音，但20kHz的正弦波，并不会因此变得更加精准！
测试：如果把一个12khz正弦波24bit48k、一个12khz正弦波24bit96k Wav文件导入StudioOne工程，把其中一个音轨反相，最终两个音轨混音出来没有任何声音，说明这两个文件生成的12khz正弦波没有任何差异，相位抵消。
二、混叠失真
数字系统可以在使用低于采样率一半的频率时（这称为奈奎斯特限制 - 例如，44.1kHz的音频的奈奎斯特限制是22.05kHz）依然保证音频的准确性。如果乐器/效果器产生的谐波高于此频率 - 例如是40kHz - 您听到的不会是40kHz的声音，您将听到的是频率降低到低于时钟频率时（在这种情况下为4.1kHz）产生的混叠失真。因此，混叠失真就会出现在可听范围，但是却与原始信号没有关联，而且听起来通常都相当的糟糕。
测试：这个原理类似我们人眼看到自行车轮幅，自行车静止的时候，可以明显看到轮毂上的钢丝，一旦自行车骑行，人眼看到的轮幅不见了，速度越快可能看到轮幅是在倒转的，这说明人眼采样率低于轮幅转动速率，产生混叠失真。
三、提高采样率
根据奈奎斯特采样定律，提高采样率会采集到更多的高频，对于录音采样“抗混叠失真”有帮助。但采集到更多高于20Khz的高频人耳不但听不到（由于互调失真的影响，带外高频信号会影响带内，产生人耳可听的带内谐波）。超高频会对于大部分播放系统会带来麻烦，除非播放系统是百分百线性，并且没有任何失真，否则只要加入超过20kHz的信号，就会调制出可听范围内的谐波，如果你直接过滤掉20kHz以上的不可闻信号，理论上你可能会得到一个更干净，音质更好的声音（关键在于怎么切除）。
小结，还原20-20k以内模拟音频信号，44.1khz采样率足够用，更高的采样率并不会增加任何“带内”可听的内容，20Khz“带外”高频会通过互调失真影响“带内”。高采样率意义在于，抗混叠失真和数字滤波（包括采样和回放），直接切掉高频，会进一步增加混叠失真（有损音质），并影响低通滤波器。另外，大部分现代解码器都是数字+模拟滤波器设计，通过升频+超采样+数字滤波技术，把数字音频信号中超高频及量化失真推到更高的频段去滤波/切。

chaos_xie 发表于 2021-10-15 22:09

能加几张图就更好了：）

charmania 发表于 2021-10-15 23:12

写得好，确实是核心干货，混叠失真影响很大因此滤波设计在DS解码中很关键

江南我最帅 发表于 2021-10-15 23:19

学习了

genius_xp 发表于 2021-10-15 23:26

过滤掉20kHz以上声音，会导致带内的声音产生的高阶谐波消失，进而影响声音的通透感，虽然超声波听不到，但是有基音的时候是能被感受到的。

genius_xp 发表于 2021-10-15 23:28

导入工程相位抵消是因为程序加了插值处理，而不是原始对比，精度不同还原还是有差异，软件插值算法让你误解完全抵消了。

hcb0000424 发表于 2021-10-15 23:30

技术性好文，言简意赅

genius_xp 发表于 2021-10-15 23:30

更高采样，获取的信息更多，声音密度更高，楼主误人子弟，冒充专业，其实半桶水。如果无效索尼就不会发布高采样。

alanhell 发表于 2021-10-16 00:10

其实24/96这种高码率的文件，重点在24 bit而不是96Khz。用楼主的话来说，就是把12Khz的正反两个正玄波分别用24bit和16bit播放，然后递减音量，就会发现有时候是会有杂音的。

高清文件的24bit会有更精确的动态范围，如果处理得当的话，底噪和瞬态表现都要远高于16bit的文件。在听大编制的现场录音时，这些动态的细节是直接和声场还有音源定位有关的，所以听起来会更加真实。一般DS类的解码，动态范围都能到20bit,所以24bit算是给足了空间给解码发挥，而16bit的文件有时候是需要开Dither的。

魔神Z 发表于 2021-10-16 00:30

我打一个比方在5寸的屏内 1080P和4K 分辨率可能视觉感知没有质的飞越，但是观感还是好很多的，如果在5寸屏幕内用720P 那么就是大果粒了

耳朵的上限其实相当于把耳朵给限制死了。类似于就只有5寸屏幕大小。虽然5寸1080P绝大多数人就已经足够了，但是采样率越高，就好比屏幕像素点越多，声音就越细腻

吉大宝 发表于 2021-10-16 00:34

44.1与96的区别我理解是时域采样相同时间内的点数增加吧{:4_104:}不过其实我听不出来我是木耳

魔神Z 发表于 2021-10-16 00:34

LZ的观点有一点还是很赞同的，就是高采样的实际性能，拿屏幕对比虽然分辨率上去了，但是延迟上升了，造成了拖影掉帧，实际感受可能还不如1080P。很多机器在播放192K或者DSD的时候，总觉得哪里有问题，个人感觉48-96K 是一个比较好的平衡点

endgame 发表于 2021-10-16 05:04

谢谢分享

处理器 发表于 2021-10-16 07:55

genius_xp 发表于 2021-10-15 23:30
更高采样，获取的信息更多，声音密度更高，楼主误人子弟，冒充专业，其实半桶水。如果无效索尼就不会发布高 ...

欢迎讨论。

高采样率会多什么信息？声音密度是什么？

处理器 发表于 2021-10-16 08:09

本帖最后由处理器于 2021-10-16 09:22 编辑

alanhell 发表于 2021-10-16 00:10
其实24/96这种高码率的文件，重点在24 bit而不是96Khz。用楼主的话来说，就是把12Khz的正反两个正玄波分别 ...
理解有偏差。

24bit是位深，记录频率的振幅，16bit足够用，你想啊黑胶只有12bit，不会影响声音的动态范围还原，24bit为量化误差留出了更多余地。deltasigma解码器实际运算精度只有6bit，更多的信息是调制出来的。

声音的本质是震动频率，采样率最重要。

林zw502 发表于 2021-10-16 08:16

奈奎斯特采样定理不是这么理解的！

低于并接近1/2采样频率的信号是存在，而不是完全保留。
就是说，44.1kHz采样率下，20kHz的信号还有能部分还原，因为至少20kHz信号的一个周期内至少有2个采样值，至于还原1%还是30%看概率分布。如果采样率96kHz，20kHz的信号一个周期中会有至少4个，平均4.8个采样点，信号可以还原的概率大大高于30%，可以说是50~90％。

处理器 发表于 2021-10-16 08:19

魔神Z 发表于 2021-10-16 00:34
LZ的观点有一点还是很赞同的，就是高采样的实际性能，拿屏幕对比虽然分辨率上去了，但是延迟上升了，造成了 ...

是。大部分观点赞成，不需要从头到尾都用高采样率，录音采样率48-96比较适宜，效果器内部/还原再升频超采样+数字滤波。

林zw502 发表于 2021-10-16 08:22

楼主你把测试文件的正弦波信号频率改为20kHz再试验一次，应该就明白了。

alanhell 发表于 2021-10-16 09:38

处理器发表于 2021-10-16 08:09
理解有偏差。

24bit是位深，16bit足够用，你想啊黑胶只有12bit，不会影响记录声音的动态范围，24bit为量 ...

不同于普遍烧友，我真心没觉得黑胶比CD音质要好。所谓的模拟味，在我感觉就是缺动态，缺细节，整体就是一个“糊”;P

我觉得很多时候DAC要和ADC一起来看。比如用12bit录出来的东西放到录音工程里回放，是能明显听出底噪的。这是因为在录音受到到SNR的限制（12bit的SNR最优能到72dB），在达到一定音量的时候，设备的底噪也就被放大到人耳能听到的范围了。而且因为录音位深的关系，这些噪音也很难在不影响录音本身的情况下被移除。再者，在DS解码进行转换的时候，不管多少的位深，都是会出量化噪声的。而这个噪声量是一定的，也就是说，你的位深越高，噪声相对于原始音源的影响就越小。16bit的理论SNR是96dB，而24bit是144db。鉴于市面上大部分的解码都是大于120db的SNR，说明16bit的文件带来的底噪，对这些解码还是有影响的。也许你会说没有人能听到-96dB的底噪。但是所谓的信噪比只是一个对比的量，当你的音量开到足够大，或者你的耳机足够灵敏的时候，在很多情况下，-100dB的底噪都是能被听到的。

综上所述，黑胶的底噪本来就很高，就算是在高端的黑胶机，也没法逃过碟片的灰尘和磨损，所以爆音和杂音是很常见的事情。那么黑胶的底噪用12bit都算高了，毕竟我听到的黑胶大部分底噪都是非常明显的。同理，大部分CD的录音，在安静的部分，也是可以明显听到录音底噪的。如果有一首歌，在人声部分有清唱的环节，很多时候，你都可以听到人声音轨插入瞬间的录音底噪。又或者在听交响现场录音的时候，在安静的部分也能听到出录音的底噪。这些情况在真正制作的好的24bit录音里，就没有。

P.S.
现在的流行乐的动态都是被压缩过的，而且声场特效也是数字模拟出来的，所以其实16bit已经绰绰有余了，毕竟所有的声音都被压到了60-100db之间，4db的噪音很容易就被该过去了。但是如果你喜欢听现场录音的话（大部分的古典和爵士），特别是在大编制的录音里，是能听到很多细节的，这时候高清录音的优势才能完全被发挥出来。当你的音量是0-110db的时候，4db的底噪在0db的录音部分，还是很明显的。

处理器 发表于 2021-10-16 09:55

alanhell 发表于 2021-10-16 09:38
不同于普遍烧友，我真心没觉得黑胶比CD音质要好。所谓的模拟味，在我感觉就是缺动态，缺细节，整体就是一 ...
现在解码器很少是16bit 纯粹Nos吧，大部分DS解码器内部都是超采样+噪声整形+数字滤波，量化噪声推到更高频段滤除掉，原始24bit相对采样率没有那么重要。声音中底噪是正常的，没有底噪的声音不自然，这个问题不是很纠结。

页: [1] 2 3 4

耳机网-耳机大家坛's Archiver

聊个比较硬核的话题吧，解释一部分“hifi玄学”疑问