找回密码
 -注册-
查看: 7702|回复: 61
打印 上一主题 下一主题

聊个比较硬核的话题吧,解释一部分“hifi玄学”疑问

[复制链接]
跳转到指定楼层
1
发表于 2021-10-15 21:55 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式 来自 北京市海淀区
本帖最后由 处理器 于 2021-10-15 23:46 编辑

玩hifi避免不了开脑放,但脑放也得方向开对,经常看到各种讨论:mp3和无损CD没区别、17000hz频率以上老烧听不见、高采样率没有意义。。。很早玩hifi时候也有类似疑问,有一次和朋友在车上调系统,发现自己15000hz以上频率确实听不见(朋友年轻点可以听到),瞬间沮丧,听力不行已经没法玩hifi了。于是做功课查料也做了一些测试,写出来分享交流,太学术的长篇大论就不转了,内容有点硬,理解了应该不会再纠结人耳能听到多少高频。

20kHz通常被认为是人耳听觉的上限,而事实上,大部分人成年之后,都会失去能听到如此高频声音的听觉。44.1kHz的CD标准采样率,已经足够覆盖人耳的听觉范围,那为何我们还要采用更高的采样率呢?

一、24bit44.1 VS 24bit96khz

奈奎斯特采样定理告诉我们:在数字系统中,当采样率大于信号本身频率的两倍时,便可以“完整地”保留原始信号中的所有信息。(注意是“完整地保留”)

因为20kHz,比CD的标准44.1kHz的一半小,所以CD的音质标准,足够还原一个20kHz的正弦波。
如果提高采样率,比如96kHz,就能记录最高48khz的声音,但20kHz的正弦波,并不会因此变得更加精准!

测试:如果把一个12khz正弦波24bit48k、一个12khz正弦波24bit96k Wav文件导入StudioOne工程,把其中一个音轨反相,最终两个音轨混音出来没有任何声音,说明这两个文件生成的12khz正弦波没有任何差异,相位抵消。

二、混叠失真

数字系统可以在使用低于采样率一半的频率时(这称为奈奎斯特限制 - 例如,44.1kHz的音频的奈奎斯特限制是22.05kHz)依然保证音频的准确性。如果乐器/效果器产生的谐波高于此频率 - 例如是40kHz - 您听到的不会是40kHz的声音,您将听到的是频率降低到低于时钟频率时(在这种情况下为4.1kHz)产生的混叠失真。因此,混叠失真就会出现在可听范围,但是却与原始信号没有关联,而且听起来通常都相当的糟糕。

测试:这个原理类似我们人眼看到自行车轮幅,自行车静止的时候,可以明显看到轮毂上的钢丝,一旦自行车骑行,人眼看到的轮幅不见了,速度越快可能看到轮幅是在倒转的,这说明人眼采样率低于轮幅转动速率,产生混叠失真。

三、提高采样率

根据奈奎斯特采样定律,提高采样率会采集到更多的高频,对于录音采样“抗混叠失真”有帮助。但采集到更多高于20Khz的高频人耳不但听不到(由于互调失真的影响,带外高频信号会影响带内,产生人耳可听的带内谐波)。超高频会对于大部分播放系统会带来麻烦,除非播放系统是百分百线性,并且没有任何失真,否则只要加入超过20kHz的信号,就会调制出可听范围内的谐波,如果你直接过滤掉20kHz以上的不可闻信号,理论上你可能会得到一个更干净,音质更好的声音(关键在于怎么切除)。

小结,还原20-20k以内模拟音频信号,44.1khz采样率足够用,更高的采样率并不会增加任何“带内”可听的内容,20Khz“带外”高频会通过互调失真影响“带内”。高采样率意义在于,抗混叠失真和数字滤波(包括采样和回放),直接切掉高频,会进一步增加混叠失真(有损音质),并影响低通滤波器。另外,大部分现代解码器都是数字+模拟滤波器设计,通过升频+超采样+数字滤波技术,把数字音频信号中超高频及量化失真推到更高的频段去滤波/切。



2
发表于 2021-10-15 22:09 | 只看该作者 来自 加拿大
能加几张图就更好了:)
回复

使用道具 举报

3
发表于 2021-10-15 23:12 | 只看该作者 来自 澳大利亚
写得好,确实是核心干货,混叠失真影响很大因此滤波设计在DS解码中很关键
回复

使用道具 举报

4
发表于 2021-10-15 23:19 | 只看该作者 来自 广西桂林市
学习了
回复

使用道具 举报

5
发表于 2021-10-15 23:26 | 只看该作者 来自 上海市徐汇区
过滤掉20kHz以上声音,会导致带内的声音产生的高阶谐波消失,进而影响声音的通透感,虽然超声波听不到,但是有基音的时候是能被感受到的。
回复

使用道具 举报

6
发表于 2021-10-15 23:28 | 只看该作者 来自 上海市徐汇区
导入工程相位抵消是因为程序加了插值处理,而不是原始对比,精度不同还原还是有差异,软件插值算法让你误解完全抵消了。
回复

使用道具 举报

7
发表于 2021-10-15 23:30 | 只看该作者 来自 四川省成都市龙泉驿区
技术性好文 ,言简意赅
回复

使用道具 举报

8
发表于 2021-10-15 23:30 | 只看该作者 来自 上海市徐汇区
更高采样,获取的信息更多,声音密度更高,楼主误人子弟,冒充专业,其实半桶水。如果无效索尼就不会发布高采样。
回复

使用道具 举报

9
发表于 2021-10-16 00:10 | 只看该作者 来自 加拿大
其实24/96这种高码率的文件,重点在24 bit而不是96Khz。用楼主的话来说,就是把12Khz的正反两个正玄波分别用24bit和16bit播放,然后递减音量,就会发现有时候是会有杂音的。

高清文件的24bit会有更精确的动态范围,如果处理得当的话,底噪和瞬态表现都要远高于16bit的文件。在听大编制的现场录音时,这些动态的细节是直接和声场还有音源定位有关的,所以听起来会更加真实。一般DS类的解码,动态范围都能到20bit,所以24bit算是给足了空间给解码发挥,而16bit的文件有时候是需要开Dither的。
回复

使用道具 举报

10
发表于 2021-10-16 00:30 | 只看该作者 来自 湖北省武汉市
我打一个比方  在5寸的屏内 1080P和4K 分辨率 可能视觉感知没有质的飞越,但是观感还是好很多的,如果在5寸屏幕内用720P 那么就是大果粒了

耳朵的上限其实相当于把耳朵给限制死了。类似于就只有5寸屏幕大小。虽然5寸1080P绝大多数人就已经足够了,但是采样率越高,就好比屏幕像素点越多,声音就越细腻
回复

使用道具 举报

11
发表于 2021-10-16 00:34 来自手机 | 只看该作者 来自 山东省
44.1与96的区别我理解是时域采样相同时间内的点数增加吧不过其实我听不出来我是木耳
回复

使用道具 举报

12
发表于 2021-10-16 00:34 | 只看该作者 来自 湖北省武汉市
LZ的观点有一点还是很赞同的,就是高采样的实际性能,拿屏幕对比虽然分辨率上去了,但是延迟上升了,造成了拖影 掉帧,实际感受可能还不如1080P。很多机器在播放192K或者DSD的时候,总觉得哪里有问题,个人感觉48-96K 是一个比较好的平衡点
回复

使用道具 举报

13
发表于 2021-10-16 05:04 来自手机 | 只看该作者 来自 澳大利亚
谢谢分享
回复

使用道具 举报

14
 楼主| 发表于 2021-10-16 07:55 来自手机 | 只看该作者 来自 北京市海淀区
genius_xp 发表于 2021-10-15 23:30
更高采样,获取的信息更多,声音密度更高,楼主误人子弟,冒充专业,其实半桶水。如果无效索尼就不会发布高 ...

欢迎讨论。

高采样率会多什么信息?声音密度是什么?
回复

使用道具 举报

15
 楼主| 发表于 2021-10-16 08:09 来自手机 | 只看该作者 来自 北京市海淀区
本帖最后由 处理器 于 2021-10-16 09:22 编辑
alanhell 发表于 2021-10-16 00:10
其实24/96这种高码率的文件,重点在24 bit而不是96Khz。用楼主的话来说,就是把12Khz的正反两个正玄波分别 ...

理解有偏差。

24bit是位深,记录频率的振幅,16bit足够用,你想啊黑胶只有12bit,不会影响声音的动态范围还原,24bit为量化误差留出了更多余地。deltasigma解码器实际运算精度只有6bit,更多的信息是调制出来的。

声音的本质是震动频率,采样率最重要。
回复

使用道具 举报

16
发表于 2021-10-16 08:16 来自手机 | 只看该作者 来自 上海市
奈奎斯特采样定理不是这么理解的!

低于并接近1/2采样频率的信号是存在,而不是完全保留。
就是说,44.1kHz采样率下,20kHz的信号还有能部分还原,因为至少20kHz信号的一个周期内至少有2个采样值,至于还原1%还是30%看概率分布。如果采样率96kHz,20kHz的信号一个周期中会有至少4个,平均4.8个采样点,信号可以还原的概率大大高于30%,可以说是50~90%。
回复

使用道具 举报

17
 楼主| 发表于 2021-10-16 08:19 来自手机 | 只看该作者 来自 北京市海淀区
魔神Z 发表于 2021-10-16 00:34
LZ的观点有一点还是很赞同的,就是高采样的实际性能,拿屏幕对比虽然分辨率上去了,但是延迟上升了,造成了 ...

是。大部分观点赞成,不需要从头到尾都用高采样率,录音采样率48-96比较适宜,效果器内部/还原再升频超采样+数字滤波。
回复

使用道具 举报

18
发表于 2021-10-16 08:22 来自手机 | 只看该作者 来自 上海市
楼主你把测试文件的正弦波信号频率改为20kHz再试验一次,应该就明白了。
回复

使用道具 举报

19
发表于 2021-10-16 09:38 | 只看该作者 来自 加拿大
处理器 发表于 2021-10-16 08:09
理解有偏差。

24bit是位深,16bit足够用,你想啊黑胶只有12bit,不会影响记录声音的动态范围,24bit为量 ...

不同于普遍烧友,我真心没觉得黑胶比CD音质要好。所谓的模拟味,在我感觉就是缺动态,缺细节,整体就是一个“糊”

我觉得很多时候DAC要和ADC一起来看。比如用12bit录出来的东西放到录音工程里回放,是能明显听出底噪的。这是因为在录音受到到SNR的限制(12bit的SNR最优能到72dB),在达到一定音量的时候,设备的底噪也就被放大到人耳能听到的范围了。而且因为录音位深的关系,这些噪音也很难在不影响录音本身的情况下被移除。再者,在DS解码进行转换的时候,不管多少的位深,都是会出量化噪声的。而这个噪声量是一定的,也就是说,你的位深越高,噪声相对于原始音源的影响就越小。16bit的理论SNR是96dB,而24bit是144db。鉴于市面上大部分的解码都是大于120db的SNR,说明16bit的文件带来的底噪,对这些解码还是有影响的。也许你会说没有人能听到-96dB的底噪。但是所谓的信噪比只是一个对比的量,当你的音量开到足够大,或者你的耳机足够灵敏的时候,在很多情况下,-100dB的底噪都是能被听到的。


综上所述,黑胶的底噪本来就很高,就算是在高端的黑胶机,也没法逃过碟片的灰尘和磨损,所以爆音和杂音是很常见的事情。那么黑胶的底噪用12bit都算高了,毕竟我听到的黑胶大部分底噪都是非常明显的。同理,大部分CD的录音,在安静的部分,也是可以明显听到录音底噪的。如果有一首歌,在人声部分有清唱的环节,很多时候,你都可以听到人声音轨插入瞬间的录音底噪。又或者在听交响现场录音的时候,在安静的部分也能听到出录音的底噪。这些情况在真正制作的好的24bit录音里,就没有。


P.S.
现在的流行乐的动态都是被压缩过的,而且声场特效也是数字模拟出来的,所以其实16bit已经绰绰有余了,毕竟所有的声音都被压到了60-100db之间,4db的噪音很容易就被该过去了。但是如果你喜欢听现场录音的话(大部分的古典和爵士),特别是在大编制的录音里,是能听到很多细节的,这时候高清录音的优势才能完全被发挥出来。当你的音量是0-110db的时候,4db的底噪在0db的录音部分,还是很明显的。


回复

使用道具 举报

20
 楼主| 发表于 2021-10-16 09:55 | 只看该作者 来自 北京市海淀区
alanhell 发表于 2021-10-16 09:38
不同于普遍烧友,我真心没觉得黑胶比CD音质要好。所谓的模拟味,在我感觉就是缺动态,缺细节,整体就是一 ...

现在解码器很少是16bit 纯粹Nos吧,大部分DS解码器内部都是超采样+噪声整形+数字滤波,量化噪声推到更高频段滤除掉,原始24bit相对采样率没有那么重要。声音中底噪是正常的,没有底噪的声音不自然,这个问题不是很纠结。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | -注册-

本版积分规则

Archiver|手机版|粤icp备09046054号|耳机网-耳机大家坛

粤公网安备 44030602000598号 耳机大家坛、www.erji.net、网站LOGO图形均为注册商标

GMT+8, 2024-4-26 01:18

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表