找回密码
 -注册-
查看: 11623|回复: 80
打印 上一主题 下一主题

对于数字音频,我们真的需要尽可能低的抖动(Jitter)吗?多少抖动量是可闻的?

[复制链接]
跳转到指定楼层
1
发表于 2023-1-22 23:06 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式 来自 湖北武汉
        先说结论:
        1.我们并不需要尽可能低的抖动,因为我们只能听到ns级别的抖动。(见参考论文二)

        2.人耳只能听到纳秒ns级别的抖动。因为不同的研究,针对不同的人群,使用不同的回放路径,还有不同的阈值判定方法,抖动的可闻阈值在大约30ns-500ns之间。(见参考二和三)

        3.在一些传统CD的内容中,已经观察到抖动必须小到121.4ps才能保持16比特的分辨率和20Khz的音频。这远远低于检测的阈值。Nishimura和Koizumi试图测量各种DA系统在重放音乐信号时的实际抖动。他们在测量中无法检测到任何大于3ns的抖动。到目前为止,消费类产品的实际抖动似乎太小了,至少在音乐信号的重现中无法检测到。(见参考论文二内容)
        
        参考论文一:《Theoretical and Audible Effects of Jitter on Digital Audio Quality数字音频中抖动的理论影响和可闻影响》, Pre-print 4826 of the 105th AES Convention, San Francisco, September 1998.  Eric Benjamin and Benjamin Gannon
        这是AES的正式论文,需要收费才能下载,内外网上也没有找到原文PDF下载,但是里面的研究结论在下面的两个研究中均提到了。

        参考论文二:        《Detection threshold for distortions due to jitter on digital audio数字音频中抖动导致的失真检测阈值》-Kaoru Ashihara1;, Shogo Kiryu1, Nobuo Koizumi2, Akira Nishimura2,Juro Ohga3, Masaki Sawaguchi4 and Shokichiro Yoshikawa5- 2004年
        本研究中的23名听众是音频专业人员或半专业人员,他们应该是训练有素的听众,他们是音频工程师、音频评论家、音响工程师和音乐家。阈值是根据听众在二选一强迫选择范式中的辨别分数来估计的。
        听众被允许使用他们自己的听觉环境(使用音箱)和他们喜欢的声音材料。结果表明,对于训练有素的听众来说,在他们喜欢的听觉条件下,随机抖动的检测阈值为250ns-500ns之间。

        参考三:《Jitter Theory 抖动理论》 - by Julian Dunn  2000年(就职于AP音频测量仪公司),文中引用了论文一的内容
        在低频时,这一水平大于100 ns,在100 Hz以上有一个急剧的截止,在500 Hz时有一个大约1 ns(峰值)的下限。

        以上参考文章中的后两个可以下载原文,第一个可以在AES官网上查到论文概要。

        关于Jitter抖动地话题,另外一个论坛2016年《示波器测试电脑内置数字音频输出的JITTER(抖晃)》一文,有过详细地讨论,不过并没有深入涉及到抖动可听阈值研究。


        我是新手,如果以上有不对的内容,请大家批评指正。


2
发表于 2023-1-23 07:43 | 只看该作者 来自 加拿大
先问一下这个抖动测试的什么抖动。如果测试的是USB的BIT级别的抖动。。那么这个抖动简直是天文数字。数据已经无法正常传输了。。

如果测试的每个USB包的发送间隔的抖动,那么现在能做到1us这个抖动的USB输出数播有多少??
回复

使用道具 举报

3
发表于 2023-1-23 09:47 来自手机 | 只看该作者 来自 广东
手机和几千块的数播有什么区别
回复

使用道具 举报

4
发表于 2023-1-23 11:35 来自手机 | 只看该作者 来自 北京丰台
直接听就行了
回复

使用道具 举报

5
 楼主| 发表于 2023-1-23 13:53 | 只看该作者 来自 湖北武汉
本帖最后由 icbcodc 于 2023-1-23 14:18 编辑
qazpl963 发表于 2023-1-23 07:43
先问一下这个抖动测试的什么抖动。如果测试的是USB的BIT级别的抖动。。那么这个抖动简直是天文数字。数据已 ...

以上参考论文不是测量抖动,而是加入抖动,让听着判断是否能对比听出,分辨出加入抖动的音频和没有加入抖动的音频。

再顺便注明下,上面提到的抖动(Jitter)的可闻阈值指我们对比听音时,可以听出的导致失真的最少的抖动是多少秒(ns纳秒,ps皮秒,还是fs飞秒)。目前高级飞秒时钟(AS318-B,AS338)都已经是做到80fs和30fs级别地抖动了,不过从整体设备角度还是会提升到ps皮秒级别的抖动。

请问,USB bit级别的抖动为什么是天文数字? 有专业一点的测量数据可以参考吗?

实验如何设置,如何知道Jitter的数值,如何确定听音这可以听出因为Jitter导致的失真,可以先看看参考论文二的原文,会比较准确,也应该能下载到:《Detection threshold for distortions due to jitter on digital audio》-Kaoru Ashihara1;, Shogo Kiryu1, Nobuo Koizumi2, Akira Nishimura2,Juro Ohga3, Masaki Sawaguchi4 and Shokichiro Yoshikawa5- 2004年

我转述过来的东西,可能不准确,不完整,建议先看看原文。


如果找不到,请回复我。

回复

使用道具 举报

6
 楼主| 发表于 2023-1-23 13:56 | 只看该作者 来自 湖北武汉
创象势力登场 发表于 2023-1-23 09:47
手机和几千块的数播有什么区别

不明白和Jitter的可闻性有什么关系,不如直说结论比较好交流。

回复

使用道具 举报

7
 楼主| 发表于 2023-1-23 14:01 | 只看该作者 来自 湖北武汉

对于购买者,肯定是尽可能听了产品再做选择。

上面的文章也正是以多位专业和半专业的人的听感为研究依据。

回复

使用道具 举报

8
发表于 2023-1-23 14:01 来自手机 | 只看该作者 来自 中国
像这种文章第一真正明白的人少;第二会扯掉很多所谓“老烧”的底裤;第三,会影响一些商家的财路。

所以,能少被毒文忽悠目的就达到了。
回复

使用道具 举报

9
 楼主| 发表于 2023-1-23 14:16 | 只看该作者 来自 湖北武汉
wxcxyz 发表于 2023-1-23 14:01
像这种文章第一真正明白的人少;第二会扯掉很多所谓“老烧”的底裤;第三,会影响一些商家的财路。

所以, ...

其实这也是我最近的疑问,可惜的是似乎中文范围,没有人讨论或者给出直接答案。也是没办法,我才去扒了几天英文资料。

最近因为想把Apple Music用数字方式输出高码率信号给音响设备,发现相关高端数字界面产品都会提到更高级的时钟,更低地抖动(Jitter),USB界面产品1K-3K的产品都会提到,由于过年无法试听,才引出上述疑问。

回复

使用道具 举报

10
发表于 2023-1-23 14:26 来自手机 | 只看该作者 来自 北京丰台
icbcodc 发表于 2023-1-23 14:01
对于购买者,肯定是尽可能听了产品再做选择。

上面的文章也正是以多位专业和半专业的人的听感为研究依 ...

不用研究,越研究越糊涂。
回复

使用道具 举报

11
 楼主| 发表于 2023-1-23 14:49 | 只看该作者 来自 湖北武汉
prodomo 发表于 2023-1-23 14:26
不用研究,越研究越糊涂。

知道的越多,越会觉得自己的无知,但一定不是糊涂。

回复

使用道具 举报

12
发表于 2023-1-23 15:01 来自手机 | 只看该作者 来自 辽宁铁岭
这么说那些外接时钟都没用了?
回复

使用道具 举报

13
发表于 2023-1-23 15:16 | 只看该作者 来自 加拿大
本帖最后由 qazpl963 于 2023-1-23 15:24 编辑
icbcodc 发表于 2023-1-23 13:53
以上参考论文不是测量抖动,而是加入抖动,让听着判断是否能对比听出,分辨出加入抖动的音频和没有加入抖 ...

USB每个bit是2ps(不同标准不同),你这直接加了几百倍的jitter,那数据就完全没法发送了。。差不多就0或者1是乱序(前后几百个bit)发送的。。。这完全就是乱码呀


至于是加入jitter我当然知道,但是是给什么加入jitter。我10秒发一个bit,加1ms的jitter,误差就0.01%。但是这样换算成USB,那这个JITTER就直接爆炸了。数据根本无法传输。
扫了下你发的论文,首先这个波形是正玄波。。而USB是方波。。这肯定不是USB了。。推测可能是同轴。而且码率是44.1K.16BIT的PCM。

你这个只能得出结论:CD机用高精度时钟的意义不大。。但是这是CD的,和USB是完全两回事。。


回复

使用道具 举报

14
发表于 2023-1-23 16:02 | 只看该作者 来自 广东东莞
Cd采样率 44.1khz,的确对时钟要求不高,特别是r2r解码芯片的机子。流媒体的话如果是96Khz或者192khz就另说了
回复

使用道具 举报

15
发表于 2023-1-23 19:31 来自手机 | 只看该作者 来自 湖南
听音是感性的,科学永远无法解决感性问题。
回复

使用道具 举报

16
发表于 2023-1-23 19:35 | 只看该作者 来自 浙江台州
我谈一下我的实践
在用网桥的时候
时钟给网桥比接解码 解析力和层次感提升明显很多
回复

使用道具 举报

17
发表于 2023-1-23 20:31 来自手机 | 只看该作者 来自 亚太地区
好文章。抖动是时序数字电路最基础的概念,而且很遗憾,只要正确地设计布线和测试,保证建立时间检查和保持时间检查通过,时钟偏移不会对数字传输的正确性造成任何影响,对于44.1这种蜗牛一样的低频率而言更是如此,遑论能听出抖动这种超人行为了。
说到底,你去问烧友和kol,十个里有十个不懂电声学,所以只能以讹传讹编造或者借用一些名词作为圈内话术传播了。
回复

使用道具 举报

18
发表于 2023-1-23 20:45 来自手机 | 只看该作者 来自 亚太地区
qazpl963 发表于 2023-1-23 15:16
USB每个bit是2ps(不同标准不同),你这直接加了几百倍的jitter,那数据就完全没法发送了。。差不多就0或 ...

肯思考就是好的,不过你可能还不太了解你所说的概念,usb异步通信,dsp的时钟以及dac的时钟都是不同的概念,但它们的频率都很低,非常廉价的pll就可以解决。

usb的工作方式不是一两句话能描述清楚的,但是它和你想象的完全不同。
回复

使用道具 举报

19
发表于 2023-1-23 21:11 | 只看该作者 来自 辽宁
本帖最后由 湾流五号 于 2023-1-23 21:18 编辑



人不要思考无法检验的问题,那是很坏的习惯,又不能赚一分钱。
回复

使用道具 举报

20
发表于 2023-1-24 01:15 | 只看该作者 来自 加拿大
blurSong 发表于 2023-1-23 20:45
肯思考就是好的,不过你可能还不太了解你所说的概念,usb异步通信,dsp的时钟以及dac的时钟都是不同的概 ...

建议你去好好重新学一下基础知识。

至于USB的频率很低。不清楚你是听谁说的。USB2.0高速的频率是固定12MHZ。你自己加上1us抖动算算PPM。再去对比下USB2.0高速标准的可接受PPM,看看超了多少倍吧。

还有这里说的是USB自身的时钟,现在的高精度钟都是给USB用的,至于你说的“dsp的时钟以及dac的时钟”,DAC的钟除了少数几个国产的你见过哪个用过高精度了。包括DCS那几个给DAC用的高级钟也都不是什么高精度钟。

至于USB异步,由于缓存小容易受到前面影响这个科普的挺多的了,懒得说了。你用自研大缓存USB异步协议的当我没说。

最后好的PPL+线+线电+钟也要好十几W,最知名的就是HELEN+钟,也不是给USB用的,都是给数字音频用的。锁定还超级费时。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | -注册-

本版积分规则

Archiver|手机版|粤icp备09046054号|耳机网-耳机大家坛

粤公网安备 44030602000598号 耳机大家坛、www.erji.net、网站LOGO图形均为注册商标

GMT+8, 2024-11-11 08:00

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表