《一》什么是DSD?这种格式有什么优缺点?
DSD是Direct Stream Digital的缩写,是Sony与Philips推出SACD时所注册的商标。这种编码技术是在1 bit的序列中,针对模拟声音信号进行2.8224MHz的取样,取样频率是CD规格44.1kHz的64倍,也就是每隔1/2,822,400秒对模拟信号进行一次取样。
Sony在推出SACD时宣称这种格式有两大优点胜过CD,一是高频延伸可100kHz,二是动态范围可达120dB。但事实上,这种基于Delta-sigma转换的编码技术有两个缺点,一是因为量化只有1bit,所以动态较为不足,二是量化噪讯会在高频领域大幅增加,以DSD64为例,噪讯在25kHz就开始陡升。要解决这两个问题,必须靠Noise Shaping运算技术提升动态,并且将高频噪讯移到人耳不可察觉的极高频领域。
所以正确的说,脉冲密度调变必须配Noise Shaping,オ能称之为DSD。虽然Andreas Koch认为DSD的高频噪讯与音乐信号无关,可以轻易被人耳听觉滤除,但大部分SACD讯源依然将高频延伸限制在50kHz,以避免极高频噪讯损害扩大机与喇叭。Sony所宜称的120dB动态范围,也仅限于0到20kHz的重播频率范围内。DSD的高频噪讯问题,在取样频率提升为两倍(DSD128)甚至四倍(DSD256)之后可以得到明显改善,DSD128的高频噪讯约在40kHz才开始产生,DSD256则要到接近80kHz时オ会产生高频噪讯,真正逼近Sony当年所宣称的理想规格。
不过,DSD256并不如想象中美好,当DSD的取样频率提升到四倍的11.2896MHz,根据Ed Meitner的说法,DSD的真正优势,其实在于数位与模拟信号编码与转换的方式优于PCM。DSD是一种「记录信号相对变化」的码与转换方式,毎一次取样都是以前一次的取样为标准而变动。相较之下,多位元PCM的毎一次取样,都试图标记模拟信号波形中的一个绝对值,理论上量化位元数与取样率越高,越能忠实重建原始模拟信号,问题是这些取样值并不知道否彼此的相对位置,必须依靠数位滤波将这些绝对值连接起来,用「推测」的方式,还原成接近于原本模拟信号的波形。基于以上差异,Ed Meitner认为DSD是比PCM更接近于「模拟」的编码与转换方式。
理论上,DsD只需要通过一颗电容与一颗电阻构成的低通滤波线路,就可以转换为模拟信号,这种更单纯、成本更低的解码线路,也是DSD胜过PCM的一大优势。
Ed Meiter是制定SACD的主要人物,早在1978年就开始实验1BIT录音
《二》DSD是如何诞生的?
SACD与DSD的推出有其商业考量背景,当时Sony兴Philips握有的CD专利已经到期,为了不让旁大的CD权利金收入中断,Sony决心推出取代CD的新世代SACD规格,以音质优于CD为号召,企图继续主宰主流音乐载体市场。为此Sony不但投入巨资大举宣传SACD的优点,还聘请Ed Meiter (EMM Labs总裁)与Andreas Koch (Playback Design总裁)两位数位领域的顶尖设计师,着手开发记录于SACD的DSD格式录音设备,希望专业录音业界接受这种数位录音规格。从DSD的规格与理论上检视,DSD的信号量与频宽表现的确大幅优于CD,但实际上,SACD的推广却不如预期顺利。推出初期首先遭遇PCM阵营推出DVD-Audio的挑战,虽然SACD最后胜出,但是普及速度却远远不及CD在1980年代的发展状况。
一方面在专业录音领域,1bit的DSD先天上难以进行剪辑、混音、等化、制作等数字运算处理,无法对应录音室中发展已经非常成熟完备的PCM混音后制设备,难以取得录音业界的认同。
另一方面,一般消费者用平价音响系统也听不出SACD与CD在音质上的明显差异。2009年,在SACD软件选择不及CD丰富,消费者又兴趣缺失的状况下,主流唱片大厂纷纷停止SACD的发行。等于宣告Sony借由SACD取代CD的梦想破灭,时至今日,只有少数发烧唱片小厂依然发行SACD,消费族群也仅限于音响迷的小众市场。
Andreas Koch也是制定SACD格式的主要人物,为Playback Design品牌总裁
进一步追溯DSD发展的源头,如果你认为DSD是因为1999年SACD推出才研发出的新技术,那你就错了。DSD所探用的Delta-sigma编码技术,其实早在1954年就出现在C.C.Cutler的专利文献中。1969年,D.J.Goodman的论文正式将Delta-sigma编码技术用于模拟声音信号的转换。SACD规格的主导Ed Meitner早在被Sony聘请之前,就在1978年开始实验1bit录音,当时是储存在磁带上,取样频率不是现在的2.8MHz,而是2.5MHz。事实上,早在数位录音与CD规格制定之前,第一场PCM与DSD的规格大战就已开打!
《三》所以DSD是比PCM更优异的格式吗?
从1980年代的PCM与DSD规格之争开始,学术界、产业界与音响迷之间对这两种格式的争论就从来没有停过。事实上,DSD与PCM的比较,牵涉的层面与变量非常复杂,检视的角度不同,得到的结论就不相同。
先从DSD与PCM的本质开始说起,DSD虽然会产生极高频噪讯,但是PCM同样会因为数位滤波而产生Pre-ringing失真。Chord数位设计者Rob Watts从PCM阵营的角度提出他的看法,他认为PCM的问题可以借由妥善设计的数位滤波解决,但是DSD的Noise Shaping却存在许多难以克服的问题,他指出Noise Shaping的本质是一种负反馈系统,这种技术会造成两个缺陷,一是低于Noise shaping底噪的微小信号将会全部丧失,二是时间相位的非线性失真。后者对于音乐的瞬时表现影响尤大,会破坏听觉对于真实音乐的重建。
Rob Watts,PCM阵营的代表人物,一手负责CHORD音源的技术开发,所以对Rob Watts而言,DSD的先天缺陷比PCM还要严重。不过,DSD阵营的Ed Meitner有不同见解。他指出音乐的强弱变化在模拟波形零点交越之处,是人类听感最敏感之处,此处的重播表现将会主宰听感对于真实音乐的重建。DSD不论音乐信号强弱如何变化,都维持最高分辨率,但是PCM在音乐信号零点交越之处的分辨率却是0bit,根本无法反应这个区间的微小声音变化,可见DSD才是比PCM更能忠实还原音乐的格式!
所以到底哪种格式较好?只能说PCM与DSD根本是半斤八两,各有优缺点。再从实际使用的层面检视,如前所述,虽然理论上DSD解码更为单纯也更接近于模拟,但是在录音室领域,DSD录音却不切实际,因为DSD无法混音、等化与制作,所以在录音处理阶段,DSD必须先转换为DXD2类的PCM格式,最后才输出为DSD格式,等于经过两次PCM与DSD的转换,对于声音质量难免造成负面影响,所以目前市面上的音乐发行仍以PCM为主流,DSD录音与解码只占极小部分。
《四》native 单声道真的存在吗
(也称直解DSD)
所谓Native DSD,代表的是没有经过任何PCM与DSD转换过程的DSD信号,也就是最纯粹、最完整保留信号原貌的DSD。表面上看,Native DSD似乎不难取得,但实际上却超乎想象的困难。让我们先看看PCM阵营的困境吧,如前所述,从1980年末期以降,市售DAC芯片就以Delta-Sigma转换技术为大宗,也就是说所有PCM信号其实在DAC芯片里都经过了DSD转换,也都夹带了DSD的高频噪讯。所以除了MSB等极少数自行开发R2R多位元数类转换线路的厂家之外,Native PCM几乎是不可能实现的愿望。
近期SACD忠实拥护者Esoteric也开始采用R2R解码
既然DAC芯片都是DSD架构,那么Natve DSD是不是容易取得多了呢?很遗憾,事实并非如此。根据Ed Meitner与PS Audio数位设计者Ted Smith的说法,唯有1bil DSD译码才能真正展现DSD的优势,他们设计的音源都采用自家开发的1bit DSD解码线路,当然符合这个条件,问题是市面上的DAC芯片碍于成本限制,几乎都不是真正的1bit解码,而是多位元(一般是5 bit) DSD解码架构,Ed Meitner与Rob Watts都认为这已经是一种PCM架构了。
所以如果以最严苛的标准检视,绝大多数透过市售ADC芯片进行的DSD数位录音,得到的都不是纯正的Native DSD。而绝大多数采用市售DAC芯片的数位音源,即使宣称支援Native DSD,实际上也不是纯DSD转换。再从录音端看,前面也提过,DSD无法混音、等化与制作,所以几乎所有DSD录音都必须转换为PCM才能进行信号处理工作,最后输出的DSD都不能称为Native DSD。那么,真正的Native DSD到底存在吗?只有在符合以下条件的状况下,才有可能实现。
第一,在录音的源头,只有两个状况可以称为真正的Native DSD,一是用真正的1 bit DSD ADC进行录音,二是用1 Bit DSD ADC转录模拟母带。
第二,DSD录音必须不需经过任何剪接、混音、等化与制作,也就是在没有转换为PCM的情况下,直接以DSD录音母带形式发行。
第三,播放端必须探用真正1bit DSD解码的数类转换器,将DSD转换为模拟信号。
第四,播放DSD文件时,别忘了从计算机或nas传送到DAC的过程也不能经过任何转换。理论上从计算机USB界面以ASI0通道传送Native DSD,或是透过DoP传送DSD封包都算是Native DSD传输,但是有一派最严苛的DSD玩家却认为DoP不能算是Native DSD。
《五》我们真的可以听出DSD与PCM的差异吗?
2004年德国Detmold音乐大学曾经做过一份研究,在严谨的条件下,用盲眼试听方式比较了SACD与DVD-Audio的听感差异,得到的结论是聆听者并无法区分两种格式的听感差异。这个结论也反应在专业录音师对于DSD与PCM的态度上。
Merging Technology解码器
Merging Technology首席软件工程师Dominique Brulhart就曾分享他的经验,Merging Technology虽然是DSD专业录音领域的第一品牌,但是他对PCM却持开放态度,他曾参加过一场研讨会,由专业录音师一同探讨DSD与PCM的差异,原本以为两派人马会剑拔弩张,没想到大家都非常理性,因为对这些录音师而言,录音过程中的变量太多,DSD与PCM的音质差异其实微不足道,工作上的实用性,才是他们考量的重点。
《六》什么是DSD64/DSD128/DSD2.8MHz/SD5.6Mhz?
前面提到SACD的2.8224MHz取样频率是CD的64倍,所以SACD使用的DSD又称为DSD64,也可写成2.8MHz DSD。以此类推,DSD 128的取样率提升为前者的两倍,所以也称为DSD 5.6Mhz或Double-rate DSD。四倍DSD称为QuadDSD、DSD256或DSD 11.2MHz ,八倍DSD则称为Octuple- rateDSD、DSD512或DSD 22.4MHz。
目前四倍与八倍DSD的录音数量极少,而且解码转换的声音质量还不够理想,距离实用化还有一段距离。
《七》四倍甚至八倍DSD的超高解析度有意义吗?
理论上,将DSD的取样频率提升到四倍的22.5792MHz之后,高频噪讯将会推移到接近80kHz才发生,经过Noise shaping之后,大幅降低了DSD的高频噪讯问题,也大幅拓展了极高频延伸。不过提升到四倍DSD之后,电子元件与时钟线路的噪讯与失真却会破坏声音质量,所以Andreas Koch认为目前DSD128仍是最理想的DSD格式。
目前少数标榜支援多倍DSD的数类转换器,大多在转换为模拟信号之前,进行了PCM的转换与处理,才能解决噪讯与失真问题。未来除非有厂家研发出1bit DSD芯片,克服电子元件与线路的缺陷,否则多倍DSD并不是最理想的DSD格式。
《八》DSD与PCM的分辨率可以换算吗?
因为编码方式不同,DSD与PCM的分辨率无法直接换算,如果真的要比较,只能以估计的方式,推算DSD64的分辨率大约等于PCM格式的20bit/141.12KHz或24bit117.6KHz。如果与既有的PCM格式相较,DSD64的分辨率大约接近PCM 24bit/96kHz,不及PCM 24bit/192kHz。
《九》Pcm转换为dsd格式真的会损失音质吗?
PCM与DSD的转换可以很简单,用免费的Foobar软件就可以办到。但是Andreas Koch在他的「DSD - The NewAddiction」一文中明确指出PCM与DSD的转换不可避兔会破坏音质,所以专业录音室里必须用昂贵的器材进行这项工作,让负面影响降到最低。也因为这两种格式的转换会破坏音质,所以Native DSD才会成为玩家追求的重点。
《十》dsf丶dff等等这些文件格式与DSD的关系
就像PCM可以分为WAV、FLAC、 AIFF、ALAC等多种文件格式,DSD也有许多不同的文件型态'大部分支援DsD播放的数位音源都能支援这些DSD格式的文件播放,说明如下:
dff: Philips于2000年推出的DSD的文件格式。
dsf:又称为dsdiff,是Sony于2005年推出的DSD文件格式,与dff非常接近,不同之处是可以夹带Meta Data曲目信息,并且在播放时于计算机荧幕或电亲显示封面图裆。dsf是Sony原本计划推出的DSD Disc所使用的文件格式,可以用自家Playstation或计算机及某些SACD唱盘播放。后DSD Disc并未正式发行,但是dsf却因为可以夹带Mela Dalia,而成为DSD的主流文件格式。
wsd:由1-bit-Audio-Consortium组织在2002年发表,这个组织主要由日本影音厂家所组成。
dst:与以上三种文件格式不同,dst是DSD的无损压缩格式,类似于PCM的FLAC文件格式,可以用比较小的文件进行储存。必须注意的是,dst主要用于SACD的多声道版本,目前大多数播放机都不支援这种文件格式。
iso:有些时候我们会看到DSD的iso文件,这并不是DSD的文件格式,而是某些用家设法从SACD复制的DSD镜像文件。虽然某些播放机可以直接播放iso文件,但是碍于SACD的版权限制,合法的播放机是不允许播放iso文件用家必须先用特定软件将iso转换为dsf文件,才能进行播放。
DXD:因为DSD格式无法混音制作的先天限制,所以导致专业录音界发展出DSD-Wide、DSD Pure与DXD等可以进行信号处理的文件格式,前两种文件格式维持DSD64编码,虽然可以进行等化与剪接等基本处理,但是实用性依然受限,所以Merging Technologies在2004年推出Pyramix工作站与Sphynx2 AD/DA转换器时,同步制定了专门用于混音制作的DXD格式。DXD是针对DSD转档最佳化的PCM格式,分辨率为24/352.8,换算分辨率大约是DSD64的三倍,制作之后就算输出为DSD128也绰绰有余,足以完整保留DSD的讯息量。不少录音师选择以DXD格式录音,以便直接进行混音制作工作,最后再输出为DSD格式。目前许多音乐下载网站也直接提供DXD格式下载,作为高解析音乐文件的选择之一。
文章转自Hao4K影音