音特美全名Etymotic Research是一家专门的声学研究机构,主要从事人耳听觉相关的基础理论研究,为医疗听力测试,助听器公司等提供理论支持和解决方案。 频响曲线,简单来说就是给耳机一个响度不变,频率连续变化的声音信号(即平直曲线,就是通常说的“扫频”),然后通过专业的人工耳(或者叫拾音器,俗称话筒、麦克风)接收耳机放出来声音信号,记录下不同频率的声音响度,从而形成的一条新的曲线。曲线的X轴即横坐标为频率,单位赫兹Hz,曲线的Y轴即纵坐标为声压级(可以理解为响度),单位分贝dB。 音特美曲线,是在麦克风直接收音,测得的声音曲线为平直曲线的条件下,将麦克风放进人工头的耳洞内进行收音,模拟人耳听到声音的过程,测得的进入人耳后的频响曲线,如图1所示↓。 图1 ER4系列耳机便是以音特美曲线为目标曲线,设计调校出来的监听耳塞,诞生距今已有30个年头。从最初的三款ER4S,ER4B,ER4P,到配有两条线可以切换ER4S和ER4P的ER4PT,再到五年前的ER4SR和ER4XR。还有ER2SE,ER2XR,SE3SE,ER3XR等系列型号。 图2 参评耳机为图2中四款,其中DIY ER4 可切换S/B/P三种模式,以下简称ER4S、ER4B、ER4P,官方ER4S简称ER4S红蓝。 前端:①苹果iphone se2 + 原装芯片转接头、②索尼xzp + nfhifi NHA-L1( APTX-HD ES9038Q2M蓝牙解码耳放)、③海贝R8(phoneout 双AK4497解码) 耳机均采用原配线材,三节套深插入耳式佩戴。 外观与佩戴 舒适度分为五个等级:很舒适;舒适;一般;难受;很难受。 线材软硬度分为五个等级:很软;软;一般;硬;很硬。 听诊器效应分为五个等级:很弱;弱;一般;强;很强。 耳机佩戴要很舒适才能带着睡觉,舒适勉强,但并不建议带耳机睡觉。听诊器效应有线耳机或多或少都会有一点,线越软听诊器效应越弱,还可以通过绕耳佩戴来改善。 ER4SR和SR2SE的外观质感比较不错,老版的ER4S红蓝塑料感比较强,给人一种工程机的感觉,DIY的ER4使用透明树脂,质感还可以。 接口方面,ER4S红蓝采用的是一粗一细的双针,比较少见,跟fitear的双针类似,但间距不同;ER4XR和ER2SE采用的是带有定位的MMCX插口;DIY ER4则采用了0.78的双针,双针又称2Pin。 声音部分 首先明确一下,三频,人耳的可听频率范围是20-20000Hz,不同领域对三频的界定不同,声乐的范围主要在80~1050Hz, 频率(Hz) | 低音 | 中音 | 高音 | 男声 | 82-330 | 110-440 | 130-523 | 女声 | 165-660 | 220-880 | 260-1047 |
器乐的范围广一些,以钢琴为例, 钢琴 | 低音区 | 中音区 | 高音区 | 频率(Hz) | 27.5-125 | 130-1000 | 1050-4186 |
为了方便大家理解,在此将耳机的音域按下表划分(单位Hz), 本文均按上述划分,如有不同看法,以你为准,请自行转换。 耳套尺寸:耳套长度指耳套导音管部分长度,并非外部总长度。 | ER4SR | ER2SE | ER4S红蓝 | ER4S | ER4B | ER4P | 耳套内孔径 | 2mm | 2mm | 2mm | 2mm | 2mm | 2mm | 耳套长度 | 11mm | 11mm | 11mm | 11mm | 11mm | 11mm |
线材确实会影响声音的听感,但影响范围一般在5%以内,均以原配线为准。在一定范围内,耳套的内孔径越小,高频会越少,极高频会越多(真实变化),相对的低频听起来会越多(听感变化);耳套内孔径越大,则高频越多,极高频越少(真实变化),相对的低频听起来会越少(听感变化)。耳套越深入,极高频也会越多,高频会相应减少。 由于苹果手机自带EQ调音,会增加低频氛围感和高频通透感,所以仅作参考。海贝R8属于高素质播放器,高频,极高频部分有一定增益,即使在低增益设置下,ER4系列的高频依然是过量的。所以以下听感以ES9038Q2M解码的声音为准。 一、听感部分(三频与音色): 极高频延伸: 10kHz以上频率的声音定义为极高频,正常人类幼年时是可以听到20kHz的声音的,但是随着年龄的增长,人耳对极高频声波的敏感度会逐渐下降,表现为可听频率上限的降低,一般到了20岁大概就只能听到18kHz了,30岁可以听到17kHz左右。 由于掩蔽效应的关系,本文把极高频延伸范围界定为10kHz以上的声音 比50~20kHz频段中的最高声压级 低30dB时的频率点,如果20kHz以内没有下跌30dB,则记极高频可延伸到20kHz或以上。 极高频 | ER4SR | ER2SE | ER4S红蓝 | ER4S | ER4B | ER4P | 延伸(Hz) | 16.8k | 17.5k | 16.9k | 16.6k | 16.8k | 16.5k |
极高频延伸,频率越高越好,响度不同会影响声音整体的通透感不同,一般相比主音部分的最低值,极高频在±5dB之间比较合适,大部分耳机能做到-10dB以上就已经很不错了。 ER4S红蓝是比DIY ER4的极高频延伸要好的,从图3、图4的曲线中可以看出,ER4SR和ER4S红蓝在极高频16kHz左右的位置是有一个峰的,相对的极高频延伸也更高一点,而ER2SE和DIY的ER4系列这个位置是没有峰的。 图3 图4 如果只是一条耳机或许是偶然,但是跨越了25年的两条耳机都有这个峰,那么可以认为这是音特美对于ER4系列的调音了。或许是在单元选取的时候提高标准,选择了极高频延伸更高的单元,或许是导管材质的选取和前腔内壁做了处理,当然不排除也有DIY可以做出这样的效果,但是被测这条是没有的。 人声部分: 远近位置,首先要是人声有一定距离的曲子,如果本来音源中人声的位置贴脸,或位于头中,距离为零,零乘几还是零。此处以蔡琴的《渡口》中的人声位置进行横评对比,取相对位置,即如果纵深声场为10,人声距离6,人声位置就是3/5。 人声音色,主要由其泛音决定,主要影响频段为3k和6kHz,高的话人声比较亮,低的话比较柔;柔的音色如果结像散一点可能会有暖的感觉,如果极高频延伸不足的话又会显得暗,在此分为很亮、亮、较亮、微亮、中、微柔、较柔、柔、很柔九个级别。 人声 | ER4SR | ER2SE | ER4S红蓝 | ER4S | ER4B | ER4P | 位置 | 2/3 | 2/3 | 1/2 | 1/2 | 1/2 | 1/2 | 音色 | 微柔 | 中 | 中 | 中 | 亮 | 微暖 |
ER4P属于微柔的级别,但是由于结像略散,听起来有点暖的感觉。 ER4B由于6~10kHz的能量分布比较多,有比较明显的齿音,主要是qi,xi,ci,si音有明显的空气摩擦感,听乐器不错,听人声会有一定负面影响。 ER2SE的人声虽然也是中性,但是会带有一丝甜味,很轻微,而且由于11k~12kHz的峰比1kHz位置高出些许,所以在一些人声收尾声时会有一点点后齿音。 声音厚度 图1 图1中可以看到,经人头拾音后,频响曲线3kHz的位置会形成一个峰,以下简称3k峰, 50~1050Hz的频段定义为耳机的主音部分,主音部分的平均响度与3k峰响度之间的差距,很大程度上决定了整个耳机声音的厚度,有些耳机的调音没有3k峰,那么取1k~3k之间的最高值(至于为什么,后面说声场的时候一起说)。将主音频段的平均响度低于3k峰10dB时的厚度定义为5,低于3k峰20dB时的厚度定义为0,如果阻抗曲线不平直,还要算上阻抗引起的能量分布偏移,主音部分随时间衰减的快慢也影响了声音的厚度感。以下为这几款耳机的瀑布图,XY坐标系为频响曲线,Z轴为时间,单位毫秒ms,显示各个频段的响度随时间衰减的过程。 得到这几款耳机的声音厚度相对值。 | ER4SR | ER2SE | ER4S红蓝 | ER4S | ER4B | ER4P | 相对厚度 | 3.5 | 4 | 2.5 | 3 | 2.5 | 4 |
一般厚度5~6适中,均衡杂食;厚度8以上声音变厚,会更富有磁性,但是声音容易变浑浊,更适合表现浑厚的男声和女低音;厚度3以下声音变薄,会欠缺质感,但是更加空灵,更适合表现一些女高音或海豚音一类。总的来说2~4的厚度是比较适合监听的。 低频部分: 下潜(50Hz以下),统一以声压级下降到低于低频频段固定程度为界,取相对值; 量感,50~500Hz部分的厚度(与上述主音厚度计算方法相同)结合下潜影响; 质感,按弹性划分为,硬H(Hard)、脆B(Brittleness)、弹E(Elasticity),一定范围内,启振和衰减的越快声音越弹,快到一定程度为脆,慢到一定程度为软,如果启振和衰减过程过于线性,则会表现为硬。 低频 | ER4SR | ER2SE | ER4S红蓝 | ER4S | ER4B | ER4P | 下潜 | 13Hz | 20Hz | 14Hz | 14Hz | 14Hz | 12Hz | 量感 | 4 | -2 | 1 | 2 | 1 | 6 | 质感 | E 7 | E 5 | E 6 | E 6 | E 5.5 | E 6.5 |
除ER2SE低频下潜不是很深外,其他几款下潜深度差不多,此为固定标准下的相对值,可自行等幅度增减。 低频量感的多少,0~20范围内没有好坏之分,更大量的低频会带来更多的氛围感,包围感,以及听感动态,但在一定程度上也会影响其他的频段。多少合适?跟音乐类型有关,0~4适合监听,5~8适合古典,9~12适合流行,13~16适合摇滚,17~20适合重金属类,还跟个人的听音偏好,听音习惯有关。 质感Q弹的低频会更丰满,脆的低频会带来更好的瞬态响应,硬的低频也有比较不错的瞬态,但是听感上并不讨喜,软的低频启振和衰减都比较慢,质感较差。 听感动态 动态指耳机的响度范围,就是音量大小范围,比如有些音乐,前奏或声音小的时候,要把音量调大才能听清,副歌部分或情绪激昂的时候,声音变大,又要把音量调小,这种响度差,就是动态。 动态主要来源与乐曲本身。耳机的灵敏度越高越容易表现出动态,灵敏度越低则需要前端系统可以提供更大的推力,也就是更大电流,更强的瞬间放电能力。 通过增加耳机主音部分(50~1050Hz)的起伏程度,主要是低频部分中50~250Hz高于中低频200~800Hz部分的响度差,或者增加1500~4000Hz高于主音部分的响度差,可以提升听感动态。 综合以上因素,每种因素站固定比例进行综合计算评分,听感动态如下: | ER4SR | ER2SE | ER4S红蓝 | ER4S | ER4B | ER4P | 听感动态 | 6 | 3.3 | 5.7 | 5.1 | 5.7 | 6.6 |
作为监听耳机,这几款主音频段都很平直,所以听感动态表现一般,当然上大推力台机的话还是可以推出大动态的。 二、素质部分: 瞬态响应 瞬态指耳机对于响度变化的反应速度,例如小声忽然增大,或者大声忽然终止,耳机能否很快速的还原这种变化,就是瞬态好不好的表现。 瞬态响应能力可以通过阶跃测试反应,即给零初始状态的耳机输入一个阶跃信号,测试耳机输出信号的时间演变。 以下是这几款耳机的阶跃测试结果,评分取多次测量的最优值。 | ER4SR | ER2SE | ER4S红蓝 | ER4S | ER4B | ER4P | 瞬态 | 9.5 ms | 9 ms | 8 ms | 8.5 ms | 8 ms | 10.5 ms | 评分 | 9.1 | 9.2 | 9.4 | 9.3 | 9.4 | 8.9 |
状态归零越快,所用时间越短,瞬态响应越好,根据哈斯效应,10ms以内的声音人耳听起来都像是一个声音,10~50ms就像声音的延长,70ms以上就像是回音,教科书上人耳分辨回音的时间为0.1s即100ms以上。在此将5ms评为10分,每增加5ms减1分。 声场 这里的声场是指声音存在的区域,或者叫声波传播的空间,就是一个立体声回放系统产生的空间感。 音乐会或演唱会现场是真实的空间感;音箱系统的空间感跟摆放的位置有很大关系,左右的横向宽度,前后的纵深距离,上下的高低,以及听音者的位置。 头戴式耳机,把耳朵整个包进去那种,声音进入耳道前,会经过耳廓的反射,形成一定立体感,但也受到耳机与耳朵的距离,夹角等相对位置的限制;压耳式的头戴耳机与入耳式耳机包括半入耳和平头式因为不经过耳廓反射这个过程,所以声音是只有左右的。 对于只有左右的系统,通过模拟图1的过程进行调音,主要调整1k~3kHz的曲线,可以模拟出声场的立体感,1kHz是纵深距离,响度越低距离越远,3kHz是左右距离,响度越大横向距离越近,1k~3kHz之间对应的就是纵向到横向这90°之间的声场,左耳机对应左边90°,右耳机对应右边90°。所以想要有一个准确的声场定位,一条耳机的左右两边的频响曲线要一致,如果一条耳机明显一边声音大,一边声音小,就是不匹配。 这里主要应用的是双耳效应,根据左右两边声音的响度差,时间差,相位差,音色差,对音源位置进行判断,当两边声音完全一样时,大脑会判断这个声音在你的纵向中轴面上,对于3kHz高于1kHz的曲线,大脑更容易将声音判断在前方位置;对于3kHz低于1kHz的曲线,大脑更容易将声音判断在后方位置,但通过主观想象也可以定位在前方更远的位置。 人对于声音的定位能力也不是生来就有的,大部分是通过后天形成的,大脑通过记录耳廓反射的声音特征,结合视觉判断,记录下不同声音特征对应的方位信息,这就是耳壳效应。不同人的耳廓大体类似,但存在一定个体差异,是需要经验积累或后天训练的。 想要听到立体感最主要的还是音源本身要记录了相关的信息,例如用人工头,在现场录的音,回放时就有比较真实的立体感;如果是录音室录的音,每个乐器和人前面都有至少一个麦克风,那么就是混音师后期调出来的空间位置关系。 图5 通常所说的比较正的声场大概就是图5这个形状↑。音特美这几款耳机的声场也都是这样的形状,只是各部分的长短比例有些差别。 这里将左右耳距离定为2个单位,左右耳中间点到鼻尖的距离定为大约1个单位,声场默认两边对称,横向定为最左到最右的距离,纵深定为两耳连线到前方最远端的距离,上下定为最上到最下的距离。 声场 | ER4SR | ER2SE | ER4S红蓝 | ER4S | ER4B | ER4P | 横向 | 4.6 | 5 | 5.6 | 5.7 | 6 | 4.4 | 纵深 | 3 | 3.3 | 3 | 3 | 3 | 2.9 | 上下 | 2 | 1.9 | 2 | 2 | 2.1 | 1.9 |
可以看出ER4B的横纵比是最好的,横向是6,去掉中间人头占的2,两边各2;纵深是3,去掉人脸占的1,前面也是2;上下声场是2.1,是近乎1:1:1的一个声场。 结合之前所说的人声位置,ER4S红蓝,ER4S,ER4B,都是在前面1/2的位置,就是距离人脸1,距离纵深远端也是1。 横向声场,也是最容易感受到的声场范围,横向大,更容易听出分离感;纵深声场,需要一定的空间想象力,更远的纵深,更容易听出空间感,结合上下声场,能够形成立体的声音分布。 对于一些低频量感比较大,比较厚的声音,声音特别是低频的氛围感,包围感会更强,但是人声的位置也会更近,一些声音甚至渗入到人头所在的区域,感觉声音就像从两耳中间的地方发出来的,这种现象称之为头中效应。 结像 了解了声场,我们知道人耳是可以判断声音的方位和距离的。对于一个立体声回放系统,当乐器或人在某个位置发声后,通过对声音的振动范围和轨迹的感知,可以形成声音的形体。这个形体就是结像。 听音经验丰富,对于乐器更了解的听者,更容易听出声音的结像。 结像的清晰度,是指结像的边缘感,线条感是否清楚,等同于画面系统中的锐度。在此分为10个等级,10超高清、9高清、8清晰、7普清、6有、5一般(似有若无)、4没有、3散、2糊、1糊成一团。 结像的大小,就比较好理解了,就是这个声音的形体所占据的空间范围。分为5个等级,很大,大,中,小,很小。 结像 | ER4SR | ER2SE | ER4S红蓝 | ER4S | ER4B | ER4P | 清晰度 | 8 | 5 | 6 | 6 | 7 | 5.5 | 大小 | 小 | 小 | 小 | 小 | 小 | 中 |
结像的清晰度越高,声音听起来会越清楚,但糊有糊的味道,各人有各人的喜好。 结像小更适合表现声音的细节,结像大更容易表现出声音的气势。 听感素质 解析力,通常指一款耳机对于音源中信息,以及细节的还原能力,取决于发声单元本身的物理性能。理论上单元的振膜越薄,磁通量越大(对于电磁换能器),越有利于耳机还原更多的信息。 也就是说一款单元确定了,那它的素质也就确定了,但是通过调整音腔,电路,或者EQ,调整各个频段声音响度的比例,是会影响到单元素质的发挥的,也就是这里所说的听感素质。对于低频比较多的耳机,降低150~500Hz是可以明显提升听感素质的;对于人声比较远的耳机,提升400~800Hz可以提升信息量;提升4kHz,或者8kHz以上的频段可以使微小的声音细节更加清晰。 分离度,原本指立体声系统中左右声道之间的隔离度,反映了两声道的串扰程度。这里主要指声音中各个成分,人声,不同乐器等声音之间的分辨程度。跟信息量,声场大小,瞬态,清晰度等均有关系。 听感素质 | ER4SR | ER2SE | ER4S红蓝 | ER4S | ER4B | ER4P | 信息量
(听感解析力) | 7 | 6 | 7 | 7 | 7.5 | 6 | 分离度 | 7.5 | 7 | 8 | 8.1 | 9 | 6.3 |
分离度可以超过10,比如声场很大,信息量没那么大情况,举个例子HD800。 分离度与信息量匹配,或略大于信息量,听感会比较舒适;分离度小于信息量,声音的辨识度会降低,听起来会比较拥挤;分离度高于信息量过多,声音会显得空虚。 总结 定位监听的这几款耳机,声场表现上都是比较准确的,尤以ER4B的声场最为规整,分离度最高,瞬态最强,完全满足了监听的需求,只是亮度偏高,对于表现乐器更加合适,人声表现为亮度高,算是特色。 ER4S亮度适中,瞬态同ER4B几乎相同,只有横向声场稍微小了那么一点点,可以说是这几款耳机里最为中正的了。 ER4SR的横向声场又小了那么一点点,但带来了更为凝实的结像,是这几款耳机里清晰度最高的,也是声音质感最好的,人声表现为微柔,也是特色。 一些人觉得ER4S的声音不够通透,差一口气,其实只是ER4S比较居中。ER4B增加了亮度,ER4SR增加了清晰度,各有取舍。也可以看出ER4系列还是有提升空间的。 ER4P为了易推性,侧重了听感动态和低频质量,但在素质方面有比较大的牺牲。 ER2SE低频稍差,极高频比较多,是比较偏科的,因为和ER4系列不在同个级别,拿来对比有些吃亏,但在同级别里,ER2SE作为一款监听塞还是比较优秀的。 写在最后 一个声音最终还是要亲耳确认过才知道喜不喜欢,听音偏好是比较主观的感知,不同人有不同人适合的度,客观数据化的体系是给不同人之间建立一个相互更容易沟通理解的桥梁,其中也有只能通过亲耳试听才能感受到的部分。 单一耳机评测无论是主观听感还是客观数据都比较难以形成有效的信息传递,故采用横评对比方式,不同耳机有不同的适用场景,合适的才是最好的。 以上听感以及对比评分仅限本文体系内适用,如有其他体系请自行转换;如果有不同看法,欢迎讨论;如有异议,以你为准。
|