|
10组盲听要求中必须10次确实是不合理的,不过至少要答对8组以上是很科学的。
我复制粘贴下在另一个帖子的回复:
哈哈,论坛里面都没人学过统计学的吗?其实那个盲听测试基本上还是合理的。没记错的话是一人做10组盲听测试,10组中猜对9次就能拿钱。为什么要做10组,而不是1组2组?是因为要减少瞎蒙蒙对(随机发生)的概率。通常来说如果这个随机的几率(p-value)要小于5%(95%置信区间confidence interval),我们就可以推翻“零假设”(电源线没有可闻的音频区别),来证明电源线有可闻的音频区别。如果要p-value小于5%,在10组试验中是要答对8次以上的(10组对8次的p-value值是5.5%)。这个可以在二项式表(重复n次独立的伯努利试验)中找到对应p-value。
如果有兴趣可以研究一下具体算法,可以看下百度百科:https://baike.baidu.com/item/%E4%BA%8C%E9%A1%B9%E5%88%86%E5%B8%83/1442377?fr=aladdin
国外关于这类ABX测试的科学解释已经相当多了,应用范围也很广。比如盲测百事可乐和可口可乐的区别,320k音频和无损音频的区别,包括国外一些音频厂商开发新产品的时候也会用到。测试和统计方法都是一样的。文献参考楼主有兴趣可以看看(英文的):https://www.madronadigital.com/statistics-of-abx-testing |
|