【大澳门威尼斯人赌场官网5月18日讯】我开了一门《统计在工程上的应用》,教学生用统计方法来检验实验资料。
我在第一堂课就推荐学生读Darrell Huff的经典之作:《如何用统计骗人》,警告他们,统计数位有许多陷阱,不要误用,也要小心勿被愚弄。
通常我举的例子都太枯糙乏味,Huff的例子又太遥远。好在最近中研院科资所的马自恒副研究员提供了一个活生生的例子。他最近发现,“废票率高的投票所,阿扁的得票率较高,连宋的得票率则较低”,以此证明有人作票,刚好是误用统计的绝佳教材。
用统计学术语来说,马博士发现了阿扁的得票率与废票率成正相关。这个没问题,但他由此推论两者之间有因果关系,认为是废票造成阿扁当选,甚至指其作票,就太没统计常识了。
统计第一课:相关性不等于因果关系。滥用这个等号,往往会得出荒谬的结论。譬如说,将台北市过去10年大小火灾的财物损失与所动用的消防车辆数作图,也可以得到正相关性。根据马博士的逻辑,他大概会说“消防车愈多导致火灾的财物损失愈大”,因而怀疑消防员是否趁火打劫。其实真正的原因是,火灾愈严重(A),财物损失就愈大(B),动用的消防车也愈多(C)。B与C有共同的原因,因此两者有正相关性,但B与C并无因果关系。
再举一个例子,我们发现70年代中研院研究员的收入持续上升(假设),又发现同一期间毒品的价格也不断上涨,要不是有人提醒我们,真正的原因是当时通货膨胀很严重,我们也可能得出吓人听闻的结论。
这两个例子因为结论太荒谬,比较容易觉察出来。但有些听起来有道理的说法,也不见得正确。譬如“抽烟导致学业衰退”,可能对,也可能不对,必须从生物化学去证明其因果关系,绝对不能只依赖统计上的相关性。因为真正的原因也可能是:因为个性焦虑,所以无法专心读书,也因为焦虑,所以抽烟,两者之间不见得有因果关系。我们的报纸电视上,充满了这种号称有统计资料支援的假科学论述,不能不小心。
阿扁的得票率与废票率的正相关,也可能不是作票,而是因为:选民不了解新修订的投票规定,导致废票率比以往高。但因连宋支持者集中在都会区,资讯充足,比较不容易盖错;阿扁的支持者较多在非都会区,宣导不够,废票率也较高。这样也可以解释的通。但是否真的如此,我也不敢肯定,要真正验了票才知道。唯一可以肯定的是,马自恒博士绝对无法从他发现的统计相关性中得出“有人作票”的结论。
令人不解的是,一位科学工作者,为什么会有如此不合科学理性的结论呢?
与墨非定律齐名的布劳奇定律说:“如果你手中只有一把铁锤,一切事物在你眼中都成了钉子”,大概就是因为偏见吧。
台湾科技大学化工系)
刘进兴
〔原载《台湾观察》#13;2004.5.14〕
转载自《民主通讯》2004.5.14〕
(//www.dajiyuan.com)