统计数字(4)优良统计的特征是什么

统计数字是事实?是谎言?

乔贝思特

标签:

这一章的重点,是说明低劣统计的制造方式:薄弱的猜测、含糊的定义、有问题的测量,以及贫乏的取样。此时你可能会想,是不是所有统计都有问题,统计不过是个“该死的谎言”。难道没有好的统计吗?我们该如何分辨统计的好坏呢?

这一章指出的问题,其实也道出了好的统计所必须具备的部分条件。首先,*好的统计不能光靠猜测*。统计最基本的问题是:这个数字是怎么算出来的?统计绝非十全十美,但某些缺点却是要不得的。我们不该对猜测抱持太大的信心(即便是基于经验或知识的猜测)。

请注意猜测的危险征兆:提供统计数字的人是否有偏见,他们是否想证明问题非常普遍或极为少见?数字是否相当庞大、接近整数?统计所描述的,是否是个从未见过、不为人知而且还包括庞大黑数的社会问题(如果是,倡议者又是如何得出这个数字呢)?

第二,*好统计靠的是清楚合理的定义*。千万记住,每一项统计调查都必须对研究对象加以定义。定义必须清楚,而且对外公开。个案不是定义,戏剧化且骇人惊悚的故事与最极端的案例更绝对不是定义。任何提出统计数据,用来描述社会问题的人,应该能够并愿意解释用以制造数据的定义。定义通常很广:能够包含各种与举例不同(且通常较为轻微)的案例。

我们要问的是:定义究竟多广?定义包含了什么?然后,问问自己,这些提出数据的人是否特别喜欢广泛或狭隘的定义?原因是什么?并且想想这些定义是否排除太多漏报个案,或纳入太多误报个案。

第三,*好统计的基础是清楚合理的测量*。所有统计多少都与测量有关;尽管测量都不完美,但是各种缺陷的严重程度不一。提供统计者应有能力与意愿解释测量社会问题的方法,并做出明智的抉择。如果提供数字的人持有某种偏见(偏好较大或较小的数字),那么,该偏见可能就会反映在测量问题的方法。例如,他们可能会调整问题的措辞,以诱导某些回应,或是藉由特殊方法解读。对于测量方法不明者,我们必须谨慎以对,思考究竟是怎样的测量选择,制造出这样的统计数据。

最后,*好的统计数据要有好的样本*。光是清楚合理的定义和测量还不够。几乎所有统计都是由小样本推论到大规模母体,提供统计数据的人,应该解释自己选择样本的方法。好的样本能够代表母体;理想上,这样的样本应该随机抽出。格外留意样本数少、非随机的便利抽样;这类样本虽然取得容易、花费低,却难以成为全面性推论的基础。记得问问自己,选择的样本会怎样扭曲最后的统计结果。

好的统计所具备的共同特征,是我们不只看到一个数字;我们还看到数字背后的定义内涵、测量方法与抽样方式,也就是得出数字的完整过程。当报告隐瞒了这些讯息,我们绝对有理由怀疑数字的真假。

摘自 《统计数字是事实?是谎言?》 商周出版社 提供

(//www.dajiyuan.com)

相关新闻
美沙酮毒害问题严重  全美死亡率激增
移民统计:西班牙华人半数从事餐饮业和零售业
世卫组织警告世界吸烟人数将增多
蒙工作场所讲法语人数稳定
如果您有新闻线索或资料给大澳门威尼斯人赌场官网,请进入。
评论