M:吉斯莫先生有一个小工厂,生产超级小玩意儿。
M:管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人员由5个领工和10个工人组成。工厂经营得很顺利,现在需要一个新工人。
M:现在吉斯莫先生正在接见萨姆,谈工作问题。
吉斯莫:我们这里报酬不错。平均薪金是每周300元。你在学徒期间每周得75元,不过很快就可以加工资。
M:萨姆工作了几天之后,要求见厂长。
萨姆:你欺骗我。我已经找其他工人核对过了,没有一个人的工资超过每周100元。平均工资怎么可能是一周300元呢?
吉斯莫:啊,萨姆,不要激动。平均工资是300元。我要向你证明这一点。
吉斯莫:这是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六个亲戚每人得250元,五个领工每人得200元,10个工人每人100元。总共是每周6900元,付给23个人,对吧?
萨姆:对,对,对!你是对的,平均工资是每周300元。可你还是蒙骗了我。
吉斯莫:我不同意。你实在是不明白。我已经把工资列了个表,并告诉了你,工资的中位数是200元,可这不是平均工资,而是中等工资。
萨姆:每周100元又是怎么回事呢?
吉斯莫:那称为众数,是大多数人挣的工资。
吉斯莫:老弟,你的问题是出在你不懂平均数、中位数和众数之间的区别。
萨姆:好,现在我可懂了。我……我辞职。
统计学的解说可能是极富逆论性的,常常被完全误解。关于吉斯莫工厂的故事揭示出,误解产生的一个共同根源是不了解平均数、中位数(中值)和众数之间的差别。
“平均”这个词往往是“算术平均值”的简称。这是一个很有用的统计学的度量指标。然而,如果有少数几个很大的数,如吉斯莫的工厂中少数高薪者,“平均”工资就会给人错误的印象。
读者还可考虑一些类似的引起误解的例子。譬如,报纸上报道有个人在一条河中淹死了,这条河的平均深度仅只2尺。这不使人吃惊吗?不!你要知道,这个人是在一个10多尺深的陷坑处沉下去的。
一个公司可能报告说它的策略是由股东们民主制订的,因为它的50个股东共有600张选票,平均每人12票。可是,如果其中45个股东每人只有4票,而另外5人每人有84张选票,平均数确实是每人12票,可是只有那5个人才完全控制了这个公司。
还有一个例子:为了吸引零售商到一个城里来,商会吹嘘道:这个城市每个国民的平均收入非常高。大多数人看到这个就以为这个城的大多数市民都属于高收入阶层。可是,如果有一个亿万富翁恰好住在该城,其他人就可能都是低收入的,而平均个人收入却仍然很高。
统计学的报告有时甚至更加使人糊涂,这因为有时“平均”这个词不是指算术平均值,而是指中值或众数。中值(中位数)是按大小顺序排列的数值表中中心位置对应的数值。如果表中数值有奇数项,则中值就简单地是中间项的值。如果有偶数项,中值往往取中间两项的算术平均值。
中值对萨姆来说比算术平均值重要,但就是中值也使人对这个工厂的工资情况得出歪曲了的印象。萨姆反正要知道的是“众数”——表中段常出现的数。在这里,众数是发给工厂中数目最多的人的工资数。有时候这叫做典型情况,因为它比其他任何情况出现次数都多。在上面最后一个例子中,那个城里一个典型家庭代表收入为众数的家庭,它也许很穷,但由于有少数亿万富翁,这个城的平均收入也还非常高。