书城经济信号与噪声
1908500000034

第34章 贝叶斯定理:只有正确的预测才能让我们更接近真相(4)

贝叶斯对赌客十分尊重。和其他早期的概率理论家一样,贝叶斯和拉普拉斯经常利用概率游戏的例子来解释自己的工作。(尽管贝叶斯本人也许不怎么爱打赌,但他更喜欢纸牌或桌球这类大众玩的赌钱游戏。)赌客作(准确的)预测,作(非常准确的)概率预测,当他决定按照自己(更准确)的预测下注时,他的世界观就暴露在所有人面前。对贝叶斯先验概率最实用的定义大概就是下注的胜率。

乌尔加利斯是典型的“贝叶斯”式赌客,他喜欢精确地对篮球比赛下注,因为他可以用这种方式进行自我检验,也可以检验其下注的准确度。在我们的谈话接近尾声时,乌尔加利斯说道:“如果你是某支球队的总经理,你可能会这样说,这个队员我要了,那个队员我也要了。一天下来,你也不知道这样做是否正确,但我并不是这样做的,每天或每个赛季结束时,我都知道自己的决策是对还是错,因为我知道自己是在赢钱还是在输钱。这个方法相当灵验。”

乌尔加利斯总是想尽办法搜集篮球信息,因为任何事都可能改变他的概率估值。像乌尔加利斯这样的职业竞技体育赌客,只有在认为胜算达到54%以上时才会下注,因为这样才足以抵消“抽头”(博彩经营者从赌客的赢利中抽的份子钱)和下注风险。凭借着高超的技艺和勤奋的工作,乌尔加利斯跻身当今世界最成功的竞技体育赌客之列,但其下注的准确率仅为57%。要想超过这一数字,比登天还难。

只要能使乌尔加利斯将自己的胜算从53%提高到56%,哪怕是一条很不起眼的信息也会因此变得关系重大。不管是玩扑克牌还是玩股票,玩家就指望这点薄利维持生计了。费希尔所说的统计学意义,指的是使用任意截点来断定哪些才是“有意义的”研究结果,哪些没有意义并且缺乏研究背景,这对赌客们来说实在太复杂难懂了。

但这并不是说乌尔加利斯提出假设时,有意地避开了他在统计数据中看到的信息(费希尔有关假设检验的见解有问题,但问题不在于假设本身,而在于他推荐的检验方法)。实际上,这一点对乌尔加利斯的工作至关重要。每个人都能看到统计模型,这些模型很快会在盘分线上体现出来,问题是这些统计模型代表的是信号还是噪声。乌尔加利斯根据其篮球知识提出假设,所以他能更快、更准确地分辨信号和噪声。

从表8–4中可以看到,乌尔加利斯赌球的方法是一种科学方法,属于纯净馏的一种。首先观察世界,之后提出问题:为什么克利夫兰骑士队不断地赢得比赛?接着,针对这一问题搜集信息,提出假设:这是因为戴维斯正处在合约年,他极力想尽快提高自己的统计数据。乌尔加利斯和物理学家或生物学家的不同之处在于,他以下注的方式验证自己的预测,而科学家们更喜欢通过实验证实自己的预测。

表8–4?科学方法

科学方法的步骤 竞技运动博彩案例

观察一种现象 骑士队不断赢得比赛

提出假设解释这一现象 骑士队不断赢得比赛是因为戴维斯即将签署新合同,所以想尽可能得高分

根据假设做出预测 直到赛季结束,戴维斯始终保持同样的状态。因此,1)他将继续以快节奏打球,2)骑士队未来将继续打出高比分的比赛

检验预测 下注

如果乌尔加利斯愿意根据自己所看到的数据提出有力的假设,他就会更积极地下注。比如,假设乌尔加利斯从丹佛掘金队教练的口中读出一些信号,如将会为球迷们呈现一场“精彩绝伦的比赛”。这句话可能只是随口说说,但也有可能是在暗示,掘金队会加快比赛节奏,以拉动门票销售。如果这一假设是正确的,乌尔加利斯对掘金队的赌注胜算将达到70%,而不是通常的50%。因为贝叶斯定理的缘故,乌尔加利斯越信任其假设,从掘金队身上获利的速度就越快。他可能要看过一两场比赛之后才会下注,因为他要观察自己的理论在实践中是否成立,即使只使用这种方法,拉斯韦加斯的赌客们也已经望尘莫及了。相反的,乌尔加利斯要避免被统计模型干扰,正如1999年湖人队开场不利,这场比赛本无多少深层意义,但其他赌客却误把它当作了信号。

通往真理的贝叶斯之路

乌尔加利斯的概率预测是主观的还是客观的呢?这很难说。

按照经验来看,所有人都有各自的信仰和偏见,这种信仰和偏见是由个人的阅历、价值观、知识涵养、政治立场或专业背景等因素凝聚而成。贝叶斯定理明确地承认人们固有的观念会影响对新证据的理解,还生动地描述了人们对于世界的变化做出的反应,这是贝叶斯定理的一大优点。比如,假设费希尔认为吸烟引起肺癌的概率只有0.000 01%,这就解释了为什么在所有证据都证明吸烟确实会引起肺癌时,这位先生仍然不信。实际上,贝叶斯定理并不干涉个人信仰,在这一理论的支持下,没有什么可以阻止你将自己认为绝对正确的事物作为自己的信仰。如果你认为上帝百分之百存在,或者上帝根本就不存在,在贝叶斯定理下,所有的证据都不会劝你改变观点。

我并非在这里告诉你对有些事物是否应当持有绝对明确的信任态度,但或许我们应该更加坦诚地说出想法。完全相信某件事的人和完全不相信某件事的人争论不休,根本就是无益之举,许多战争或许就是由这样的争论引起的(如印刷机问世之初发生在欧洲的“宗派战争”)。

这并不是说所有的先验理念都是正确无误或者行之有效的,但我认为,我们的信念使得我们永远做不到完全客观、合理或是准确。不过,我们可以尽量做到少一些主观、少一些不合理、少一些错误。基于个人信念之上的预测,是自我检验的最佳(或许也是唯一的)方法。如果客观性关注的是超越我们个人处境的更大真理,而预测是检验我们的认知是否符合真理的最佳方式,那么我们当中最为客观的人,就是作预测最准确的人。费希尔的统计学方法认为,客观性存在于实验室的实验当中,所以与贝叶斯定理相比,费希尔的统计学方法并不适合完成准确预测这一任务。

实际上,贝叶斯定理有一个特性,即随着时间推移,证据越来越多,我们的观念也应该彼此交合。在图8–4中,我给出了一个例子,3个投资者正在判断自己是处于牛市还是熊市。他们最初的看法截然不同——其中一个投资者非常乐观,他从一开始就认为股票市场有90%的概率是牛市;还有一个投资者的脾气有些暴躁,认为股市只有10%的概率是牛市。每次股市上涨,投资者的情绪就比之前乐观一点;每次股市下跌,他们的情绪就悲观一点。然而,在我设定的这套模拟机制中,尽管每天股市上下振荡,但总的来说还是上涨了60%。虽然道路坎坷,但3位投资者最终还是正确地做出了判断,他们几乎(尽管并非完全)确信自己正处于牛市当中。

从理论上来讲,科学就应该这样产生作用。达成共识的科学概念难以琢磨,但真理越辩越明,新证据不断出现,科学观点总能汇聚到一起并且向真理逼近,一如股市的曲折反复。科学界在对范例进行改编、使之与新证据相符时,虽然有时也操之过急,但通常总是过于保守。而不变的是,只要踏上了贝叶斯之旅,所有正确的甚至是错误的固有观念都会重新得到审视,并最终走向真理。

举个例子来说,此时很多科学家正在使用的统计学方法或许正在进行范式转移。我在这里对费希尔统计学方法中出现的瑕疵所作的批评并不新奇,也不过激:多年来,不论是临床心理学、政治科学,还是生态学领域的著名学者,总在发出这样的声讨,但迄今为止统计学方法仍没有任何根本性的改进。

然而,最近一些德高望重的统计学家认为,“频率主义”统计学方法不再适用于大学课程。另有一些教育学者也在考虑将费希尔定理从学报中移除。事实上,近10年出版的各类刊物都在向人们宣传贝叶斯定理。

乌尔加利斯也是一样。虽然不是每次作预测都遵循贝叶斯定理,但是他在假设中检验统计数据,从篮球知识中获取认知方法,甚至乐于接受概率性答案,这些完全是贝叶斯定理倡导的做法。

教科书和传统观念不会说变就变,但贝叶斯定理始终认为,我们定会找到更好的方法,因为贝叶斯定理预测到贝叶斯理论家终会大获全胜。

国际象棋大战:

计算机与人类的智能博弈

和很多前辈一样,24岁的埃德加·艾伦·波也为亚马逊土耳其机器人着迷,这是一台会下国际象棋的新奇机器,拿破仑·波拿巴和本杰明·富兰克林都曾是它的手下败将。1770年这台机器在匈牙利问世,那时艾伦·波还未出生,美国也未建立。19世纪30年代,这台机器来到美国海港城市巴尔的摩和弗吉尼亚州首府里士满巡回展览,而此前几十年这种机器就已经风靡欧洲了。艾伦·波推断这不过是一个精巧的骗局,齿轮和传送装置暴露了亚马逊土耳其机器人的秘密——一定有一位象棋高手坐在箱子里,操纵杠杆,移动棋子,每次“将军”时,方巾包裹的头就会向下点一下。

艾伦·波被视为“侦探小说之父”,他的有些推理作品神秘而离奇。比方说,这次他的怀疑就是有据可依的。艾伦·波怀疑一个人(后来他断定此人便是德国国际象棋大师威廉·斯伦贝谢),在拆卸和组装机器时都有他的身影,但比赛一开始他就不见了踪影(啊哈!原来是威廉·斯伦贝谢在箱子里)。

然而,在艾伦·波有关亚马逊土耳其机器人的文章中,真正有预见性的观点,应该是他抓住了这个机械人对我们今天所说的人工智能(这一术语直到120年之后才出现)的深层影响。计算机未来有望能模拟甚至改进人的高级功能,艾伦·波的文章对这一前景表达了非常深刻、非常现代的矛盾心理。

艾伦·波承认,若真有一台机器能下国际象棋,那将十分引人注目。在他写那篇文章时,人们口中“与众不同”的第一台机械计算机——查尔斯·巴贝奇称为差分机的机器——都还未被构想出来。巴贝奇想过要制造计算机,但终其一生都未能完整地制造出来,而且,这台计算机除了完成加、减、乘、除的简单运算外,最多只能粗略估计一些基本函数的值,比如对数运算。艾伦·波认为巴贝奇的想法已经很吸引人了,但归根结底,这台机器能做的不过是输入可预测的信息,转动齿轮,然后再输出可预见到的结果。这毫无智慧可言,纯粹是机械计算而已。但是,若一台计算机会下国际象棋,就是一个奇迹,因为下棋需要智慧。

艾伦·波说道,如果真的有这样一台下棋机器,从定义上看,这台机器肯定局局获胜,因为机器是不会犯计算错误的。但是,这个亚马逊土耳其机器人并非招招完美,艾伦将这一事实当作进一步证伪的证据:这不是一台机器,而是由人控制的器械,充满人性的缺点。

尽管艾伦·波的逻辑也有缺陷,但时至今日人们仍对机器心存敬畏。在所有表现人类智慧的一流发明中,计算机最震撼人心。比尔·盖茨常被票选为“全美最令人敬佩的人”,而苹果和谷歌则当选“最受欢迎的公司”。我们总是期待计算机既省力又完美,甚至能够克服人类的缺点。

另外,人们相信电脑程序的计算结果百分之百的准确,甚至是有预见性的。2012年,两个英国青少年被指控行骗,他们向股票投资者推广选股机器人“MARL”,称它能“进行每秒1 986 832次的数学计算”,同时可以避免“人类的直觉判断”,投资者只要购买了MARL推荐的低价股票,每过1个小时投资就能翻倍。最终两个少年成功骗取了100多万美元。

即使计算机预测没有使人们更容易被骗,大家对它仍心怀敬畏。比如,一些计算机能预测医院病人康复的概率。在新闻报道中,这些计算机常被表述成现实版的人工智能哈儿9 000(电影《2001:太空漫游》中的计算机)。在电影中,哈儿9 000认为自己对宇航员不再有什么用处了,于是便试图遏制他们的活动。

进入大数据时代,信息爆炸,人们处理信息的能力迅速提高。在这样的时代,我们对待计算机及其可能为人类做出的贡献也许应该抱有更加健康的心态。技术作为节省劳动力的手段,确实可以惠及人类,但我们不该期待机器能代替我们进行思考。

国际象棋的人机大战

1912年,西班牙工程师莱昂纳多·托雷斯·克维多制造了另一个版本的土耳其机器人,将其命名为“棋手”。尽管常有人将棋手这个机器人视为第一款国际象棋计算机游戏,但是它的功能非常有限,只能处理剩下3个棋子的残局,决定这3个棋子的走步。“棋手”也没有像亚马逊土耳其机器人那样的标志性头饰。)

现代国际象棋计算机之父是来自麻省理工学院的数学家克劳德·香农,他也是信息论的创立者。1950年,香农发表了一篇题为“设计程序让计算机下棋”的论文。香农发现了一些电脑程序方面的运算法则和技术,至今仍是国际象棋计算机游戏程序的核心。香农还明白了为什么国际象棋会成为检测机器处理信息能力的对象。

香农发现,国际象棋的目标出奇地清晰、明了,就是把对方的王“将死”。另外,国际象棋的比赛规则也相对简单,比赛中没有运气成分和随机因素。然而,只要下过国际象棋的人(我本人也只是略知一二)都会发现,国际象棋目标简单、规则简单,但想赢得比赛却并不是那么容易的。在一局棋中要走上24步都需要高度集中精神,更不要说赢得比赛了。香农将国际象棋视为计算机界的“试金石”,直接用它来检验计算机的计算能力及其可能拥有的其他能力。

但是香农与其后继者不同,他并没有对计算机持有过于理想化的浪漫观点,香农并不认为计算机能像人类一样布阵下棋。同时,香农觉得计算机下棋赢了人类并非必然。相反,他认为计算机有以下4个优点:

1. 计算速度快。

2. 不会犯错,除非编程时就编入错误。

3. 不会偷懒,在分析招数、分析可能位置时不会半途而废。

4. 不带感情色彩,不会赢了一步就过度自信以致失去胜势,或是遇到困局就沮丧,劣势其实是可以逆转的。

香农认为,计算机的这些优点可以与人类具备的4大优势相抗衡:

1. 思维灵活,解决问题知道变通,不会按部就班。

2. 拥有想象力。

3. 懂推理。

4. 会学习。

香农认为,人机竞赛是公平的。但是在20世纪90年代,这种情况只是少数,且稍纵即逝,例如,俄罗斯国际象棋大师加里·卡斯帕罗夫是历史上最厉害的棋手,他曾对阵IBM公司的计算机“深蓝”,深蓝是史上最先进的计算机之一。

在这场比赛开始之前,人类一直保持着人机竞赛的不败纪录,甚至连平局的情况都没出现过。但是,从那场比赛之后,计算机却超越了人类,而且,在我们的有生之年会一直领先下去。

国际象棋比赛预测和启发法