乐读窝

反常识

乐读窝 > 哲学心理 > 反常识

我们能预测的,往往是模式固定的事件

书籍名:《反常识》    作者:邓肯.J.瓦茨



简单来说,在复杂社会系统中发生的事件可以分为两类,一类是符合某种稳定历史模式的事件,另一类则是不符合稳定历史模式的事件,而我们只能对第一类事件做出可靠的预测。在第5章中我们也说过,即使对于可预测的第一类事件,我们也无法预测到任何特定的结果,这比预测掷骰子的结果准确不到哪里去。但只要我们能收集到足够多的历史数据,就可以较为准确地预测出事件发生的概率,对我们来说,这就已经足够了。

比如,每年我们都可能不幸感染流感,而人们能预测得最准确的就是每个季度的患病率。由于流感患者人数众多,且季节性流感的发病趋势每年都相对一致,所以制药公司可以较好地预测出每个月需要往各个地区运送多少流感疫苗。另外,财务状况相同的消费者,其信用卡欠款逾期的概率可能大不相同,这取决于他们当前的生活状况,但信用卡公司可以通过关注一系列社会经济、人口和行为变化,准确地预测出总体违约率。互联网公司也在越来越多地利用用户浏览网页产生的海量数据,来预测某个用户点击某个搜索结果,积极回应某个新闻故事,或受特定推荐影响的概率。政治学家伊恩·艾瑞斯(Ian  Ayres)在《超级数字天才》(Super  Crunchers)一书中写道:“在金融、医疗服务和电子商务等数据高度密集型行业中,这种类型的预测越来越多。因为在这些行业中,基于数据的预测收益通常不大,但这些收益可以通过数百万甚至数亿个微小决策(这种情况每天都会发生)累积起来,最终产生巨大收益。”2

这种模式目前看来还不错。但还有很多商业领域,以及在制定政策和制度时需要做出的预测并不符合这种“超级计算”模式。比如,当一位图书出版商决定给一位作者支付预付金时,他就要预测该作者的书在未来的销售情况,书将来卖得越多,作者获得的版税就越多,出版商为了防止作者和其他出版商签约,也会支付更多的预付金。但如果出版商高估了这本书的销量,就会造成对作者的超额支付,这样作者会获利,出版商则会赔钱。同样,当一家电影公司决定拍一部电影时,也要预测这部电影未来的票房收入情况,从而预测出它值得投入多少制作和营销费用。再比如,当一家制药公司决定进行一种新药的临床实验时,它必须斥资对实验成功的概率和新药的市场份额进行预测。

由此可见,这些行业都依赖于预测,但这些预测要比预测当年冬天北美流感病例的数量,或者预测某个用户点击某个在线广告的概率要复杂得多。当出版商为一本书支付预付金时,距离该书出版可能还要一两年,所以出版商不仅要预测这本书的内容是否优质,还要预测这本书出版后的市场反应和评价,以及其他相关因素。同样,关于电影、新型药品和其他商业或开发项目的预测,实际上也需要持续数月或数年长的复杂多元的过程。更糟糕的是,决策者每年能做出的此类决策并不多,因此他们无法通过大量预测的平均值来消除不确定性。

尽管如此,在以上例子中,决策者至少有一些历史数据可供参考。比如,出版商可以借鉴过去同类书籍的销售情况,电影公司也可以参考之前同类电影的票房收入、DVD销量和销售利润。同样,制药公司可以评估同类药物进入市场的成功率,营销人员可以参考同类产品的成功案例,杂志出版商可以参考往期有相似封面故事的杂志在报刊亭的销售情况等。除此之外,决策者还可以通过一些方式获得很多其他数据,包括市场调研、项目内部评估,以及对行业情况的整体了解等。因此,只要在项目立项和启动期间,情况没有什么大的变动,决策者仍然有可能做出可靠的预测。那他们应该怎么做出这些预测呢?



市场、民调和模型,效果无差的预测方式


一种日渐流行的方法是利用“预测市场”的方式做出预测。在这种市场中,买卖双方交易的是一种专门设计的证券,该证券的价格与某一结果发生的预测概率相对应。比如,在2008年美国总统大选的前一天,投资者可以花0.92美元在艾奥瓦电子交易市场(历史最悠久、最著名的预测市场之一)购买一份合约,如果奥巴马获胜,投资者将赢得1美元。由此看来,预测市场中参与者的行为和金融市场中的某些现象很相似,都根据报价参与买卖。不同的是,在预测市场中,价格是对某件事情结果的预测,比如在上面的例子中,大选前夕艾奥瓦电子交易市场预测奥巴马获胜的概率就是92%。

在做这样的预测时,预测市场利用了一种现象,即《纽约客》杂志专栏作家詹姆斯·索罗维基(James  Surowiecki)所称的“群体智慧”(wisdom  of  crowds)。这一概念指的是,虽然个体在预测上经常容易出错,但把大量预测结果平均之后,此类错误就可以被抵消。因此,从某种意义上来说,预测市场比组成它的参与者更“聪明”。许多预测市场也会要求参与者用真钱下注,这样一来,比起不了解此领域的人来说,对某一领域有所了解的人更有可能参与其中。预测市场这一特性的强大之处在于,谁拥有相关的市场信息并不重要,无论是一位专家,还是很多位非专家,或者两者都有,理论上来讲,市场可以根据每个人下注的比例,将他们的观点全部纳入其中。事实上,没有人能一直赢过设计合理的预测市场。原因在于,如果有人能赢过市场,他们就会产生从中赚钱的动机,但在市场中,这一赚钱的举动马上就会导致价格的波动,从而将新信息纳入其中。3

预测市场利用群体智慧的潜力已经引起了经济学家和政策制定者的极大兴趣。举例来说,如果在2010年4月英国石油公司发生漏油事故之前,就有预测市场的活动着手预测墨西哥湾深海石油钻探发生事故的可能性,那么像英国石油公司工程师这样的内部人士就可能参与其中,将公司正面临的风险公之于众。届时,监管机构就可能会对这些风险进行更准确的评估,并有可能在事故发生前就对石油业采取严厉的管控措施,这样或许就能避免漏油事故的发生。这些都是预测市场支持者的观点,不难看出为什么他们对预测市场这么感兴趣了吧。实际上,近年来预测市场已经涉足很多领域的预测,包括新产品的成功概率、新上映电影的票房收入,以及体育赛事的结果等。

然而事实上,预测市场比理论上要复杂得多。比如,在2008年总统大选期间,一家广受欢迎的预测市场Intrade就经历了一系列奇怪的波动。当时一名匿名交易者在参选者约翰·麦凯恩(John  McCain)身上押下重注,这一举动致使市场对麦凯恩获胜的预测概率大幅飙升。没有人知道幕后下注者是谁,有人怀疑是麦凯恩的支持者,甚至可能是其竞选团队中的一员,他试图通过操纵预测市场的价格,从而制造出“有可靠的选举预测者认为麦凯恩会当选”的假象,希望这个预言得以实现。但最终他没有成功,其他交易者迅速扭转了这一趋势,这一神秘交易者也以赔钱告终。由此来看,市场基本还是按预期正常运行的。

然而,这一事件也暴露出预测理论的一个潜在弱点,即假设理性的交易者不会故意输钱,但当有参与者想要操纵预测市场之外的人(比如媒体)的看法,而且涉及金额相对较小(如几万美元,相比于电视广告数千万美元的花费较小)时,那么他们可能不会在乎赔钱。在这种情况下,预测市场传递出来的信息就不那么明了了。4

类似这样的问题让有些怀疑论者声称,预测市场并不一定优于其他在实践中更难操控的简单方法,比如民意调查。但由于很少有人对不同方法之间的相对效果进行比较,所以人们对此也知之甚少。5为了解决这个问题,我和雅虎研究院的同事就美式橄榄球联盟(NFL)的比赛结果,对几种不同的预测方法进行了系统的比较。

首先,我们对2008赛季的每场比赛(共14~16场比赛,每周末一场)做了民意调查,受访者需要回答预测主队获胜的概率,以及他们对自己所做预测的把握。我们还从Probability  Sports网站上收集了类似的数据,该网站是一家赛事竞猜网站,参与者通过预测体育赛事的结果有可能获得现金奖励。

然后,我们将这两项调查的结果与拉斯维加斯的体育博彩市场(历史最悠久、最受欢迎的博彩市场之一)和另一个预测市场Trade  Sports做了比较。

最后,我们将民意调查和预测市场的结果与两个简单的统计模型的结果进行了比较。第一个模型只取决于主队获胜的历史概率——58%,该模型就预测主队有58%的概率获胜,第二种模型考虑了两支球队最近的胜负情况。这样我们就建立了不同的预测方法——两个民意调查、两个预测市场和两个统计模型之间的六方比较。6

虽然这些方法各不相同,但我们惊讶地发现,它们的效果都差不多。公平地来说,两个预测市场的表现稍好于其他方法,这也符合上面的理论论证。但表现最好的预测方法(拉斯维加斯博彩市场)只比最差的方法(总是预测主队有58%胜率的统计模型)精确了3个百分点。其他方法的表现则介于这两者之间。事实上,考虑最近输赢情况的模型和拉斯维加斯预测市场的结果也非常接近。如果你用这两种方法来预测球队之间的实际分差,它们之间的平均误差将相差不到0.1分。但如果你用这两种不同的预测方法就数百场或数千场比赛的结果来押注,那么这些微小的差别可能就是赚钱和赔钱的区别了。但令人吃惊的是,在预测市场中,数千人投入了大量时间利用任何有用的信息分析即将到来的比赛,他们的集体智慧却只比利用历史平均获胜率的简单统计模型好一丁点儿。

当我们把这个结果告诉预测市场的研究人员时,他们认为是美式橄榄球的一些特点导致了这一结果。他们认为,美式橄榄球联盟有很多诸如薪资上限、选秀权这样的规则,这些规则可以让球队之间尽可能地保持平衡。当然橄榄球比赛的结果也可能取决于很小的随机行为。比如外接手在全速跑过球门线的瞬间,接住四分卫传来的绝杀,在最后几秒赢得比赛。也就是说,橄榄球比赛中有很多随机性,而这正是人们为之兴奋的原因。这可能也没什么好惊讶的,毕竟这些都是权威人士每周用来炮轰球迷的无用预测和分析(可能那些权威人士会感到惊讶)。为了证实这一结论,预测市场的研究人员坚持要我们在其他信噪比高于橄榄球赛事的领域找到相同结果。

好吧,那棒球呢?棒球球迷们对比赛的每个细节都有着近乎狂热的关注,无论是安打率还是投手轮值,只要是可衡量的因素他们都不会放过。一个专门分析棒球统计数据的研究方式——赛伯计量学(Sabermetrics)由此诞生,它还衍生出了自己的期刊《棒球研究期刊》(Baseball  Research  Journal)。因此,有人可能认为,比起橄榄球的预测市场,棒球的预测市场更能充分地考虑各方面的信息,所以它的表现应该远远好过统计模型吧,但其实并非如此。我们针对美国职业棒球大联盟1999—2006年的近两万场比赛,对比了拉斯维加斯体育博彩市场的预测结果与基于主队获胜率和最近胜负情况的简单统计模型的结果。这一次两者的差距更小了,事实上,预测市场和统计模型的表现基本没有差别。也就是说,尽管棒球领域有充足的统计分析数据,没有薪资上限,也有纽约洋基队和波士顿红袜队等巨星球员云集的球队,但棒球比赛的结果比起橄榄球比赛来说甚至更接近随机事件。

此后,我们在运用预测市场的方式预测其他事件的情况中也发现了同样的结果,比如预测电影首周票房收入和总统大选的结果等。这些事件与体育赛事不同,它们没有任何旨在提升竞争的规则或条件,预测市场还可以利用事件的很多相关信息来提升自己的预测表现,使其准确率远远超过简单统计模型或针对相对不知情之人进行的民意调查。然而,当我们将以预测准确而闻名的好莱坞股票交易所(Hollywood  Stock  Exchange,最受欢迎的预测市场之一)和简单的统计模型进行比较时,却发现前者的表现只是略微好一点儿。7在另一项对1988—2004年期间5次美国总统大选的结果的研究中,政治学家罗伯特·埃里克森(Robert  Erikson)和克里斯托弗·沃里茨恩(Christopher  Wlezien)发现,经过简单的统计修正,普通民意调查的预测表现甚至超过了被大肆吹捧的艾奥瓦电子交易市场。8