乐读窝

反常识

乐读窝 > 哲学心理 > 反常识

学会对自己的预测进行跟踪记录

书籍名:《反常识》    作者:邓肯.J.瓦茨



为什么不同方法之间的结果如此相似?我们也不清楚,但我们怀疑是预测时产生的意想不到的副作用在作祟。一方面,当涉及复杂系统时,无论是体育比赛、选举,还是电影的票房收入,未来事件的预测准确率都会受到严格的限制;而另一方面,人们似乎可以利用相对简单的方法使其准确率接近可能达到的极限。打个比方说,如果你有一个加重的骰子,掷过几十次后,就会知道哪些面朝上的概率较大,之后再去下注的话胜率就会大一些。除此之外,你还可以使用一些更精细的方法,比如在显微镜下研究骰子表面所有的细微裂痕和不规则之处,或者建立一个复杂的计算机模拟程序,但这些方法对改进预测并没有什么大的帮助。

同样,我们发现,在橄榄球比赛中,只要知道一条信息——主队获胜的概率约大于50%,就足以将预测的准确率提升到随机猜测之上。如果再考虑一条简单的信息——获胜率更高的球队胜算更大,对于提升预测准确率也大有帮助。此外,你可能还会考虑收集其他信息,比如四分卫最近的表现、球队的伤病情况、明星跑卫的女友风波等,但这些信息对提升预测准确率起到的作用很有限。也就是说,对复杂系统的预测准确率服从边际收益的递减规律:最初的信息能大幅度地提升预测准确率,但可能的提升空间很快就会被用尽。

当然,我们有时候也会关注预测准确率的微小提升。比如,在互联网广告或高频股票交易中,人们每天可能做出数百万甚至数亿次预测,可能会涉及巨额资金。这种情况下就有必要花些钱和精力来研究那些能够利用最精细模型的复杂预测方法。但在其他行业中,比如电影出品、书籍出版或新技术研发行业,你每年只需要做出几十个,最多数百个预测,而且你做的预测往往只是整个决策过程中的一部分,所以,即使采用相对简单的方法,你也可以预测得很好。

在预测时,人们不该使用的方法就是仅仅依靠个体的意见,尤其是自己的观点。原因是,尽管我们善于发现与某个特定问题相关的因素,但却不擅长衡量这些因素之间的相对重要性。比如,在预测某部电影的首周票房收入时,你可能会觉得,电影制作和营销预算、排片数以及评审点映评分等因素都是高度相关的因素。没错,但是在电影评分略低于平均值和营销预算超额支出1  000万美元之间,你该如何权衡呢?我们并不清楚。当决定如何分配营销预算时,如何确定有多少人会受互联网广告或杂志广告的影响,又有多少人会从朋友那里听说这个产品,这些问题我们也无从得知,尽管这些因素都可能是相关的。

你可能会认为,准确地做出这些预测是专家擅长的,但正如泰特洛克的实验结果所示,专家在定量预测方面的表现和普通人一样糟糕,甚至可能更差。9专家存在的真正问题并不是他们的预测水平比普通人差,而是因为他们是专家,所以我们每次只会咨询其中一位专家,但我们应该做的是综合多人的意见(无论是专家还是普通人),然后取平均值。至于怎么做到这一点,可能就不重要了。

尽管预测市场有很多花里胡哨的东西,但它的预测结果只比民意调查等简单方法的结果稍微好一点儿,而它们之间的差距远不如简单地对大量意见取平均值所得到的提升大。另外,我们可以直接从历史数据中评估各种预测的相对重要性,实际上这也是统计模型要完成的全部工作。不过,尽管复杂模型可能比简单模型的预测效果稍微好一点儿,但和完全不使用模型相比,它们之间的差距相对小得多。10预测结束时,模型完成了与人类一样的目标。首先,它们利用某种判断力来决定哪些因素与预测问题相关,然后,它们估计并权衡了每个因素的相对重要性。心理学家罗宾·道斯(Robyn  Dawes)曾指出:“窍门就在于,知道考虑哪些变量,然后知道如何考虑这些变量。”11

不断应用这个窍门,你也可以逐渐了解,哪些预测可以以相对较小的误差做出,而哪些不能。比如,在其他条件相同的情况下,越早预测事件的结果,出现的误差会越大。对于电影票房的预测来说,在电影刚过审时就预测肯定比上映前一两周的预测要难,无论你用的是什么方法。同样,对新产品的销量预测也可能没有对现有产品的预测准确。而你对此无能为力,只能开始单独使用多种不同的方法,甚至同时使用全部方法(就像我们在预测市场研究中做的那样),并随时观察它们的效果。我在第5章开头就提到,人们并不习惯对自己的预测进行跟踪记录:我们做了很多预测,却很少会去检查究竟有多少预测对了。但跟踪并记录预测效果非常重要,因为只有这样,你才能知道预测有多准,并由此得出是否应该重视自己的预测。12



与其靠历史数据预测未来,不如专注当下


无论你多么谨慎地遵守这条建议,所有预测方法仍存在一个严重的限制,即这些方法的可靠性取决于未来发生的事件及其平均发生的频率在多大程度上和过去相同。13比如,在正常情况下,信用卡公司能准确地预测出用户的违约率。虽然个人的情况可能非常复杂并且无法预测,但人群的总体复杂性和不可预测性往往变化很小,所以平均来说模型具有较好的预测效果。但正如许多预测模型批评家所言,很多我们关心的事件结果之所以吸引人们的关注,正是因为它们发生在不同寻常的时间,比如金融危机爆发期,革命性技术出现时,专制政权被推翻时,或者暴力犯罪数量显著下降等情况发生时。在这些情景下,依靠历史数据预测未来结果将会引发非常严重的问题。比如,在金融危机过后,许多信用卡公司发现用户的违约率出现了显著的飙升。

更重要的是,2008年之前,许多银行使用模型来给抵押贷款及其衍生品(比如声名狼藉的债务抵押债券,即CDO)定价,现在看来,这些模型太过于依赖近期的数据了。由于那段时间房价一直在上涨,所以评级分析员和交易员都认为,全美范围内房价下跌的可能性非常低,因此他们严重低估了抵押贷款违约率和止赎率上升的风险。14乍一看,这似乎是预测市场最好的用武之地,因为比起银行的“定量分析师”来说,预测市场应该能更准确地预测风险。但事实上,正是这群“定量分析师”以及同样没有预测到风险的政治家、政府监管部门和其他金融市场专家参与到了预测市场中,导致群体智慧的作用大大被弱化了。可以说,正是所谓的群体智慧让我们一开始就陷入了混乱之中。因此,如果模型、市场和群体智慧都对预测金融危机这样的“黑天鹅”事件束手无策,那么我们应该怎么办呢?

依赖历史数据的方法还存在第二个问题,即重大的战略决策并不常见,因此采用统计方法也无法奏效。就历史意义而言,可能大部分战争结局都不佳,大多数公司在合并后都收效甚微,但也有一些军事干预是正当合理的,有一些公司的合并也非常成功,而我们几乎不可能提前分辨出它们的区别。如果你能进行几百万次,或者起码几百次这样的抉择,那么用历史概率来预测可能还有些道理。但是,当你面临是否带领国家参与战争,或者是否进行战略并购的抉择时,只有一次机会。所以,即使你能计算出概率,60%的成功率和40%的成功率之间的差别也可能没有多大意义。

因此,就像无法预测“黑天鹅”事件一样,统计模型和群体智慧也不适用于预测一次性的战略决策。但是,人们却总是需要做出这类决策,而且它们可能是某个人做出的最重要的决定。那么有没有什么方法可以提高我们对此类决策的预测准确率呢?很不幸,这个问题还没有明确的答案。多年来,人们尝试过很多方法,但并没有发现长期有效的方法。部分原因是,技术很难正确实施,但主要原因还是第5章中提出的问题——未来存在一定程度的不确定性,这种不确定性必然会使完美的计划出错。