乐读窝

反常识

乐读窝 > 哲学心理 > 反常识

注重相关性,而非因果性

书籍名:《反常识》    作者:邓肯.J.瓦茨



综上所述,心理学实验表明,很多潜在的相关因素以真实可见的方式影响着我们的行为,而我们丝毫没有察觉到它们起到的作用。心理学家发现了很多这样的效应,比如启动效应、框架效应、锚定效应、可用性法则、动机性推理,以及损失规避等,但很难看出它们是如何结合在一起的。在实验中,人们往往一次只强调一种潜在的相关因素,以重点突出它的影响力。但在现实生活中,同一种情况可能存在很多这样的相关因素,它们的影响各不相同。因此,理解这些因素之间的相互作用至关重要。也就是说,拿一支绿色的笔会让你想到“佳得乐”,听德国音乐会让你倾向于买德国酒,或是心里想着社保号码会影响到你接下来的竞拍出价,这些事情可能的确会发生。当你同时受到许多可能互相冲突的潜意识影响时,究竟会买什么,又会花多少钱呢?

这并不确定。无意识的心理偏见的泛滥也不是我们面临的唯一问题。再回到之前冰激凌的例子,尽管我喜欢吃冰激凌是一个基本规则,但在某一特定时间点,我的喜欢程度可能大有不同,这取决于当天的时间、天气、我有多饿,以及我想买的冰激凌有多好吃等。另外,我的决定不仅取决于我有多喜欢冰激凌,或者我的喜爱程度与冰激凌的价格之间的关系,还取决于我是否知道最近店铺的位置、之前是否去过、我有多忙、我和谁一起、他们想买什么、我是否得去银行取钱、最近的银行在哪里,以及我是否看到别人吃冰激凌或者听到某首歌时想起了吃冰激凌的快乐时光等。即使是在最简单的情况下,相关因素可能也有很多。有这么多因素需要考虑,即使是非常相似的情况也会有重要的微妙差别。当我们想要理解或者预测一个人的决定时,如何才能知道这些因素中哪些需要关注,哪些可以“放心”忽略呢?

这种知道哪些因素与特定情况相关的能力,就是我们在引言中讨论的常识性知识的特点。在实践中,我们很少想到相关因素,因为做决定的轻松掩盖了复杂的影响因素。哲学家丹尼尔·丹尼特(5)曾说,当他半夜起来想做点东西吃时,只需要知道冰箱里是否有面包、火腿、蛋黄酱和啤酒,剩下的事情就水到渠成了。当然,他也知道,“蛋黄酱在和餐刀接触时不会溶解餐刀,一片面包比珠穆朗玛峰要小,打开冰箱不会导致厨房发生核灾难”,以及其他无数不相关的事情或逻辑关系。但不知怎的,他可以忽略这些,只专注于那些重要的事上,甚至他自己都不知道到底忽略了什么16。

丹尼特指出,在实践中知道什么是相关因素与能够去解释为什么我们知道它们是相关因素,这两者之间有巨大的差别。很明显,和某种情况相关的因素就是该情况与其他相似情况共有的一些特征而已。例如,价格和购买决策相关,因为在买东西时,价格往往起着至关重要的作用。但我们如何知道,哪些情况和当下的情况类似呢?这也很简单:类似情况往往具有相同的特征。当一个人要买东西时,他会考虑到很多因素,包括价格、质量、可用性等。从这个意义上来讲,所有的购买决定都是相似的,但问题来了,要确定哪些特征与某种情况相关,就需要我们将该情况与一些相似的情况联系起来,而要知道与哪些情况相似,又需要知道与它们相关的特征。

这种内在的循环就是哲学家和认知科学家所说的框架问题,他们已为此争论了几十年。框架问题首先发现自人工智能领域。当时,研究者正尝试开发计算机程序和机器人来处理相对简单的日常工作,比如打扫房间等。一开始,研究者认为,要在程序中实现与一项任务相关的所有内容并不难。毕竟,人们每天都要打扫自己的房间,做的时候甚至都不用动脑子,教给机器人又有多难呢?然而他们发现,事实上却非常困难。在引言中我们提到,即使是像坐地铁这样相对简单的事情,也需要掌握大量的知识,这些知识不仅包括地铁的站台和出口的信息,还包括保持人与人之间的距离,避免眼神接触,以及别挡到匆忙的纽约人的路等规则。很快,研究者意识到,对于人工智能来说,学会任何一项日常工作都非常困难,原因都相同——涉及的相关事实和规则多到超出我们的想象。虽然在大多数情况下,很多内容都可以忽略,但这根本解决不了问题,因为我们无法事先知道哪些事情可以忽略,而哪些不能。研究者发现,即使是实现最微不足道的任务,他们也得重复编写冗长的程序。17

对于人工智能最初的设想是,在类似我们自己的实践过程中,或多或少地复制人类的智慧,然而棘手的框架问题使其陷入了困境。但是,这场失败还有一线希望。由于一次次的失败,人工智能研究者不得不从头开始把每个事实、规则和学习过程编入程序中,但他们的程序往往无法如预想的那样成功运行,造成的后果也非常严重,比如机器人摔下悬崖或试图穿墙而过等,这说明框架问题不可忽视。人工智能研究者没有直接破解这些难题,而是采取了一种完全不同的方法,即一种强调数据而非思考过程的统计模型。该方法也就是现在的“机器学习”,它远没有最初的认知方法那么直观,却卓有成效,而且带来了无数重大突破,包括当你输入指令时瞬间完成查询的神奇搜索引擎,无人驾驶汽车,甚至是能玩《危险边缘》(Jeopardy!)(6)游戏的计算机等。18



填充想象,人类思考的本质


框架问题不仅仅是人工智能领域的问题,它也是人类智能面临的问题。正如心理学家丹尼尔·吉尔伯特(Daniel  Gilbert)(7)在《撞上幸福》(Stumbling  on  Happiness)一书中所写,当我们想象自己或者他人面对一种特定情况时,不可能把所有可能相关的细节问题全部都考虑清楚。就像一个勤劳的助理可能会用资料卡片来充实单调的PPT一样,我们就某事或某人的“心理模拟”也会搜索大脑中包括记忆、图像、经历、文化规范和预期结果的庞大数据库,然后恰如其分地插入各种必要的细节使画面变得完整。比如,调查发现,当受访者离开餐馆时,他们能轻松地描述出男服务员的着装,即使该餐馆的服务员全是女性;当被问起教室里黑板的颜色时,学生们往往回忆说是绿色,即正常黑板的颜色,即使他们教室的黑板实际上是蓝色的。一般来说,人们会系统性地放大预期损失带来的痛苦和预期收益带来的快乐。比如,在网上进行在线配对时,参与者获得的信息越少,他们对配对的对象就会越感兴趣。在所有这些例子中,一个谨慎的人不会在得到足够多的信息前给出明确的答案。由于“填充想象”的过程会在瞬间轻松发生,所以我们通常不会察觉到它的存在,也不会意识到自己错过了什么。19

框架问题警示我们,这样做一定会犯错,而我们却一直在这么做。与人工智能研究者编写的程序不同,人类活动并不会迫使我们重写思考的整个心理模型。正如保罗·拉扎斯菲尔德在《美国士兵》一书中提到的那样,每个结果和它的对立面都同样明显,一旦知道了结果,我们总能想到之前遗漏的信息,发现它们其实是与该情况相关的。也许我们会坚信,自己中了彩票后肯定会很开心,但事实并非如此,这显然是一个失败的预测。当我们意识到自己并未那么开心时,往往是因为遇到了新的情况,比如亲戚们突然请求经济援助等。之后我们就会想,如果能早点儿知道这些情况,就一定能准确地预测出自己中彩票后的幸福程度,这样也许就不会买那张彩票了。我们并不会质疑自己预测未来幸福程度的能力,反而会简单地认为,我们只是漏掉了一些重要的东西,这种错误以后肯定不会再犯了。实际上我们还会再犯。事实上,无论我们在预测某人的行为上失败了多少次,都会把当时不了解的事情作为理由来辩解。这样,我们就成功地掩盖了框架问题——总让自己相信下次肯定能做对,却从不考虑自己到底做错了什么。

在经济奖励和激励的关系中,框架问题尤为明显,而且很难消除。比如常见的,实行经济激励措施可以提高员工的绩效。最近几十年里,基于绩效的薪酬制度使用得越来越多,最具代表性的就是与股票价格挂钩的高管薪酬。20虽然员工们关心的不仅仅是钱,诸如内在感受、认可度、职业晋升等因素都会影响到他们的工作表现,但在其他条件相同的情况下,适当地运用经济奖励显然可以提高员工的业绩。多年来的大量研究表明,薪酬与绩效之间的关系实际上复杂得超乎我们的想象。

反常识案例

通过工资激励员工的方式真的有效吗

最近,我和雅虎公司的同事温特·梅森(Winter  Mason)进行了一系列基于网络的实验。在这些实验中,我们给予被试不同的报酬,让他们执行各种简单的重复性任务,比如,将正在行驶的车辆的照片按时间顺序排列,或者在矩形字母网格中找出隐藏的单词等。所有的实验参与者都是从“亚马逊土耳其机器人”(Amazon’s  Mechanical  Turk)网站上招募而来的,这个网站是2005年亚马逊为识别存货中的重复物品而建立的。如今,数百家公司用它来“众包”各种任务,包括在图片中做标记、描述报刊文章的观点,或者决定两个解释中哪个更好等。当然,它也为心理学实验招募被试提供了有效途径,有些心理学家也会通过在大学校园里张贴传单来招募。我们需要支付给被试(或“土耳其机器人”)每个任务几美分的报酬,这笔花费只占正常成本的一小部分。21

总的来说,有数百人参与了我们的实验,他们完成了成千上万个任务。有时每个任务的报酬只有1美分,比如对一组图片进行排序或找出单词;而有时候,同样的任务会支付给他们5美分,甚至10美分。10倍之差在工资上是一个巨大的差异,要知道,美国计算机工程师当时平均每小时的工资只是全美最低工资的6倍。所以你可能认为这个差异会对人们的行为产生显著的影响。事实确实是这样,我们付给被试的钱越多,他们在实验中完成的任务就会越多。我们还发现,那些分配了简单的任务(如图像排序,每组2张)的被试完成的工作量比分配了中等困难或非常困难的任务(每组3张或4张)但每个任务的报酬不变的被试更多。换句话说,所有这些都符合常识。但关键是,尽管存在这些差异,我们发现他们的工作质量,也就是图像排序的准确率并没有随着工资的增长而提高,即使他们的工资只按照正确完成的任务支付。22

这个结果该如何解释呢?当时我们并不清楚。在被试完成工作后,我们问了他们一些问题,其中就包括他们认为自己做的工作应该得到多少报酬。有趣的是,他们的理想工资和任务的难易程度之间并没有什么关系,理想工资更多地取决于已经被支付的报酬。平均而言,每项任务工资为1美分的被试认为,他们应该得到5美分;工资为5美分的被试认为,他们应该得到8美分;而工资为10美分的被试则认为,他们应该得到13美分。也就是说,无论他们的实际工资是多少,要知道其中有些人的工资已经是其他人的10倍了,每个人还是认为自己的工资过低。这一发现告诉我们,虽然我们期望通过增加工资激励员工努力工作,但实际上,即使是非常简单的任务,工资增加的动力也会极大地被员工增加的权利意识削弱。

这种效应在实验室之外很难测试,因为在大多数真实环境中,我们很难控制员工对工资的期望。想想看,美国女性的平均工资仅是做同样工作的男性的90%,或者欧洲公司CEO的工资比美国同行的低很多。23在这两个例子中,你能说低薪群体就一定比高薪群体工作不努力或表现差吗?或者想象一下,如果明年你的老板突然给你涨了一倍工资,你会比以前努力多少呢?如果在一个平行世界里,银行家的工资是我们这里的一半,那毫无疑问,肯定会有一些银行家选择跳槽。对于那些继续留在银行业的人,他们工作时会没有之前那么努力或者变得更差吗?我们的实验结果表明,并不会。如果结果是“会”,你一定会想,仅仅通过工资激励会对员工表现产生多大影响呢?

事实上,很多研究发现,工资激励的方式实际上会削弱员工的业绩。首先,当工作涉及多方面或者很难衡量时,员工往往只会关注工作中易于衡量的方面,因而忽略了其他重要部分。比如,老师会重视那些可能在考试中考到的内容,而忽略了整体学习。其次,当受奖励的心理压力抵消了努力工作的意愿时,工资激励也会产生“抑制”作用。最后,在个人贡献很难与团队的整体贡献区分开来的情况下,工资激励会导致员工依仗别人的努力,或者避免承担风险,从而阻碍创新。通过这些相互矛盾、令人费解的发现,我们得知,尽管大家都认为人们会以某种方式对经济激励做出反应,但对于如何在实践中应用激励措施来获得预期效果,目前还不清楚。一些管理学者经过几十年的研究后甚至发现,经济激励和员工表现在很大程度上是无关的。24

尽管这一点被多次指出,管理者、经济学家和政治家仍然试图使用激励措施来引导人们的行为。列维特和都伯纳曾写道:“典型的经济学家认为,如果可以放手去制定合适的激励机制,世界上就没有解决不了的问题。激励是子弹,是杠杆,是钥匙,它虽然很小,却具有改变环境的惊人力量。”25好吧,也许是这样,但这并不意味着我们制定的激励措施就会带来预期的效果。事实上,列维特和都伯纳发表的一篇短文,也就是关于高中老师在考试中作弊的那篇,讨论的正是政策制定者通过激励措施改善教学质量的一个尝试。结果事与愿违,这种激励反而引发了彻底的作弊行为和各种各样的小把戏,比如“应试教育”或者只关注边缘学生(他们的成绩只要提高一点就能多一个及格人数)。这应该让我们停下来思考,通过激励机制来实现预期的行为到底可行吗?26

常识并没有停止起作用。一旦我们发现一些激励措施不起作用,就会简单地认为它们是错误的。也就是说,一旦政策制定者知道了这一结果,他们总能说服自己相信,他们需要做的就是制定“正确”的激励机制。当然他们忽视了,目前的激励措施恰恰也是他们之前认为自己正在做的正确的事。政策制定者并不会受到这种忽视的影响,我们也不会。比如,有新闻报道了政客无法负担长期的财政问题,有人还调侃地总结说:“像银行家一样,政客们也需要激励。”至于解决方案,就是“让国家利益与领导国家的政治家的利益保持一致”。这听起来倒是很简单,但文章也承认,之前试图“修复”政治的努力总是让人失望。27

就像理性选择理论一样,常识总是会告诉我们,人们做某件事情都有自己的理由,这确实有可能,但我们并不能因此提前预测到,人们会做什么以及为什么这么做。28一旦他们做了,原因就会凸显出来,我们也会得出结论:如果早点知道一些特定的重要因素,肯定能预测到结果。虽然事后看起来,正确的激励机制本应该能得到预期的结果,但这种“事后诸葛亮”的预测表现纯粹是假象。原因有二:

第一,框架问题说明,我们永远无法知道可能与该情况相关的所有因素。

第二,一篇著名的心理学文献指出,许多相关因素超出了我们的认知范畴。

这并不是说人类行为完全不可预测。我将在第7章中说明,人类行为表现出了各种各样可预测的规律,而且通过预测,我们可以得到有用的结论。这不是说,我们不该试着找出促使人们做出决定的动机。如果没有其他情况,合理化他人的行为也许有利于人们之间的相处,这本身就是一个有价值的目标,也可能会帮助我们从错误中吸取教训。即使我们有能力理解观察到的行为,也并不意味着我们能进行预测,即使我们可以做出可靠的预测,但最好是在直觉和经验的基础上做的。正是理解和预测行为的差异导致了常识推理的众多失败。如果这种差异给处理个人行为带来了困难,那么在处理群体行为时,这种困难会变得更加严重。

章末总结