现场实验，一个内嵌的持续性试错过程

书籍名:《反常识》作者：邓肯.J.瓦茨

然而，上述随机实验并不为大众所接受，主要原因是，这类实验在实践中很难进行。比如，在高速公路旁竖一块广告牌，或在杂志上登一个广告，你一般很难知道谁会看见这些广告，甚至消费者也往往意识不到自己看见了广告。此外，这些广告的效果也很难衡量，消费者可能会在几天甚至几星期后才去购买，到那时，看到广告和购买行为之间的联系已经不明显了。因此，这种实验不受欢迎也是合情合理的。

反常识案例

如何检验投入的广告是否真的带来了收益？

我在雅虎公司的三个同事戴维·赖利（David  Reiley）、泰勒·施莱纳（Taylor  Schreiner）和兰德尔·刘易斯（Randall  Lewis）进行了一场开创性的“现场实验”（field  experiment），从而使该难题的解决有了新的进展。这场实验的被试是一家大型零售商的160万名客户，他们同时也是雅虎的活跃用户。

为了进行这场实验，赖利和公司随机分配了130万用户到实验组，当这些人登录网站后，他们将会看到该零售商的广告；同时，剩下的30万用户被分配到控制组中，即使他们和实验组访问完全相同的页面，也不会看到这些广告。由于研究者对实验组和控制组的划分是完全随机的，所以这两组人之间行为的差异必定是由广告引起的。而所有参与实验的人都在零售商的数据库中，所以根据他们在广告活动结束后几周内的实际购买行为，就可以衡量出广告的效果。20

研究人员利用这种方法估算得出，广告产生的短期额外收入大约是广告成本的4倍，而且长期来看可能会更高。于是，他们得出结论，这场广告活动确实是有效的。这个结果对雅虎和零售商来说显然都是个好消息。但他们也发现，几乎所有受到影响的受众都是老年消费者，也就是说，这些广告对于40岁以下的人来说几乎没有效果。乍一看，这一结果似乎不太好，但换个角度思考一下，发现某事行不通也是解决问题的第一步。比如，广告商可以尝试各种方法来吸引年轻人，包括不同的格式、风格，甚至采取不同的奖励手段和优惠方式，有效的方法很可能存在其中，此时采用系统的方法把它们找出来就非常有意义了。

但若所有尝试都没有效果，那也许是这个品牌对特定的人群没有吸引力，或者这些人对在线广告本就没兴趣。既然如此，广告商起码可以停止向这些人群投放广告，从而腾挪出更多资源集中在那些可能会受广告影响的人群身上。所以，提高营销效果的唯一方法，首先就是要知道什么有效与什么无效。因此，我们不应该把广告实验当成一种要么产生“答案”，要么没有答案的一次性实验，而应该把它看作一个内嵌在所有广告中的持续学习过程的一部分。21

现在，越来越多的研究人员认为，这种理念不仅适用于广告，也适用于各种线上或线下的商业战略和政策规划。比如，在《麻省理工斯隆管理评论》（MIT  Sloan  Management  Review）的一篇文章中，麻省理工学院教授埃里克·布林约尔松（Erik  Brynjolfsson）和迈克尔·施拉格（Michael  Schrage）认为，追踪库存、销售和其他业务指数（无论是搜索页面的链接布局、商店货架的产品摆放，还是邮件推送的细节展示）的新技术的出现，开创了一个商业对照实验的新时代。布林约尔松和施拉格还引用了哈拉斯娱乐公司的首席执行官加里·洛夫曼（Gary  Loveman）的话：“只有在两种情况下，哈拉斯娱乐公司才会解雇员工，要么是从公司偷东西，要么是在商业实验中没有设置合适的对照组。”可能让你感到不安的是，赌场经营者已经在基于科学的商业实践方面处于领先地位。不过，其他企业也能从这种将实验控制纳入常规管理的思维模式中获益。22

在更传统的经济和政治领域，现场实验也开始流行起来。比如，麻省理工学院贫困行动实验室（MIT  Poverty  Action  Lab）的研究人员已经进行了100多次现场实验，以测试各种援助政策的效果，这些政策主要集中在公共卫生、教育、储蓄和信贷领域。也有政治学家测试了广告和电话拉票对选民投票的影响，以及报纸对政治舆论的影响。劳动经济学家也进行了大量现场实验，以测试不同薪酬方案的有效性，以及薪酬反馈对绩效的影响。研究人员提出的通常都是非常具体的问题，比如，援助机构应该为人们免费发放蚊帐还是应该收费呢？员工对固定工资和绩效工资的反应会如何呢？为人们提供储蓄计划是否可以帮助他们增加储蓄呢？但即使是如此具体的问题，其答案也会对管理者和规划者有所帮助。当然，现场实验也可以是大规模的。例如，公共政策分析师兰德尔·奥图尔（Randal  O’Toole）曾提倡对美国国家公园管理局（National  Park  Service）进行现场实验，他提出将不同的国家公园管理方法随机应用于不同的公园，比如黄石国家公园、优胜美地国家公园、冰川国家公园，以此来测试哪种管理方法的效果最好。23

应用“局部知识”，棘手问题的解决思路

现场实验潜力巨大，但其使用频率远远没有达到应有的水平，因为有时候实验并不总是行得通。比如，一家公司不可能轻易重塑一部分品牌，或者只针对部分消费者重塑自身的品牌。24对于这类决策，现场实验可能就帮不上忙了，但这些决定仍然需要做出。学者和研究者能就因果关系的细节进行深入讨论固然很好，但政治家和商业领袖通常需要在不确定的情况下采取行动。在这种情况下，首要规则就是不要过于追求完美，别让它阻碍我们做事，就像我当海军时教官经常提醒我们的那样：有时，就算有个糟糕的计划也总比没有计划强。

这话很有道理。实际上，在很多情况下，一个人能做的就是选择一个看上去最有可能成功的方案，并付诸行动。但是，由于规划者手握权力，且决策必须由他们做出，因此他们对自己直觉的信心十足，这种自信往往会导致灾难性的后果。正如我在引言中提到的，19世纪末20世纪初，工程师、建筑师、科学家和政府技术官僚都乐观地认为，社会问题可以照搬自然科学和工程问题的解决方法。但是，政治学家詹姆斯·斯科特指出，这种乐观情绪基于的是一种错误观念，即规划者的直觉和人类长期积累的自然科学知识一样精确可靠。

斯科特认为，这种“高度现代主义”观念的主要缺陷在于，它忽视了与作用环境相关的局部知识的重要性，而倾向于建立僵化的因果关系思维模式。正如斯科特所说，将一般规律应用到复杂的世界中，“会导致实践失败、社会幻灭或者很可能两者兼具”。斯科特认为，若想解决这个问题，就需要“制订出能够应用广泛的实践技能和后天知识的计划，以应对不断变化的自然和人文环境”。另外，这类知识很难被精确地归纳成通用的规则，“原因是，应用这些知识的环境非常复杂且不可复制，所以我们无法应用理性决策的一般制定程序”。也就是说，制订计划时依赖的知识必须建立在具体应用环境的基础上。25

事实上，斯科特这种支持“局部知识”的观点，多年前在经济学家弗雷德里希·哈耶克（Friedrich  Hayek）的一篇名为《知识在社会中的运用》（The  Use  of  Knowledge  in  Society）的著名论文中也提到过。哈耶克认为，计划在本质上就是整合知识的问题，若想知道需要配置什么资源，以及配置的地方，就需要知道每个人相对于他人来说需要多少资源。但是，哈耶克也认为，一个规划者无论有多聪明、初衷有多好，他也无法将一个数亿人组成的大经济体中的所有知识整合在一起。然而，市场在没有任何监督和指导的情况下，却能每天完成所有信息的整合。比如，如果某人发现了用铁可以获取更多利润，那么相比其他人，这个人会愿意花更多钱来买铁。这样一来，由于铁的总需求上升了，在其他条件不变的情况下，铁的价格也会上升。因此，使用效率较低的人，买的铁会越来越少，而使用效率较高的人则会买得越来越多。我们不需要知道铁的价格为什么会上涨，也不需要知道是什么人突然想买更多的铁。事实上，我们不需要知道关于这个过程的任何信息，市场中“看不见的手”会自动地把世界上有限的铁资源分配给能充分利用它的人。

哈耶克的这篇文章经常被自由市场的支持者用来证明政府制定的解决方案往往比基于市场的方案差。在某些情况下，这个结论是正确的。例如，致力于减少碳排放的“总量管制和交易制度”采用的就是这一论证。该政策不是由政府来规定企业应该如何减少碳排放量，而是通过简单地“限制”单个经济体可排放的总量，为碳排放量设定成本，然后由企业自行决定最佳应对之策。比如，一些企业会想办法减少能耗，另一些企业将转而使用替代能源，还有一些企业将寻求净化现有排放物的方法。结果是，一些企业宁愿从愿意减排的企业那里购买碳排放额度，购买的价格则取决于整体供需情况，就像在其他市场中一样。26

像总量管制和交易制度这类基于市场的机制，似乎确实比集权化官僚制的解决方法更可能成功。但基于市场的机制并不是利用局部知识的唯一途径，也不一定是最佳途径。例如，反对总量管制和交易制度的批评人士称，碳排放信用市场很可能会催生各种各样复杂的衍生品，比如2008年使金融体系陷入崩溃的衍生品，其结果可能会破坏制定政策的初衷。批评人士认为，一种稳妥的方法是只通过征税来增加碳排放的成本，这样既可以刺激企业减少排放，也可以给企业自行决定如何最好地减少碳排放的灵活性，而且也没有市场带来的成本开销和复杂性。

利用局部知识的另一种非市场方法是有奖竞赛，这种方法在政府和基金会中越来越受欢迎。有奖竞赛并不会将资源提前分配给预先选定的接受者，而是采用逆向资助机制——每个人都可以参与解决问题，但只有实现既定目标的解决方案才能获得奖励。近年来，有奖竞赛吸引了越来越多的关注，因为它可以利用相对较少的资金发掘出惊人的创造力。比如，美国国防部高级研究计划局（Defense  Advanced  Research  Projects  Agency，简称DARPA）仅仅提供几百万美元的奖金，就能集合几十所大学研究实验室的创造力，建造出自动驾驶汽车，这比起等量工作需要的传统研究经费少多了。同样，奖金为1  000万美元的安萨里X大奖（Ansari  X  Prize）吸引了价值超过1亿美元的研发工作，用于建造可循环使用的航天器。视频租赁公司奈飞仅以100万美元的奖金，就吸引了世界上最有才华的计算机科学家帮助其改进电影推荐算法。

此外，像Innocentive等诸多“开放式创新”的公司在工程学、计算机科学、数学、化学、生命科学、物理学和商业等领域也举办了数百个有奖竞赛。受这些例子的启发，政府部门也在考虑，能否用有奖竞赛来解决棘手的政策问题呢？例如，多年前，奥巴马政府的“力争上游”政策在整个教育体系里掀起了轩然大波。该政策实际上是美国各州之间针对公共教育资源开展的有奖竞赛，竞赛依据各州必须提交的教育计划来分配公共教育资源，这些计划将在不同维度上对各州进行评分，包括学生成绩考核、教师责任制，以及劳动合同改革等。围绕力争上游政策的争议在于，该政策将教师质量作为学生成绩的主要决定因素，并把标准化考试作为衡量学生成绩的唯一方式。尽管这些争议都有道理，但力争上游政策依然是一项有趣的实验，理由很简单，就像总量管制与交易制度一样，该政策只在最高层面制定了解决方案，而把具体实施细节交给了各州自己。27