《思考,快与慢》笔记
专家预测的局限性:当直觉遇到公式
在《思考,快与慢》这本充满智慧的著作中,丹尼尔·卡尼曼带领我们探索了人类思维的两种模式:快速的直觉型思考(系统1)和缓慢的理性型思考(系统2)。第21章“直觉判断与公式运算,孰优孰劣?”更是直接将这两种思维模式带入了一个充满争议的领域:预测的准确性。书中通过一系列引人深思的研究和案例,揭示了一个令人震撼的结论:在许多领域中,简单的统计公式比专家预测更为准确。
这种结论并非空穴来风。早在上世纪,心理学家保罗·米尔(Paul Meehl)就通过一系列研究发现,统计预测方法在预测违反假释程序、飞行员的成功训练以及刑事累犯情况等方面的准确性,远超过了14名经验丰富的辅导员的预测📊。这一发现在临床心理学界引起了轩然大波,引发了长达50余年的研究热潮。根据现有的研究数据,约60%的研究表明,运算手法更为准确,而其余研究则认为两者准确性相近,但统计方法因其低成本而更具优势。
这些研究的应用范围极为广泛,涵盖了医学、经济、社会学等多个领域。例如,在预测癌症病人的寿命、心脏病的诊断、少年累犯的可能性等方面,专家预测的准确性与简单的统计公式相比并不占优,甚至更为低下📈。这种现象在米尔所称的“有效性低的环境”中尤为明显。在这些充满不确定性和不可预见性的领域中,专家预测的准确性往难以超越简单运算的结果。
简单公式的力量:波尔多酒与天气的预言
如果说米尔的研究是这场“预测大战”的开山之作,那么普林斯顿大学经济学家奥利·阿申菲尔特(Orley Ashenfelter)的研究则为这场战役增添了更多的戏剧性。他通过天气的三个特征——夏季生长期的平均温度、丰收期的降水量以及上一个冬季的总降水量——构建了一个简单的统计公式,用以预测波尔多酒的未来价格🍷。这个公式的预测准确性令人惊叹,预测价格与真实价格的相关系数超过了0.9。
这一发现不仅挑战了专家预测的权威性,也对经济理论提出了质疑。根据经济理论,价格应该能够反映所有有用信息,包括天气因素。然而,阿申菲尔特的研究表明,专家预测往因过于依赖主观判断而导致偏差。例如,在评估新酒的价格时,专家们可能会过分关注个人的品鉴体验,而忽略了天气等客观因素的影响🍇。这种主观判断的局限性在米尔的“断腿原则”中得到了进一步的阐释:只有在极少数情况下,主观判断才可能比公式更为准确。
统计模型的优越性:数据的力量
那么,为什么简单的统计公式会比专家预测更为准确呢?米尔和他的后继者们提出了两个主要原因。首先,专家在预测时往会尝试将不同的特征进行复杂的结合,以展现自己的“聪明才智”。然而,这种复杂化反而可能降低预测的准确性。正如米尔所言,将不同特征简单地整合在一起往会更为有效📊。
其次,专家预测的不可一致性是另一个重要问题。即使是经验丰富的专家,也可能在两次评估中给出不同的答案。例如,一位放射科医师在两次检查中对同一张片子的判断可能会有20%的偏差👨⚕️。这种不可一致性在低效的环境中尤为明显,进一步削弱了专家预测的可靠性。
为了解决这些问题,研究者们提出了基于等权原则的简单统计公式。这种公式通过对各个预测因素进行均衡考虑,避免了复杂模型的过拟合问题📈。例如,罗宾·道斯(Robyn Dawes)提出的“非正当线性模型”表明,简单的等权公式往能够比复杂的多次回归模型更为准确。这种发现的意义不仅限于学术领域,也为实践提供了重要的指导。
数据评分的奇迹:从婴儿到婚姻的预测
在书中,最令人印象深刻的案例之一是弗吉尼亚·阿普加(Virginia Apgar)提出的新生儿评分系统👶。在1953年之前,医生们主要依靠主观经验来判断新生儿的健康状况,导致许多新生儿因未能及时发现危险信号而夭折。阿普加的评分系统通过对心率、呼吸、反应、肌肉强度和颜色等五个变量进行评估,为新生儿提供了一个标准化的评估体系。这个简单的评分系统不仅提高了评估的准确性,还显著降低了婴儿的死亡率。
类似的简单评分系统在其他领域也取得了显著的成功。例如,道斯提出的婚姻稳定性公式——“做爱的频率减去争吵的频率”——虽然简单,却能够很好地预测婚姻的稳定性💏。这种基于简单原则的评分系统的成功,进一步证明了统计模型在预测中的优越性。
总的来说,《思考,快与慢》通过一系列引人深思的研究和案例,揭示了人类预测的局限性以及统计模型的力量。在这个充满不确定性的世界中,简单的公式往比专家预测更为准确。这种发现不仅挑战了我们对“专家”权威的信任,也为我们提供了一种更为可靠的预测方式。正如米尔所言,“在社会科学中,还没有哪一项研究像这项一样,众多研究虽定性不同,结果却都一致地指向同一个方向”。