VoxEU列劳动力市场经济研究前沿

劳动经济学及其他领域的自然实验:2021年诺贝尔奖得主大卫·卡德、约书亚·安格瑞斯特和圭多·因本斯

2021年10月16日

2021年诺贝尔经济学奖被授予加州大学伯克利分校的大卫·卡德(David Card)，以表彰他“对劳动经济学的实证贡献”，以及麻省理工学院的约书亚·安格瑞斯特(Joshua Angrist)和斯坦福大学的圭多·因本斯(Guido Imbens)，以表彰他们“对因果关系分析的方法论贡献”。本专栏解释了在实证经济学中使用自然实验如何在因果关系分析方面取得了很大进展。在过去的30年里，随之而来的“可信度革命”对教育、移民和最低工资等关键政策挑战的研究产生了转变。

我曾经天真地向已故的艾伦•克鲁格(Alan Krueger)询问经济学中自然实验的先驱。他有点不好意思地回答说，这就像问摇滚乐的先驱一样。我并不需要做太多研究，就能揭示上世纪80年代和90年代劳动经济学运动的众多主角，这场运动改变了实证工作在该领域以及其他许多经济学领域的工作方式。然而，就像摇滚乐一样，自然实验也有他们的四人组，他们是2021年诺贝尔奖得主大卫·卡德、约书亚·安格瑞斯特和圭多·因本斯，以及已故的艾伦·克鲁格。我希望很多人会同意我的观点，这个奖也是对克鲁格的荣誉。

经济学中的重要问题是因果关系问题。移民如何影响本地劳动力市场前景?在学校多读一年或上大学有什么好处?最低工资对低技能工人的就业前景有什么影响?但这些问题很难回答，因为我们缺乏正确的反事实。

例如，我们不知道如果移民更少，当地人会过得怎么样。相反，我们观察已实现的治疗的本土结果，即实际发生的移民水平。观察到的已实现的治疗和结果之间的关联可能有三个原因:

一个是利益变量的实际因果效应——例如，移民的到来对本地人工资的影响。
或者，因果关系也可能以另一种方式运行——例如，移民可能会在表现特别好的劳动力市场定居。
最后一种可能性是，可能存在第三个变量(称为混杂因素)，影响治疗和结果。以上大学的回报为例，毕业生可能比离校者更有能力或更努力，即使他们没有上大学，也会有更高的收入。

社会科学的挑战在于如何破解这些因果关系的难题。

经济学家们很久以前就熟知那些将成为自然实验的支柱的主要方法。揭示因果关系的关键是对感兴趣的变量的变化来自哪里有一个清晰的观点和一个可信的对照组。

其中一种方法- - -差异中的差异- - -经常被用来通过比较一些地区或群体来分析政策变化，在这些地区或群体中，有些人得到了待遇，而另一些人则没有。这些群体在政策改变或干预发生前后都被跟踪。通过比较治疗组和对照组随着时间的变化，两组不必事先完全相同。在没有治疗的情况下，它们以类似的方式进化就足够了。

另一种方法是工具变量。这将一个变异的来源联系起来，希望与结果和混杂因素无关，称为仪器，与治疗，这反过来应该影响结果。因此，工具变量可以用来梳理因果关系，并经常有助于分离来自自然实验的变化。

这些方法早在20世纪80年代之前就为经济学家所知和使用。一个例子是西奥多·舒尔茨(Theodore Schultz, 1964)关于“剩余劳动力假说”的研究。舒尔茨想要估算农业经济中劳动的边际产量，并使用1918- 1919年流感流行期间印度各省的死亡人数作为劳动力供应的冲击。

那么，20世纪80年代的自然实验者究竟做出了什么贡献呢?我在是谁发起的这个问题上的幼稚，突显出很难确定今年诺贝尔奖表彰的确切贡献。为了阐明这一点，我们有必要认识到，舒尔茨这样的工作在很大程度上是个例外。上世纪七八十年代是实证经济学的黑暗时代。爱德华·利默(Edward Leamer)(1983)呼吁“从计量经济学中剔除骗局”，这突显了当时许多人的沮丧情绪。

利默通过对死刑是否能阻止犯罪这一问题的讨论，阐明了他对现状的失望。艾萨克·埃利希(Isaac Ehrlich, 1977,1977)的两项有影响力的研究得出了这样的结论，但利默证明，通过改变估计的几个方面，可以很容易地从单个数据集获得相反的结果。同时代的评论家也对埃利希分析提出了异议，并强调了函数形式、回归模型中包含的变量和样本变化方面的脆弱性。

然而，所有这些争议都忽略了一个主要问题，即死刑和谋杀率之间的联系是否能告诉我们死刑的因果效应。埃利希很清楚，犯罪率也可能影响死刑执行，并使用工具变量法来规避这个问题。但是他选择的工具——政府总支出、警察支出、人口支出和非白人人口比例——既不太可信，也没有讨论这些工具为什么有用。

这个例子和围绕它的讨论很有代表性。事实上，这可能是一个更仔细的调查。某种程度上机械地使用工具变量是经验主流的一部分。在时间序列研究中，仪器通常只是过去的治疗值。

与此同时，许多经济学家明白混淆和反向因果关系的问题，而且广泛使用的方法往往不适合这项任务。普林斯顿大学的Orley Ashenfelter写了一系列关于政府资助培训项目评估的论文(Ashenfelter 1974,1978, Ashenfelter and Card 1985)。

也许具有讽刺意味的是，他还采用了差异中的差异方法来比较接受过培训的工人和其他未经培训的工人。但是，观察训练前后不同的时间跨度，对训练影响的估计却大相径庭。他清楚地发现，受过培训的工人的收入轨迹与对照组明显不同:在开始培训之前，受训者的收入往往会下降。因此，看起来像是训练效果的东西可能只是受训人员在不利情况下的自然反弹。

与此同时，有一个这样的培训计划的随机评估，国家支持工作示范，和阿申菲尔特的博士生罗伯特·拉隆德比较实验估计和非实验的替代方案。Lalonde(1986)的研究强调了非实验方法的脆弱性，并为当时许多年轻的经济学家提供了重要的动力，他们试图做得更好。

当阿申菲尔特继续倡导对政府项目进行实验性评估时，普林斯顿大学的另一名博士生加里•索伦(Gary Solon)采取了不同的策略。梭伦感兴趣的是失业救济对失业者寻找工作行为的影响，以及他们找到新工作所花费的时间。失业救济金各不相同的原因有两个:确定救济金水平的规则以及个人以前的收入和就业历史。虽然我们对规则的影响感兴趣，但研究人员往往只是简单地比较了所获得的收益和结果，从而将政策与劳动力市场前景中的个体异质性混为一谈。

Solon(1985)从1979年开始对高收入者的失业救济金征税，采用“差中差”设计，将他们与未纳税的对照个人进行比较，小心翼翼地分离出福利规则的影响。这是另一项具有里程碑意义的研究，影响了他周围的许多人，甚至更远的地方，比如麻省理工学院的博士生劳伦斯·卡茨(Lawrence Katz)和布鲁斯·迈耶(Bruce Meyer)，他们将进一步开展这项工作。

普林斯顿并不是唯一一个酝酿不满情绪的地方。在哈佛大学，理查德·弗里曼(Richard Freeman)受到了舒尔茨之前提到的工作的很大影响。弗里曼试图在自己的作品中模仿舒尔茨，使用类似的电击，但他的作品还没有达到可以被归类为适当的自然实验的程度。

但他的一个博士生艾伦·克鲁格(Alan Krueger)做到了。克鲁格1986年加入普林斯顿大学担任助理教授，成为大卫·卡德的同事;约书亚·安格瑞斯特当时是一名博士生。他们是一群年轻经济学家的一部分，他们坚信自己可以做得更好，创造出更可信的实证研究。

卡德(1990)对马里埃尔(Mariel)偷渡事件进行了研究，以衡量移民对本土工人的影响。他的研究强调了新一代工人的工作方式与之前的工作方式之间的差异。为了规避移民可能会在表现良好的劳动力市场定居的问题，他研究了1980年通过马里埃尔(Mariel)船只抵达的古巴émigrés移民。马里埃尔的古巴人都在迈阿密登陆，许多人留在那里，在几个月里为该市增加了约7%的劳动力。

卡德在一个简单的差异分析中仔细比较了迈阿密本地人的结果，并与一些比较城市进行了比较，这些城市与迈阿密相似，但没有大量的移民流入。迈阿密居民的收入和失业率的演变与其他城市大致相似，但结果有些混乱，不能完全确定。尽管如此，玛丽埃尔的研究仍然是一个卓越的自然实验，并影响了当时的许多研究人员。

大卫·卡德和艾伦·克鲁格最出名的可能是他们关于最低工资的研究，特别是卡德和克鲁格(1994)，他们分析了新泽西州最低工资的增长。他们在另一个“差异中的差异”框架中比较了新泽西州快餐店的就业影响和邻近的宾夕法尼亚州快餐店的就业影响，并发现了类似的就业变化。也许新泽西州和宾夕法尼亚州在某些方面有所不同，这就是为什么一个州提高了最低工资而另一个州没有提高，这种影响抵消了任何就业下降的影响。卡德和克鲁格还比较了新泽西州最低工资上调前收取不同工资的餐馆，得出了类似的结果，以此解决了这一问题。

这项最低工资研究的一个创新之处在于，在经济学家几乎完全依赖二手数据来源的时候，他们使用自己的调查收集数据。现在，在实证经济学中，寻找好的新数据源或生成自己的数据源是很常见的。正如批评者所指出的那样，新泽西州的数据质量并不是特别好，卡德和克鲁格(2000)通过在重新分析中使用行政记录来改进它，这证实了结果。批判性地重新评估自己的作品，并在必要的时候进行改进，是这些作者的另一个特点。

所有刚才描述的研究都使用了差异中的差异，但自然实验运动的一个关键工具是工具变量法。安格里斯特(Angrist)和克鲁格(Krueger)(1991)关于完成额外一年学业的回报的研究强调了它的用途。他们利用了美国义务教育法律的性质，该法律规定，学生一旦达到义务教育年龄(许多地方是16岁)就可以退学，即使他们的生日是在学年的中间。由于每年9月份只有一次入学，对于那些决定尽快退学的人来说，出生日期会导致在校时间的变化。这导致安格瑞斯特和克鲁格使用出生四分之一作为受教育年限的工具，这在美国人口普查的大型公共使用样本中是可用的。

这篇论文尤其引人注目，因为它是工具变量的现代、深思熟虑的使用的一个转折点(尽管还有一些其他的工具变量)。安格瑞斯特和克鲁格用辅助的经验证据仔细地支持了固有的假设。例如，作者在文件中指出，在人口普查中，义务教育法律以完全预期的方式影响了年轻群体的入学率，尽管这些不是分析中使用的主要群体。他们还表明，出生四分之一的影响主要影响那些高中或高中以下的人，他们应该受到义务教育法律的影响，而不是那些接受了更多教育的人。像许多重要的自然实验论文一样，简单的图形证据支持它的故事，这种透明度是自然实验运动的另一个关键特征。

安格瑞斯特和克鲁格对学校教育的研究令人惊讶的一点是，工具变量实际上比更naïve的分析给学校教育带来了更高的回报。这令人惊讶，因为大多数分析师预计naïve的关联太大了，因为我们认为那些无论如何都会有更高收入的人也是接受更多教育的人，这使得naïve的关联向上倾斜。

这就是Angrist和Guido Imbens的工作发挥作用的地方。两人都刚刚完成博士学位，在哈佛大学担任助理教授时相识。显然，不同的人会从额外一年的教育中得到不同的好处。有些人可能在家族企业有一份有保障的工作，完成高中学业可能无关紧要;对另一些人来说，这可能会改变他们的生活。那么，我们到底在衡量谁对教育的回报呢?因本斯和安格瑞斯特(1994)表明，正是那些个人的教育受到仪器的影响。

在安格瑞斯特和克鲁格的案例中，这包括那些处于早期辍学边缘的人。他们的研究几乎没有告诉我们如何完成大学学位。虽然我们不知道一年教育对每个人的收入影响，也不知道对每一年的收入影响，但使用工具变量的研究结果往往与政策目的所关注的群体特别相关。

安格里斯特和因本斯的分析在卡德(2001年)对教育回报文献的解释中发挥了关键作用，自那以后，这些见解被许多研究人员使用和扩展。它还强调，任何单一的研究都只能对一个问题提供部分结果。为了获得更全面的情况，我们需要使用不同的仪器或受影响的不同个体进行更多的分析。随着时间的推移，这些外部有效性的问题已经受到越来越多的关注。

这些作者的经典论文也受到了批评。事实上，这里提到的所有论文都被其他人仔细地解剖和重新分析过。这一过程使人们更好地了解所使用的方法，并改进了许多方法。披头士四人组自己也参与了这个过程。你瞧，也许令人惊讶的是，许多报纸在接受审查时表现得相当不错。

自然实验方法论不仅席卷了劳动经济学，也席卷了许多其他经济学领域。一些人担心我们很快就会用光好的自然实验，而这种方法会导致我们把注意力集中在狭隘的、相对不重要的问题上。相反，似乎发生了相反的事情:随着越来越多的研究人员使用这些方法，我们遇到了越来越多可以利用的好环境。好问题会有好答案。

衡量自然实验革命成功与否的一个粗略标准是这样一个事实:自1990年以来，至少有一半的克拉克奖章(由美国经济协会颁发给40岁以下最优秀的经济学家的奖项)被授予了与自然实验方法有关的获奖者。这是非同寻常的，因为获奖者来自包括理论在内的各个领域，这也凸显了实证经济学在这一时期所取得的成功。当然，这在很大程度上是因为今年的获奖者向我们展示了做可靠实证工作的方法。