AdobeStock_188073083.jpeg
VoxEU 经济研究前沿 税收

利用机器学习进行有效的政策定位

一项公共政策的影响在一定程度上取决于它在选择目标方面的有效性。机器学习可以通过利用越来越多的可用信息来提供帮助。本专栏使用来自意大利的数据,介绍了两个如何利用机器学习来针对那些可能从政策中获得更多利益的群体的例子。它说明了与基于一些任意选择的特征使用粗策略分配规则的标准实践相比,机器学习目标的好处。

为了为政策制定提供信息,我们需要对因果性和预测性问题给出答案。Kleinberg等人(2015)提供了一个例子,帮助我们区分两者。采取行动应对干旱的政策制定者可能需要知道雨舞是否会产生预期的效果。这是一个纯粹的因果问题。但其他与雨有关的决定,如是否分发雨伞,只需要对坏天气的可能性有一个很好的预测,因为撑伞的收益是已知的,至少在某种程度上是近似的。这就是Kleinberg等人(2015)所说的“预测政策问题”。

大多数政策评价文献都集中在因果问题上。计量经济学中的“可信度革命”(Angrist和Pischke 2010)为我们提供了事后评估公共项目因果效应的工具。然而,一项政策的影响也取决于它在选择目标方面的有效性。在资源稀缺的情况下,预测哪个目标可能获得更大的回报至关重要。这就是机器学习派上用场的地方。在统计学和计算机科学中开发的机器学习算法(Hastie et al. 2009)已被证明对预测任务特别强大(Mullainathan and Spiess 2017)

我们给出了两个如何使用机器学习来针对那些可能从政策中获得更多利益的群体的例子这些例子说明了与基于任意选择的可观察特征实现粗分配规则的标准实践相比,机器学习目标的好处。然而,只有事后评估方法才能最终告诉我们,以预测为目标是否能带来预期的收益。该专栏还讨论了一些问题——透明度、操纵等——当机器学习算法用于公共政策时出现的问题。

机器学习目标的例子

在Andini等人(2018a)中,我们考虑了2014年意大利推出的旨在促进家庭消费的退税计划。意大利政府选择了一个粗略的目标规则,只向年收入在8145欧元至2.6万欧元之间的员工提供退税。考虑到政策目标,另一种选择可能是针对消费受限的家庭,这些家庭本应在奖金中消费更多。

调查通常包含自我报告的措施,可以用作消费约束的代理。我们使用了意大利银行2010年和2012年的家庭收入和财富调查(SHIW),该调查询问了家庭的收支能力。我们采用现成的机器学习方法,根据大量可能用于目标定位的变量来预测这种情况。我们首选的算法是决策树,这导致了图1所示的分配机制。它只选择了几个变量,主要是指家庭收入和财富。例如,那些金融资产低于13255欧元、家庭可支配收入低于36040欧元的家庭预计将受到消费限制。其他预计会如此的群体可以通过查看图表轻松评估。

图1消费受限状态的决策树预测模型

即使我们有理由相信,预计消费受限的家庭更有可能在退税后消费,但没有什么能确保这是事实(Athey 2017)。为了减轻这些担忧,我们根据2014年的SHIW数据,分别估计了奖金对预计将受到消费限制的家庭和那些没有受到消费限制的家庭的影响。为了做到这一点,我们回到标准计量经济学,假设对可观察对象进行选择并运行回归。

估计的影响是积极的和显著的,仅对预测的消费受限的家庭。退税受益人的分布表明,通过使用机器学习进行目标定位可以获得巨大收益(图2,红色边框):预计约三分之一的实际受益人不会受到消费限制,而约三分之二的非受益人预计会受到消费限制。

图2预测消费的比例——受退税接受者身份限制

在第二个应用中(Andini et al. 2018b),我们关注向公司分配公共信用担保的“预测政策问题”。这些计划旨在通过提供公共资金担保,支持企业获得银行信贷。原则上,担保计划的目标应该是信誉良好(以确保该计划的财务可持续性)和定量配给的公司,因为其他公司无论如何都可能获得信贷(世界银行2015年)。在实践中,现有的担保计划通常基于naïve规则,这些规则将低信用借款人排除在外。我们提出了一种基于机器学习预测的替代分配机制,其中明确解决了信用可靠性和信贷配给问题。

调查对象是意大利,该国的一个公共担保基金自2000年以来一直在运作。利用来自信贷登记的微观层面数据(包括信贷配给和不良贷款激增的措施),我们确定了假设的目标公司,并估计了一个机器学习模型来预测这种状态。在这种情况下,我们最喜欢的项目机器学习算法是随机森林,它本质上是许多决策树的平均值。

为了评估以这些公司为目标是否会改善该计划对信贷可用性的影响,我们首先考虑获得担保的公司集合,并根据机器学习是否预测它们是目标,将它们分为两组。对提供担保后几年的银行贷款支付增长率进行简单比较表明,以机器学习为目标的组表现更好(图3)。应用更严格的回归不连续设计(如de Blasio等人2018年所示)证实了这一结果,这表明担保对机器学习目标组的信贷可用性有更大的影响。

图3基于机器学习的担保基金受益公司业绩分析

机器学习定位的问题

将机器学习方法应用于政策定位需要处理一些有争议的话题。一个问题是决策规则的可解释性,这可能以牺牲精确性为代价。在一些应用程序中,简单的算法已经足够准确,就像退税示例中的决策树一样。在其他情况下,较好的机器学习目标规则类似于黑箱,如上述公共担保方案的随机森林。黑箱规则缺乏可解释性可以被视为对透明度的威胁,因为被排除的代理可能不容易理解他们基于哪些理由没有成为目标(Athey 2017)。精确性和透明性之间的权衡取决于具体的应用程序。

然而,有一个透明度的维度,可以被称为实质性透明度,它涉及政策制定者完成其使命的问责制,即以有效的方式使用公共资金。在这方面,机器学习目标显然胜过粗糙的分配规则。

另一个问题是,基于机器学习的目标规则是通过观察特定的回报来构建的(例如,改善企业获得信贷的机会)。为了达到这个目标,目标规则选择特定的组(目标),而不是其他组。这种选择可能会损害其他政策目标(“忽略了收益”;见Kleinberg et al. 2018)。例如,在阐述担保基金的例子时,公共担保也被大力提倡作为应对经济衰退的措施。有人可能会问,我们的机器学习目标规则最终是否排除了南部地区的公司,这些地区受到危机的打击更严重。事实并非如此:基于机器学习的规则优先考虑韩国,而保证基金的实际规则则有利于朝鲜。

最后一个问题是,当目标规则已知时,代理可能会操纵其可观察到的特征以从策略中获益。然而,这适用于任何类型的目标定位。例如,将决策树与实际的退税规则进行比较,可以看到,为了获得奖金,潜在的接受者应该操纵多个变量(例如,在最简单的情况下,金融资产和收入),而实际的衡量方法仅基于收入。

作者注:本文仅代表作者个人观点,并不代表意大利央行的观点。

参考文献

Angrist, JD,和JS Pischke(2010),“实证经济学的可信度革命:更好的研究设计如何使计量经济学摆脱骗局”,经济展望杂志24(2): 3-30。

Andini, M, E Ciani, G de Blasio, A D 'Ignazio和V Salvestrini (2018a),”机器学习的目标:意大利退税计划的应用,《经济行为与组织杂志》,即将出版。

Andini, M, M Boldrini, E Ciani, G de Blasio, A D 'Ignazio和A Paladini (2018b),“为政策目标服务的机器学习:公共信用担保的案例”,意大利银行工作文件,即将出版。

Athey, S(2017),“超越预测:使用大数据解决政策问题”,科学355(6324): 483 - 485。

Athey, S, and G Imbens(2016),“异构因果效应的递归划分”,PNAS113(27): 7353 - 7360。

Chalfin, A, O Danieli, A Hillis, Z Jelveh, M Luca, J Ludwig和S Mullainathan(2016),“机器学习的人力资本生产力和选择”,美国经济评论106(5): 124 - 127。

de Blasio, G, S de Mitri, A D 'Ignazio, P Finaldi Russo和L Stoppani(2018),“中小企业借款的公共担保。RDDevaluation”,银行与金融杂志96: 73 - 86。

哈斯蒂,T, R Tibshirani和J Friedman (2009),统计学习的要素:数据挖掘、推断和预测,纽约:施普林格。

Jiménez, G, S Ongena, JL Peydrò和J Saurina(2012),“信贷供应和货币政策:通过贷款申请识别银行资产负债表渠道”,美国经济评论102(5): 2301 - 2326。

Kang, JS, P Kuznetsova, M Luca和Y Choi(2013),”哪里不吃?利用在线评论预测卫生检查,改善公共政策”,2013年自然语言处理经验方法会议论文集,1443 - 1448。

Kleinberg, J, J Ludwig, S Mullainathan和Z Obermeyer(2015),“预测政策问题”,美国经济评论105(5): 491 - 495。

Kleinberg, J, H Lakkaraju, J Leskovec和S Mullainathan(2018),“人类决策和机器预测”,经济学季刊133(1): 237 - 293。

麦克布莱德,L,和A尼科尔斯(2015)通过机器学习改善贫困目标:美国国际开发署贫困评估工具的应用,工作纸。

Mullainathan, S,和J Spiess(2017),“机器学习:应用计量经济学方法”,经济展望杂志31(2): 87 - 106。

Rockoff, JE, BA Jacob, TJ Kane和DO Staiger(2011),“当你招聘一个有效的老师时,你能识别出一个有效的老师吗?”,教育财政政策6(1): 43 - 74。

Wager, S, and S Athey(2018),“使用随机森林的异质处理效果的估计和推断”,美国统计协会杂志113(523): 1228 - 1242。

世界银行(2015),”中小企业公共信用担保计划原则”。

这里我们指的是监督学习方法。其他关于使用机器学习辅助公共决策的例子可以在Rockoff等人(2011),Kang等人(2013),McBride和Nichols (2015), Chalfin等人(2016)和Kleinberg等人(2018)中找到。

在我们的应用程序中,我们利用了这样一个事实,即我们知道我们想要针对哪个群体,同时,我们有观察到这种情况的数据,这样我们就可以使用机器学习来估计预测模型。但情况可能并非总是如此。此外,政策制定者可能希望直接基于因果效应的事后证据,而不是任何先验证据。Athey和Imbens(2016)以及Wager和Athey(2018)开发了机器学习方法来确定因果效应更强的人群。

[3]信贷配给是通过观察申请银行贷款的公司的信贷动态来评估的(类似于Jiménez等人,2012)。

4724年读

Baidu
map