VoxEU列经济研究前沿国际贸易

预测未来的工具和机器学习出口

2023年8月14日

统计学习模型越来越多地用于私人和公共组织的决策。本专栏讨论他们如何能被有效地应用于预测出口成功的公司的财务帐目。训练算法后,出口商和中报的经验,可以获得样本外概率得分,赶上公司出口地位的距离。作者指出,至少有两个情况下,当预测下一个出口商可能有用:贸易融资和产业政策的设计。

弗朗西斯卡Miccoci

博士生IMT学校高级研究——卢卡

科幻小说,通常情况下,预测未来。在1950年代,一个小说家想象未来的世界里,犯罪可以预见的组合机器和精神上有天赋的人。少数派报告最终成为一个动作电影在2000年代,和成群的观众仍然着迷于人类和机器能合作在预测未来。只有大约20年后,我们知道决策者不是精神上有天赋,但他们终于有机器可以帮助选择政策目标。¹

机器学习²模型被证明是强大的工具为决策者在公共和私人组织。在旧的科幻小说,我们确实有一个算法在公共法庭档案潜在的罪犯。³我们也有一个算法发现会计骗子(Usuki et al . 2020年)。然而,大多数利用大数据和机器学习的好处已经由私营公司,谁抓住了机会的预测模型广泛的操作,从库存管理客户关系,在金融行业的情况下,从信用风险管理投资组合优化。

然而,我们认为,仍有未开发和未开发的效益来循证公共政策设计。例如,De Blasio et al。(2018)展示了一个合适的机器学习框架可以目标对象可以获得更多的退税。最近,出现了新方法在统计学习的交集和因果推论,提高事后政策评价方法(阿塞和Imbens 2019),其目的是利用可观察到的信息来预测政策反设事实和更高的精度。

在最近的一篇论文(Micocci和Rungi 2023),我们关注的是事前的预测分析国际贸易。我们利用公司级财务信息预测和距离公司是否成为成功的出口商。我们一般直觉依赖于历史悠久的证据表明,出口商和中报是异构的,因此,统计不同(梅尔2008年Ottaviano,伯纳德et al . 2012年)。虽然贸易提供了一般的福利收益,只有少数几家公司能够保持成本的处理不同的监管环境,满足不同消费者的口味,建立营销和物流渠道。

因此,我们基本的直觉是机器学习算法可以从中报提取重要信息,区分出口商。如果我们这样做,我们也可以测量多远公司从成为一个出口国基于我们知道曾在国际市场上获得了成功。第一步是训练不同的算法一个代表性样本,包括出口商和中报。我们选择一个广泛的52预测电池包括一个公司的经济活动的不同方面(财务约束、全要素生产率、大小、年龄、创新、工业关系、地理位置,等等),参照特定的文学。一旦我们评估与更好的算法预测精度,⁴然后我们可以关注中报和他们提出在国际市场的能力。

我们可以更好的把握通过观察图1,绘制实际预测2010 - 2018年在法国获得了中报。

图1预测的中报(分数)贝叶斯添加剂后回归树与missingness属性

源:Micocci和Rungi (2023)

跑后我们最好的算法,我们可以获得一段预言,从0到1,其中一个代表出口地位的肯定。建设,最短的距离,最高的公司能够成功的几率成为出口国。从更广泛的角度来看,如果我们看看公司位于正确的尾巴的预测在图1中,我们有谁下一个出口商的信息。

但如何有用的预测下一个出口?我们能想到的至少两个案件中,一个可能想知道公司的出口潜力。第一个是在贸易融资的情况下,当贸易促进机构或私人金融中介机构决定如何分配资源的国际化企业。价值是一项投资项目融资?申请人的信用风险可以附加什么项目?是该公司进入国际市场后能够维持竞争吗?预测评分培训之前的成功和失败的经验可以帮助设计信贷政策组织,旨在促进国际化。例如,一个可能得出这样的结论:申请者已经符合所有成功的出口商的特点,而且,在这种情况下,最好是公共资源分配到最需要的地方。另一方面,如果一个公司太远离出口状态,人们可以质疑该实用程序的投资项目,专注于如何减少的距离成功的出口商。注意信用评分预测模型是现在常见的金融行业,⁵当信用风险衡量债务人破产的概率。在我们看来,预测在国外市场的成功显然比预测更有挑战性的一个公司的失败。然而,基线预测模型的预测精度得到相对高,⁶正如我们在每十只犯错误一次观察。

第二个更敏感的情况下,它是有用的知道下一个出口商是增长和多样化的产业政策。最近的全球冲击后,促进多元化和开发新的工业能力已经成为一个优先级(2022年国际货币基金组织(IMF)来解决更广泛的市场失灵,不利的商业环境中,和新兴地缘政治风险的来源。在过去的十年里,欧盟已经阐述了一些一般原则对欧盟产业政策(2023年欧盟),整合了许多EU-related政策,包括对外贸易和国内市场。在此背景下,知道一个人可以是很有用的发现边缘潜在的出口商,可以提高一个国家的贸易潜力,一个地区,或者一个行业。更多的从技术上讲,出口成绩检测事前的贸易广泛的利润率如何可以改变如何成为有竞争力的地区或行业。

例如,让我们考虑一下地图复制在图2中,我们可以发现潜在的出口商在法国的地理集中的公司出口的几率高于中位数。值得注意的是,我们可以简要评论,有更多的空间增加彩色绿色贸易地区广泛的利润率。最值得注意的是,巴黎和巴黎不是彩色的绿色,尽管我们知道首都地区举办许多出口商。相反,灰色区域表示没有显著的浓度的出口商。如果我们更好看,更大的边缘潜在的出口商坐落在这个国家的其他地区,虽然在工业活动可能的密度低的地方。最终,更少的出口商预计该国南部和海外领土。

图2下一个出口在哪里?

请注意在法国:坚果便是区域位置上
源:Micocci和Rungi (2023)

更加聪明的分析可以在哪些行业调查公司更好地成为下一个出口商,和一个也可以评论的力量不同的预测指标包括在电池。然而,在这个阶段,我们不知道如何以及为什么企业在出口条件。后者是一个有关任何事前的预测模型的局限性,只能通知决策者的图片。预测模型不替代经济结构模型、政策评价方法和影响分析。总值在现代宏观计量经济学的情况下,预测结果或通货膨胀可以为央行行长必不可少的运动,但是仍然需要采取其他工具来设计最优的政策。

最后,现代数据科学已经扩大的可能性做出更好,更快,更高效的决策基于经验证据。国际贸易学者和政策制定者可以求助于机器学习预测模型,因此,有更多的弦弓设计以证据为基础的政策。然而,随着传统的科幻小说会提醒我们,我们总是需要照顾少数派报告(s),即当一个小,虽然不小,机器的预测可能是错的机会,预见事件可以通过人工干预改变。

引用

Ansgar、W、P Goldsmith-Pinkham T Ramadorai和柱身(2019),“机器学习在信贷市场的影响”,VoxEU.org, 1月11日。

阿塞,S和G W Imbens(2019),“机器学习方法,经济学家应该知道”,年度回顾的经济学11 (1):685 - 725。

英格兰银行(2022),“机器学习在英国金融服务”。

Bargagli-Stoffi F, F Incerti, M Riccaboni和Rungi (2023),“机器学习僵尸狩猎:预测痛苦从公司的账户和缺失值”。

伯纳德•B J B Jensen S J雷丁和P K Schott(2012),“公司异质性的经验和国际贸易”,年度回顾的经济学2012个4 (1):283 - 313。

Breinlich、H、V使得科拉迪,N罗查,太阳,J M C桑托斯席尔瓦和T Zylkin(2022),在国际贸易中“机器学习研究——评估贸易协定”的影响,经济政策讨论文件17325。

de Blasio G, E尚,D 'Ignazio和M Andini (2018),“有效的政策定位和机器学习”,VoxEU.org, 11月21日。

迪克,P K(1991),《少数派报告》的第4卷收集到的菲利普•k•迪克的故事。斯考克斯市,Citadel《暮光之城》。

欧盟(2023),“欧盟工业政策的一般原则”,事实表在欧盟、欧洲议会。

Hastie T R Tishirani和J·弗里德曼(2017),统计学习的元素:数据挖掘、推理和预测第二版,网上12日修订,施普林格系列统计数据。

国际货币基金组织(IMF)(2022),“增长和多样化的产业政策:一个概念性的框架”,国际货币基金组织部门纸2022 (017)。

Kapelner,和J布莱西(2015),“预测通过贝叶斯添加剂与缺失的数据回归树”,加拿大杂志的统计数据43 (2)。

jonkleinberg J H Lakkaraju J Leskovec J路德维希和S穆雷风(2018),“人类决策和预测机”,经济学的季刊133 (1):237 - 293。

Mayer, T和G P Ottaviano(2008),“快乐几:欧洲公司的国际化”,Intereconomics43:135 - 148

Micocci F和Rungi(2023),“预测出口商与机器学习”,即将到来世界贸易审查。

穆雷风,S和J这位(2017),“机器学习:应用计量经济学方法”,《经济视角31 (2):87 - 106。

Usuki T M日本须贺,D Miyakawa Shiraki K和S近藤(2020),“机器学习与会计欺诈”,VoxEU.org, 5月13日。

脚注

看到穆雷风和这位(2017)或阿塞和Imbens(2019)讨论集成机器学习模型的效用在经济学和计量经济学。
在这种情况下,我们可以更好地利用统计学习这个词。短暂,统计学习处理的统计推断问题找到一个基于数据预测函数,而机器学习强调解决所需的计算方面,特殊的统计推断问题。对统计学习理论的引用,看到Hastie et al。(2017)。
节奏(矫正罪犯管理分析替代制裁)是一个美国法庭所使用的算法评估的可能性成为惯犯。参见jonkleinberg et al。(2018)。
当我们讨论预测精度,我们总是把正确分类的能力模型,分离的出口商的中报,只看预测的电池。措施的预测精度依赖于计算有多少假阳性和假阴性一得到锻炼。
其中,看到英国央行(Bank of England)的报告(2019年)在机器学习工具的扩散金融业在英国。丰一个应用程序,看到Bargagli-Stoffi et al。(2023)。参见Ansgar et al。(2019)讨论强化学习问题。
Micocci模型的赛马,Rungi(2023)表明,贝叶斯添加剂回归树(BART)缺失值作为预测因子(Kapelner和布莱西,2015)返回一个更高的预测精度相比与其他计量经济学或机器学习工具。不同的标准措施的预测精度。,所谓的曲线下面积(AUC)告诉我们,预测精度是0.90。