VoxEU列金融监管与银行业微观经济管理

机器学习对抗会计欺诈

2020年5月13日

发现和防止会计欺诈是世界各地许多政策制定者关注的问题。本专栏介绍了一个框架，该框架结合了机器学习技术，以检测和预测公司在报告财务信息时的欺诈行为。该框架依赖于更大的企业信息集，以实现更好的检测性能，并与以往的框架不同，提供了对潜在的未来会计欺诈的预测。

作者

Teppei Usuki

误报财务信息(“财务报表造假”)是一个严重的经济事件，无论从实际角度还是从企业会计丑闻带来的潜在损害来看，都应该避免。

特别是上市公司财务信息的虚假报告，扭曲了参与股票、债券交易、银行贷款等金融交易的各类经济主体的决策，导致资源配置效率低下。在真实的商业关系中，这种误报也可能导致客户和供应商都不知道的过度冒险。因此，当这种风险变得明显时，可能会导致经济活动意外停滞。如果故意报告错误(“会计欺诈”)并经常发生，可能会造成市场崩溃等更严重的后果。

到目前为止，对虚假会计机制的研究主要是理论性的，并且在很大程度上是在会计领域进行的(例如Dechow et al. 1996)。一种理论文献关注的是一家公司实施会计欺诈的潜在“原因”。讨论了公司故意伪造财务信息的原因，例如，在面临不景气的经营业绩时，试图实现更好的采购条款。这类研究通常描述给定一定目标功能和约束的公司的最佳行为，从而说明会计舞弊的决定因素。

第二股的理论文献寻求识别的财务信息是统计上相关的会计欺诈的发生。

例如，大量的研究研究了“可自由支配会计应计制”。这些被认为与管理层的利润调整行为有关，并被发现与会计欺诈密切相关。

近年来，在实证文献中取得了进展，使用统计模型来检测财务报表中的会计欺诈，从而确定有可能从事欺诈行为的公司。在实证研究中，Dechow等人(2011)和Song等人(2016)将会计舞弊的自变量纳入参数模型，以检测并发事件。这些模型表现出良好的样本拟合，也证实了理论猜想。

虽然实证文献在发现会计舞弊方面取得了良好的进展，但仍有大量的变量有待考虑。在模型中只包含少数几个变量，虽然有助于检验理论假设，但却忽略了可能带来额外预测能力的有关公司的大量信息。

因此，Kondo等人(2019)的目标是将大量解释变量纳入一个使用机器学习方法(Chen等人2004年开发的一种随机森林)检测会计欺诈的模型中。正如最近两篇著名的文章(Perols 2011, Perols et al. 2017)所讨论的，检测会计欺诈就像大海捞针。我们的模型使用了尽可能广泛的公司信息，比如从公司财务信息构建的财务指标;公司治理相关变量，重点关注股东、高管和员工信息;以银行信息为解释变量的银行交易变量。

我们模型的第二个目标是解决未来会计舞弊的发生，或“预测”。大多数现有的研究明确地集中在当前报表中的会计欺诈检测(“临近预测”)，这与破产事件不同，不一定容易被公众观察到。因此，“临近预测”对审计具有重要的实用价值。从审计业务的角度来看，特别审查那些更容易发生误报的公司也是谨慎的做法。因此，我们使用基于机器学习的分析框架来预测会计舞弊。

我们验证了我们的预测模型的性能如下利用日本上市公司的会计造假数据，我们比较了不同模型的表现。模型1是一个参数化模型，它只依赖于现有研究中使用的有限变量。模型2是使用机器学习的非参数模型，只依赖于有限的变量;模型3-16是非参数模型，使用了具有扩展变量集的机器学习。具体来说，模型12是一个依赖于上述所有变量的完整模型。

首先，我们发现机器学习技术和高维特征空间的使用都提高了检测性能(图1)。由于只有使用机器学习才能对模型12中的变量进行扩展，所以很难衡量机器学习方法的应用与变量空间的扩展相比，究竟在多大程度上有助于更好的欺诈检测性能。结果表明，即使在使用与现有研究类似的变量组时，构建检测模型的方法也有独创性的空间。

图1绩效评估结果

请注意:图1显示了使用Accounting Fraud Flags 2(即严重事件和附属事件)训练的所有检测模型的性能评估指标AUC，并对测试数据进行评分，及其95%的置信区间。参见Kondo等人(2019)了解更多细节。

我们验证了我们的模型的性能与我们的第二个目标(使用支撑样本进行预测)有关(图2)。我们确认了我们的模型达到了足够的预测性能。因此，我们补充了文献，表明值得使用具有高维数据的机器学习模型来预测未来的会计欺诈。

图2与预测有关的绩效评估结果

注意:图2显示了使用Accounting Fraud Flags 2(即严重事件和附属事件)训练的所有预测模型的AUC，一个性能评估指标，并在测试数据上打分，及其95%的置信区间。参见Kondo等人(2019)了解更多细节。

我们还表明，除了现有研究中使用的变量之外，其他变量至少在一定程度上是有用的。具体而言，员工平均服务年限和公司高管持有的流通股比例的重要性排名较高。我们在图3中演示了估计的预测得分如何随这些变量波动。结果表明，除了目前文献中考虑的因素外，可能还有许多其他变量对检测和预测欺诈有重要贡献。因此，我们的研究结果表明，如果扩展特征空间，这些模型有更大的实际应用空间，同时也需要进一步的会计舞弊机制的理论研究。

图3平均属性附近的属性变化与得分变化的关系

请注意:图3展示了每个属性向上或向下改变时得分的变化。

需要注意的是，构建基于机器学习的模型需要建立各种超参数，尤其是在训练环节。一些示例包括要构造的树的数量、最小分支的数量，以及在设置分支规则时引用的统计信息的类型。虽然我们的结果在很大程度上不依赖于这些参数，但有必要指出的是，机器学习方法不会自动化所有涉及模型构建的任务。

此外，应该认识到，除了我们论文中使用的方法，还有其他机器学习方法来检测和预测会计欺诈。事实上，本研究的一些作者使用不同的机器学习方法取得了良好的性能，这表明未来通过结合几十种不同的模型可以得到一个更鲁棒的模型。由于建立一个紧凑且易于使用的模型显然是有益的，未来的模型可以建立在我们的研究之上，并将所使用的变量的数量限制在那些我们认为从预测的角度来看相对重要的变量上。然而，我们应该注意到，即使目标结果相同，不同的变量的重要性取决于目标是检测还是预测欺诈。此外，即使执行相同的预测，不同的目标标志设置也会导致排名高的变量组之间的差异。因此，在构建这样一个紧凑易用的模型时，应根据模型的目的进行变量的选择。

另一个警告是，我们的预测模型假设恒定的社会经济环境和会计标准。例如，如果在一个新业务中存在一种完全不同的欺诈行为，当前的模型可能无法检测或预测这一点。此外，即使公司的现实情况不变，由于会计准则的变化，财务变量可能会取不同的值，这可能会影响欺诈检测和欺诈预测结果。因此，定期监测模型的有效性是很重要的。

一旦建立了令人满意的预测模型，就必须分析得出的分数，并决定是否采取适当的反应。由于有些公司目前正在进行或可能在不久的将来进行会计欺诈，因此需要具备专业知识的专业人员迅速处理这类案件。当会计舞弊的可能性足够大到需要进行干预时，需要作出良好的判断。与此相关，账户级异常检测是补充公司级欺诈模型的一个重要研究课题。我们还应该注意到，当提供模型分数时，现场专业人员使用这种分数的程度是一个很大的问题。因此，另一个潜在的问题是如何有效地激励员工利用分数的高检测和预测能力(参见Kleinberg等人2018年的讨论)。

从政策的角度来看，如何采用这种预测技术还有一个问题。例如，如果检测欺诈性会计的模型的细节广为人知，那么试图进行某种类型的会计欺诈的公司可能能够避免被检测。实际上，模型的细节不太可能被广泛知道，因此在不被模型发现的情况下进行欺诈是不容易的。这个问题的一个可能的解决方案是不断改进模型，这样那些恶意绕过这些模型的公司就会发现更难做到这一点。

在考虑预防会计欺诈的先进措施时，另一个需要进一步讨论的问题是，是否有可能通过采取特定的审计方法或治理手段来抑制欺诈事件。

编者注:本专栏所基于的主要研究最初以一种讨论文件日本经济贸易和工业研究所(RIETI)的研究。