aid1536094 v4 - 728 px -引用-期刊文章的步骤1 -版- 3. jpg
VoxEU 教育 经济研究前沿

跨研究领域的学术文章的生命周期

研究人员通过引用计数进行评估,通常有一个截止日期。但这一列显示了不同学科的引文生命周期不同,一些学科的年度引文峰值比其他学科更早或下降更大。在评价研究人员或机构时,应该考虑到这些差异。

许多用于评估研究者表现的有影响力的指标都是基于引用数量,因此我们对引用行为理解得越好,我们对科学产出的理解就越好(Bornmann和Daniel 2008)。很少有人致力于理解和量化一篇文章发表后的几年里,文章的引用是如何演变的,以及这在各个研究领域是如何变化的。鉴于一些有影响力的引用指标规定了自发表以来的年限限制,在评估跨研究领域的研究人员时,应该考虑到这种行为。

在之前的一篇文章中,我们展示了发表在前五大经济学期刊上的文章的引用有一个明确的生命周期,在经济研究领域(应用、应用理论、理论、计量经济学方法)中有很大的差异(Anauati et al. 2016)。当时,我们提出了一种识别这些周期的方法,该方法考虑了引文膨胀(引文现在更常见的事实)和引文分布的偏斜性。基于这些发现,在我们的后续研究中,我们进一步深入研究了学术文章的生命周期。这次我们关注的是更广泛研究领域的差异(Galiani和Gálvez 2017)。

我们选择研究社会科学、生命科学、物理科学、数学研究和健康研究的研究领域,目的是覆盖广泛的被引趋势模式。我们分析了以下学科的文章:天文学和天体物理学、生物化学、生物学、经济学、金融学、数学、医学、物理学、政治学、心理学、社会学和统计学。对于这12个研究领域中的每一个,我们选择了5个在该领域内享有声望的一般研究期刊和样本文章,采用了一种策略,以确保我们的最终样本在时间周期和成功(以总引用计数衡量)方面具有代表性。此外,我们还确保了我们的抽样策略不会受到引文膨胀的影响。

这产生了1985年至2000年间发表的59707篇研究文章的代表性样本。然后我们收集了从出版前两年到2015年底的每年的谷歌引用,超过500万次引用。

引文数量的原始趋势

图1绘制了每个研究领域在发表后2年和5年内收到的总引用数的份额,相对于发表后15年收到的所有引用数。这是因为在计算期刊影响因子时,通常会考虑两年和五年。

图1在发表后2年和5年内收到的全部引文相对于发表后15年内收到的所有引文的份额

图1显示了不同研究领域之间的引文动态差异很大。在被引用次数方面被认为是成功的学科(经济学和金融学)在发表后的头几年获得了相对较小的被引用比例。这表明,推动这些领域的文章取得成功的一个重要因素是它们被引用的时间更长,而不是它们发表后不久被引用的数量激增。

为了更好地显示这些差异,图2绘制了每个研究领域的平均论文(实线)和中位数论文(虚线)在发表后每年的被引用次数。该图通过区分1985年至1989年(蓝色为1985-1989年)和1995年至1999年(红色为1995-1999年)发表的文章的估计,说明了引文膨胀的影响。

图2按研究领域划分的平均和中位数文章的年度引用趋势估计

笔记:按1985年至1989年及1995年至1999年发表的文章计算。使用五年中心移动平均线平滑值。注意,y轴的刻度在子图中是不同的。

从图2可以清楚地看出趋势是不同的。在物理学、天文学和天体物理学、生物化学和生物学等学科中,经过一段时间后,每年被引用的数量会下降。在其他学科,如经济学、金融学、数学、政治学、社会学和统计学,每年的平均引用量曲线一直在上升。

图2显示了在分析跨时间和跨研究领域的引文行为演变时应该考虑的两个特征:

  • 1995-1999年的曲线总是高于1985-1989年的估计值。这表明了引文膨胀,而且在所有的研究领域都不是以相同的速度发生的。
  • 平均引文曲线的值高于中值引文曲线。这意味着在每年的引用分布中存在很强的正偏态。请注意,这种引用分布的不对称性在所有的研究领域都是普遍的,并且随着论文的老化而持续存在。然而,这种趋势的强度似乎在不同领域有所不同。

跨研究领域的文章生命周期

由于图2中绘制的曲线可能因为引文膨胀而上升,我们使用分位数回归来确定跨研究领域的论文生命周期。该规范意味着可以控制被引用的长期趋势(考虑到被引用膨胀),并允许对论文不同(有条件的)成功水平进行分析。图3显示了评估跨研究领域的文章生命周期的结果。紫色曲线对应使用分位数回归估计的生命周期。绿色曲线对应使用回归估计的生命周期。

图3通过回归分析估计了研究论文被引的生命周期

笔记:使用以五年为中心的移动平均线平滑值。注意,y轴的刻度在子图中是不同的。

在控制引文膨胀的情况下,年度引文在所有学科中表现出一个生命周期模式。然而,不同的研究领域之间存在差异:

  • 一些学科的年度引用峰值要比其他学科高得多。
  • 被引用的峰值并不是在不同领域同时达到的,在达到这个峰值之后,每年被引用的价值下降的方式不同。
  • 分位数回归和OLS估计之间的差异在不同学科之间也有很大差异。

由于许多文献计量学指标对高度成功的文章特别敏感,了解高被引文章的动态对于理解它们潜在的缺陷是很重要的。图4显示了关注响应变量分布较高条件分位数的类似分析的结果。从这一分析中可以明显看出,即使对于非常成功的研究文章,在本研究涵盖的所有学科中也观察到了生命周期模式。此外,证据再次表明,不同学科之间存在巨大差异。

图4通过跨研究领域的回归分析获得的高度成功文章的估计生命周期

笔记:使用五年中心移动平均线平滑值。注意,y轴的刻度在子图中是不同的。

讨论和结论

年度引文的生命周期模式存在于广泛的学科中,但在不同的研究领域差异很大。经济学、政治学和社会学等社会科学的生命周期较长,每年的引用量比其他学科更晚达到峰值,然后逐渐下降。数学和统计学的文章也有类似的模式,尽管每年被引用的数量低于社会科学。在天文学和天体物理学、生物化学、生物学、医学和物理学领域,论文被引用的次数更多集中在发表后的头几年。由于在计算评价指标时,按年龄筛选文章是一种常见的做法,这些差异不是中性的,在评价研究人员或机构时应该考虑到这些差异。

参考文献

Anauati, V, S Galiani和R H Gálvez(2016),“量化跨经济研究领域学术文章的生命周期”,经济调查54(2): 1339 - 1355。

Bornmann, L,和H D Daniel(2008),“引用计数测量什么?”引用行为研究综述”,杂志的文档64(1): 45 - 80。

Galiani, Sebastian和Gálvez, Ramiro H.(2017),“跨研究领域的学术文章的生命周期。”可以在SSRN:https://ssrn.com/abstract=2964565http://dx.doi.org/10.2139/ssrn.2964565

2940年读

Baidu
map