Researchersrsquo; Individual Publication Rate Has Not Increased in a Century
Fanelli, D. amp; Lariviere, V
Abstract: Debates over the pros and cons of a “publish or perish” philosophy have inflamed academia for at least half a century. Growing concerns, in particular, are expressed for policies that reward “quantity” at the expense of “quality,” because these might prompt scientists to unduly multiply their publications by fractioning (“salami slicing”), duplicating, rushing, simplifying, or even fabricating their results. To assess the reasonableness of these concerns, we analyzed publication patterns of over 40,000 researchers that, between the years 1900 and 2013, have published two or more papers within 15 years, in any of the disciplines covered by the Web of Science. The total number of papers published by researchers during their early career period (first fifteen years) has increased in recent decades, but so has their average number of co-authors. If we take the latter factor into account, by measuring productivity fractionally or by only counting papers published as first author, we observe no increase in productivity throughout the century. Even after the 1980s, adjusted productivity has not increased for most disciplines and countries. These results are robust to methodological choices and are actually conservative with respect to the hypothesis that publication rates are growing. Therefore, the widespread belief that pressures to publish are causing the scientific literature to be flooded with salami-sliced, trivial, incomplete, duplicated, plagiarized and false results is likely to be incorrect or at least exaggerated.
Introduction
Ever since the early 20th century, academic lives and careers have been guided, first in the United States and later in other countries, by a “publish or perish” philosophy whose effects are increasingly controversial [1]. Already in the 1950s, academics were publically disputing that, whilst publishing promptly onersquo;s results is a duty for all researchers, setting explicit productivity expectations was a recipe for disaster [2]. The debate escalated after the 1980s, with the increasing adoption of formal performance evaluation practices and the growing use in such context of quantitative metrics of productivity and citation impact, such as the Impact Factor and the h-index [3–5]
Today, whenever problems of contemporary science are discussed, it is commonplace to suggest that scientists, being pressured to pad their CVs with publications, might be increasingly fractioning their results (i.e. “salami slicing” data sets to the smallest publishable unit), surreptitiously re-using data in multiple publications, duplicating their papers, publishing results that are preliminary or incomplete, underemphasizing limitations, making exaggerated claims and even resorting to data fabrication, falsification and plagiarism e.g.[6–10]. Research evaluation policies in scientifically prominent countries have reacted to these concerns by derewarding productivity. The German Research Foundation (DFG), for example, has imposed a limit on the number of papers that researchers can include in their CVs in support of a grant application [11]. In The Netherlands, the national research assessment exercise has revised its policies and has dropped the “productivity” category, which counted total number of publications, from its ranking system [12]. Evidence that modern science suffers from over-productivity, however, is mostly anecdotal or indirect. Scientific journals are said to be increasingly flooded with submissions, but such estimates are not adjusted for various confounding factors, and in particular the fact that the population of scientists is growing [13, 14]. Several surveys have probed scientistsrsquo; perceptions of pressures to publish, and found them to be high in all disciplines and particularly high in the United Kingdom and North America, but it is unclear how such perceptions reflect actual behaviour, or even if they may represent a self-fulfilling prophecy [15–17]. Meta-analyses suggest that positive outcome bias in the literature has increased in recent decades and might be higher in academically productive areas, especially in the United States [18–21], but the causes underlying these patterns remain highly speculative. To the best of our knowledge, no study has conclusively assessed whether individual publication rates of scientists have actually increased as commonly speculated. In particular, whilst a rise in collaborations has been amply documented across the sciences e.g. [22] and whilst some evidence suggests that individual scientists are publishing more studies overall, at least in the physical sciences [23], no study has verified whether researchers are actually publishing more on an individual basis and independent of their specific collaboration patterns. This gap in the literature is not surprising, because assessing individual publication rates in the literature is technically very challenging. By sampling researchers whose names included three initials (e.g. Vleminckx-SGE), we were able to analyse publication patterns of individual scientists that operated during the 20th century in all disciplines covered by the Web of Science database. Since individual careers vary widely in length, and since pressures to publish are supposed to be highest at the beginning of scientific careers, we limited all measurements to the first 15 years of publication activity. We will refer to this category as “early-career researchers”. Since our literature database included studies up to the year 2013, we could retrieve the publication patterns of 98 cohorts of earlycareer researchers, whose first year publication ranged between 1900 and 1998. Since publications are assumed to be crucial to survival in academia, we excluded all authors who had ceased publishing before the end of their
剩余内容已隐藏,支付完成后下载完整资料
近一个世纪,科研人员的个人发文量并没有显著增加
Fanelli, D. amp; Lariviere, V
摘要:关于“出版或灭亡”哲学的利弊的辩论使至少半个世纪的学术界为之火热。特别是对于以“质量”为代价来奖励“数量”的政策表示担忧,因为这些政策可能会促使科学家不合理地将其出版物分散(“萨拉米饼切片”),复制,冲动,简化或甚至制作他们的结果。为了评估这些关切的合理性,我们分析了超过40,000名研究人员的出版物模式,1900年至2013年期间,在科学网络涵盖的任何学科中,在15年内发表了两篇或更多篇论文。研究人员在其早期职业生涯(前十五年)期间发表的论文总数近几十年来有所增加,但是他们的平均合作者人数也在增加。如果考虑到后一因素,通过分数衡量生产力,或只计算作为第一作者发表的论文,我们观察到本世纪的生产力没有增加。即使在八十年代以后,大多数学科和国家的调整生产力并没有增加。这些结果对方法选择是稳健的,对于出版率正在增长的假设,实际上是保守的。因此,普遍认为,出版压力正在导致科学文献充满萨米腊肠,琐碎,不完整,重复,剽窃和虚假的结果,可能是不正确或至少夸张的。
1 简介
自20世纪初以来,学术生活和事业首先在美国乃至其他国家受到“出版或灭亡”哲学的指导,其影响越来越引起争议。 20世纪50年代以来,学术界人士普遍认为,尽快发布结果是所有研究人员的职责,设定明确的生产力预期是灾难的秘诀。 20世纪80年代以来,辩论升级,随着正式绩效评估实践的日益普及,以及生产力和引文影响量化指标如影响因子和h指数的日益增长的使用,
今天,当讨论当代科学的问题时,常常提出科学家们正在迫切地用出版物来填写其简历,可能会越来越多的将其结果(即“萨拉米饼切片”数据集)分解成最小的可发布单位),暗中重新使用多个出版物中的数据,复制他们的论文,发布初步或不完整的结果,不重要的限制,夸张的主张,甚至诉诸数据制作,伪造和剽窃,如。科学技术突出国家的研究评估政策已经使生产力下降,对这些担忧产生了反应。例如,德国研究基金会(DFG)已经限制了研究人员可以在其简历中包含的论文数量,以支持授权申请。在荷兰,国家研究评估工作对其政策进行了修订,并从其排名系统中降低了出版物总数的“生产力”类别。然而,现代科学受到过度生产力的证据主要是轶事或间接的。据说科学杂志越来越多地被淹没,但是对于各种混杂因素,特别是科学家人口的增长,这些估计并没有得到调整。几项调查探索了科学家对出版压力的看法,发现它们在所有学科中都很高,在英国和北美尤为如此,但不清楚这种看法如何反映实际行为,或者即使它们代表了自我实现的预言。 Meta分析表明,近几十年来文学中的积极成果偏好有所增加,在学术生产领域可能会更高,特别是在美国,但这些模式的依据仍然很高。据我们所知,没有研究结论性地评估了科学家的个人出版率是否实际上是通常被推测的。特别是,虽然合作的增长已经在整个科学领域得到充分的记录。虽然有些证据表明个体科学家总体上发表了更多的研究,至少在物理科学中,没有一项研究证实研究人员是否实际上是在个别基础上发布更多的,而是独立于其具体的协作模式。文献中的差距并不奇怪,因为评估文献中的个人出版率在技术上是非常具有挑战性的。通过对名称包括三个缩写词(例如Vleminckx-SGE)的研究人员进行抽样,我们能够分析20世纪在科学数据库所涵盖的所有学科中运行的个体科学家的出版模式。由于个人职业的长短差异很大,由于在科学事业开始时出版的压力应该是最高的,所以我们把所有的测量限制在头十五年的出版活动中。我们将这个类别称为“早期职业研究人员”。自从我们的文献数据库包括截至2013年的研究,我们可以检索98名早期研究人员的出版模式,他们的第一年出版物的范围从1900年到1998年。由于出版物被认为对学术界的生存至关重要,所以我们排除了所有作者在早期职业生涯结束之前停止出版,因为这些作品可能不代表成功和/或活跃的科学家。此外,为了减少名称消歧错误(见材料和方法),分析仅限于在美国,加拿大,欧洲-15个国家,澳大利亚和新西兰工作的研究人员。因此,我们的最终样本包括41,427人。
为了明确地识别个体作者,我们从Science of Science数据库(以下称为WOS)中检索了所有名称包括三个或更多个缩写的姓名(姓氏加名字和至少两个中间名称的姓名,例如Vleminckx-SGE) 这种组合大大减少了作者识别错误,并使我们的结果保守。
2 材料和方法
我们从WOS中检索了由这些名称中的任何一个共同撰写的所有记录。 为了识别早期职业研究人员,我们选择了至少共两篇论文的研究人员,从第一次出版之日开始,他们的论文跨度至少为15年。 我们将把这个子集的成员称为“早期职业”作者。
分析每个早期职业作者的出版物列表,以提取以下信息:
- 第一篇论文发表的年份。
- 第一篇论文年度之后的14年中共同撰写的论文总数。
- 这些论文中共同作者的平均人数。
- 在数据检索时(即2014年12月)计算的这些文件累计引用总数。
- 这些论文的平均5年影响因子,按纪律标准化。
- 作者姓名在合作者名单中首先出现的论文数量。
- 最可能的作者国家的活动
WOS中的记录最近几年才开始将每个作者的文章与他/她的个人地址相关联。 以前的记录只包括所有地址的列表,如同它们在纸上。 因此,为了与作者的确定性地址相匹配,我们记录了研究人员第一作者在论文中列出的第一个归属国。 如果在出版期间有不止一个国家与这个名字相关联,那么国家是由多数人统治的。 作者根据这种方法(特别是因为他们从未作为第一作者发表文章),没有任何一个国家可以被推断,被置于一个“未知”类别,全文中的数字与“其他国家 “类别。
3 消歧误差风险
两位作者姓名相同,第一名和第二名中文姓名的名字的可能性极低。 理论上,可能的组合数可能高达268,假设字母中有五个字母和26个字母的平均姓氏长度。 然而实际上,姓氏往往是针对具体国家的,有些国家更有可能拥有两个中间名,并且姓名较短,导致理论上的同义词比例更高,即多个研究者分享相同的姓氏和首字母。 以前的证据表明,来自拉丁美洲和东南亚国家的作者,特别是来自中国的作者的错误率往往更高,其中姓氏被翻译成使其高度相似的字母表。 因此,我们所有的主要分析仅限于作者,我们的算法(见上文)归功于北美,欧洲-15,澳大利亚和新西兰的国家。
重要的是要强调,我们研究中的消歧错误几乎是单向的,因此使我们的分析非常保守。我们的抽样策略可能遇到的主要错误类型是将两个不同的作者合并成一个。这将使与该名称相关的显着生产力膨胀,因为科学家人口在本世纪稳步增长,这增加了两位或两位以上科学家共同名称的可能性。因此,我们的时间序列中,消除歧义的错误可能会有所增加,如果有的话,作者的表观生产力会大幅增加。一个单独个人的参考书目不正确地分为两部分的相反错误只能在作者根据时间更改姓名或姓氏时发生,这是相对罕见的事件。因此,我们报告的生产力的不断增长的趋势可能仍然高估了个别生产率随着时间的变化。
为了估计我们样本中消歧误差的比率,我们随机搜索了50个名字,并检查了其出版物列表的一致性。 这项分析显示,47位研究人员没有同音异义,而检索的论文列表中并没有包含任何错误的论文。 两位研究人员有一种同义词,其中一篇论文可归因于此,一位研究员的名字包括来自三位不同研究人员的论文。
4 样本的代表性
我们通过进行两次测试,探讨了我们抽样策略的代表性。首先,我们评估了科学网中三个初始名称的流行率。由于科学网络中的地址直到最近才与作者名称相关联,所以我们不得不将分析限于第一作者姓名,然后可以明确地将所列出的第一个关联关联。因此,我们研究了从一年到今后,每个国家的第一作者姓名之间的三位一体个人比例如何变化。这一比例的幅度和时间变化在所包括的国家的幅度和时间变化方面都有明显的差异,这取决于国家,显示这些年份的增长和减少。这些时间趋势与我们研究发现的出版模式是不相关的,它们是单向的。例如,葡萄牙和英国在这一比例中最强烈的下降,即在国家中,分数和第一作者出版率呈现出不同的趋势。
其次,我们评估了我们样本中作者的姓名是否显示出可能提出偏倚抽样的模式。 在补充文本文件中,我们报告了美国和英国在1978年,1988年,1998年,1998年的样本中20个最有生产力和最低生产力的作者的名字。没有超出外国名称或任何其他明确 任何类别或年份之间的差异是显而易见的。 例如,所有样本中的东南亚名字都很少,与生产力水平或采样年份无关。 这表明我们的抽样策略为在任何特定国家或地区开展业务的研究人员提供了代表性的样本。
5 分析
在广义线性模型中分析了所有参数的时间趋势,研究者第一次出版的年份是自变量,而在随后的15年的研究者出版物中测量的数量构成了因变量。错误的分布被建模为准泊松计数数据(即论文的数量,共同作者的平均数,引文)和高斯的剩余变量。这些选择是基于由数据性质决定的理论考虑,通过检查必要转换后数据分布的形状证实。作者的出版物之间的着作权没有重叠,完全证明了错误独立性的假设。涉及跨世纪模式的所有分析都拟合了一个三次多项式,而那些限于1980年后期的分析则拟合了一级多项式(即单变量,线性回归)。立方多项式优于更复杂的模型,因为分析的范围主要是为了说明长期趋势。评估所有模型的残差分布,并将其视为足够接近于正态分布的分析目的,分析仅仅是描述性的,并且基于非常大的样本,使得我们的结果不依赖于零假设检验。为了评估分析选择是否可能隐藏了与我们报告的不同趋势,我们绘制了每年的部分和第一作者出版率的相应“原始”平均值。手段趋势与回归模型建议的趋势密切相关,并确认所有学科的平均分数和第一作者出版率在本世纪不能说是增加。
6 数据库覆盖的文献
WOS数据库仅捕获了一部分文献,所以我们研究了通过减少关键期刊的覆盖率观察到的趋势可能是人为因素的可能性。 相反,我们发现,所有学科的WOS覆盖率都稳步上升,不符合我们报告的模式。 如果科学家实际上发表了更多的论文,那么他们会在日益减少的期刊中正确地出版这些文章,并且恰恰是那些不包括在数据库中的文章,这是不大可能的。 老年文献的WOS覆盖率较低也意味着,如果有的话,我们的研究可能低估了老年作者的实际出版率,使我们的测试对于发布率不断扩大的假设再次保守。
7 讨论
我们分析了超过40,000名科学家的个人出版物资料,其第一次记录的文章出现在1900年至1998年之间的科学数据库网站上,并且在活动的头十五年内发表了两篇或更多篇论文 - “早期职业”阶段据认为出版的压力很大。正如预期的那样,科学家发表的论文总数有所增加,特别是近几十年来。然而,平均合作者人数也有所增加,估计出版率时应考虑到这一因素。共同着作权调整后,各学科科学家的出版率并没有提高,实际上大部分下降。共同作者可能不会公平地反映实际的贡献,因为作者归因实践可能会随着时间的推移而发生变化,因此以前没有获得作者奖励的角色 - 例如。高级科学家,导师,实验室主任,技术员,统计学家 - 现在可能是。然而,即使我们忽视了共同作者身份,并且测量了作为第一作者发表的论文数量,大多数学科的立场都表明谁主要对这项工作做出了贡献,我们没有观察到总体上没有显着增加。早期职业科学家作为第一作者,在二十世纪五十年代发表的文章大约比同事少一册。这些结果对于方法学选择是稳健的,并且对于增加出版率的假设是保守的。因此,普遍认为,出版压力正在导致科学文献充满萨米腊肠,琐碎,不完整,重复,剽窃和虚假的结果,可能是不正确或至少夸张的。如果所有学科的研究人员已经对所有学科的压力作出了反应,他们似乎主要是通过扩大其机构内部和外部的合作网络,从而获得(共同)作者身份论文具有相同的研究力量。并不是所有的合作都是一样的,有可能具体的协作类型(例如长途合作与实验室间的协作)可能会对出版率产生不同的影响。然而,直观上(由我们自己的数据支持),具有多个合作者的研究人员能够共享多篇论文,从而增加其出版物的总体列表。既然生产率和影响都不是通过当前的文献计量学工具分类计算的,所以扩大合作范围是一个几乎无成本的策略来抵制出版的压力,并且在文献中公开推荐。
不可否认,共同着作权主要是为了与所研究的现象越来越复杂化相关的真正的科学必需品而增长。共同着作权在物理科学早期开始增长的事实,以及我们的发现,即从人文科学转向物理科学(即从高到高的一致性学科),最佳数量共同作者增加支持这一假设。由于长途通信技术的改进以及越来越多的跨学科研究支持,共同作者也可能增加。然而,在生物医学研究和其他领域观察到的共同着作权的急剧上升表明,除了日益增长的科学复杂性之外,还有其他因素正在发挥作用。特别是,我们假设绩效评估政策可能是增加共同作者权力的驱动力之一,因此可疑的共同作者实践可能是研究人员和政策制定者极为忽视的压力。
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[28220],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。