同行评审危机:如何修复超负荷的系统
期刊和资助者正在努力提高紧张的审查流程的速度和效率。

多单元光谱探测器(MUSE)安装在智利甚大望远镜上,使研究人员能够探测最遥远的星系。这台仪器非常受欢迎:在其下一次观测(10月至次年4月)中,科学家们已经申请了超过3000小时的观测时间。这带来了一个问题。尽管MUSE被称为宇宙时光机,但它也无法在短短七个月内完成379个夜晚的工作。
负责运营智利望远镜的欧洲南方天文台(ESO)通常会邀请专家小组来评选最具价值的提案。但随着申请数量的激增,负责评估的科学家负担也随之加重。
“这个负担简直难以承受,”欧洲南方天文台(ESO)位于德国加兴的观测项目办公室的天文学家南多·帕塔特(Nando Patat)说道。因此,ESO在2022年将这项工作交还给了申请者。想要获得观测时间的团队还必须评估来自竞争对手的相关申请。
这一变化是对同行评审中劳动力危机的一种越来越受欢迎的回应。同行评审是专家评估和筛选资助申请和研究手稿,然后才最终决定是否提供资金或出版。
随着学术论文数量逐年增加,出版商和编辑们抱怨称,让所有论文都经过审阅变得越来越难。一些资助机构,例如欧洲南方天文台(ESO),甚至难以找到审阅者。
随着同行评审体系压力的不断增大,许多研究人员指出,期刊上出现的低质量或错误百出的研究,是同行评审体系未能保持严谨性的体现。另一些人则抱怨,繁琐的拨款审查体系阻碍了激动人心的研究理念获得资助。
这些都是长期存在的担忧。同行评审自出现以来,就一直被指责为一项行动迟缓、把关严格、充满偏见的制度。但一些数据显示,不满情绪正在增长。新冠疫情爆发后,出版物数量激增,给该体系带来了更多压力,促使人们对提高同行评审速度和效率的方法产生了兴趣,期刊上也开展了各种实验,从向审稿人付费到提供更有条理的指导。
另一些人则认为同行评审已经变得太不可靠了。他们建议进行彻底的改革,甚至包括彻底取消这种做法。
比你想象的更近
尽管同行评审常被誉为科学探索的基石,但如今的同行评审制度直到20世纪60年代和70年代才在期刊和资助机构中普及。在此之前,审稿的思路更加随意。马里兰大学帕克分校科学史学家梅琳达·鲍德温(Melinda Baldwin)研究了学术界同行评审制度的发展,她表示,虽然有些期刊会采用外部评审,但许多编辑完全根据自己的专业知识或一小部分学术专家的专业知识来判断发表哪些内容。
但随着公共研究经费的大幅增加,稿件数量的激增迫使所有期刊的编辑都倾向于外部评审,以避免为数不多的审稿人造成负担。即使是现在,外部评审也远非一个单一的标准。相反,它是一个多元化的检查和筛选方法的集合,因期刊、学术领域和资助者而异。
20世纪末兴起的学术体系如今正面临着类似的危机:稿件过多,而审稿人不足。科学体系正在大量产出研究论文,但审稿人队伍的增长速度似乎不够快。
这一问题的证据主要是道听途说,因为期刊倾向于对其信息保密。但一些数据已经浮出水面。2018 年,Publons 网站(现归分析公司 Clarivate 所有)发布了一份报告,分析了 2013-17 年期间通过一种广泛使用的同行评审工作流工具提交的超过一千万份稿件的匿名信息。报告发现,随着时间的推移,编辑们不得不发出越来越多的邀请才能获得完整的评审(参见go.nature.com/4k8xbfp)。Publons还调查了 11,000 名研究人员,警告称“审稿疲劳”现象正在加剧。最近,从眼科学到微生物学等领域报告称,越来越多的科学家拒绝了评审邀请。上个月发布的一篇博客中,东京咨询公司 Scholarly Intelligence 的创始人、分析师 Christos Petrou 分析了 16 家主要科学出版商的稿件周转时间。他发现,从稿件提交到论文被接受的平均周转时间正在增加——目前为 149 天,而 2014 年为 140 天:十年间增加了约 6%(参见go.nature.com/4mkm29d)。
英国物理学会(UK Institute of Physics)位于伦敦的出版机构IOP出版社在2020年和2024年对研究人员(主要从事物理和环境科学领域)的体验进行了调查。2024年,约3000名受访者中,有一半表示,他们收到的同行评审请求数量在过去三年中有所增加(参见go.nature.com/4h7gagv)。令人鼓舞的是,只有16%的受访者表示他们收到了过多的请求(低于四年前的26%),但来自欧洲和美国的受访者更有可能这样说(参见“审稿人的压力”)。

评论奖励
资助者和期刊进行的许多实验旨在激励研究人员进行更多的评论,并让他们更快地提交评估。
一些期刊尝试公开发布评审周转时间,这导致评审完成时间略有缩短,主要是在高级研究人员中。其他期刊则为高效的评审员颁发奖项,尽管有证据表明,此类奖项导致评审员在随后几年完成的评审更少,可能是因为他们觉得自己已经尽了自己的一份力。另一个想法是改变研究评估实践:出版《自然》杂志的施普林格·自然集团 (Springer Nature) 于 4 月对 6,000 多名科学家进行了一项调查,发现 70% 的人希望他们的工作评估能够考虑他们在同行评审中的贡献,但只有 50% 的人表示他们目前这样做了。( 《自然》杂志的新闻团队在编辑上独立于其出版商。)
最终的激励可能是经济方面的。关于支付审稿人报酬的争论多年来一直摇摆不定。支持者认为,这公平地反映了审稿人的工作和价值。2021 年,布达佩斯罗兰大学心理学家巴拉兹·阿克泽尔 (Balazs Aczel) 和他的同事估计,审稿人在 2020 年为撰写报告花费了超过 1 亿小时。以学者的平均工资计算,这笔贡献价值数十亿美元。然而,批评者警告说,如果研究人员因审稿而获得报酬,可能会存在利益冲突和不正当的激励,并指出大多数学者表示他们是在有薪工作时间内履行审稿职责。
潜在的审稿人很少会说明他们拒绝审稿的原因。但阿克泽尔认为,越来越多的审稿人对提供免费服务感到不满,而商业出版商却将其转化为利润。马萨诸塞州波士顿的科学诚信顾问詹姆斯·希瑟斯强烈表达了这一观点。2020年,他在一篇博客上表示,他只接受来自学会、社区和其他非营利期刊的免费审稿邀请。大型出版商将收到450美元的发票。
他现在开玩笑说,此举适得其反。虽然商业出版商的申请量停止了,但其他类别的申请量却增加了。
今年,有两份出版物报道了向期刊审稿人支付报酬的实验结果。《重症监护医学》为每份报告支付 250 美元。这项由加拿大政府资助的试验表明,支付报酬使得审稿人更有可能接受请求(接受邀请的比例从 48% 上升到 53%),周转时间也从 12 天略微缩短到 11 天。审稿报告的质量相当。但该期刊副主编、加拿大金斯顿皇后大学重症监护医师 David Maslove 表示,该期刊没有足够的资源继续支付审稿费用。
相比之下,英国剑桥的非营利组织“生物学家公司”(Company of Biologists)在成功试行后,继续在其期刊《生物学开放》(Biology Open)上实行付费评审。该期刊向审稿人支付每篇评审220英镑(295美元),并且——与《重症监护医学》(Critical Care Medicine)不同——告知审稿人,预计在四天内收到首次回复,以便编辑在稿件提交后一周内决定是否接受或拒绝。
试验中的每篇稿件均在7个工作日内收到初步决定,平均审稿时间为4.6个工作日。相比之下,该期刊的标准审稿流程则需要38天。《Biology Open》的主编Alejandra Clark表示,期刊工作人员一致认为审稿质量得到了保证。
“如果它可以扩展,那么我们需要想办法筹措资金,”克拉克说。“我们当然希望通过提高论文处理费(APC)来调整部分成本,避免给作者增加负担,但这些就是我们正在讨论的。”
扩大审阅者范围
一些资助机构也难以找到评审员。“越来越难找到有时间、有能力,或者愿意评估我们提案的人了,”德国汉诺威私人资助机构大众基金会的团队负责人汉娜·德内克(Hanna Denecke)说道。尽管评审员每天的工作报酬接近1000欧元(约合1160美元)。
与 ESO 一样,大众基金会也通过要求申请人审查同一轮融资中的其他提案来解决这一问题,这一系统称为分布式同行评审 (DPR)。
6月30日,在伦敦举行的一次会议上,英国资助机构宣布DPR试验成功,并证明其审批速度比传统审批流程快一倍。为了避免审核人员可能对竞争对手持负面态度的担忧,申请被分成不同的池子。研究人员不会审核自己池子里的申请,因此不会影响自己申请被接受的机会。
大众基金会热衷于DPR的原因之一是,它将决策权从资深且经验丰富的科学家手中转移开来。“有人可能会说,这些人就像守门人,可能会把其他人挡在门外,”Denecke说。
面对日益增多的申请,一些资助机构不堪重负,转而采取“需求管理”的策略,每所大学针对一项特定资助只考虑一个申请。但英国谢菲尔德大学的信息专家斯蒂芬·平菲尔德指出,这只会将审查的负担推到其他方面。“机构必须进行非正式的同行评审流程,才能选择合适的申请。这只是在转移负担,”他说道。此外,为了应对质量保证措施(例如英国研究卓越框架),机构还必须对研究工作和个人进行额外的审查。
“很少有同行评审体系的分析将这些非正式因素考虑在内。然而,这却极其耗时,”平菲尔德说道。
归根结底,解决资助机构和期刊人才短缺问题最具可扩展性的解决方案是扩大审稿人队伍。平菲尔德指出,需要审稿的研究论文数量增长,大部分来自科研实力较弱国家的作者,而西方国家的审稿人往往来自同一批资深学术专家。
2016年的一项研究表明,20%的科学家承担了前一年69%到94%的评审工作。 “同行评审员的数量比作者的数量要少,”Pinfield说。“我认为人们感受到了这种压力。”
一个问题是,编辑们自然倾向于询问他们认为工作出色、按时提交报告的审稿人。扩大审稿人范围,最终可能会收到质量较低或准确性较低的审稿意见——华盛顿大学西雅图分校的生物学家卡尔·伯格斯特罗姆和北卡罗来纳州立大学罗利分校的统计学家凯文·格罗斯在一篇关于同行评审压力的分析中提出了这一观点。他们的研究成果于7月9日以预印本的形式发表。
许多科学出版商目前正在利用技术手段,帮助自动搜索更广泛的审稿人。例如,2023年,一款工具被整合到全球许多期刊使用的Editorial Manager稿件系统中,该工具允许编辑根据学科专业知识和其他标准搜索Scopus数据库,查找审稿人。其他出版商也推出了类似的软件。
另一个流行的想法是联合评审:一位资深学者与一位早期职业研究人员配对,同时引入一位新的评审员并对其进行培训。
提高效率和质量
提高评审效率(或许还能提高质量)的一个方法是向审稿人提出一系列清晰的问题。这种形式被称为结构化同行评审。
去年,研究人员发表了一项严格测试的结果,以了解裁判对这一想法的反应。
“作为一名编辑,你收到的同行评审报告并不总是详尽无遗。结构化的同行评审旨在真正聚焦于我们想要得到答案的问题,”加州斯坦福大学出版实践专家、《研究诚信与同行评审》杂志联合主编马里奥·马利茨基 (Mario Malički) 说道。他与阿姆斯特丹爱思唯尔出版创新经理巴哈尔·梅赫马尼 (Bahar Mehmani) 共同进行了这项研究。
2022年8月,爱思唯尔进行了一项试点,要求审稿人在评估提交给220家期刊的论文时回答九个具体问题。Malički和Mehmani研究了这些稿件中由两位独立审稿人评估的样本。他们发现,与试验开始前评估的稿件相比,审稿人更有可能就最终建议达成一致,例如数据分析是否正确以及实验是否正确。(然而,审稿人仍然不经常达成一致:一致率为41%,高于试验前的31%。)
爱思唯尔目前在其300多种期刊中采用结构化同行评审。其他期刊也已根据这一理念制定了相应的变体。
Malički 补充道,提出问题似乎有助于揭示评审知识方面的差距,评审员更有可能说其他人应该检查统计数据或建模等技术方面。
提高评审质量也是那些推动同行评审系统更大透明度的人们提出的论点——通过鼓励期刊在发表的论文的同时发表报告,并鼓励审稿人署名。
支持者认为,这可以提升评审报告的地位,从而鼓励更多人同意撰写。此外,它还能缓解人们对许多期刊发表粗制滥造研究的批评,这些批评在很大程度上降低了人们对同行评审流程严谨性的信任。由于期刊的同行评审传统上是保密的,因此很难确定评审人员是否真诚地尝试审查论文,还是仅仅草草了事就通过了。
平菲尔德同意发表评论可以提高质量:“如果评论者知道他们的工作将被公开,那么我们有理由认为他们会确保评论的质量。”
一些期刊多年来一直在试行透明的同行评审。今年,《自然》杂志扩大了试点范围,强制推行该做法(《自然》新闻团队在编辑上独立于其稿件编辑团队)。该杂志在6月份的一篇社论中表示:“我们这样做的目的是打开许多人认为的科学‘黑匣子’,揭示研究论文的生成过程。这有助于提高透明度,并(我们希望)建立人们对科研过程的信任。”
少评论?
解决审稿人负担过重的问题有一个显而易见的方法:减少同行评审。
一些研究人员提出了更有选择性地使用有组织的同行评审的可能性,在某些情况下,甚至可能完全放弃它。荷兰莱顿大学的信息科学家Ludo Waltman认为,部分原因是论文数量激增,部分原因是科学的专业化和复杂性日益提高,导致现有系统没有足够的能力对所有内容进行高质量的同行评审。“因此,许多文章发表在那些只提供相当肤浅的同行评审的期刊上,”他说道。他还补充道,“我们需要扪心自问,是否真的有必要对所有研究成果进行同行评审。”
另一些人则认为,评审制度阻碍了真正激动人心的科学研究。纽约市心理学家兼博主亚当·马斯特罗安尼 (Adam Mastroianni) 曾批评现行的同行评审制度成本高昂且效率低下,他表示,科学上的每一次关键突破都会伴随着一些人的质疑。“当你让这些人也参与同行评审时,他们会说‘这不可能实现,因为我不会资助或发表它’。”
德内克表示,在私人资助机构中,最常尝试从根本上减少拨款评审员的作用——或许是因为他们不花公共资金。大众基金会是几个尝试过抽签资助的组织之一。在这种模式下,所有通过基本质量评估的申请,在申请特定资金时,都有平等、随机的机会获得资助。理论上,这减轻了评审员的负担,他们不再需要仔细分析和比较细节。
但德内克表示,大众基金会已经放弃了进一步的资金抽签,因为评估初步提案的评审小组希望最终确定最终选择。“所以,我们最终只由评审员推荐哪个提案应该获得资助,”她说。
荷兰蒂尔堡大学人文与数字科学学院的管理人员也开展了类似的奖助金抽奖活动11,他们邀请申请者到演讲厅观看官员从木箱中抽取纸质选票。
马丁·范德梅尔(Martijn van der Meer)说,这真是一场怪诞的演出。范德梅尔曾与他人合著了一篇关于彩票的论文,并在蒂尔堡大学担任负责任研究政策顾问期间协助组织了这次抽奖。一些旁观者犹豫着是否要鼓掌。研究人员表示,他们认为这项实验是成功的——尽管获奖者“不像通过同行评审程序获得奖金时那么高兴”,范德梅尔说道。
其他资助机构则要求评审员特意将目光锁定在那些突破常规的科学上。哥本哈根附近的维伦基金会(Villum Foundation)指示评审员优先考虑那些他们认为“尚未成熟、风险过高甚至过于幼稚”的项目,以获得最高250万丹麦克朗(39万美元)的资助。
与此同时,在出版领域,预印本的兴起促使一些人尝试不同的稿件同行评审模式。一种想法是转向一种有时被称为“发布、评审、策展”的系统。在这个系统中,稿件被发布到预印本服务器,经过评审,最终被推广到特定的研究社群。在这种模式下,仍然需要有人组织稿件的同行评审。然而,它确实减轻了评审系统的压力——它省去了将已评审和被拒稿的论文发送到其他期刊再进行评审的过程。
伯格斯特罗姆和格罗斯在对同行评审系统压力的数学模型中写道:“同行评审界的负担很大程度上来自于需要在其他期刊上征求对已经被拒绝的稿件的新的评审”。
托马斯·吉列莫(Thomas Guillemaud)是法国国家农业与农业研究院(INRAE)的进化生物学家,该研究院是一家总部位于巴黎的农业研究机构。他参与运营了一项成立于2017年的计划,该计划独立于期刊组织同行评审。该计划名为“同行评审社区”(Peer Community In),为研究人员提供可与论文一起提交的评审意见。“因此,同一套同行评审意见、评审决定和作者的回复可以被不同的期刊多次使用,”他说道;现在许多期刊已经接受了附有这些评审意见的稿件。另一项类似的计划——“评审共享”(Review Commons)——于2019年成立。
但沃尔特曼表示,此类进展只能部分缓解系统的压力。他主张建立一个“大多数研究成果无需同行评审”的系统,尽管它们会经过一些基本的筛选,类似于某些预印本服务器的流程。他认为,与其对所有研究成果都进行评审,不如让研究人员自然而然地就感兴趣的稿件进行公开的“有意义的对话”——这意味着有些预印本根本不会受到评论。他表示,该系统的第一步是不再赋予同行评审成果相对于预印本服务器上发布的文章特殊地位。
伦敦生物医学资助机构惠康基金会(Wellcome)的开放研究负责人汉娜·霍普(Hannah Hope)表示,传统的同行评审模式或许可以分解成更小的筛选步骤,以集中时间和资源。例如,“技术验证”筛选——仅用于确保项目数据以正确的元数据发送到指定的存储库——可能就是这样一种规模较小的评估。
未来几年,一个趋势似乎很明显:人工智能 (AI) 将在评审过程中扮演更重要的角色——无论是在资助机构还是在期刊——旨在减轻评审员的负担。许多出版商正在尝试使用人工智能对论文进行初步检查,有时还会向评审员指出潜在问题。
大多数出版商强调,他们使用人工智能工具来帮助审稿人,而不是取代他们——但人们仍然普遍担心人工智能软件在审稿过程中的作用。
学习很辛苦
鉴于同行评审在研究中的规模和重要性,马利茨基表示,测试和评估该系统的运行情况以及如何引入变革(包括旨在改善评审员招募和保留的变革)非常困难。
“这些系统本来就不是为试验设计的。我知道这听起来很傻,但这确实是技术限制,”他说,“所以,我们一直没有研究同行评审。”
例如,当马斯洛夫在他的期刊上引入审稿人付费时,他将这种体验描述为有风险的,类似于“在飞行中修理飞机”。
尽管体制压力重重,许多研究人员仍将审稿视为日常工作的一部分。马斯洛夫认为,为顶级期刊审稿是为自己的领域做出贡献的机会。“偶尔受邀为这些出版物审稿,我都会停下手头的工作,接下这项任务,并欣然接受,”他说。
自然 644 , 24-27 (2025)
doi: https://doi.org/10.1038/d41586-025-02457-2
更新与修正
- 澄清 2025 年 8 月 8 日:此功能的早期版本并未明确说明 Stephen Pinfield 所在的大学。