预印本在疫情初期对全球论述COVID-19传播能力的影响
● ● ●
《柳叶刀-全球健康》(The Lancet Global Health)近期发表评论,分析了此次疫情期间预印本对信息传播的影响。本文分析显示,因为能够及时传播最新信息,预印本在公共卫生紧急情况下可以发挥强大作用。预印本研究对当前COVID-19疫情讨论与决策的影响表明:我们必须重新思考,在当前和未来的公共卫生紧急情况下,如何奖励和认可科学共同体的贡献。
自WHO于2020年1月5日首次通报2019冠状病毒病(COVID-19)以来,中国境内COVID-19 确诊病例已超过80,000例,截至2020年3月6日,疫情已蔓延至全球近90个国家[1]。虽然SARS-CoV-2是新发病毒,但科学家们已经迅速填补了其流行病学、病毒学和临床知识的空白,仅在1月10日至1月30日期间就进行了50多项关于该病毒的新研究[2]。不过,目前决策者和大众都期待获取即时信息,许多研究率先以未经同行评议的预印本形式分享出来。
在过去的三十年里,预印本服务器已在科学出版的生态系统中十分普遍,但COVID-19似乎将这些平台的利用度提高至前所未有的高度[3]。尽管同行评议对于科学验证来说至关重要,但当前的疫情已经显示了预印本在紧急事件中传播信息的速度。基于2020年2月1日及之前发表的有关评估SARS-CoV-2传播潜力(即基本传染数[R0])的预印本和同行评议研究,本评论分析了此次疫情期间预印本对信息传播的影响。我们还分析了预印本和同行评议研究关于估算结果的一致性,并提出了一种基于共识的方法来评估突发公共卫生事件时期预印本论文结果的有效性。为了进行分析,我们收集了来自科学研究、新闻报道以及与SARS-CoV-2及基本传染数R0相关搜索趋势的公开数据。R0是指一个新病例在完全易感人群中可能引起的继发病例平均数,对R0的估计可以让决策者了解特定疫情的流行潜力。
我们分别用MediaCloud和Google Search Trends来发掘相关新闻报道和搜索趋势,两者均作为信息传播的替代性指标。同时,我们还通过谷歌学术(Google Scholar)进行相关科学研究检索;为了解决索引中可能出现的延迟,还检索了四个具有代表性的常用公开预印本服务器:arXiv、bioRxiv、medRxiv和SSRN(Social Science Research Network)。附录(P2)罗列了每个数据源的检索词和其他具体信息。通过Google Scholar、arXiv、bioRxiv、medRxiv和SSRN检索到的所有研究,我们都对其研究相关性进行了人工筛查,最终只保留了正文中包含SARS-CoV-2 R0估计值的研究。
最初的数据发掘阶段纳入了11项独立研究,并人工整理了每项研究的首次发表日期、发表平台、评议状态(预印本VS同行评议)和研究方法(附录P3)[4-18]。我们还从每项研究中提取了R0估计值以供进一步分析。在第一个版本之后进行预印本修订或者在单个研究中使用多种估计方法都会产生多个R0,针对这种情况,我们对每个R0估计值都做了记录,并将每个估计值都作为一个单独条目来代表任何给定时间点的所有可用信息(附录P3)。由于我们已于1月23日将第一个已知的R0估计值发布到SSRN上,因此我们绘制了1月23日至2月1日期间的搜索趋势分数和新闻报道量曲线图(附录P4)。用MediaCloud和Google Search Trends得到的基线数据显示,2020年1月23日之前的搜索兴趣和新闻报道量很少,可忽略不计;而截至2020年2月9日收集的数据显示,峰值过后搜索兴趣和报道量逐渐降低(附录P4)。为了说明这11项研究的发布时间,我们用指示条标注了每项研究发布的日期,并在同一张图中显示不同时间点搜索趋势和新闻报道量的变化(附录P4)。然后,我们把这11项研究中16个R0估计值的相关信息整理成表格,包括平均值和估计范围(如95%置信区间等)(附录P3)。R0估计值是按出版日期和作者姓氏首字母顺序排列的,表中同时包含了预印本和同行评议研究的结果以供比较;还分别计算了预印本和同行评议研究的R0平均值和95%置信区间(见下文Figure)。
附录P3
Google Search Trends 和MediaCloud的数据显示,在疫情初期,对COVID-19 R0的搜索兴趣和新闻报道在相关同行评议研究发表之前就达到了顶峰。在分析选定的时间段内,在 bioRxiv、medRxiv和SSRN发表了五项预印本研究(这些研究都估计了R0)之后,在于1月23日至1月25日搜索兴趣激增,并于1月27日达到峰值。同时,新闻报道兴趣在1月28日达到峰值,而第六项预印本研究于同一天在arXiv上发表(附录P4)。随后,Li及其同事于1月29日17:00(东部标准时间)在The New England Journal of Medicine发表第一项同行评议研究。此后至2月1日,Eurosurveillance、The International Journal of Infectious Diseases、《柳叶刀》(The Lancet)和Journal of Clinical Medicine 陆续发表另外四项同行评议研究[14,19]。预印本研究中的R0平均值为3.61(95% CI:2.77–4.45);同行评议研究中的R0平均值为2.54(2.17–2.91),虽然组内和组间都存在建模方法和数据源的差异,但两组研究(预印本组和同行评议组)的95%置信区间存在重叠(附录P3)。尽管预印本研究的R0平均值高于同行评议组,但这一差距主要是由两个上限异常值导致的(R0高于95%置信区间最大值;见上图)[9-10]。我们基于95% CI共识剔除这两个估计值后,预印本组的R0平均估计值降到3.02(95% CI:2.65–3.39)。值得注意的是,有两项同行评议研究之前已作为预印本发布[15-16]。尽管Riou和Althaus提出的R0估计值在同行评议后仍保持不变,但Zhao及其同事在预印本研究中提出的R0估计值要高于同行评议后的R0估计值。
附录P4
我们的分析结果表明,由于预印本论文的发布要快于同一主题领域中同行评议研究的发表,因此预印本可能正在推动此次COVID-19疫情中的相关讨论。虽然本文的分析侧重于搜索趋势和新闻媒体数据,并以此作为衡量公众讨论的指标,但由于WHO在2020年1月26日宣布创建一个COVID-19相关研究的资料库,包含那些未经过同行评议的论文,因此预印本可能也在影响着决策讨论[20]。
虽然预印本能够快速传播信息有其特有的优势,但缺乏同行评议确实可能会有意或无意地导致研究缺乏可信度和信息错误等问题。这一严重弊端在当前疫情期间尤为突出,特别是一项病毒学研究从预印本服务器bioRxiv上高调撤稿之后。该研究曾错误的声称COVID-19致病病毒中含有艾滋病毒插入片段[21] 。这个预印本论文撤稿的事实恰恰显示了紧急事件期间公开同行评议的力量。被撤回的文章似乎受到来自全球数十名科学家的强烈抗议,因该文章发布在一个公开的服务器上,所以这些科学家都能看到这项研究[22]。科学家们大多是通过推特发表短评和博客发表长评来发声抗议的,这说明,将来研究预印本对公共讨论的影响时,这些论坛和平台可以提供丰富的额外数据来源[22]。然而,此类事件表明,使用任何预印本研究的结果指导实践时需要谨慎。
考虑到这一点,本文中呈现出的多项研究综合分析,有助于保证谨慎对待预印本研究的结果,同时可以在同一主题领域的同行评议研究发表前获取重要和强有力的见解。本文使用了一种简单的方法,汇总了1月29日第一个同行评议研究发表之前的预印本中包含的10个R0估计值;然后取这些R0估计值的平均值,并依据人工分析和95%置信区间剔除两个上限异常值。即使在剔除异常值之前,这种方法得出的R0平均值也非常接近1月29日及之后发表的同行评议研究中的R0估计值。不过,未来的研究可以采取依据置信区间计算加权平均数这种更复杂的方式,类似传统的Meta分析方法。在进行定量分析时,这种基于共识的总体分析方法可能是最简单的;而许多影响决策的流行病学重要参数(如潜伏期、世代时间等)都是定量的,本文提出的方法可推广至这类研究。
本文分析显示,因为能够及时传播最新信息,预印本在公共卫生紧急情况下可以发挥强大作用。此外,本分析中包含的两个预印本研究之后发表在了同行评议期刊上,这表明,即使是声誉很高的期刊现在也允许在同行评议之前分享重要的研究发现,而且预印本平台的使用不会影响之后研究在同行评议期刊上的发表[15-16]。毫无疑问,关键作者排序和同行评议出版物无疑是个人职业发展(如学术晋升)的重要指标;然而,预印本研究对当前COVID-19疫情讨论与决策的影响表明:我们必须重新思考,在当前和未来的公共卫生紧急情况下,如何奖励和认可科学共同体的贡献。
*中文翻译仅供参考,一切内容以英文原文为准。
注:本文转载自柳叶刀TheLancet。