若论文数据库也遭美国 “卡脖子”,中国如何应对?
pixabay.com
中国科协生命科学学会联合体秘书长王小宁在4月中旬的一次座谈会上表示,公共论文数据库PubMed “卡” 了国内两家科研机构的 “脖子”,具体是哪两家,他并未点明,且未说明具体原因。
在中美关系紧张之际,不仅国内工业界在热议哪些技术被卡了脖子,中国科学家也在密切地关注和讨论:如果科学界也像芯片技术那样被卡了脖子,那该怎么办?从实验设备、试剂耗材,到实验动物模型,再到数据库、软件工具,我们还能自主地从事科学研究吗?
撰文|叶水送
● ● ●
4月19日,中国科协技术协会生命科学学会联合体秘书长、免疫学家王小宁在一个内部座谈会上对科学界的 “卡脖子” 问题表示担忧,“如果美国政府不让我们使用PubMed,我们该怎么办?”
据了解,目前国内有数家基础研究机构已经不能正常使用PubMed(注:此前国内高校也有因用计算机软件大量抓取PubMed上的信息,被封IP地址的案例),“他们选择性地给你封掉”,王小宁表示。
但 “我们查文献基本靠PubMed,”王小宁表示,中国现在既是PubMed最大的原始数据的提供方,又是最大的数据购买方。
上世纪50、60年代,中西方隔阂很深时,中国科学家的论文曾被拒绝发表在西方英文期刊上。今天,我们不得不面对的一个假设是:如果中美在基础科研领域的关系进一步恶化,那么PubMed中断该怎么办?
PubMed是全球科研人员使用的免费论文引文数据库平台,生物医药领域的科研人员发表论文后,一般都会将论文上传至PubMed,从而方便更多的人检索,提高论文曝光以及下载量。中国生命科学乃至整个科研领域都高度依赖这一数据库平台。
PubMed数据库由美政府资助创建及运营,截图来源:PubMed官网
自1996年成立至今,PubMed积累了大量论文数据。由于它免费供全球科学家使用,加上建立的时间较长,全球各地很多科学家养成了习惯,如果想检索论文会到其上面检索、搜集论文。类似PubMed这样的论文数据库还有Web of Science等,但PubMed凭借免费、数据量大,赢得了大量的用户。
根据其官网介绍,PubMed由美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)开发和管理,NCBI是美国国立卫生研究院(NIH)的一个下属单位,而NIH直属美国卫生与公众服务部,其主任由美国总统直接任命。2018年,NIH成为调查在美华人学者与国外合作的 “急先锋”。
PubMed公益属性强,没有盈利的诉求,不仅建起来花钱,而且每年都需要投入重金运营,因此这块 “不赚钱” 的业务此前不被国内看好。
当然,中国在这一领域也并非空白,此前也建过类似PubMed的一些网站,如1989年建立的中国科学引文数据库 (Chinese Science Citation Database)。然而它们不仅没有获得国内科学家的认可,更不用说国际科研群体,目前处于一种被动运营的状态。
而国内用户常用的中国知网,论文并非由作者自己上传,而是由平台来上传。而且,中国知网只是对自己收录期刊内容的一个搜索,别的内容搜索不到,这一点也限制了其论文的数量。
因此,在很长一段时间,国内都没有一个自己的持续投入、获得国际认可的自上传论文数据库平台。
事实上,建一个类似PubMed的数据库在技术上难度不大,主要是肯花资金,以及建成后注重长线运营和传播。另外,提高网站的用户体验,以及加强运营和传播显然很重要。尤为重要的一点是开放,这样网站既可以服务于中国科学家,同时也能为全球科学家提供服务,才有可能在国际上流行开来。
美国忌惮中国基础科学的发展由来已久。今年5月12日,美国参议院商务、科学与交通委员会投票通过《无尽前沿法案》,其中一条是 “参加中国资助的人才招聘计划的任何美国科学家,都将被禁止获得或使用联邦经费”。目前,法案仍需参议院审议和总统通过,但这预示着中美在科研合作上的空间即将被进一步挤压。
参议员Charles Schumer, 《无尽前沿法案》提出者 | 图源:flickr.com
早在2018年,美国就以知识产权和科研诚信为由,在全美掀起了主要针对在美华人学者以及同中国有科研合作的美国科学家的行动。尽管最终的调查结果发现,“有问题” 的人只是被怀疑对象中的很小一部分人,但美国仍没有停止调查行动,而是选择继续压缩同中国科研合作的空间。
当前,“中美在科研领域是否也会脱钩” 的话题已经摆到了台面上。如果美国定向地关闭PubMed这样的基础学术设施,会对中国科研产生什么样的影响?这也是中国学者应该思考的问题。
目前,中国科学界正在自查自纠,搞清楚除了PubMed,还存在哪些短板。
王小宁在上述座谈会中透露,中国科协正在建立生命科学领域 “白清单” 机制,对于具有 “卡脖子” 特征的技术进行梳理,以明确攻关方向。
然而,摆在我们眼前的事实是,大到实验仪器,小到试剂耗材、动物模型,甚至实验数据处理软件,我国依赖 “进口” 的环节非常多。
中科院上海生命科学信息中心主任于建荣在研讨会上表示,“从基层一线传递出来的声音看,科学信息、实验动物、科学仪器设备、试剂耗材‘四要素’存在关键技术上严重依赖进口的问题。”
“实验动物也是一样,珍贵动物品系的缺失,对后续的科学研究、产业发展造成的打击无异于源头的 ‘截流’。” 中国医学科学院医学实验动物研究所所长秦川表示,“核心技术是买不来的,不仅(只有)光刻机”。
除了硬件上存在较大的短板,我国在科研领域的软件上同国外的差距也很大,如去年Matlab在哈工大被列入实体名单后,就宣布禁止哈工大师生使用该软件,当时在国内掀起了激烈的讨论,然而我们在抗议Matlab的行为之后,只能选择继续使用它,因为没有其他的更好方案。
中科院计算所研究员包云岗去年曾撰文指出,当我们在思考如何解 “Matlab被禁” 这个解燃眉之急的同时,更需要考虑如何才能在未来做出像Matlab那样的工作,做出能 “卡别人脖子” 的技术。
中科院神经所所长蒲慕明在《自然》的一篇报道中表示,“中美关系紧张,这给中国提了一个醒”,中国应加强自给自足。
在今年公布的十四五规划中,我国强调了加强本土创新,强调基础科学与工业界的联动。
事实上,针对科学界卡脖子问题的讨论并非首次,只是我们从认识到这一问题的存在到解决这一问题,恐怕还需数年之久。
参考资料
1. 中国科协建立生命科学领域“白清单”机制. 科技日报. 2021年4月20日
http://www.stdaily.com/index/kejixinwen/2021-04/20/content_1116710.shtml
2.Chinese scientists call for 'info independence' on life science. CGTN.
3. China’s Five-Year Plan Focuses On Scientific Self-Reliance. Nature.
4. Matlab被禁感悟:把东西做出来,而不是追求把论文发出来http://zhishifenzi.com/depth/depth/9378.html
制版编辑 | 卢卡斯
说到底,还是教育的问题;教育的失败,就是社会的失败;科学在这块土地,为什么没有话语权?在这块土地上,谁有话语权?