1989年开始,它只是几十个弦理论学家的电子邮件列表,现在已经发展到200多万篇论文的集合,成为物理学家、天文学家、计算机科学家、数学家和其他研究人员的中心枢纽。在1月3日的预印服务器arXiv.org以一篇题为“仿射迭代和包裹效应:各种方法”。(相比之下,亚历山大图书馆(Library of Alexandria)的手稿据信不超过数十万份。)

宾夕法尼亚州立大学天体物理学教授、arXiv的科学总监施泰因·西于尔兹松说:“我们是作者们快速、自由地交流研究成果的一种方式。”与传统的科学期刊不同,arXiv(发音为archive,因为“X”代表希腊字母chi)允许科学家在同行评议之前分享研究成果。

向传统期刊投稿时,作者通常要等半年或更长时间才能发表;论文通常在一天内出现在arXiv上。作者经常向arXiv提交手稿,然后在同行评议的期刊上发表,但越来越多的论文只在arXiv上发表。除了传统的手稿,arXiv还包含白皮书历史概述甚至厚颜无耻的愚人节报纸

“它就像我们这个领域的支柱,”位于日内瓦附近的欧洲核子研究中心(CERN)的科学信息处负责人亚历克斯·科尔斯(Alex Kohls)说。CERN是世界上首屈一指的粒子物理研究组织。“它不仅是物理学家和计算机科学家的工具,它还对整个学术交流过程产生了影响。”例如,生命科学领域受arxiv启发的预打印服务器,例如bioRxiv而且medRxiv事实证明,在冠状病毒大流行期间,它们为加快生物医学研究提供了宝贵的帮助。新利棋牌手机版下载

中国经济出现了爆炸式增长。2008年,在arXiv上线17年后,它的论文数量达到了50万篇。到2014年底,这个数字翻了一番,达到100万。7年后,arXiv的藏书又翻了一番,但仍在纠结自己的角色:它更像是一本精选的学术期刊,还是更像是一个无差别收集论文的在线仓库?

在这种混乱中,一些研究人员对arXiv的审核政策感到担忧,他们说,这些政策缺乏透明度,导致论文被不公平地拒绝或分类错误。与此同时,arXiv正在努力提高其版主的多样性,这些版主主要是美国机构的男性。

物理学家之间有一个共同的说法:“如果它不在arXiv上,它就不存在。”换句话说,对于大量的研究学科来说,arXiv已经成为科学过程本身不可或缺的一部分。对于使用arXiv的研究人员来说,arXiv是他们日常工作流程的一部分:他们可以在早上喝咖啡的时候浏览新发布的版本,中午提交论文,晚上下载阅读材料。这一巨大的作用证明了arXiv的成功,但也表明这个存储库的问题不仅是它自己的——也是科学的问题。

两个堆叠柱状图显示了arXiv.org版主和提交的论文所代表的研究所国籍的百分比。
信贷:阿曼达Montanez;来源:arXiv.org

灾难性的成功

在arXiv出现之前,物理学家有邮寄预印本的传统。尚未通过同行评议的纸质手稿被送到世界各地的实验室和大学图书馆,供渴望获得最新科学新闻的读者阅读。随着时间的推移,预印本的数量变得巨大,邮件变成了电子邮件。1991年,现在康奈尔大学的保罗·金斯帕格(Paul Ginsparg)把他的物理学家同事乔安妮·科恩(Joanne Cohn)的电子邮件列表自动化成一个任何人都可以提交和访问的存储库。效果立竿见影。

“在几年之内,粒子物理学的每一篇文章或多或少都首先提交给了arXiv,”科尔斯说。由于arXiv惊人的快速发布速度和随后在物理、数学和计算机科学的其他领域的广泛采用,arXiv迅速成为检查新结果的主要场所,而不是传统的期刊或会议。

“星期五,望远镜看到了一些东西。到星期一就会有相关的论文。到了周二,就有论文反驳了周一发表的论文,”西于尔兹松说。“这很有趣。这是令人兴奋的。”

现在韩国科学技术高级研究院的研究员Lanu Kim领导的一项研究发现,arXiv论文的高引用作者是越来越多的人可能懒得出版了在传统期刊上。“如果他们从arXiv获得了足够的兴趣,他们可能会选择在期刊出版过程中不经历这些麻烦,”Kim说。她的研究发现,传统期刊对引用仍有重要影响,但它们更多地扮演着馆长的角色,而不是研究的传播者。

尽管arXiv取得了成功,但它一直在稳定和资源方面苦苦挣扎。服务器经历了剧变,将其位置移到了康奈尔大学内部。目前,有仅为少数工作人员提供资金,以帮助志愿者版主处理每天多达1200份的提交。西于尔兹松说:“我们是一辆老旧的经典车,锈迹终于消失了,活塞也开始磨损了。”“我们人手不足,资金不足——多年来一直如此。”

同样,arXiv作为一个机构的发展也没有跟上依赖它的科学团体的发展。科尔斯说:“在很长一段时间里,它基本上是由少数人经营的。”即使在今天,也只有大约200名志愿审查员负责大约150个分类,他们每个人每天可能要处理多达30篇论文——这一因素导致了延迟和其他问题。

做任何事情都要适度

当作者提交一篇论文时,它会进入一个队列,由版主进行例行评估。如果版主没有将论文标记为有问题的,它通常会在第二天发布。但版主经常会进行干预,将发布时间推迟几天或几周,对论文进行重新分类,甚至直接拒绝提交。

“他们采取的行动似乎违背了预印本服务器的应有角色,”印度苏拉特卡尔省卡纳塔克邦国立理工学院的物理学家迪帕克·维德(Deepak Vaid)说。瓦伊德指出,他所说的是不一致的节制和缺乏透明度。

延迟可能看起来微不足道,但对于急于第一个宣布某个发现或大胆的新假设的科学家来说,即使是几天也可能至关重要。通过将论文重新归类到arXiv的“一般”类别中——这是一个包罗一切的类别,通常充满了质量可疑的研究,审查员可以有效地将他们认为不符合更精细类别标准的论文归类。最后,审核员可以直接拒绝论文。

“我们必须划清界限,”Sigurdsson说,他指出arXiv有时会收到一些很可能是伪科学的提交,比如一些作者声称“证明爱因斯坦是错的”或构建了一个“万有理论”。为了防止盗版泛滥,arXiv规定提交作者必须经过“验证”。最初,验证是基于学术归属,但今天它也可以依赖于“背书”系统:任何人都可以提交,只要经过认证的用户在同一“主题领域”内发表了一定数量的论文。西于尔兹松说:“我们在某种程度上是一瘸一拐的,因为有总比没有强。”

Vaid同意赞同或其他验证系统对于清除伪科学是必要的。但他说,因为预印本服务器不是期刊,arXiv和它的审稿人应该放松他们的标准,在拒绝时不要那么严厉。

西于尔兹松提出了相反的观点。“如果信噪比变得太糟糕,那么它就会变得毫无用处。那你还不如看看YouTube上的评论,”他说。在arXiv,大约6%的作品被搁置,大约2%的作品被拒绝。顶级期刊,比如自然而且科学,接受不到10%的论文。(ArXiv在质量控制方面的努力也催生了与之竞争的预印本服务器的诞生,比如viXra.org,它们欢迎提交,监管最少。不出所料,主流学者认为这种存储库的效用极小。)

尽管审稿不是同行评议,arXiv的审稿人和编辑一样有权拒绝论文。金斯帕格说:“他们执行的是我所说的‘类似于同行评议的一眼就能看出来的做法’——不佯装在快速周转方面全面,要求也低得多。”“他们的偏见总是在‘接受’的方向上,因为我们期望科学能够自我纠正。”

对于一些满怀希望的作者来说,arXiv被接受的门槛据说很低,这让他们更难接受任何拒绝。2017年,Vaid的一篇文章被拒绝了,理由是其引言“使用了高度戏剧化和失实的语气”。当他要求澄清以帮助重写介绍时,arXiv的一名代表回答说:“版主不是裁判,不会提供他们决定的细节。”

因为审核员没有时间对每一份提交进行全面的同行评审,arXiv的政策是不详细说明被拒绝的内容。“我们不想争吵,”西于尔兹松说。对拒绝或分类错误提出上诉是可能的,但这个过程很乏味——本质上是复制了同行评审的麻烦,只是为了发布到预印本服务器上。

2021年8月,arXiv审查员拒绝了备受推崇的中国科学家卢朝阳和潘建伟的一篇论文。第一次在量子研究中。而不是上诉,陆和潘明确地选择了上诉在viXra上发布预印本和其他服务器——尽管不是在陆之前公开表示对arXiv的拒绝感到困惑和沮丧。意大利博洛尼亚大学(University of Bologna)的理论物理学家罗伯托·卡萨迪奥(Roberto Casadio)独立审查了这篇论文,他无法理解它为什么被拒绝。“它很好地研究了arXiv的广义相对论和量子宇宙学范畴内的一个主题,”Casadio说。“结果是对还是错,arXiv的读者社区可以——也应该——有机会独立评估。”

在寻找代理

arXiv陷入困境的一个原因可能是其版主阵容的不平衡。在知识库的大约200名审核员中,只有13%是女性,正如前面提到的,大多数审核员是美国机构的男性。许多审核员已经在他们的领域工作了几十年,从数学、物理和其他物理科学甚至比现在更不多样化的时候开始。

西于尔兹松承认:“如果(arXiv的审查员)反映出基本上相当于终身研究员小组的人口统计数据,那就好了。”但招聘新团队成员很困难,因为审核是一项费力不讨好的工作,几乎没有职业奖励,而且有很多缺点。女性版主尤其经常成为谩骂邮件的目标。

除了明显的性别和国籍失衡之外,Vaid还指出了更为隐蔽的意识形态代表性问题。当涉及到统一量子场论和引力时,弦理论仍然比竞争的方法更受欢迎,如环量子引力。版主和期刊编辑一样,有一定的权力来决定发表哪种理论。虽然没有可靠的数据被整理来证实这种怀疑,Vaid认为环量子引力的支持者比弦理论家更经常被拒绝。

目前还不清楚,将所有这些方面的审核员多样化是否会解决批评者的抱怨。毕竟,没有所谓的“中国物理学”或“美国数学”,国际科学界的成员有很多共同点。但版主多样性的问题和过度热情或不适当的拒绝可能是相关的。

六年前,日内瓦大学的量子物理学家尼古拉斯·吉辛提出了他的理论学生被审查他们的论文在2014年被arXiv拒绝。(论文的修改版随后通过了同行评审并发表在物理信2015年)。对于吉辛来说,这一事件提出了一个问题:arXiv属于谁?是运营该网站的员工和志愿者,还是为其提供研究的全球科学家社区?

Ginsparg表示,arXiv的初衷是“属于”更大的物理社区,但他指出,尽管该服务器最初是为物理学家服务的,但如今提交的计算机科学论文几乎占了绝大多数。

尽管arXiv在法律上以康奈尔大学为中心,并得到了美国Simons基金会和国际学术机构联盟的资金支持,但科尔斯说:“我们的研究人员认为arXiv属于科学界。”

如果arXiv真的属于更广泛的科学界,他们依赖它,并在其中填满了200万篇论文,这对arXiv的未来意味着什么?

对于Vaid来说,答案很明确:任何“一切照旧”的做法都注定要失败。他说:“没有责任——零责任,没有责任。”他认为arXiv需要在标准和拒绝的解释上更加透明。Sigurdsson认为,在arXiv实施更全面的同行评议的建议不太可能成功。但他表示,他计划在未来几年将审核员的数量增加到至少300人,以便每个类别至少有两名审核员。

Ginsparg也承认arXiv的独特地位赋予了社区责任。他说:“尽管如此,让全球多个领域的研究成果通过单一门户还是存在一个原则问题。”“(ArXiv)的行为和任何无意的偏见都应该持续接受审查。”

如果以目前的速度发展下去,arXiv的库将在十年内再翻一番。接下来的200万篇论文将包含什么发现是不可能知道的,但arXiv在科学领域的主角角色似乎不太可能消失。

在最近的图书馆翻新期间,一项调查询问了欧洲核子研究中心的工作人员他们想要什么:新家具?更好的咖啡吗?Kohls说:“他们说的是‘在那里放一个大屏幕,写一个脚本,自动显示arXiv每天提交的新内容。’”“它可能会成为欧洲核子研究中心图书馆的中心。”