arXiv,30 歲生日快樂!它的誕生,始於一個​被塞滿的郵箱

新智元 2021-08-16 01:30:58 阅读数:622

本文一共[544]字,预计阅读时长:1分钟~
arxiv 生日

新智元報道

來源:twitter

編輯:小勻

【新智元導讀】arXiv 30歲啦!在這特殊的「而立生日」,許多學者們也送上了祝福,感恩與arXiv一起度過的這些年!根據《自然》,2021 年預計arXiv會有大約 190,000 篇新文章。

arXiv 30歲啦!

這個收集物理學、數學、計算機科學、生物學與數理經濟學的論文預印本的網站,始於1991年8月14日。

30年來,它見證了無數學者的耕耘。

根據Nature的報道,截至2008年10月,arXiv.org已收集超過50萬篇預印本;至2014年底,藏量達到1百萬篇。截至2016年10月,提交率已達每月超過10,000篇。

預計 2021 年會有大約 190,000 篇新文章。

這個神奇的網站由保羅·金斯巴格創建,當時工作於洛斯·阿拉莫斯國家實驗室的他,常常充滿預印本發文的郵箱而發愁。

於是,保羅·金斯巴格意識到了中央存儲的必要性,並於1991年8月創建了一個中央倉庫郵箱,該郵箱存儲在洛斯阿拉莫斯國家實驗室中,可以從任何計算機上進行訪問。

創立:始於一個被塞滿的郵箱

在金斯巴格創立中央倉庫郵箱後,很快它又增加了其他訪問方式:1991年使用FTP,1992年使用Gopher,1993年使用萬維網。

漸漸地,這個本意在收集物理學的論文預印本,隨後括及天文、數學等其它領域。

早期,arXiv被稱為「LANL預印本數據庫」。LANL就是洛斯阿拉莫斯國家實驗室的縮寫。

2001年,arXiv落脚於康乃爾大學,並在全球各地設有鏡像站點。網站在1999年改名為arXiv.org。

2002年,金斯巴格因這個網站獲得了麥克阿瑟獎。

到了2011年9月,康奈爾大學圖書館全面負責了arXiv的運營和發展。

不過,金斯巴格本人似乎並不贊同arXiv的這個結局。

他在《高等教育紀事報》中被引用說「這原應該是一個3小時的旅程,而不是一個無期徒刑」。

但是,金斯巴格仍然留在arXiv的科學顧問委員會(頁面存檔備份,存於互聯網檔案館)和arXiv物理顧問委員會(頁面存檔備份,存於互聯網檔案館)中。

意義:造就開放獲取

說到arXiv的意義,它的存在是造就了科學出版業中所謂開放獲取運動的因素之一。

現今的一些科學家仍習慣先將其論文上傳至arXiv.org,再提交予專業的學術期刊。

這個趨勢對傳統學術期刊的經營模式造成了可觀的沖擊。

不過,許多arXiv上的論文都被認為不靠譜——因為它們未經同行評審。

盡管如此,2004年起,arXiv采行了一套「認可」系統。

在這套系統下,作者首先要得到認可,這種認可可能來自另一比特具認可資格者的背書,或者依照某些內部規定而自動授予。

來自著名學術機關的作者通常會自動得到認可。

例如,最近美國計算機科學家,波特蘭州立大學教授,Melanie Mitchell在arxiv上發布了一篇文章批判AI,就引起了極大的爭議,遭reddit網友狂噴。

Mitchell是一比特主要研究領域為複雜系統和遺傳算法以及細胞自動機。她的論文闡述了科研人員對AI的四個謬誤,這些謬論可能導致對該領域的過度自信預測。

reddit網友錶示,不知道這篇論文為什麼被炒作起來了,但上述四個理論已經是眾所周知的事。

並直言,arxiv大部分這種論文都是舊新聞炒冷飯。

還有網友認為這篇論文投稿肯定中不了。

近年來,arXiv加入了自動機器學習框架的審核,這樣,許多潜在問題就能够被及時標記,以便之後的人工審查。

盡管有爭議,但ArXiv在計算機科學裏究竟有多受歡迎?

根據2017年的一份重磅報告,所有計算機科學論文裏,有23%在arXiv.org上有電子版本,而10年前這個數字只有1%

許多研究人員都使用arXiv來發布預印版論文。在2017年arXiv上發布的論文中,有56%是在提交同行評議之前或在審核中的預印本

計算機科學的各個領域中,電子文獻的流行程度差异很大。理論計算機科學與機器學習領域,超過60%的發錶論文有arXiv電子版本;其他領域對arXiv的使用率基本為零。不過,大多數領域對arXiv的使用都處於上昇趨勢。

在這特殊的「而立之年」生日,許多學者們也送上了祝福,感恩與arXiv一起度過的這些年!

留言說出你與arXiv的故事吧!

參考資料:

版权声明:本文为[新智元]所创,转载请带上原文链接,感谢。 https://gsmany.com/2021/08/20210816013014890Y.html