维基百科top-cited学术文章,透露

基因集合和天文学研究主导的列表最常引用的出版物和必须在受欢迎的在线百科全书。

  • Giorgia囊内

维基百科是世界fifth-most-viewed网站。
信贷:克里斯巴特森除

维基百科top-cited学术文章,透露

基因集合和天文学研究主导的列表最常引用的出版物和必须在受欢迎的在线百科全书。

2018年5月16日

Giorgia囊内

克里斯·巴特森除

维基百科是世界fifth-most-viewed网站。

在维基百科上最常引用的期刊文章包括论文的名字月球陨石坑和人类和小鼠基因的DNA序列,许多最受欢迎的作品中多次引用在线百科全书比在科学文献。

“这是很不可思议的,几乎所有高被引文章科学文章,”Matt Miller说数据科学家和图书馆员在纽约市。米勒分析了引用的数据由维基媒体基金会发布的3月份加州,旧金山的非营利组织运行维基百科。的数据集,其中包含一些1570万条记录,显示多少次来源与正式的标识符,如isbn(国际标准书号),必须引用(数字对象标识符)所有维基百科的近300个语言版本。维基媒体指出,大多数出版物引用标识符在维基百科书,但米勒专门看着出版物的数字必须-最广泛使用的标识符期刊文章在英语版的维基百科。他的数据集包含120万引用必须使用,引用超过835000独特的文章。

引用最广,4702年引文在英文维基百科,是a2002集合超过15000的人类和小鼠的基因序列(见“英文维基百科”)。维基百科页面引用研究几乎只对单个基因或蛋白质的条目。说:“这是一个惊喜,”罗伯特•Strausberg癌症研究员领导了这一项目,现在科学副主任路德维希癌症研究所在纽约市。

一个扩展版的基因集合,出版于2004年,是second-most-cited文章中,约有3400引用(相比之下,487年科学文献引用,根据谷歌学者)。丹妮拉哈德,癌症遗传学家我们国家癌症研究所马里兰州贝塞斯达,和论文的作者说,出版物可能引用如此频繁,因为他们提供访问信息表达基因的序列。

,排名前十的五篇文章关于DNA目录,其中包括研究细节的方法生成这样的集合。一个2005年的地图近3000的人类蛋白质相互作用还包括在名单上,数字7。(维基的原始文章指出:“毫无疑问,维基爱参考书。”)

天文学的文章列表的其余部分,有四个条目。third-most-referenced纸,被近3000英文维基百科页面,是a2007年的研究帮助研究人员解释Hipparcos的结果,第一个太空任务测量位置,距离,恒星的亮度。

其他宇宙论文名单上的覆盖小行星的大小和亮度,月球陨石坑的名字(在1971年的出版物,刚刚16在科学文献引用,根据谷歌学者)。这些文件可能是高度引用,因为他们是可靠的参考许多天体,有自己的维基百科页面,天文学家地板van Leeuwen说剑桥大学,英国,根据该研究。

机器人的工作

维基百科,于2001年发射,接收每月大概160亿页的见解,目前是世界fifth-most-visited网站。任何人都可以创建或编辑现有的文章,但是网站的指导方针要求作家和编辑必须属性引用和信息来源如书籍或发表学术论文。

一个单独的维基罗斯Mounce转储的数据的分析,他在伦敦慈善基金会世外桃源基金开放项目,揭示了encylopaedia DOI在所有文章的被引用十多语言版本(参见“所有维基百科语言版本”)。六的文章都是相同的,但第一项是明显不同的。top-referenced DOI是一篇2007年的论文更新一个世纪全球气候分类,有高达280万引用-但只有169英文维基百科(second-most-cited源在所有版本刚刚超过21000引用)。

气候研究严重被因为数百万的引用来自页面创建一个自动化的计算机程序。机器人,由物理学家Sverker约翰逊达拉那的大学法伦,瑞典了近300万篇文章,2014年7月,根据维基百科。三分之一的文章在瑞典和其他在Cebuano Waray,两种语言菲律宾。的机器人关于地理位置产生了数以百万计的文章如城镇和岛屿,和大部分的文章包括当地气候类型的信息,参考气候研究,约翰逊说。他补充说,他没有精确的数据bot-generated引文的气候,但280万是大致正确的。”

Mounce指出,其他文章可能大量引用维基百科上但没有正式引用的必须,而不是引用的其他手段,如他们的PubMed ID数字。

引用是重要的如果人们相信信息,主任John Chodacki说加州大学管理中心位于伯克利。“这是真正的期刊文章和维基百科页面,”他说。但分析和比较在学术论文引文数据历来可能只使用paywalled服务。“最有趣的事情之一是,这信息是可用的。”

这篇文章最初发表在nature.com上