摘要
在注册报告(RRs)中,最初的同行评审和原则上的接受发生在了解研究结果之前。这与发表偏见作斗争,并将计划研究与计划外研究区分开。rr如何提高研究结果的可信度是直截了当的,但几乎没有经验证据。此外,这可能会带来意想不到的成本,比如降低新颖性。在这里,353名研究人员对来自心理学和神经科学的29篇发表的rr论文和57篇非rr比较论文进行了同行评审。在所有19个标准上(平均差异0.46,刻度范围为−4至+4),RRs在数字上优于对照论文,其影响范围从统计上与比较论文在新颖性(0.13,95%可信区间[−0.24,0.49])和创造力(0.22,[−0.14,0.58])到方法严谨性(0.99,[0.62,1.35])和分析(0.97,[0.60,1.34])和整体论文质量(0.66,[0.30,1.02])方面的显著改进。rr可以提高研究质量,减少发表偏倚,最终提高发表文献的可信度。
这是订阅内容的预览,通过你所在的机构访问
相关的文章
引用本文的开放获取文章。
社论:“预结果回顾”研讨会
实验经济学开放获取2023年2月27日
社会学的预注册和注册报告:优势、劣势和其他考虑因素
美国社会学家开放获取2023年2月11日
生态与进化领域注册报告的机遇与挑战
自然通讯开放获取11月28日
访问选项
访问《自然》和其他54种《自然》杂志
获取Nature+,我们最超值的在线订阅
每月29.99美元
随时取消
订阅这本杂志
收到12个数字问题和在线文章访问
每年119.00美元
每期只要9.92美元
租或购买这篇文章
只要这篇文章,只要你需要它
39.95美元
价格可能受当地税收的影响,在结账时计算
![](https://media.springernature.com/m312/springer-static/image/art%3A10.1038%2Fs41562-021-01142-4/MediaObjects/41562_2021_1142_Fig1_HTML.png)
数据可用性
所有数据文件都可以在OSF中使用:https://osf.io/aj4zr/.
代码的可用性
所有文件和脚本都可以在OSF上使用:https://osf.io/aj4zr/.
参考文献
注册报告的下一步是什么?自然573, 187-189(2019)。
钱伯斯,C.注册报告革命。文化改革的教训。意义16, 23-27(2019)。
Nosek, B. a . & Lakens, D.注册报告:一种增加发表结果可信度的方法。Soc。Psychol。45, 137-141(2014)。
Nosek, b.a.,间谍,J. R. & Motyl, M.科学乌托邦:2。重组激励机制和实践,以促进真相而不是出版。教谕。Psychol。科学。7, 615-631(2012)。
同行评议:科学和期刊核心的一个有缺陷的过程。J. R. Soc地中海。99, 178-182(2006)。
负面结果正在从大多数学科和国家消失。科学计量学90, 891-904(2012)。
法内利,D.“积极的”结果在科学的层次上向下增加。《公共科学图书馆•综合》5, e10068(2010)。
弗兰科,A.,马尔霍特拉,N. &西蒙诺维茨,G.社会科学中的出版偏见:打开文件抽屉。科学345, 1502-1505(2014)。
发表偏倚的存在及其发生的危险因素。《美国医学会杂志》263, 1385-1389(1990)。
发表偏见:同行评议系统中验证性偏见的实验研究。Cogn。其他。Res。1, 161-175(1977)。
格林沃尔德,a.g.对零假设偏见的后果。Psychol。公牛。82, 1-20(1975)。
发表决定及其对显著性检验得出的推论的可能影响,反之亦然。j。统计协会。54, 30-34(1959)。
马克尔,M. C.普拉克,J. A. &赫加蒂,B.心理学研究中的复制:它们真正发生的频率是多少?教谕。Psychol。科学。7, 537-542(2012)。
施密特,s,我们真的要再来一次吗?复制的强大概念在社会科学中被忽视了。精神病将军。13, 90-100(2009)。
马克尔,M. C. &普拉克尔,J. A.事实比新奇更重要。建造。Res。43, 304-316(2014)。
多重研究文章显著结果对可信度的反讽效应。Psychol。方法17, 551-566(2012)。
Giner-Sorolla, R.科学还是艺术?美学标准如何顺利通过出版瓶颈,却破坏了科学。教谕。Psychol。科学。7, 562-571(2012)。
Begley, C. G. & Ellis, L. M.提高临床前癌症研究的标准。自然483, 531-533(2012)。
Prinz, F., Schlange, T. & Asadullah, K.信不信由你:我们能在多大程度上依赖已发表的潜在药物靶点数据?Nat. Rev.药物发现10, 712-712 (2011)
Camerer, c.f.等。评估经济学实验室实验的可复制性。科学351, 1433-1436(2016)。
Camerer, c.f.等。评价社会科学实验的可复制性自然而且科学在2010年到2015年之间。Nat,哼。Behav。2, 637-644(2018)。
克莱因,r.a.等。许多实验室2:研究不同样本和设置的可复制性差异。方法实践。Psychol。科学。1, 443-490(2018)。
克莱因,r.a.等。研究可复制性的变异:一个“多实验室”复制项目。Soc。Psychol。45, 142-152(2014)。
开放科学合作。估计心理科学的可重复性。科学349, aac4716(2015)。
艾博索,C. R.等。许多实验室3:通过复制评估整个学术学期的参与者池质量。经验,社会;Psychol。67, 68-82(2016)。
Allen, C. & Mehler, d.m.a.在早期职业生涯和以后的开放科学挑战、好处和技巧。公共科学图书馆杂志。17, e3000246(2019)。
schel, a.m., Schijen, M. & Lakens, D.过量的积极结果:比较标准心理学文献与注册报告.预印在PsyArXivhttps://osf.io/p6e9c(2020)。
Hummer, L. T., Singleton Thorn, F., Nosek, B. a . & Errington, T. M.评估注册报告:文章影响的自然主义比较研究。预印在OSFhttps://osf.io/5y8w7(2017)。
作为手工艺的研究vs作为新事物的产生的研究:向虚无进发。创造。J >30., 323-328(2018)。
鲍迈斯特,R. F.《在暴风雨中描绘社会心理学的未来:赢家、输家和建议》。经验,社会;Psychol。66, 153-158(2016)。
诺塞克,B. a . &埃林顿,T. M.这是争论复制意味着什么的最佳时机?在你动手之前。自然583, 518-520(2020)。
Gelman, A., Hill, J. & Yajima, M.为什么我们(通常)不必担心多重比较。J. Res.教育滚开。5, 189-211(2012)。
Epskamp, S. & Nuijten, m.b. statcheck:从文章中提取统计数据并重新计算P值。R包版本1.3.1(2018)。
哈德威克,T. E.和Ioannidis, J. P. A.绘制注册报告的宇宙。Nat,哼。Behav。2, 793-796(2018)。
钱伯斯,C. D. &梅勒,D. T.协议透明度对注册报告至关重要。Nat,哼。Behav。2, 791-792(2018)。
John, L. K., Loewenstein, G. & Prelec, D.用实话实说的激励来衡量可疑研究实践的普遍程度。Psychol。科学。23, 524-532(2012)。
西蒙斯,J. P.,尼尔森,L. D.和西蒙松,U.假积极心理学:数据收集和分析的未公开的灵活性允许将任何事情呈现为重要。Psychol。科学。22, 1359-1366(2011)。
Nuijten, m.b., van Assen, m.a.l.m, Hartgerink, c.h.j, Epskamp, S. & Wicherts, j.m.“statcheck”工具在发现统计报告不一致方面的有效性。预印在PsyArXivhttps://osf.io/tcxaj(2017)。
Stan开发团队。Stan建模语言用户指南和参考手册(2020)。
确认
作者感谢L. Hummer在研究计划方面的帮助,感谢A. Denis和Z. Loomas帮助准备调查材料,感谢B. Bouza和N. Buttrick帮助在Qualtrics中实施调查,感谢A. Allard帮助编写文章。本研究由Arnold Ventures和James S. McDonnell基金会(grant # 220020498)资助给B.A.N.,并由国家科学基金会研究生研究奖学金计划(grant # 1247392授予S.R.S)支持。资助者在研究设计、分析、发表决定或手稿准备中没有任何作用。
作者信息
作者及隶属关系
贡献
概念化:调查:C.K.S.、T.M.E.和B.A.N.文章编码:S.R.S.、J.B.数据整理:调查:C.K.S.和K.M.E.文章编码:S.V.、S.R.S.和J.B.调查:调查:C.K.S.和T.M.E.文章编码:S.R.S.、t.r.s.和S.V.方法:调查:C.K.S.、T.M.E.、K.M.E.和B.A.N.文章编码:S.R.S.、J.B.和S.V.软件:文章编码:S.R.S.和J.B.可视化:调查:C.K.S.文章编码:S.R.S.、J.B.和S.V.验证:调查:K.M.E.文章编码:S.V.项目管理:T.M.E.资源:T.M.E.和F.S.T.监督:T.M.E.和B.A.N.资金获取:T.M.E.和B.A.N.写作,初稿:c.k.s., T.M.E., K.M.E.和B.A.N.写作、审查和编辑:c.k.s., T.M.E., S.R.S., J.B., F.S.T., S.V., K.M.E.和B.A.N.
相应的作者
道德声明
相互竞争的利益
t.m.e.、C.K.S.和B.A.N.是非营利组织开放科学中心(COS)的员工,该中心的使命是提高研究的开放性、完整性和可重复性。COS为期刊、编辑和研究人员采用和实施RRs提供支持。其余作者声明没有利益冲突。
额外的信息
同行评审信息人类行为感谢Balazs Aczel, Marcel van Assen和其他匿名审稿人对这项工作的同行评审所做的贡献。
出版商的注意施普林格自然对出版的地图和机构从属关系中的管辖权主张保持中立。
扩展数据
扩展数据图1所有差异评分结果变量之间的相关性图。
19个结果变量的相关矩阵中,较大的深蓝圈表明正相关强于较小的浅蓝色圈。
扩展数据图2每个DV和每个Familiar水平的参数估计的后验概率分布,比较rr和比较文章的差异。
水平线表示80%(粗)和95%(细)可信区间,圆点表示后验均值。正值表示rr的性能优势,负值表示比较文章的性能优势。
扩展数据图3每个DV和每个改进水平的参数估计的后验概率分布,比较rr和比较文章的差异。
水平线表示80%(粗)和95%(细)可信区间,圆点表示后验均值。正值表示rr的性能优势,负值表示比较文章的性能优势。
扩展数据图4每个DV和每个“猜对”水平的参数估计的后验概率分布,比较rr和比较文章的差异。
水平线表示80%(粗)和95%(细)可信区间,圆点表示后验均值。正值表示rr的性能优势,负值表示比较文章的性能优势。
权利和权限
关于本文
引用本文
索德伯格,c.k.,艾灵顿,t.m.,斯齐亚沃尼,S.R.et al。与标准出版模式相比,注册报告的研究质量的初步证据。Nat Hum行为5, 990-997(2021)。https://doi.org/10.1038/s41562-021-01142-4
收到了:
接受:
发表:
发行日期:
DOI:https://doi.org/10.1038/s41562-021-01142-4
这篇文章被引用
《自然》欢迎注册报告
自然(2023)
特刊简介
Politische Vierteljahresschrift(2023)
社论:“预结果回顾”研讨会
实验经济学(2023)
社会学的预注册和注册报告:优势、劣势和其他考虑因素
美国社会学家(2023)
三位一体审查:将注册报告与研究伦理和资金审查相结合
BMC研究笔记(2022)