一个旨在测试心理学实验可靠性的大型国际小组成功地再现了过去13个实验中的10个结果。该联盟还发现,两种效应无法重现。

近年来,在重复经典研究屡遭失败后,人们对其结果可靠性的担忧日益加剧,心理学受到了冲击。重复失败可能意味着最初的研究有缺陷,新实验做得不好,或者在不同的环境或人群中,审查的效果有所不同。

人类与一个神秘的远古族群杂交 进化能力本身如何进化 脆弱的统计数据使科学变得不可复制

为了解决这个“可复制性危机”,36个研究小组组成了“多实验室复制项目”,重复进行13项心理学研究。该联盟将早期实验中的测试合并成一份问卷——需要15分钟完成——并将其分发给来自12个国家的6344名志愿者。

该团队选择了代表心理科学多样性的混合效应,从被反复重复的经典实验到未被重复的当代实验。

其中10种效应在不同的样本中得到了一致的复制。其中包括诺贝尔经济学奖得主、新泽西州普林斯顿大学(Princeton University)心理学家丹尼尔•卡尼曼(Daniel Kahneman)的经典结果,比如收益与损失框架,即人们更愿意冒险以避免损失,而不是获得收益1;还有锚定效应,即一个人收到的第一条信息可能会对后来的决定产生偏见2.该团队甚至表明,锚定比卡纳曼最初的研究显示的要强大得多。

令人鼓舞的成果

加州大学洛杉矶分校的心理学家丹尼·奥本海默(Danny Oppenheimer)说:“这对心理学来说是一个非常重要的举措。”他的工作正在接受审查,但他没有参加这次合作。“这意味着,可复制性问题虽然绝非微不足道,但可能并不像该领域的一些批评者所认为的那样普遍。”

弗吉尼亚州夏洛茨维尔开放科学中心的心理学家布莱恩·诺塞克(Brian Nosek)是该项目的联合负责人,他认为研究结果令人鼓舞。他说:“这表明,在我们的领域,有一些重要的影响是可复制的,而且一直如此。”“但这并不意味着每13个效应中就有10个会复制。”

卡尼曼对此表示赞同。他说,这项研究“似乎做得非常好,完全令人信服”,“尽管从这一项努力中对整个研究领域得出极端结论肯定还为时过早”。卡纳曼发表了一封公开信2012年,他呼吁建立启动效应研究的“菊花链”,在启动效应研究中,微妙的潜意识暗示可能会影响后来的行为。

在最近的调查中,有13种效应被仔细研究过,其中一种只是得到了微弱的支持,还有两种根本没有被复制。这两种不可复制的效应都涉及到社会启动。在其中一项研究中,人们在接触了金钱之后,对当前社会制度的认可有所增加3..在另一项调查中,美国人在看到美国国旗后更倾向于保守的价值观4

缅因州沃特维尔科尔比学院的社会心理学家特拉维斯·卡特领导了最初的国旗启动研究,他说他很失望,但全心全意地信任诺塞克的团队,尽管他想在进一步评论之前审查他们的数据。伊利诺斯州芝加哥大学的行为科学家尤金·卡鲁索(Eugene Caruso)领导了最初的货币启动研究,他说:“鉴于许多实验室项目的“样本更大、更多样化”,我们应该利用这种缺乏重复的情况来更新我们对这种效应的可靠性和普遍性的信念。”两位研究人员都称赞了这一举措。

打开文档

由盖恩斯维尔佛罗里达大学的理查德·克莱因和凯特·拉特里夫以及意大利帕多瓦大学的米开朗基罗·维亚内洛共同协调的“众多实验室”团队发现,无论是在线还是在实验室,实验结果在很大程度上不受志愿者国籍或实验环境的影响。当有变化时,它仅限于大而明显的影响,如锚定,而不是小而微妙的影响,如看到旗帜的启动。

这与经常被引用的观点相矛盾,即一些心理学研究,特别是那些关于微妙社会启动效应的研究,很难被复制,因为它们对被研究的样本或原始调查人员的技能等因素很敏感。事实上,社会启动研究很难被复制,“这对我个人来说也很困难,”诺塞克说,“因为社会启动对我的研究很重要。”

Many Labs项目的计划在可能的情况下由原作者审查,公开记录,并在期刊上注册社会心理学在进行任何实验之前,它的方法都经过同行评审。研究结果现已提交给该杂志网上.“这种开放性应该成为所有研究的标准,”伊利诺伊大学香槟分校(University of Illinois at Urbana-Champaign)的丹尼尔·西蒙斯(Daniel Simons)说,他正在协调一项类似的合作尝试,以验证一种经典的心理效应,但这项研究没有涉及到。“我希望这将成为心理学的标准方法。”

奥本海默说,其他学科也可以从许多实验室的方法中受益。“心理学并不是近年来唯一存在复制问题的领域。”