- +1
心理學(xué)的危機(jī):為什么超六成的實(shí)驗(yàn)無法重復(fù)?

研究心理學(xué)為什么需要做實(shí)驗(yàn)?
行為科學(xué)(Behavioral Science)主要指代研究人或動物行為的學(xué)科。而其中,關(guān)于人的行為的研究,主要關(guān)注人內(nèi)部或者人與人之間的思維過程及其外顯表現(xiàn),例如:決策、判斷、人際交流,以及做出行動上的選擇。其中,心理學(xué)(為簡化闡述,此處只討論人類心理學(xué))是一種典型的行為科學(xué)。學(xué)術(shù)意義上的心理學(xué)并不等同于民間傳說中的“讀心術(shù)”或者“面相學(xué)”,而是一門以科學(xué)手段探索人類認(rèn)知、情緒、人格與行為的學(xué)科。
與經(jīng)濟(jì)學(xué)、社會學(xué)等其他社會科學(xué)學(xué)科類似,心理學(xué)采用定性(qualitative)與定量(quantified)結(jié)合的手段。在定量研究方法中,行為實(shí)驗(yàn)(Behavioral Experiment)又是心理學(xué)的主要研究方法之一。
行為實(shí)驗(yàn)的目的,在于證明因果關(guān)系。例如,有些研究需要探明喝咖啡對于人認(rèn)知功能(如:注意力)的影響。最直接的辦法就是比較喝咖啡的人和不喝咖啡的人在要求集中注意力的任務(wù)(如:計(jì)算、分類整理資料)上的表現(xiàn)差異。此處,我們將喝咖啡與否稱為自變量(Independent Variable),這代表了我們想要探索的“起因” (IV),而人在任務(wù)中的表現(xiàn),則被稱為因變量(Dependent Variable),這代表了我們想要探索的“結(jié)果”(DV)。這個(gè)因果關(guān)系如下所示:
(3)在自變量到因變量的因果鏈條中,需要排除其他混淆因素對因變量的影響(排他定律)
如何設(shè)計(jì)一個(gè)實(shí)驗(yàn)來驗(yàn)證這個(gè)因果關(guān)系呢?我們需要一群實(shí)驗(yàn)參與者,然后把他們隨機(jī)分配在兩組中。在第一組(實(shí)驗(yàn)組)中,我們讓實(shí)驗(yàn)參與者喝更多的咖啡。而在另一組(對照組)中,我們讓參與者不喝咖啡。接下來對所有的實(shí)驗(yàn)參與者,我們考察他們在同樣的任務(wù)上的表現(xiàn)差異。在這個(gè)實(shí)驗(yàn)中,通過人為讓一組人多喝,一組人少喝,再測量他們的任務(wù)表現(xiàn),我們控制了因果鏈條中的時(shí)間關(guān)系(自變量發(fā)生在因變量之前)。而通過比較兩組的任務(wù)差異,我們觀察到了自變量(喝咖啡量)和因變量(任務(wù)表現(xiàn))之間的關(guān)系。最后,把參與者隨機(jī)分配到兩組,則最大可能地降低或平衡了其他因素(如:性別、年齡、飲食習(xí)慣)對他們?nèi)蝿?wù)表現(xiàn)的影響(排除混淆因素的作用)。
心理學(xué)實(shí)驗(yàn)中的“可重復(fù)性”問題有多嚴(yán)重?
如上文所述,一個(gè)嚴(yán)謹(jǐn)?shù)男睦韺W(xué)實(shí)驗(yàn),旨在通過巧妙的實(shí)驗(yàn)設(shè)計(jì)來驗(yàn)證自變量到因變量的因果關(guān)系。過去幾十年間,一系列精彩的實(shí)驗(yàn)研究,極大地推動了心理學(xué)的繁榮與發(fā)展。
學(xué)術(shù)研究是一個(gè)承前啟后的過程,前人可能會通過實(shí)驗(yàn)發(fā)現(xiàn)一些獨(dú)特的現(xiàn)象,而后人則會在前人研究的基礎(chǔ)上延伸出一些新的研究想法,這就對前人研究的真實(shí)性和可靠性提出了更高的要求。所以,越來越多的研究者希望看到前人的研究可以被重復(fù)。畢竟,如果一個(gè)研究能被越多人重復(fù),就越證明這個(gè)發(fā)現(xiàn)的穩(wěn)健和可靠。
近年來,一些研究機(jī)構(gòu)和個(gè)體開始向之前發(fā)表文章的原作者索要實(shí)驗(yàn)材料,然后試圖在與原作近似的實(shí)驗(yàn)條件下重現(xiàn)前人的發(fā)現(xiàn)。然而,不重復(fù)不知道,一重復(fù)嚇一跳。一系列的重復(fù)研究紛紛顯示,不少心理學(xué)實(shí)驗(yàn)正在遭遇“不可重復(fù)質(zhì)疑”。
網(wǎng)站“開放科學(xué)架構(gòu)”(Open Science Framework)在2013年對心理學(xué)中的一些重要效應(yīng)進(jìn)行了重復(fù)實(shí)驗(yàn), 結(jié)果顯示一些經(jīng)典的行為決策研究結(jié)果具有較穩(wěn)定的效應(yīng),但是一些社會認(rèn)知領(lǐng)域的經(jīng)典效應(yīng)則被發(fā)現(xiàn)難以重復(fù)[2]。
《自然》期刊(Nature)在2015年發(fā)表了一篇對于100個(gè)發(fā)表在心理學(xué)期刊上的研究進(jìn)行重復(fù)研究的報(bào)告 [3]。結(jié)果顯示,只有39個(gè)研究很好地重復(fù)了前人的發(fā)現(xiàn),而在剩下61個(gè)研究中,有部分研究顯示了和原作相似(但不等同)的結(jié)果,甚至還有一部分研究結(jié)果則與原作幾乎完全不同。
除了機(jī)構(gòu)的參與,一些個(gè)體研究者也陸續(xù)向?qū)η叭说慕?jīng)典研究發(fā)難,導(dǎo)致一系列曾經(jīng)讓人興奮不已的研究紛紛中槍。其中最受詬病的領(lǐng)域來自于社會認(rèn)知中的啟動效應(yīng)(Priming Effect)和具身認(rèn)知(Embodied Cognition)。
以啟動效應(yīng)為例,啟動效應(yīng)指的是人在上一個(gè)情境中接觸到的實(shí)驗(yàn)刺激會影響到他們在接下來另一個(gè)情境中的判斷和行為。其中一個(gè)經(jīng)典(但又在今天飽受爭議)的例子來自于耶魯大學(xué)約翰巴奇(John Bargh)的研究[4]。在巴奇最初的研究中,他們讓實(shí)驗(yàn)參與者先玩一個(gè)重新排列打亂的字母以組成正確單詞的任務(wù)。其中一半實(shí)驗(yàn)參與者(實(shí)驗(yàn)組)需要重排的這些單詞恰恰可以被用來描述與“老人”相關(guān)的情景,而對照組的實(shí)驗(yàn)參與者則排列一些更加中性的單詞。那么根據(jù)巴奇的理論,當(dāng)人們在玩這個(gè)游戲的時(shí)候,相對于對照組,實(shí)驗(yàn)組中的參與者已經(jīng)在不知不覺中受到這些單詞的影響。接下來研究員要求所有實(shí)驗(yàn)參與者走到一個(gè)特定的地方,并同時(shí)暗中記錄下他們步行到目的地的時(shí)間。實(shí)驗(yàn)結(jié)果顯示,實(shí)驗(yàn)組中的研究參與者走得比對照組更慢,說明他們受到了“老人”這個(gè)概念的影響。然而近年來,這篇引用率達(dá)數(shù)千之巨的經(jīng)典著作卻遭遇了挑戰(zhàn)。其他研究者的一些重復(fù)研究陸續(xù)發(fā)現(xiàn)這一社會認(rèn)知中的經(jīng)典效應(yīng)不能被重復(fù)[5]。由于巴奇的這篇論文堪稱是社會認(rèn)知的經(jīng)典之作,這一挑戰(zhàn)無疑對社會認(rèn)知領(lǐng)域產(chǎn)生了極大的沖擊。
事實(shí)上,對“心理學(xué)實(shí)驗(yàn)的可重復(fù)性”的憂心甚至延伸到其他采用行為實(shí)驗(yàn)方法的社會學(xué)科。自從赫伯特西蒙和卡尼曼開始挑戰(zhàn)經(jīng)濟(jì)學(xué)的“理性人”假設(shè)以來,行為經(jīng)濟(jì)學(xué)成為冉冉上升的明星。在經(jīng)濟(jì)學(xué)領(lǐng)域的頂級期刊美國經(jīng)濟(jì)評論(The American Economic Review,AER)和經(jīng)濟(jì)學(xué)季刊(The Quarterly Journal of Economics,QJE)中也出現(xiàn)了更多的行為經(jīng)濟(jì)學(xué)實(shí)驗(yàn)。而最近加州大學(xué)伯克利分校的何德華教授(Teck-Hua Ho)等人就計(jì)劃對2011-2014年間發(fā)表在AER和QJE上的18個(gè)行為經(jīng)濟(jì)學(xué)實(shí)驗(yàn)進(jìn)行重復(fù)檢驗(yàn),至于結(jié)果,就讓我們拭目以待吧。
實(shí)驗(yàn)不能被重復(fù)等同于學(xué)術(shù)不端嗎?
越來越多的研究者、期刊和媒體開始關(guān)注心理學(xué)實(shí)驗(yàn)的重復(fù)性問題,并有不少人稱之為心理學(xué)的道德危機(jī)。不過,這一說法本身值得商榷。
首先,實(shí)驗(yàn)的無法被重復(fù)并不一定等同于學(xué)術(shù)造假。一個(gè)實(shí)驗(yàn)無法被重復(fù),除了學(xué)術(shù)造假,可能還有其他因素:首先,重復(fù)實(shí)驗(yàn)的操作與情景本身可能會對一些研究結(jié)果造成影響;其次,參加重復(fù)實(shí)驗(yàn)與原始實(shí)驗(yàn)的樣本本身也存在差異;這些不同樣本之間的個(gè)體差異(如文化、年齡、經(jīng)濟(jì)水平、教育背景)也可能對實(shí)驗(yàn)結(jié)果產(chǎn)生影響,此外,人的進(jìn)化、社會環(huán)境的變化,也可能使那些多年前發(fā)現(xiàn)的效應(yīng)不再穩(wěn)健。行為科學(xué)的最大魅力在于,人和社會都是動態(tài)變化的有機(jī)體,因此新的理論出現(xiàn),舊的理論消失或者不再適用,都是有可能的。
另一個(gè)可能被忽視的情況是,由于近幾年一些社會心理學(xué)領(lǐng)域的知名教授被發(fā)現(xiàn)數(shù)據(jù)造假,當(dāng)“一些人造假”與“另一些人實(shí)驗(yàn)無法重復(fù)”的新聞消息同時(shí)占據(jù)版面,讀者就往往會自然而然地把兩者聯(lián)系在一起。但事實(shí)上,前者是明顯的學(xué)術(shù)不端,但是如果因此就把實(shí)驗(yàn)無法重復(fù)和學(xué)術(shù)不端等同起來,就很可能犯了心理學(xué)所說的判斷謬誤,即誤認(rèn)為同時(shí)出現(xiàn)的兩件事一定是相關(guān)甚至是存在因果聯(lián)系的。
盡管實(shí)驗(yàn)無法重復(fù)并不等同于學(xué)術(shù)不端,但是這場風(fēng)波也確實(shí)應(yīng)該讓心理學(xué)研究者與學(xué)術(shù)期刊警醒。例如,為了盡可能減少因?yàn)椤皩W(xué)術(shù)不端”而造成的實(shí)驗(yàn)無法重復(fù),期刊需要采納更加嚴(yán)格的審稿體系,要求研究者提交原始數(shù)據(jù)、原始研究材料以及分析方法。再者,近些年來心理學(xué)研究越來越向追求“問題新奇”的方向發(fā)展。雖然這會給這一領(lǐng)域帶來更多樂趣和聚焦,但是這種獵奇心一旦過了頭,研究者就可能更多去追求熱鬧,而忽視對一些真正接近人類思維本質(zhì)的問題的研究。事實(shí)上,只有從“搞個(gè)大新聞”到回歸踏實(shí)做研究,才能催生更多經(jīng)得起檢驗(yàn)的研究成果,也才能推動整個(gè)學(xué)科的前進(jìn)。
從研究的方法論上看,研究者自身也應(yīng)該爭取在一篇論文中重復(fù)自己的結(jié)果?,F(xiàn)如今優(yōu)秀的心理學(xué)雜志往往要求4個(gè)及以上的重復(fù)實(shí)驗(yàn)。而為了進(jìn)一步證實(shí)自己研究的可推廣性和可重復(fù)性,研究者應(yīng)該考慮在一篇文章中融入多種情景(更替實(shí)驗(yàn)材料)和多種方法論(實(shí)驗(yàn)室實(shí)驗(yàn)、真實(shí)生活中的田野實(shí)驗(yàn)、二手?jǐn)?shù)據(jù)、甚至是像經(jīng)濟(jì)學(xué)一樣的理論模型),這本身也是一個(gè)自我檢驗(yàn)和取信于人的過程。
總而言之,盡管心理學(xué)實(shí)驗(yàn)的可重復(fù)性問題對心理學(xué)造成了巨大沖擊,但是這本身并不意味著心理學(xué)的危機(jī)或者末路,反而為這一學(xué)科的規(guī)范化和嚴(yán)謹(jǐn)化提供了方向。而對于心理學(xué)研究者而言,最應(yīng)該保持的態(tài)度還是“清者自清”,拋開那些浮華但是經(jīng)不起檢驗(yàn)的議題,去真正探索值得研究的基本理論問題。
[1] Science 28 August 2015: Vol. 349 no. 6251 aac4716
[2] Investigating Variation in Replicability: A “Many Labs” Replication Project https://osf.io/wx7ck/
[3] First results from psychology’s largest reproducibility test http://www.nature.com/news/first-results-from-psychology-s-largest-reproducibility-test-1.17433
[4]Bargh, J. A., Chen, M., & Burrows, L. (1996). Automaticity of Social Behavior: Direct Effects of Trait Construct and Stereotype Activation on Action. Journal of Personality and Social Psychology, 71(2), 230-244.
[5]Behavioral Priming: It's All in the Mind, but Whose Mind? http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0029081





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




