- +1
Nature:新冠流行難預(yù)測,超級計算機(jī)和氣象學(xué)家來幫忙
原創(chuàng) Leo 集智俱樂部

流行病傳播模型是政府決策的重要參考,而預(yù)測疾病傳播的模型通常會依賴于數(shù)百個參數(shù)——這就會引入不確定性。當(dāng)流行病預(yù)測模型的參數(shù)多到有點(diǎn)夸張時,預(yù)測出來的結(jié)果恐怕可靠性不足。最近的Nature官網(wǎng)的一篇報道,介紹了科學(xué)家怎樣借助超級計算機(jī)和氣候模型來改善一個經(jīng)典的流行病傳播模型。

在一群計算機(jī)科學(xué)家耗時數(shù)月審核了一個最具影響力的流行病傳播模型 CovidSim 后,他們認(rèn)為:如果希望對新冠流行趨勢的預(yù)測更加可靠,流行病學(xué)家可以嘗試使用氣候模型。
倫敦帝國理工學(xué)院開發(fā)了流行病預(yù)測模型 CovidSim。在說服英美政府為降低死亡人數(shù)而制定的封鎖政策中,CovidSim 模型給出的預(yù)測結(jié)果起到了一定的推進(jìn)作用。然而,其可靠性卻也一直受到懷疑。

CovidSim模型的早期預(yù)測顯示,如果各國政府不采取行動,英國最多將有50萬人死亡,美國最多將有220萬人死亡。這一度成為英美兩國政府決策的重要參考。
近日,受倫敦皇家學(xué)會委托的研究員使用超級計算機(jī),對CovidSim進(jìn)行了深入研究。這項研究結(jié)果于11月發(fā)布于預(yù)印本平臺 Research Square 。
論文題目:
Model uncertainty and decision making: Predicting the Impact of COVID-19 Using the CovidSim Epidemiological Code
論文地址:
https://www.researchsquare.com/article/rs-82122/v3
領(lǐng)導(dǎo)該課題的倫敦大學(xué)學(xué)院化學(xué)家兼計算機(jī)科學(xué)家 Peter Coveney 表示,他們的研究表明,CovidSim 對輸入數(shù)值微小變化的敏感程度被人們忽略了,因此預(yù)測結(jié)果高估了封鎖政策能減少的死亡人數(shù)。

Coveney 不愿批評由流行病學(xué)家 Neil Ferguson 領(lǐng)導(dǎo)的帝國理工學(xué)院研究團(tuán)隊。畢竟,Coveney 贊同這個團(tuán)隊做出了最好的預(yù)測工作。Coveney 表示,CovidSim 的確表明,如果什么措施都不做確實會造成嚴(yán)重的后果。但流行病學(xué)家應(yīng)該對“集成”模型('ensemble' models)的模擬效果進(jìn)行壓力測試。
類似于機(jī)器學(xué)習(xí)中的多個模型相結(jié)合的集成學(xué)習(xí)(Ensemble Learning)概念,“集成”模型也包含著數(shù)千個不同版本的小模型。這些模型運(yùn)行在不同的輸入條件和假設(shè)中,以應(yīng)對不同的概率的場景。從天氣預(yù)報到分子動力學(xué),在計算量很大的領(lǐng)域中,這種概率混合方法都很常見。
Coveney 的團(tuán)隊已經(jīng)為 CovidSim 做到了這一點(diǎn)。其研究結(jié)果表明:如果該模型作為一個整體“集成”,運(yùn)行后得到的一系列可能的死亡人數(shù),其平均值是原來預(yù)測結(jié)果的兩倍——并且更接近實際數(shù)值。
Coveney 說:“雖然 CovidSim 被捧為最復(fù)雜的流行病學(xué)模型,但與真正復(fù)雜的超級計算應(yīng)用程序相比,它就像一個玩具?!庇始覍W(xué)會大流行建模快速援助(Royal Society’s Rapid Assistance in Modelling the Pandemic,RAMP)倡議的一部分就是基于 Coveney 所做的性能檢查。
超級計算機(jī)捕捉復(fù)雜參數(shù)變化
Coveney 團(tuán)隊使用了位于波茲南超級計算和網(wǎng)絡(luò)中心的 Eagle 超級計算機(jī)對CovidSim 進(jìn)行了6000次獨(dú)立的運(yùn)行測試。每次測試都有一組獨(dú)特的參數(shù)。這些參數(shù)表示了流行病的一些特征:包括病毒的傳染性和致命性、人們在各種環(huán)境中潛在的接觸者數(shù)量以及居家工作等政策的執(zhí)行情況等。在三月份帝國理工的團(tuán)隊做出預(yù)測的時候,這些參數(shù)依然依賴于推測:其中一些來自關(guān)于病毒本身的初步數(shù)據(jù),另一些則是基于對過往流感等傳染性疾病的經(jīng)驗。
預(yù)測疾病傳播的模型通常會依賴于數(shù)百個參數(shù)——這就會引入不確定性。發(fā)起建立 RAMP 的人群中就有一種隱憂:流行病預(yù)測模型的參數(shù)多到有點(diǎn)夸張,預(yù)測出來的結(jié)果恐怕可靠性不足。
他的團(tuán)隊從 CovidSim 代碼中發(fā)現(xiàn)了940個參數(shù),其中對結(jié)果影響非常大的有19個。而且,不同的預(yù)測結(jié)果中三分之二的差異其實是由三個參數(shù)造成的:在出現(xiàn)癥狀且具有傳染性之前的潛伏期長度、社交隔離的執(zhí)行情況以及感染者的隔離期。
研究表明,這些參數(shù)的微小變化可能會對模型的輸出產(chǎn)生巨大的非線性影響。例如,數(shù)千次模擬測試中的大多數(shù)結(jié)果表明,在封鎖政策下,英國的死亡人數(shù)遠(yuǎn)遠(yuǎn)高于帝國理工的初步預(yù)測——在某些情況下,甚至高出5-6倍。平均死亡人數(shù)也是帝國理工預(yù)測人數(shù)的2倍。
在一個模擬的情景中,假設(shè)英國每周有60人需要住院接受重癥監(jiān)護(hù),那么三月份的報告預(yù)測英國共計將有8700人死亡。Coveney小組得出的結(jié)果表明,這一數(shù)字平均約為15,000人;在某些情況下,甚至可能超過40,000人。很難將這些預(yù)測與英國新冠肺炎死亡的實際數(shù)字進(jìn)行比較,因為封鎖政策開始的時間比任何模型假設(shè)的結(jié)果都晚了一周,那時已經(jīng)有大量的感染者在傳播疾病了。
Coveney 表示,帝國理工的團(tuán)隊做錯了——他們正確地運(yùn)行了模擬,但是不知道如何從模型中得出包含概率的混合結(jié)果。這意味需要做另一番計算。Coveney 也認(rèn)為,不應(yīng)將該模型作為一個整體“集成”運(yùn)行其得到的結(jié)果用來決策是否改變防疫政策。但是英國愛丁堡大學(xué)的流行病學(xué)家和數(shù)據(jù)科學(xué)家 Rowland Kao 指出,政府應(yīng)當(dāng)比較、綜合多種預(yù)測模型的結(jié)果。如果基于單一的模型來做決策,就太草率了。
引入氣候模型和貝葉斯工具
帝國理工團(tuán)隊的領(lǐng)導(dǎo)者 Ferguson 認(rèn)同了 Coveney 的大部分意見。但他也表示:“只不過,在三月份我們尚無能力進(jìn)行這樣的模擬測試。”Ferguson 同時表示,帝國理工團(tuán)隊已經(jīng)對模型進(jìn)行了很大的改進(jìn),現(xiàn)在模型已經(jīng)可以得到包含概率的混合結(jié)果了。例如,他們現(xiàn)在使用貝葉斯概率來表示 CovidSim 輸入的不確定性。這種做法在一些流行病學(xué)模型中很常見,例如口蹄疫。
還有一個更簡單模型的預(yù)測結(jié)果被用來建議英國政府本月應(yīng)重新執(zhí)行封鎖政策。這種模型比CovidSim更靈活:“基于不確定性方面的考量,如果我們可以一周多次運(yùn)行模擬程序,實時擬合數(shù)據(jù)要容易多了。”Ferguson 表示。
Coveney 表示,“這樣聽上去就像是在做正確的改進(jìn),且與我們的預(yù)測結(jié)果也一致了。”
Ferguson 表示,技術(shù)方案的選擇通常取決于對計算能力的權(quán)衡?!叭绻阆胍话逡谎壅_地描述所有的不確定性,用一個計算難度較小的模型會更加容易。”
英國牛津大學(xué)的氣候物理學(xué)家 Tim Palmer 認(rèn)為,使用貝葉斯工具是進(jìn)步的做法。Tim 率先在天氣預(yù)報中使用了集成建模。但也只有通過在最強(qiáng)大的計算機(jī)上運(yùn)行的集成建模技術(shù),我們才能得到最可靠的流行病預(yù)測。在政府間氣候變化專門委員會(Intergovernmental Panel on Climate Change,IPCC)的協(xié)調(diào)下,這些新技術(shù)提高了氣候預(yù)測模型的可靠性。
Palmer 也表示,流行病模型預(yù)測也需要類似IPCC的機(jī)構(gòu),我們需要某些國際間合作的設(shè)施,我們可以在這樣的設(shè)施中開發(fā)流行病模型。情況緊急,這件事的推進(jìn)將會很倉促,但是我們需要某種國際組織來綜合全世界的流行病學(xué)模型進(jìn)行預(yù)測。
Simulating the pandemic: What COVID forecasters can learn from climate model
翻譯自:https://www.nature.com/articles/d41586-020-03208-1
作者:Leo
審校:趙雨亭
編輯:鄧一雪
復(fù)雜科學(xué)最新論文
集智斑圖頂刊論文速遞欄目上線以來,持續(xù)收錄來自Nature、Science等頂刊的最新論文,追蹤復(fù)雜系統(tǒng)、網(wǎng)絡(luò)科學(xué)、計算社會科學(xué)等領(lǐng)域的前沿進(jìn)展?,F(xiàn)在正式推出訂閱功能,每周通過微信服務(wù)號「集智斑圖」推送論文信息。掃描下方二維碼即可一鍵訂閱:
推薦閱讀
集智俱樂部QQ群|877391004
原標(biāo)題:《Nature:新冠流行難預(yù)測,超級計算機(jī)和氣象學(xué)家來幫忙》
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




