Nature：新冠流行難預(yù)測，超級計算機(jī)和氣象學(xué)家來幫忙

2020-11-30 11:05

來源：澎湃新聞·澎湃號·湃客

聽全文

原創(chuàng) Leo 集智俱樂部

導(dǎo)語

流行病傳播模型是政府決策的重要參考，而預(yù)測疾病傳播的模型通常會依賴于數(shù)百個參數(shù)——這就會引入不確定性。當(dāng)流行病預(yù)測模型的參數(shù)多到有點(diǎn)夸張時，預(yù)測出來的結(jié)果恐怕可靠性不足。最近的Nature官網(wǎng)的一篇報道，介紹了科學(xué)家怎樣借助超級計算機(jī)和氣候模型來改善一個經(jīng)典的流行病傳播模型。

一個“失敗”的新冠傳播模型

在一群計算機(jī)科學(xué)家耗時數(shù)月審核了一個最具影響力的流行病傳播模型 CovidSim 后，他們認(rèn)為：如果希望對新冠流行趨勢的預(yù)測更加可靠，流行病學(xué)家可以嘗試使用氣候模型。

倫敦帝國理工學(xué)院開發(fā)了流行病預(yù)測模型 CovidSim。在說服英美政府為降低死亡人數(shù)而制定的封鎖政策中，CovidSim 模型給出的預(yù)測結(jié)果起到了一定的推進(jìn)作用。然而，其可靠性卻也一直受到懷疑。

2020年3月31日，特朗普查看CovidSim模型的預(yù)測圖

CovidSim模型的早期預(yù)測顯示，如果各國政府不采取行動，英國最多將有50萬人死亡，美國最多將有220萬人死亡。這一度成為英美兩國政府決策的重要參考。

近日，受倫敦皇家學(xué)會委托的研究員使用超級計算機(jī)，對CovidSim進(jìn)行了深入研究。這項研究結(jié)果于11月發(fā)布于預(yù)印本平臺 Research Square 。

論文題目：

Model uncertainty and decision making: Predicting the Impact of COVID-19 Using the CovidSim Epidemiological Code

論文地址：

https://www.researchsquare.com/article/rs-82122/v3

領(lǐng)導(dǎo)該課題的倫敦大學(xué)學(xué)院化學(xué)家兼計算機(jī)科學(xué)家 Peter Coveney 表示，他們的研究表明，CovidSim 對輸入數(shù)值微小變化的敏感程度被人們忽略了，因此預(yù)測結(jié)果高估了封鎖政策能減少的死亡人數(shù)。

論文通訊作者 Peter Coveney

Coveney 不愿批評由流行病學(xué)家 Neil Ferguson 領(lǐng)導(dǎo)的帝國理工學(xué)院研究團(tuán)隊。畢竟，Coveney 贊同這個團(tuán)隊做出了最好的預(yù)測工作。Coveney 表示，CovidSim 的確表明，如果什么措施都不做確實會造成嚴(yán)重的后果。但流行病學(xué)家應(yīng)該對“集成”模型（'ensemble' models）的模擬效果進(jìn)行壓力測試。

類似于機(jī)器學(xué)習(xí)中的多個模型相結(jié)合的集成學(xué)習(xí)（Ensemble Learning）概念，“集成”模型也包含著數(shù)千個不同版本的小模型。這些模型運(yùn)行在不同的輸入條件和假設(shè)中，以應(yīng)對不同的概率的場景。從天氣預(yù)報到分子動力學(xué)，在計算量很大的領(lǐng)域中，這種概率混合方法都很常見。

Coveney 的團(tuán)隊已經(jīng)為 CovidSim 做到了這一點(diǎn)。其研究結(jié)果表明：如果該模型作為一個整體“集成”，運(yùn)行后得到的一系列可能的死亡人數(shù)，其平均值是原來預(yù)測結(jié)果的兩倍——并且更接近實際數(shù)值。

Coveney 說：“雖然 CovidSim 被捧為最復(fù)雜的流行病學(xué)模型，但與真正復(fù)雜的超級計算應(yīng)用程序相比，它就像一個玩具?！庇始覍W(xué)會大流行建模快速援助（Royal Society’s Rapid Assistance in Modelling the Pandemic，RAMP）倡議的一部分就是基于 Coveney 所做的性能檢查。

超級計算機(jī)捕捉復(fù)雜參數(shù)變化

Coveney 團(tuán)隊使用了位于波茲南超級計算和網(wǎng)絡(luò)中心的 Eagle 超級計算機(jī)對CovidSim 進(jìn)行了6000次獨(dú)立的運(yùn)行測試。每次測試都有一組獨(dú)特的參數(shù)。這些參數(shù)表示了流行病的一些特征：包括病毒的傳染性和致命性、人們在各種環(huán)境中潛在的接觸者數(shù)量以及居家工作等政策的執(zhí)行情況等。在三月份帝國理工的團(tuán)隊做出預(yù)測的時候，這些參數(shù)依然依賴于推測：其中一些來自關(guān)于病毒本身的初步數(shù)據(jù)，另一些則是基于對過往流感等傳染性疾病的經(jīng)驗。

預(yù)測疾病傳播的模型通常會依賴于數(shù)百個參數(shù)——這就會引入不確定性。發(fā)起建立 RAMP 的人群中就有一種隱憂：流行病預(yù)測模型的參數(shù)多到有點(diǎn)夸張，預(yù)測出來的結(jié)果恐怕可靠性不足。

他的團(tuán)隊從 CovidSim 代碼中發(fā)現(xiàn)了940個參數(shù)，其中對結(jié)果影響非常大的有19個。而且，不同的預(yù)測結(jié)果中三分之二的差異其實是由三個參數(shù)造成的：在出現(xiàn)癥狀且具有傳染性之前的潛伏期長度、社交隔離的執(zhí)行情況以及感染者的隔離期。

研究表明，這些參數(shù)的微小變化可能會對模型的輸出產(chǎn)生巨大的非線性影響。例如，數(shù)千次模擬測試中的大多數(shù)結(jié)果表明，在封鎖政策下，英國的死亡人數(shù)遠(yuǎn)遠(yuǎn)高于帝國理工的初步預(yù)測——在某些情況下，甚至高出5-6倍。平均死亡人數(shù)也是帝國理工預(yù)測人數(shù)的2倍。

在一個模擬的情景中，假設(shè)英國每周有60人需要住院接受重癥監(jiān)護(hù)，那么三月份的報告預(yù)測英國共計將有8700人死亡。Coveney小組得出的結(jié)果表明，這一數(shù)字平均約為15,000人；在某些情況下，甚至可能超過40,000人。很難將這些預(yù)測與英國新冠肺炎死亡的實際數(shù)字進(jìn)行比較，因為封鎖政策開始的時間比任何模型假設(shè)的結(jié)果都晚了一周，那時已經(jīng)有大量的感染者在傳播疾病了。

Coveney 表示，帝國理工的團(tuán)隊做錯了——他們正確地運(yùn)行了模擬，但是不知道如何從模型中得出包含概率的混合結(jié)果。這意味需要做另一番計算。Coveney 也認(rèn)為，不應(yīng)將該模型作為一個整體“集成”運(yùn)行其得到的結(jié)果用來決策是否改變防疫政策。但是英國愛丁堡大學(xué)的流行病學(xué)家和數(shù)據(jù)科學(xué)家 Rowland Kao 指出，政府應(yīng)當(dāng)比較、綜合多種預(yù)測模型的結(jié)果。如果基于單一的模型來做決策，就太草率了。

引入氣候模型和貝葉斯工具

帝國理工團(tuán)隊的領(lǐng)導(dǎo)者 Ferguson 認(rèn)同了 Coveney 的大部分意見。但他也表示：“只不過，在三月份我們尚無能力進(jìn)行這樣的模擬測試。”Ferguson 同時表示，帝國理工團(tuán)隊已經(jīng)對模型進(jìn)行了很大的改進(jìn)，現(xiàn)在模型已經(jīng)可以得到包含概率的混合結(jié)果了。例如，他們現(xiàn)在使用貝葉斯概率來表示 CovidSim 輸入的不確定性。這種做法在一些流行病學(xué)模型中很常見，例如口蹄疫。

還有一個更簡單模型的預(yù)測結(jié)果被用來建議英國政府本月應(yīng)重新執(zhí)行封鎖政策。這種模型比CovidSim更靈活：“基于不確定性方面的考量，如果我們可以一周多次運(yùn)行模擬程序，實時擬合數(shù)據(jù)要容易多了。”Ferguson 表示。

Coveney 表示，“這樣聽上去就像是在做正確的改進(jìn)，且與我們的預(yù)測結(jié)果也一致了。”

Ferguson 表示，技術(shù)方案的選擇通常取決于對計算能力的權(quán)衡?！叭绻阆胍话逡谎壅_地描述所有的不確定性，用一個計算難度較小的模型會更加容易。”

英國牛津大學(xué)的氣候物理學(xué)家 Tim Palmer 認(rèn)為，使用貝葉斯工具是進(jìn)步的做法。Tim 率先在天氣預(yù)報中使用了集成建模。但也只有通過在最強(qiáng)大的計算機(jī)上運(yùn)行的集成建模技術(shù)，我們才能得到最可靠的流行病預(yù)測。在政府間氣候變化專門委員會（Intergovernmental Panel on Climate Change，IPCC）的協(xié)調(diào)下，這些新技術(shù)提高了氣候預(yù)測模型的可靠性。

Palmer 也表示，流行病模型預(yù)測也需要類似IPCC的機(jī)構(gòu)，我們需要某些國際間合作的設(shè)施，我們可以在這樣的設(shè)施中開發(fā)流行病模型。情況緊急，這件事的推進(jìn)將會很倉促，但是我們需要某種國際組織來綜合全世界的流行病學(xué)模型進(jìn)行預(yù)測。

Simulating the pandemic: What COVID forecasters can learn from climate model

翻譯自：https://www.nature.com/articles/d41586-020-03208-1

作者：Leo

審校：趙雨亭

編輯：鄧一雪

復(fù)雜科學(xué)最新論文

集智斑圖頂刊論文速遞欄目上線以來，持續(xù)收錄來自Nature、Science等頂刊的最新論文，追蹤復(fù)雜系統(tǒng)、網(wǎng)絡(luò)科學(xué)、計算社會科學(xué)等領(lǐng)域的前沿進(jìn)展?，F(xiàn)在正式推出訂閱功能，每周通過微信服務(wù)號「集智斑圖」推送論文信息。掃描下方二維碼即可一鍵訂閱：