“AI制藥”熱潮之后：智能算法如何加速藥物靶點(diǎn)發(fā)現(xiàn)？

澎湃新聞?dòng)浾?季敬杰

2026-04-24 08:44

來源：澎湃新聞

聽全文

前幾年，“AI制藥”曾是科技與醫(yī)藥界最炙手可熱的名詞之一。很多人一度想象，只要把海量數(shù)據(jù)喂給AI算法，很快就能造出靈丹妙藥。而幾年過去，當(dāng)我們走進(jìn)藥房，真正由AI完全自主研發(fā)并獲批上市的藥物依然寥寥無幾。這不禁讓人產(chǎn)生疑問：AI在藥物發(fā)現(xiàn)中到底扮演著怎樣的角色？

日前，英矽智能（Insilico Medicine）、安斯泰來制藥（Astellas Pharma）等多家機(jī)構(gòu)的科學(xué)家在《自然綜述·藥物發(fā)現(xiàn)》（Nature Reviews Drug Discovery）上聯(lián)合發(fā)表了一篇綜述文章，系統(tǒng)性地解答了這個(gè)問題。該研究指出，目前AI最為深刻的影響發(fā)生在新藥研發(fā)的最前端——靶點(diǎn)發(fā)現(xiàn)與評(píng)估?？茖W(xué)家已經(jīng)能夠通過日益豐富的AI算法工具，大大加快靶點(diǎn)篩選與發(fā)現(xiàn)的過程，但仍面臨實(shí)驗(yàn)驗(yàn)證、可解釋性等問題。

通過數(shù)據(jù)“理解”疾病

“藥物發(fā)現(xiàn)與開發(fā)極其耗時(shí)、昂貴且充滿風(fēng)險(xiǎn)，而找準(zhǔn)正確的藥物靶點(diǎn)，是提高研發(fā)成功率的關(guān)鍵?！痹撜撐膶懙??！鞍悬c(diǎn)”就是藥物要“擊中”的目標(biāo)，它們通常是人體內(nèi)某種特定的蛋白質(zhì)或基因，在疾病發(fā)生的過程中扮演關(guān)鍵角色。藥物分子就像一把鑰匙，只有找到疾病對(duì)應(yīng)靶點(diǎn)并與之有效結(jié)合，才能改變細(xì)胞的運(yùn)行狀態(tài)，從而治愈疾病。

傳統(tǒng)的靶點(diǎn)發(fā)現(xiàn)無異于大海撈針。人類大約有兩萬個(gè)蛋白質(zhì)編碼基因，但迄今為止，全球所有獲批藥物所針對(duì)的靶點(diǎn)只有716個(gè)。找到靶點(diǎn)之后，還要篩選和設(shè)計(jì)出針對(duì)它的藥物分子，再進(jìn)入漫長(zhǎng)且昂貴的動(dòng)物和人體實(shí)驗(yàn)驗(yàn)證階段。

傳統(tǒng)的靶點(diǎn)發(fā)掘過程極度依賴科學(xué)家的直覺乃至偶然的運(yùn)氣。如果一開始找的靶點(diǎn)不對(duì)，藥物分子在實(shí)驗(yàn)中效果不佳，就意味著大量的資源浪費(fèi)。面對(duì)廣闊且未知的疾病靶點(diǎn)的“海洋”，人類的算力顯得捉襟見肘，而這正是AI大展拳腳的地方。

AI算法的基本原理是通過數(shù)據(jù)的學(xué)習(xí)，發(fā)現(xiàn)隱藏的模式，進(jìn)而做出預(yù)測(cè)。人類的生命科學(xué)以及疾病研究已經(jīng)產(chǎn)生了大量數(shù)據(jù)，AI能夠高效解析其中的關(guān)聯(lián)。首先是各種科研項(xiàng)目中得到的“組學(xué)”數(shù)據(jù)，比如基因組、蛋白質(zhì)組，它們記錄著疾病發(fā)生時(shí)分子層面的細(xì)微變化。其次是細(xì)胞圖像數(shù)據(jù)，AI可以通過觀察細(xì)胞形態(tài)的微妙變化來尋找線索。

此外，還有人類已經(jīng)發(fā)現(xiàn)的蛋白質(zhì)網(wǎng)絡(luò)、代謝通路等“知識(shí)圖譜”，其中記錄著生物體和細(xì)胞內(nèi)部的復(fù)雜關(guān)系。AI還可以學(xué)習(xí)海量科學(xué)文獻(xiàn)、臨床試驗(yàn)記錄甚至專利報(bào)告，從中自動(dòng)挖掘出連人類專家都可能忽略的潛在聯(lián)系。當(dāng)這些線索被拼湊起來，AI就有可能找出人類沒有注意到乃至從未設(shè)想過的疾病靶點(diǎn)。

AI算法：總結(jié)經(jīng)驗(yàn)與探索未知

如何讓AI學(xué)會(huì)像頂尖生物學(xué)家一樣思考？該研究指出，不同的AI算法能夠在靶點(diǎn)發(fā)現(xiàn)中承擔(dān)不同任務(wù)。

最常用的是“監(jiān)督學(xué)習(xí)”?？茖W(xué)家把已知成功的“藥物-靶點(diǎn)”配對(duì)信息交給AI，AI如同學(xué)生“刷題”一般，通過學(xué)習(xí)這些成功案例的特征并尋找它們的共性，最終在未知的蛋白質(zhì)中，預(yù)測(cè)出哪些也有潛力成為新藥物的靶點(diǎn)。

例如，文章中提到了一種名為BANDIT的監(jiān)督學(xué)習(xí)模型，它成功推斷出一種原本作用機(jī)制不明的抗癌藥物（ONC201），其實(shí)是精準(zhǔn)打擊了一個(gè)名叫DRD2的靶點(diǎn)，這直接推動(dòng)了該藥物在特定腦瘤中的臨床試驗(yàn)并最終獲得加速批準(zhǔn)。

而面對(duì)那些沒有標(biāo)準(zhǔn)答案的領(lǐng)域，則可以使用“無監(jiān)督學(xué)習(xí)”和“表征學(xué)習(xí)”算法，將那些表現(xiàn)出相似異常的基因或蛋白質(zhì)歸類，從而在混亂中尋找規(guī)律，發(fā)現(xiàn)隱藏的疾病通路。比如，“圖神經(jīng)網(wǎng)絡(luò)”（GNN）算法能夠在學(xué)習(xí)分子數(shù)據(jù)后建立起疾病、基因、蛋白質(zhì)之間的關(guān)系網(wǎng)絡(luò)，通過分析關(guān)鍵樞紐位置來找到重要靶點(diǎn)。

近年來備受矚目的生成式AI和大語言模型也開始進(jìn)入靶點(diǎn)發(fā)現(xiàn)領(lǐng)域。就像語言模型可以寫詩寫代碼一樣，經(jīng)過海量生物醫(yī)學(xué)知識(shí)訓(xùn)練的“生物大模型”可以充當(dāng)虛擬的疾病生物學(xué)家，甚至通過學(xué)習(xí)基因語言來預(yù)測(cè)基因變化。比如谷歌開發(fā)的“AI聯(lián)合科學(xué)家”（AI co-scientist）系統(tǒng)，能夠自主生成科學(xué)假設(shè)，互相辯論，并在肝臟纖維化等疾病中成功挖掘出全新的治療靶點(diǎn)。

找到靶點(diǎn)只是第一步，一些生成式AI算法還能幫助進(jìn)行成藥性與安全性評(píng)估。AlphaFold等模型能精準(zhǔn)預(yù)測(cè)蛋白質(zhì)三維結(jié)構(gòu)，模擬靶點(diǎn)的立體結(jié)構(gòu)，評(píng)估它是否適合開發(fā)藥物。一些模型甚至能生成逼真的虛擬細(xì)胞數(shù)據(jù)，在計(jì)算機(jī)里模擬基因被敲除后的反應(yīng)。

數(shù)據(jù)質(zhì)量與可解釋性難題

目前成功進(jìn)入臨床的AI靶點(diǎn)仍然不多。論文列舉了幾個(gè)已經(jīng)走進(jìn)臨床試驗(yàn)的案例，如 TNIK（用于肺纖維化）和 PIKfyve（用于漸凍癥），說明 AI 的確能夠幫助找到新方向，但這些案例也暴露出現(xiàn)實(shí)的困難，例如有些靶點(diǎn)最終在臨床中仍未表現(xiàn)出足夠療效。

論文梳理了AI在藥物靶點(diǎn)發(fā)現(xiàn)中面臨的挑戰(zhàn)。首先是數(shù)據(jù)質(zhì)量，許多公開的組學(xué)數(shù)據(jù)庫存在標(biāo)注不一致、背景信息缺失、樣本偏向歐美人群等問題，使模型難以泛化到更廣人群。科研文獻(xiàn)也存在研究無法被重復(fù)驗(yàn)證的情況。該論文指出，某大型復(fù)現(xiàn)項(xiàng)目中只有約40%實(shí)驗(yàn)被成功重復(fù)，意味著AI可能會(huì)從錯(cuò)誤數(shù)據(jù)中學(xué)習(xí)，自然也難以進(jìn)行有效的預(yù)測(cè)。

其次是可解釋性。靶點(diǎn)發(fā)現(xiàn)關(guān)乎重大科研投資，科研人員和藥企需要知道 AI預(yù)測(cè)靶點(diǎn)背后的邏輯和證據(jù)，否則很難采納它的建議。因此，新一代AI模型正嘗試在提供預(yù)測(cè)的同時(shí)給出證據(jù)路徑，比如引用關(guān)鍵文獻(xiàn)或解釋網(wǎng)絡(luò)中的重要關(guān)系。

論文指出，在未來，真正有潛力改變行業(yè)的是AI驅(qū)動(dòng)的閉環(huán)實(shí)驗(yàn)平臺(tái)，其中由AI模型先提出潛在的靶點(diǎn)假設(shè)，再由自動(dòng)化的機(jī)器人實(shí)驗(yàn)室接管工作，對(duì)活體細(xì)胞進(jìn)行藥物測(cè)試。實(shí)驗(yàn)產(chǎn)生的海量結(jié)果會(huì)實(shí)時(shí)傳回給AI，AI據(jù)此修正自己的錯(cuò)誤，不斷進(jìn)化，并馬上提出下一輪假設(shè)。如果這一模式成熟，靶點(diǎn)發(fā)現(xiàn)的速度與可靠性都可能實(shí)現(xiàn)質(zhì)的飛躍。

責(zé)任編輯：宦艷紅

圖片編輯：李晶昀

校對(duì)：姚易琪

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#AI制藥 #AI藥物 #靶點(diǎn)發(fā)現(xiàn)