- +1
“AI制藥”熱潮之后:智能算法如何加速藥物靶點(diǎn)發(fā)現(xiàn)?
前幾年,“AI制藥”曾是科技與醫(yī)藥界最炙手可熱的名詞之一。很多人一度想象,只要把海量數(shù)據(jù)喂給AI算法,很快就能造出靈丹妙藥。而幾年過去,當(dāng)我們走進(jìn)藥房,真正由AI完全自主研發(fā)并獲批上市的藥物依然寥寥無幾。這不禁讓人產(chǎn)生疑問:AI在藥物發(fā)現(xiàn)中到底扮演著怎樣的角色?
日前,英矽智能(Insilico Medicine)、安斯泰來制藥(Astellas Pharma)等多家機(jī)構(gòu)的科學(xué)家在《自然綜述·藥物發(fā)現(xiàn)》(Nature Reviews Drug Discovery)上聯(lián)合發(fā)表了一篇綜述文章,系統(tǒng)性地解答了這個(gè)問題。該研究指出,目前AI最為深刻的影響發(fā)生在新藥研發(fā)的最前端——靶點(diǎn)發(fā)現(xiàn)與評(píng)估??茖W(xué)家已經(jīng)能夠通過日益豐富的AI算法工具,大大加快靶點(diǎn)篩選與發(fā)現(xiàn)的過程,但仍面臨實(shí)驗(yàn)驗(yàn)證、可解釋性等問題。
通過數(shù)據(jù)“理解”疾病
“藥物發(fā)現(xiàn)與開發(fā)極其耗時(shí)、昂貴且充滿風(fēng)險(xiǎn),而找準(zhǔn)正確的藥物靶點(diǎn),是提高研發(fā)成功率的關(guān)鍵?!痹撜撐膶懙??!鞍悬c(diǎn)”就是藥物要“擊中”的目標(biāo),它們通常是人體內(nèi)某種特定的蛋白質(zhì)或基因,在疾病發(fā)生的過程中扮演關(guān)鍵角色。藥物分子就像一把鑰匙,只有找到疾病對(duì)應(yīng)靶點(diǎn)并與之有效結(jié)合,才能改變細(xì)胞的運(yùn)行狀態(tài),從而治愈疾病。
傳統(tǒng)的靶點(diǎn)發(fā)現(xiàn)無異于大海撈針。人類大約有兩萬個(gè)蛋白質(zhì)編碼基因,但迄今為止,全球所有獲批藥物所針對(duì)的靶點(diǎn)只有716個(gè)。找到靶點(diǎn)之后,還要篩選和設(shè)計(jì)出針對(duì)它的藥物分子,再進(jìn)入漫長(zhǎng)且昂貴的動(dòng)物和人體實(shí)驗(yàn)驗(yàn)證階段。
傳統(tǒng)的靶點(diǎn)發(fā)掘過程極度依賴科學(xué)家的直覺乃至偶然的運(yùn)氣。如果一開始找的靶點(diǎn)不對(duì),藥物分子在實(shí)驗(yàn)中效果不佳,就意味著大量的資源浪費(fèi)。面對(duì)廣闊且未知的疾病靶點(diǎn)的“海洋”,人類的算力顯得捉襟見肘,而這正是AI大展拳腳的地方。
AI算法的基本原理是通過數(shù)據(jù)的學(xué)習(xí),發(fā)現(xiàn)隱藏的模式,進(jìn)而做出預(yù)測(cè)。人類的生命科學(xué)以及疾病研究已經(jīng)產(chǎn)生了大量數(shù)據(jù),AI能夠高效解析其中的關(guān)聯(lián)。首先是各種科研項(xiàng)目中得到的“組學(xué)”數(shù)據(jù),比如基因組、蛋白質(zhì)組,它們記錄著疾病發(fā)生時(shí)分子層面的細(xì)微變化。其次是細(xì)胞圖像數(shù)據(jù),AI可以通過觀察細(xì)胞形態(tài)的微妙變化來尋找線索。
此外,還有人類已經(jīng)發(fā)現(xiàn)的蛋白質(zhì)網(wǎng)絡(luò)、代謝通路等“知識(shí)圖譜”,其中記錄著生物體和細(xì)胞內(nèi)部的復(fù)雜關(guān)系。AI還可以學(xué)習(xí)海量科學(xué)文獻(xiàn)、臨床試驗(yàn)記錄甚至專利報(bào)告,從中自動(dòng)挖掘出連人類專家都可能忽略的潛在聯(lián)系。當(dāng)這些線索被拼湊起來,AI就有可能找出人類沒有注意到乃至從未設(shè)想過的疾病靶點(diǎn)。
AI算法:總結(jié)經(jīng)驗(yàn)與探索未知
如何讓AI學(xué)會(huì)像頂尖生物學(xué)家一樣思考?該研究指出,不同的AI算法能夠在靶點(diǎn)發(fā)現(xiàn)中承擔(dān)不同任務(wù)。
最常用的是“監(jiān)督學(xué)習(xí)”??茖W(xué)家把已知成功的“藥物-靶點(diǎn)”配對(duì)信息交給AI,AI如同學(xué)生“刷題”一般,通過學(xué)習(xí)這些成功案例的特征并尋找它們的共性,最終在未知的蛋白質(zhì)中,預(yù)測(cè)出哪些也有潛力成為新藥物的靶點(diǎn)。
例如,文章中提到了一種名為BANDIT的監(jiān)督學(xué)習(xí)模型,它成功推斷出一種原本作用機(jī)制不明的抗癌藥物(ONC201),其實(shí)是精準(zhǔn)打擊了一個(gè)名叫DRD2的靶點(diǎn),這直接推動(dòng)了該藥物在特定腦瘤中的臨床試驗(yàn)并最終獲得加速批準(zhǔn)。
而面對(duì)那些沒有標(biāo)準(zhǔn)答案的領(lǐng)域,則可以使用“無監(jiān)督學(xué)習(xí)”和“表征學(xué)習(xí)”算法,將那些表現(xiàn)出相似異常的基因或蛋白質(zhì)歸類,從而在混亂中尋找規(guī)律,發(fā)現(xiàn)隱藏的疾病通路。比如,“圖神經(jīng)網(wǎng)絡(luò)”(GNN)算法能夠在學(xué)習(xí)分子數(shù)據(jù)后建立起疾病、基因、蛋白質(zhì)之間的關(guān)系網(wǎng)絡(luò),通過分析關(guān)鍵樞紐位置來找到重要靶點(diǎn)。
近年來備受矚目的生成式AI和大語言模型也開始進(jìn)入靶點(diǎn)發(fā)現(xiàn)領(lǐng)域。就像語言模型可以寫詩寫代碼一樣,經(jīng)過海量生物醫(yī)學(xué)知識(shí)訓(xùn)練的“生物大模型”可以充當(dāng)虛擬的疾病生物學(xué)家,甚至通過學(xué)習(xí)基因語言來預(yù)測(cè)基因變化。比如谷歌開發(fā)的“AI聯(lián)合科學(xué)家”(AI co-scientist)系統(tǒng),能夠自主生成科學(xué)假設(shè),互相辯論,并在肝臟纖維化等疾病中成功挖掘出全新的治療靶點(diǎn)。
找到靶點(diǎn)只是第一步,一些生成式AI算法還能幫助進(jìn)行成藥性與安全性評(píng)估。AlphaFold等模型能精準(zhǔn)預(yù)測(cè)蛋白質(zhì)三維結(jié)構(gòu),模擬靶點(diǎn)的立體結(jié)構(gòu),評(píng)估它是否適合開發(fā)藥物。一些模型甚至能生成逼真的虛擬細(xì)胞數(shù)據(jù),在計(jì)算機(jī)里模擬基因被敲除后的反應(yīng)。
數(shù)據(jù)質(zhì)量與可解釋性難題
目前成功進(jìn)入臨床的AI靶點(diǎn)仍然不多。論文列舉了幾個(gè)已經(jīng)走進(jìn)臨床試驗(yàn)的案例,如 TNIK(用于肺纖維化)和 PIKfyve(用于漸凍癥),說明 AI 的確能夠幫助找到新方向,但這些案例也暴露出現(xiàn)實(shí)的困難,例如有些靶點(diǎn)最終在臨床中仍未表現(xiàn)出足夠療效。
論文梳理了AI在藥物靶點(diǎn)發(fā)現(xiàn)中面臨的挑戰(zhàn)。首先是數(shù)據(jù)質(zhì)量,許多公開的組學(xué)數(shù)據(jù)庫存在標(biāo)注不一致、背景信息缺失、樣本偏向歐美人群等問題,使模型難以泛化到更廣人群。科研文獻(xiàn)也存在研究無法被重復(fù)驗(yàn)證的情況。該論文指出,某大型復(fù)現(xiàn)項(xiàng)目中只有約40%實(shí)驗(yàn)被成功重復(fù),意味著AI可能會(huì)從錯(cuò)誤數(shù)據(jù)中學(xué)習(xí),自然也難以進(jìn)行有效的預(yù)測(cè)。
其次是可解釋性。靶點(diǎn)發(fā)現(xiàn)關(guān)乎重大科研投資,科研人員和藥企需要知道 AI預(yù)測(cè)靶點(diǎn)背后的邏輯和證據(jù),否則很難采納它的建議。因此,新一代AI模型正嘗試在提供預(yù)測(cè)的同時(shí)給出證據(jù)路徑,比如引用關(guān)鍵文獻(xiàn)或解釋網(wǎng)絡(luò)中的重要關(guān)系。
論文指出,在未來,真正有潛力改變行業(yè)的是AI驅(qū)動(dòng)的閉環(huán)實(shí)驗(yàn)平臺(tái),其中由AI模型先提出潛在的靶點(diǎn)假設(shè),再由自動(dòng)化的機(jī)器人實(shí)驗(yàn)室接管工作,對(duì)活體細(xì)胞進(jìn)行藥物測(cè)試。實(shí)驗(yàn)產(chǎn)生的海量結(jié)果會(huì)實(shí)時(shí)傳回給AI,AI據(jù)此修正自己的錯(cuò)誤,不斷進(jìn)化,并馬上提出下一輪假設(shè)。如果這一模式成熟,靶點(diǎn)發(fā)現(xiàn)的速度與可靠性都可能實(shí)現(xiàn)質(zhì)的飛躍。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




