藥物發(fā)現(xiàn)領域正處于一個迷人的轉(zhuǎn)折點。這個問題的物理學是可以理解和計算的,然而量子力學計算太昂貴和耗時。 Eroom’s Law 觀察到,盡管技術有所進步,但藥物發(fā)現(xiàn)速度越來越慢,成本越來越高。
最近一篇研究 GPU 計算和深度學習在藥物發(fā)現(xiàn)中的轉(zhuǎn)變作用 顯示出這種趨勢可能很快逆轉(zhuǎn)的希望。
該綜述發(fā)表在 自然機器智能 上,詳細介紹了從分子模擬和蛋白質(zhì)結構測定到生成性藥物設計等挑戰(zhàn)方面的許多進展,這些挑戰(zhàn)加速了計算機輔助藥物發(fā)現(xiàn)工作流程。在高度并行化 GPU 和支持 GPU 的算法的發(fā)展推動下,這些進步為計算化學和結構生物學開發(fā)新藥帶來了新的可能性。
研究人員在藥物發(fā)現(xiàn)和機器學習方面的合作,以確定 GPU 加速的深度學習工具,為這些挑戰(zhàn)創(chuàng)造了新的可能性,如果這些挑戰(zhàn)得到解決,將成為更快、更廉價藥物開發(fā)的關鍵。
研究作者寫道:“我們預計,越來越強大的 GPU 體系結構的日益可用性,以及先進 DL 策略和 GPU 加速算法的開發(fā),將有助于讓世界范圍內(nèi)更廣泛的科學界能夠負擔得起藥物發(fā)現(xiàn),并使其易于獲得?!?。
分子模擬與自由能計算
分子模擬為藥物發(fā)現(xiàn)中的許多重要計算提供了動力,是一種計算顯微鏡,可用于利用物理定律進行虛擬實驗。 GPU 驅(qū)動的分子動力學框架可以模擬細胞的機制,從而深入了解基本機制,并通過自由能微擾等計算計算候選藥物與其預期蛋白質(zhì)靶點的結合強度。對分子模擬來說,最重要的是計算勢能面。
在重點綜述中,作者介紹了機器學習潛能是如何從根本上改變分子模擬的。機器學習勢或神經(jīng)網(wǎng)絡勢是一種模型,用于學習能量和力,以便用量子力學的精度進行分子模擬。
作者報告說,自由能模擬從 GPU 中受益匪淺。基于神經(jīng)網(wǎng)絡的力場,如 ANI 和 AIMNet 減少了絕對束縛自由能誤差和力場開發(fā)的人力。其他深度學習框架,如重加權自動編碼器 Bayes (RAVE) 正在推動分子模擬的邊界,采用增強的采樣方案來估計蛋白質(zhì)-配體結合自由能。像 Deep Docking 這樣的方法現(xiàn)在正在使用 DL 模型來估計分子對接分數(shù)并加速虛擬篩選。
蛋白質(zhì)結構測定進展
在過去的 10 年中,有一個 蛋白質(zhì)結構數(shù)量增加 2.13 倍 是公開的。低溫結構沉積速率的增加和蛋白質(zhì)組學的增殖進一步促進了結構和序列數(shù)據(jù)的豐富。
CryoEM 憑借其簡單、魯棒性和對大分子成像的能力,預計在未來幾年內(nèi)將主導高分辨率大分子結構測定。它對樣品的破壞性也較小,因為它不需要結晶。
然而,數(shù)據(jù)存儲需求和計算需求是相當大的。該研究的作者詳細說明了像 DEFMap 和 DeepPicker 這樣的基于深度學習的方法是如何在 GPU 的幫助下為 CryoEM 的高通量自動化提供動力,以確定蛋白質(zhì)結構的。通過 DEFMap ,可以理解局部密度數(shù)據(jù)關系的分子動力學模擬與深度學習算法相結合,以提取與隱藏原子漲落相關的動力學。
用原子精確度預測蛋白質(zhì)結構的 AlphaFold-2 和 RoseTTAFold 模型的突破性發(fā)展,正迎來一個新的結構測定時代。 Mosalaganti 等人最近發(fā)表的一篇文章強調(diào)了這些模型的預測能力。它還展示了如何將蛋白質(zhì)結構預測模型與 cryoelectron 層析成像( CryoET )相結合,以確定核孔復合體的結構,核孔復合體是一種由 1000 多個蛋白質(zhì)組成的大規(guī)模細胞結構。 MosaLaMagniti 等人繼續(xù)對核孔復合體進行粗粒度分子動力學模擬。這讓我們對基于人工智能的蛋白質(zhì)結構預測模型、 CryoEM 和 CryoET 的結合所帶來的各種模擬的未來一瞥。
生成模型和深度學習架構
藥物發(fā)現(xiàn)的核心挑戰(zhàn)之一是化學空間的巨大規(guī)模。有 10 個60因此,研究人員需要一種有組織和可搜索的化學空間表示。通過在現(xiàn)有分子的大基礎上進行訓練,生成模型可以學習化學規(guī)則,并在模型的潛在空間中表示化學空間。
生成模型通過隱含地學習化學規(guī)則,產(chǎn)生了他們以前從未見過的分子。這將導致比原始訓練數(shù)據(jù)庫中的分子具有指數(shù)級的唯一性和有效性。研究人員還可以構建數(shù)值優(yōu)化算法,在模型的潛在空間中運行,以搜索最優(yōu)分子。這些在潛在空間中起著梯度的作用,計算化學家可以利用這些梯度來引導分子生成朝著理想的性質(zhì)發(fā)展。
作者報告稱,許多最先進的深度學習架構正在推動更強大的生成模型。圖形神經(jīng)網(wǎng)絡、生成對抗網(wǎng)絡、變分編碼器和轉(zhuǎn)換器正在創(chuàng)建生成模型,以改變分子表征和從頭藥物設計。
卷積神經(jīng)網(wǎng)絡,如化學感受,已被訓練用于預測化學性質(zhì),如毒性、活性和溶劑化。遞歸神經(jīng)網(wǎng)絡具有學習化學空間潛在表示的能力,可以對多個數(shù)據(jù)集和任務進行預測。
MegaMolBART 是一種基于變壓器的生成模型,在 AI 超級計算規(guī)模上實現(xiàn)了 98.7% 的獨特分子生成。借助對模型并行訓練的支持, MegaMolBART 可以訓練 1B +個參數(shù)模型,以便在大型化學數(shù)據(jù)庫上進行訓練,并且可以針對廣泛的任務進行調(diào)整。
科學計算的百萬倍飛躍
今天, GPU 正在加速計算機輔助藥物發(fā)現(xiàn)工作流程的每一步,從目標闡明到 FDA 批準,在所有方面都顯示出了有效性。隨著計算速度的加快,科學計算正在 GPU 上大規(guī)模并行化。
超級計算機有助于將這些計算擴展到多個節(jié)點和 GPU ,利用快速通信結構將 GPU 和節(jié)點連接在一起。
關于作者
AbrahamStern )是 NVIDIA Clara Discovery 的產(chǎn)品經(jīng)理。他的興趣在于科學計算和機器學習的交叉點,尤其是在化學和藥物發(fā)現(xiàn)問題上。 Abe 在南佛羅里達大學獲得了計算化學博士學位,之前是加州大學歐文分校的博士后學者。
Nate Bradford 是 NVIDIA 的醫(yī)療內(nèi)容經(jīng)理,分享 AI 框架和解決方案,以幫助開發(fā)人員、研究人員和創(chuàng)新者完成畢生的工作。從加速新療法的發(fā)現(xiàn)到實現(xiàn)醫(yī)療設備的實時傳感,人工智能正在開創(chuàng)醫(yī)療保健的新時代。
審核編輯:郭婷
-
變壓器
+關注
關注
159文章
7503瀏覽量
135751 -
NVIDIA
+關注
關注
14文章
5025瀏覽量
103266 -
AI
+關注
關注
87文章
31155瀏覽量
269487
發(fā)布評論請先 登錄
相關推薦
評論