據有關統計:傳統藥物研發耗時耗力,一般需要超過 15 年,耗資 30 多億美元,但每年上市的原創新藥僅十幾種。目前,已知的 4000 多種疾病中 90% 尚無藥可治。
如何加速新藥研發?騰訊表示,為解決困難,開始做些嘗試——發布首個 AI 驅動的藥物發現平臺 “云深智藥(iDrug)”。它致力于幫助用戶大幅度減少尋找潛在活性藥物的時間和成本。“云深”源自唐詩《尋隱者不遇》的 “只在此山中,云深不知處”,新藥的發現過程正是如此。
基于騰訊 AI Lab 自主研發的深度學習算法,提供數據庫和云計算支持,能覆蓋臨床前新藥研發全部流程的五大模塊。
騰訊表示,其 AI Lab 自研的預測蛋白質結構的新思路,該算法在 2020 年起加入行業頂級評估平臺 CAMEO(全球唯一的蛋白質結構預測自動評估平臺)。
目前平臺上已經運行十個左右研發項目——包括對抗新冠病毒藥物的虛擬篩選和性質預測,目前篩選得到的化合物在實驗驗證中。
平臺如何為藥物研發加速助力?
疾病的形成由很多物質組成,最終形成疾病的關鍵蛋白,我們把它設為靶點。
解決靶點,就有可能解決疾病。
而解決靶點,就需要知道它的蛋白結構,再去找到對應的藥物破解它。
了解關鍵蛋白的結構,設計藥物分子來抑制它的功能,疾病就會解除。
過去通過實驗尋找針對疾病靶點的有效藥物,往往難度大、周期長、費用高。
從進入臨床試驗的行業案例來看,在新藥研發中,AI 技術最快可以將新藥發現周期從 3-6 年縮短到 6 個月至 1 年;從技術層面看,云深智藥平臺同樣具備相似的能力。它能最快的時間,模擬鎖的結構。
結合 AI 深度學習模型預測的蛋白質結構以及蛋白質功能(蛋白質折疊),就可以有針對性地設計藥物分子來抑制它的功能,將疾病通路阻斷。
基于自監督學習的蛋白質折疊方法,不依賴同源序列,而是直接從序列數據庫中通過自監督學習,學得共進化的模式,從而能夠從無到有地產生出含有共進化信息的偽同源序列,并最終讓這些蛋白能夠有效折疊。
通過一種基于深度學習的可迭代方法,有效整合模板建模與自由建模,首次提出了動態的、可迭代的氨基酸對特異性的約束條件,顯著提高了建模的精度,從而更好的折疊蛋白。
云深智藥平臺,不僅可以根據鎖的類型和形狀來設計或者選擇合適的候選鑰匙,還能吸收其他人開鎖經驗,能極大節省人力物力。
可通過 AI“遷移 ”從其他靶點上面學習到的知識(如分子局部結構對靶點結合強度的影響),應用在目標靶點上來提高模型預測精度。
目前該算法在數千個實驗數據集上預測精度(預測活性與實驗測量活性的相關性)的中位數從目前最高記錄 0.36 提升到 0.42,且篩選可用模型的百分比從 56% 提升到 60%。
獲悉,平臺還支持 ADMET 性質預測功能(藥物的吸收、分配、代謝、排泄和毒性),目前已經開源。該平臺藥物小分子 ADMET 屬性預測模塊已在多個數據集上比學術界現有最好模型提高 3%~11%;在合作伙伴的反饋中,平臺的自研算法精度超過現有商業軟件 6%~37% 不等。
當然,除了上述在算法領域不斷創新,平臺還提供算力和數據庫的一體化服務支撐。
數據方面,分子大數據是藥物研發中的基礎設施。
云深智藥平臺使用的分子大數據,基于現有公開數據集,進行了多個環節的精細清洗整理工作,得到可以用于直接構建深度學習模型的藥物分子大數據集。
算力方面,騰訊云為云深智藥平臺提供數據庫服務。
藥企、科研機構登錄平臺即可開展研究,不需要再自行部署計算資源,從而能盡快將 AI 能力引入現有的研發流程中。
責任編輯:tzh
-
AI
+關注
關注
87文章
30896瀏覽量
269111 -
騰訊
+關注
關注
7文章
1655瀏覽量
49440 -
學習算法
+關注
關注
0文章
15瀏覽量
7469
發布評論請先 登錄
相關推薦
評論