(文章來源:孜然實驗室)
冷泉港實驗室的定量生物學家大衛·麥坎德里斯(David McCandlish)和Zhou Juannan開發了一種具有預測能力的算法,使科學家能夠觀察到特定的基因突變如何結合在一起,從而使關鍵蛋白質在物種進化過程中發生變化。
在《自然通訊》中描述的算法稱為“最小異位顯性插值法”,可以直觀地顯示蛋白質如何進化為更高效或根本無效。他們比較了數千種蛋白質的功能,發現了突變如何導致蛋白質從一種功能形式進化為另一種形式的模式。
異位顯性(Epistasis)描述了基因突變之間的相互作用,其中一個基因的作用取決于另一個基因的存在。在許多情況下,科學家認為,當現實與他們的預測模型不一致時,基因之間的這些相互作用就會發揮作用。考慮到這一點,麥坎德里斯在假設每個突變都很重要的前提下創建了這個新算法。術語“插值”描述了預測物種可能實現最佳蛋白質功能的突變的進化路徑的行為。
研究人員通過測試構成鏈球菌GB1蛋白的基因中發生的特定突變的影響,創建了該算法。他們之所以選擇GB1蛋白,是因為它具有復雜的結構,它將產生大量可能的突變,并可以以多種可能的方式進行組合。
麥坎德里斯說:“由于這種復雜性,該數據集的可視化變得非常重要。我們希望將數字變成一張圖片,以便我們更好地理解[數據]告訴我們的內容。”麥坎德里斯在辦公室的照片。他指的是他所謂的蛋白質GB1的可視化“進化空間”。圖片:CSHL
可視化效果就像拓撲圖。高度和顏色與蛋白質活性水平相關,圖上各點之間的距離代表突變發展到該活性水平需要多長時間。天然的GB1蛋白質具有適度的蛋白質活性水平,但可能會通過在幾個不同位置發生的一系列突變而演變為更高的蛋白質活性水平。麥坎德里斯將蛋白質的進化路徑比喻為遠足,蛋白質是試圖最有效地到達最高或最佳山峰的遠足者。基因以相同的方式進化:通過突變尋求阻力最小和效率最高的途徑。
為了到達山脈中的下一個最高峰,遠足者更有可能沿著山脊線旅行,而不是一路徒步回到山谷。沿著山脊線有效地避開了另一個可能艱難的上升過程。在可視化中,山谷是藍色區域,其中突變組合導致最低水平的蛋白質活性。該算法顯示了每個可能的突變序列的最佳程度,以及一個遺傳序列突變為許多其他可能的序列所需的時間。在COVID-19大流行等情況下,該工具的預測能力可能特別有價值。研究人員需要知道病毒的發展過程,以便在病毒到達最危險的形式之前知道在哪里以及何時攔截它。
麥坎德里斯解釋說,該算法還可以幫助“理解病毒在進化過程中可能采取的遺傳途徑,以逃避免疫系統或獲得耐藥性。如果我們能夠理解可能的途徑,那么也許我們可以設計出可以阻止進化或逃避免疫的療法。”這種預測遺傳算法還有其他潛在應用,包括藥物開發和農業。
(責任編輯:fqj)
-
AI
+關注
關注
87文章
31103瀏覽量
269435 -
智能算法
+關注
關注
0文章
77瀏覽量
11943
發布評論請先 登錄
相關推薦
評論