世界上最大的遺傳學研究鑒定數(shù)據(jù)庫使科學家能夠訪問NVIDIA Clara Parabricks,以加速推進基因組學和藥物研發(fā)領域的發(fā)展。
英國生物樣本庫(UK Biobank)通過讓其龐大的數(shù)據(jù)集和 NVIDIA GPU 加速分析工具在云上可用,使科學家能夠訪問更多高質量基因組數(shù)據(jù)和分析。
英國生物樣本庫是一個大規(guī)模的生物醫(yī)學數(shù)據(jù)庫和研究資源平臺,擁有來自英國各地超過50萬名參與者的去標識化基因數(shù)據(jù)集以及醫(yī)學成像和病例數(shù)據(jù),使用者涵蓋全球范圍內25,000多名注冊研究員。
再生元遺傳學研究中心(Regeneron Genetics Center)是生物技術領軍企業(yè) Regeneron 的高通量測序中心。該中心最近與英國生物樣本庫合作,對所有生物庫參與者的外顯子組(基因組蛋白質編碼部)進行了測序和分析。
Regeneron 的團隊在外顯子組測序流程中采用了 NVIDIA Clara Parabricks,這是一款對下一代測序數(shù)據(jù)進行二級基因組分析的軟件套件。
英國生物樣本庫已經(jīng)發(fā)布了45萬個此類外顯子組,以供獲批的研究人員使用,如今還通過其基于云的研究分析平臺,為科學家提供六個月免費使用 Clara Parabricks 的機會。此研究分析平臺是由生物信息學平臺 DNAnexus 開發(fā)的,讓科學家能夠在 AWS云中使用運行于 NVIDIA GPU 之上的 Clara Parabricks 。
英國生物樣本庫副首席執(zhí)行官 Mark Effingham 博士表示:“正如 Regeneron 所展示的那樣,使用 Clara Parabricks 的 GPU加速,可實現(xiàn)大規(guī)模處理基因組數(shù)據(jù)集時所需的吞吐量、速度和再現(xiàn)性。英國有許多研究團隊都非常希望能夠在我們的平臺上使用這些加速功能,以獲取廣泛的數(shù)據(jù)集。"
Regeneron的外顯子組研究借助Clara Parabricks加速
Regeneron 的研究員使用 NVIDIA Clara Parabricks 的 DeepVariant Germline Pipeline ,借助專門針對該遺傳中心工作流程的模型來運行分析。
研究人員確定了1200萬個編碼變體和數(shù)百個與健康相關的基因,某些基因與肝病和眼病的風險增加有關,而其他基因則與糖尿病和哮喘的風險降低有關。
研究人員用于高質量變異體檢測的獨特工具集可通過研究分析平臺(Research Analysis Platform)提供給英國生物樣本庫的注冊用戶,進而使科學家能夠通過運行用于生成初始參考數(shù)據(jù)集的生物信息學管道,將自己的外顯子組數(shù)據(jù)與來自英國生物樣本庫的測序外顯子組數(shù)據(jù)相協(xié)調。
基于云的平臺可提高訪問的公平性
研究人員在破譯人類以及感染人類的病毒和細菌的基因密碼時,往往會受制于自身可用的計算資源。
英國生物樣本庫正在通過向全球科學家開放其數(shù)據(jù)集,實現(xiàn)訪問的民主化,重點是進一步擴大處于職業(yè)生涯早期以及中低收入國家的研究人員使用的范圍。研究人員無需下載這一巨大的數(shù)據(jù)集,通過網(wǎng)絡瀏覽器進入英國生物樣本庫的云平臺,就能在自己的計算資源上使用。
Effingham 說道:“有研究員和臨床醫(yī)生與我們聯(lián)系,他們希望訪問英國生物樣本庫的數(shù)據(jù),但卻苦于連處理小規(guī)模數(shù)據(jù)所需的基本計算能力都不具備。而基于云的平臺則能夠提供訪問大規(guī)模外顯子組測序和全基因組測序分析所需的世界級技術。”
Effingham 表示,使用該平臺的研究員只需支付自身分析的計算成本、以及存儲生物樣本庫PB級數(shù)據(jù)集生成的新數(shù)據(jù)的費用。
在 DNAnexus 平臺上使用 Clara Parabricks 有助于減少這種基因組分析的時間和成本,在5分鐘內就能完成在32-vCPU機器上需要花費一小時計算的全外顯子組分析,同時也能降低大約40%的成本。
外顯子組測序為精準醫(yī)療提供洞察
對于研究遺傳學和疾病之間聯(lián)系的研究員,外顯子組測序是一個重要的工具,而英國生物樣本庫的數(shù)據(jù)集就包含近50萬參與者的外顯子組。
外顯子組約占人類基因組的1.5%,由所有已知的基因及其調控因子組成。通過研究大量人群的外顯子組遺傳變異,科學家可以更好地了解人群結構劃分,幫助研究員解決進化問題并探究基因組的工作原理。
利用像英國生物樣本庫這樣的大規(guī)模數(shù)據(jù)集,還能確定與遺傳疾病相關的特定基因變異,包括心血管疾病、神經(jīng)退行性疾病和某些癌癥。
Effingham 表示,外顯子組測序甚至還能揭示潛在的遺傳驅動因素,這些因素可能會增加或減少個人因COVID-19感染而患嚴重疾病的風險。隨著疫情的持續(xù),英國生物樣本庫正在向其數(shù)據(jù)庫中添加COVID病例的數(shù)據(jù)、疫苗接種狀態(tài)、醫(yī)學成像數(shù)據(jù)、以及數(shù)千名參與患者的愈后情況。
原文標題:英國生物樣本庫利用 NVIDIA Clara Parabricks 推進基因組學研究
文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。
審核編輯:湯梓紅
-
數(shù)據(jù)
+關注
關注
8文章
7057瀏覽量
89096 -
NVIDIA
+關注
關注
14文章
4991瀏覽量
103134 -
gpu
+關注
關注
28文章
4742瀏覽量
128976
原文標題:英國生物樣本庫利用 NVIDIA Clara Parabricks 推進基因組學研究
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論