誰能想到,一條不起眼的耳垂折痕,可能與冠心病發(fā)病的概率相關,因為它們關聯(lián)著同一個基因。
在人類表型組研究中,醫(yī)生可以通過觀察外觀表型,來判斷患者罹患冠心病的風險。可以說,人類表型組研究是“后基因時代”的戰(zhàn)略制高點,如果這條線被研究透徹,從微觀到宏觀的各個維度表型之間的關系都能一覽無遺,屆時,或許人類健康之謎就能被徹底解決。
近日,復旦大學攜手曙光共同建設的國際人類表型組學研究平臺(以下簡稱:研究平臺),通過對人類表型組在物理、化學和生物層面進行跨尺度多維度研究,滿足人類表型組數(shù)據的存儲、共享和應用,形成服務全國的生物醫(yī)學大數(shù)據研究與應用設施。
表型數(shù)據與信息技術 共筑“生命健康密碼”
人類表型組的研究需要信息技術提供強有力的計算工具,借助先進的IT技術解決方案,完成海量實驗數(shù)據的存儲、讀取與挖掘處理。同時,信息技術還有助于加強表型數(shù)據庫的數(shù)據管理、信息傳遞、檢索和資源共享等。
作為跨尺度多維度人類表型組研究平臺,這里設有人體成像與測量、睡眠與生物電、人體能量代謝艙等多個測量實驗室,可檢測約2萬個表型詞條,比如分子蛋白質組、分子代謝組、細胞表型、語音表型等等。這些人類表型組相關數(shù)據將用于探索基因、人體特征與疾病健康之間的關系,為疾病預防與干預提供關鍵線索與指引,解讀人類生命密碼所需的關鍵信息。
同時,研究平臺以海量表型數(shù)據資源的高等級安全保存為核心,實現(xiàn)數(shù)據資源的匯聚、管理、共享和挖掘,形成我國人群健康表型組標準化技術體系,構建中國健康人群表型圖譜及數(shù)據庫。
高效存儲共享與應用 提高組學科研質量
人類表型組項目涉及的主要應用為基因測序、序列拼接軟件如SOAP2,BWA,BWASW 、Bowtie/Bowtie 2SHARCGS等,在計算時會產生海量的中間數(shù)據。存儲系統(tǒng)性能的好壞對計算效率將產生很大影響。因此,在人類表型組項目中,一方面要保證存儲系統(tǒng)的高讀寫性能;另一方面,要減少序列拼接程序運行時對存儲系統(tǒng)的影響。
針對生物基因領域測序產生海量小文件的情況,曙光分布式存儲系統(tǒng)ParaStor通過Scale-Out橫向擴展、IB+RDMA高速互聯(lián)、內核態(tài)POSIX協(xié)議、智能SSD Cache及小文件聚合等技術,消除傳統(tǒng)的Scale-up縱向擴展存儲架構的性能局限性,有效解決生物基因應用中對海量大文件存儲場景高聚合帶寬、小文件存儲場景高IOPS的存儲需求。
ParaStor可通過性能與容量的線性增長,滿足對存儲系統(tǒng)數(shù)據處理能力和擴展性的要求。此外,針對業(yè)務系統(tǒng)對可靠性、穩(wěn)定性的需求,ParaStor分布式存儲系統(tǒng)通過多種技術手段,從物理底層到邏輯層全方位保證存儲系統(tǒng)高可靠性和高可用性。豐富的協(xié)議接口,多類型數(shù)據融合存儲,可以保證多業(yè)務共享。
在復旦大學國際人類表型組學研究平臺項目中,ParaStor大幅度提高海量人類表型組數(shù)據的存儲、共享和應用效率,在提升我國組學數(shù)據質量意識、引領國際標準研發(fā)、推動我國生物醫(yī)學領域原創(chuàng)研究的過程中起到了重要的作用。
原文標題:曙光攜手復旦大學,共筑國際“表型組研究平臺”!
文章出處:【微信公眾號:中科曙光】歡迎添加關注!文章轉載請注明出處。
責任編輯:pj
-
數(shù)據庫
+關注
關注
7文章
3822瀏覽量
64506 -
大數(shù)據
+關注
關注
64文章
8896瀏覽量
137517 -
中科曙光
+關注
關注
5文章
308瀏覽量
17817
原文標題:曙光攜手復旦大學,共筑國際“表型組研究平臺”!
文章出處:【微信號:sugoncn,微信公眾號:中科曙光】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論