縱觀數據存儲歷史可以發現,隨著人類社會數據量的不斷增加,存儲介質也在持續不斷地迭代變化。人類歷史的腳步不會停下,碳基生物存儲尤其是DNA存儲是我們不得不關注的重要前沿技術方向。
DNA是已知最古老的信息存儲系統,存儲著碳基世界中從微生物到人類的億萬生命數據。人類的存儲介質經歷了從骨骼、毛皮、竹簡、紙到電腦硬盤的演變,但在DNA上“寫入”和“讀取”數據似乎只是造物主才能做的事情。近年來,隨著DNA合成技術(數據寫入)和DNA測序技術(數據讀取)的突破性發展,DNA存儲已成為下一代存儲技術熱點。2019年7月1日,著名科普雜志《科學美國人》公布了2019年十大突破性技術榜單,DNA存儲技術榜上有名。
5G通信、萬物相聯、人工智能……在大數據時代的未來,雖然傳統存儲硬盤隨著科技進步在不斷優化提升,但人類社會日益增長的信息數據的存儲需求,必將使傳統存儲硬盤面臨巨大挑戰。有數據顯示,2015年至2019年期間,機器對機器間的流量以44%的年復合增長率增長,并且到2020年全球每月將產生高達6.3ZB(1ZB>10億TB)的數據量。這必然造成硅基半導體材料的巨大消耗、數據維護期間的電力供應問題以及海量電子垃圾引發的生態環境危機。
相比之下,一個邊長約1米的DNA立方體就足以容納等量數據。DNA存儲技術以其體積小、數據密度大、穩定性強、能耗極低等優勢,成為解決未來因數據爆發產生系列危機的潛在技術路徑之一。此外,人工智能尤其是類腦智能的發展,硅基人工智能在未來或有向更高層次的碳基人工智能發展的可能性。屆時,DNA存儲技術將成為不可或缺的配套技術之一。
一、DNA存儲簡介
DNA即脫氧核糖核酸(英文Deoxyribonucleic acid的縮寫)是磷酸基團、多糖和四種堿基構成的雙螺旋結構大分子,是主要的遺傳物質。DNA四種堿基A、T、G和C的排列順序代表遺傳信息,控制合成不同功能的蛋白質,用以構建生命體和催化一系列體內生化反應。
DNA存儲是將二進制文件通過編碼映射成DNA里A、T、G和C堿基序列,按序列順序通過人工合成技術形成長鏈DNA來保存數據的方法。數據寫入即人工合成DNA,數據讀取即DNA測序,數據拷貝即DNA復制。利用DNA中堿基序列編碼存儲二進制數據具體實例如下所示。
二、DNA存儲的優勢與挑戰
DNA存儲的優勢顯而易見。一是數據密度大、占地小。理論上1克DNA可存儲455EB數據量。二是DNA特殊的雙螺旋結構使其性能十分穩定、存儲時間長。在干冷條件下可保持數萬年以上,常溫下可保持幾百甚至上千年。三是能耗低。常溫保存時基本不需要電力。
但該技術的挑戰也與之并存。一是成本過高。目前DNA存儲200MB數據需要耗資80萬美元。二是讀寫速度慢。在DNA中寫入20MB數據可能需要1天時間。近年來,“數據讀取”技術(DNA測序技術)發展較快,代表性企業包括Pacbio、Illumina和華大基因等公司,但“數據寫入”技術(DNA合成技術)發展慢,需要較大的理論和技術突破。三是數據存儲的準確性有待提高。目前DNA測序時的重復讀取導致讀錯概率較大。四是隨機讀寫困難。目前DNA合成技術無法一次性產生較長的DNA分子,只能合成眾多的短片段。這使得在眾多DNA小片段組成的混合物中快速調取出特定數據較為困難。
三、DNA存儲技術不斷獲得突破
實際上,DNA存儲并非新名詞,相關研究已持續了30余年。1988年,美國藝術家Joe Davis與哈佛大學科學家合作,首次把0與1的電子數據和DNA的四個堿基對應,將古日耳曼代表著生命和女性的圖片編輯到大腸桿菌的DNA序列中。2001年,以色列科學家研制出世界第一臺DNA計算機,它的輸出、輸入和軟硬件全由DNA分子組成。2007年,日本科學家成功使用細菌DNA儲存數據。2010年,美國合成生物學家克雷格?文特爾帶領研究團隊化學合成了整個支原體基因組DNA,并將該課題研究者的名字、研究所網址和愛爾蘭詩人詹姆斯的詩句等信息編碼進新合成的DNA中。
而當美國哈佛大學教授喬治·丘齊在2012年將650KB數據寫進DNA,使DNA存儲數據容量的紀錄提高了1000倍后,DNA存儲技術進入快速發展的新時期。
2013年,歐洲生物信息實驗室(EMBL)將20MB數據寫進DNA存儲;2016年4月,美國微軟公司向美國生物科技初創公司 Twist 購買了1000萬個DNA分子,用于研究數據儲存。同年7月,微軟公司和華盛頓大學分子信息系統實驗室(MISL)合作,耗資約80萬美元將200.2MB的數據(包含100本書籍的信息)成功存入DNA。2017年,微軟公司投資20億美元,為其高能耗的數據中心開發DNA服務器,并計劃在10年內部署一臺復印機大小的商用DNA存儲裝置。同年,美國哥倫比亞大學和紐約基因組中心研究人員開發一種噴泉碼技術,使DNA高效存儲數據和無損讀取,并將DNA存儲效率在喬治·丘齊技術水平上再提高100倍。2018年,愛爾蘭沃特福德理工學院(WIT)研究人員開發出一種新型DNA存儲方法,可在1克大腸桿菌DNA中存儲1ZB的數據。
2019年3月,美國微軟公司和華盛頓大學的研究人員開發出一個完全自動化的系統,用于編寫、存儲和讀取DNA編碼的數據。雖然成本和耗時依然居高不下,但全自動合成和讀取是DNA存儲技術從實驗室走向商業數據中心的關鍵步驟。
四、DNA存儲技術受到西方科技強國重視
DNA存儲技術具有解決未來社會因數據量激增引發的一系列挑戰的潛力,尤其是近些年DNA存儲技術的難點不斷被攻克,商業化應用曙光微顯。西方科技強國們敏銳地嗅到DNA存儲技術的前景,紛紛走上DNA存儲的餐桌,不愿缺席這場未來技術盛宴。
國家層面。美國在DNA存儲技術方面的研究一直處于世界領先地位,政府層面也高度重視該技術的發展。2018年2月,美國高級情報研究計劃局(IARPA)發布“分子信息存儲”(MIST)項目,旨在開發可部署的存儲技術,利用DNA存儲取代傳統存儲方式。IARPA項目經理David Markowitz表示,建設一個10億GB的數據中心需要10年時間,花費100億美元以及數百兆瓦的電力,但存儲相同的數據量僅需1千克DNA。英國政府也注意到DNA存儲技術的應用潛力,資助Goldman等科學家成立專門的公司,用于研發下一代DNA存儲技術。此外,以色列、愛爾蘭、法國和日本等國也紛紛開展了DNA存儲方面的研究工作。
研究機構層面。美國哈佛大學是全球最早開展DNA存儲技術研究的科研機構,積累了豐富的研究成果;華盛頓大學的DNA存儲技術也處于世界領先地位。此外,美國的加州大學、約翰霍普金斯大學、伊利諾伊大學、勞倫斯伯克利國家實驗室、哥倫比亞大學和紐約基因組中心;歐洲生物信息研究所;法國的查爾斯-賽德倫高分子研究所和艾克斯-馬賽大學;愛爾蘭沃特福德理工學院和瑞士蘇黎世理工學院等高校或科研機構均開展了DNA存儲技術的相關研究并紛紛取得突破性成果。
企業層面。美國微軟公司是當前全球研究DNA存儲技術最活躍的高科技公司。值得一提的是,微軟公司近年來經過一系列變革和戰略調整,積極投身云計算、生物存儲等業務,公司市值由2013年的2000多億美元增長到2019年的破萬億美元,成為全球市值最高的上市公司。微軟對DNA存儲技術的重視,值得重點關注。除傳統科技巨頭外,近些年DNA存儲行業也涌現出眾多初創科技企業,如美國Catalog公司、Molecular Assemblies公司、Twist Bioscience公司和Iridia公司等,以及英國的Evonetix公司、法國的DNA Script公司、愛爾蘭的Helixworks Technologies公司和奧地利的Kilobaser公司等。
五、DNA存儲技術的戰略意義及相關建議
(一)DNA存儲技術具有重要戰略價值
傳統存儲器的主要材料是硅晶片,其制作需要熔融、切割、刻蝕和清洗等過程。伴隨著數據存儲需求激增的同時是硅晶片使用量的激增,以及由此造成的環境污染問題、水資源和能源消耗問題等。此外,硅基半導體的摩爾定律也在走向物理極限。另一方面,5G通訊的普及將促進物聯網社會的構建,海量電子元器件必然產生電子垃圾泛濫的新問題。DNA存儲技術將在減少半導體材料、電力能源、水資源的使用,減少化學工藝造成的廢水廢物排放,尤其是使用可生物降解的DNA代替不可降解的電子垃圾等方面,或可發揮重要作用。因此,DNA存儲技術對國家開發替代性的數據存儲介質、維護生態環境安全和能源安全等具有重要戰略意義。
(二)DNA存儲技術或將增加數據管理難度和數據失竊風險
存儲數據的DNA可整合到細菌基因組、動物基因組甚至是人類基因組(如手指的一小塊細胞群,不會對整個身體基因組造成影響)上,數據可隨細胞復制而拷貝擴增。DNA存儲技術或將使生物體尤其是人體成為自由行走的“硬盤”。DNA因其微型性、生物相容性等隱蔽性特點,以及非金屬材料導致的傳統安檢設備失效,將嚴重沖擊當前的數據管理模式。尤其是某些人員通過DNA秘密攜帶重大機密數據出入海關,將增加數據失竊風險。西方科技強國在DNA存儲領域的快速發展,使我國數據安全面臨新挑戰、新變局。密切跟蹤全球DNA存儲技術的研究進展,積極促進和提升我國DNA存儲技術的研發能力,與時俱進更新數據管理理念和模式,研發DNA存儲相關的新型監測和監管設備,是我國面對DNA存儲技術挑戰的重要應對之策。
(三)DNA存儲技術或將成為特殊加密用途的數據存儲手段
DNA存儲作為一種新興多能的存儲方式,或將成為軍事領域、經濟領域等特殊加密用途的數據存儲手段。軍事應用方面。美國科學家曾在1999年發表過“DNA隱寫術”的文章。研究人員將“JUNE 6 INVASION:NORMANDY”(6月6號入侵:諾曼底)這段歷史上的軍事密令轉化成100bp左右的DNA信息,然后將該DNA與30億bp的垃圾DNA信息混在一起。只有通過密鑰(也就是一對引物)進行PCR擴增獲取目的DNA片段,測序后解碼方可獲得該信息。金融應用方面。近期,Facebook推出了電子加密貨幣Libra,一石激起千層浪,眾多國家央行高度警惕和密切關注,不少大型企業也蠢蠢欲動推出自己的電子加密貨幣。從比特幣到Libra,電子貨幣似乎將成為未來社會的一個重要趨勢,而個性的、穩定的和安全的新型存儲方式也就成為必然需求。美國初創公司Carverr推出將數字貨幣密碼存儲在DNA中的服務,以保護數字貨幣財產,28位客戶已與其簽約。Carverr公司目前還在與銀行和其他大型加密貨幣控股公司進行談判,以擴大服務范圍。
(四)其他生物存儲技術也值得重點關注
近期,除DNA存儲技術外,其他生物存儲技術也涌現出新成果。例如,2019年5月,美國哈佛大學開發出利用蛋白質存儲數據的新技術。該技術減少了合成新分子的難度和消耗時間,同時避免了從線性DNA大分子中編碼和讀取數據的難題。7月,美國布朗大學將2000bp數字圖像數據儲存在含有糖、氨基酸和其他類型小分子的液體混合物陣列中,并能夠在其中進行數據檢索。據稱,小分子代謝物具有比DNA更大的信息密度。
傳統半導體存儲方式或許在未來一段時間內仍將占據數據存儲方式的主流,而包括DNA存儲、蛋白質存儲和小分子代謝物存儲等形式的碳基生物存儲方式在技術層面尤其是成本方面還有很長的路要走。但是,縱觀數據存儲歷史可以發現,隨著人類社會數據量的不斷增加,存儲介質也在持續不斷地迭代變化。人類歷史的腳步不會停下,碳基生物存儲尤其是DNA存儲是我們不得不關注的重要前沿技術方向。
-
存儲
+關注
關注
13文章
4314瀏覽量
85851 -
DNA
+關注
關注
0文章
243瀏覽量
31038
原文標題:技經觀察 | DNA存儲有望成為下一代存儲介質的技術方向
文章出處:【微信號:drc_iite,微信公眾號:全球技術地圖】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論