2013 年,中國憑借「天河二號(TH-2)」超級計算機成功擊敗美國的「泰坦(Titan,由 Cray——美國著名超級計算機制造商于美國橡樹嶺國家實驗室研造)」,成為世界上運算速度最快的超級計算機。隨后,中國乘勝追擊,于 2016 年憑借「神威·太湖之光(Sunway TaihuLight)」超級計算機以近兩倍于「天河二號」的運算速率與三倍于其的運行效率,坐穩了超級計算機領域的頭把交椅。至今,我國包攬了世界頂級超級計算機榜單的前兩位。
今年年初,中國趁熱打鐵,想要率先完成世界第一臺運算速率為「百億億級」的超級計算機的研造。面對中國的威脅,美國能源部向惠普企業(Hewlett Packard Enterprise,簡稱 HPE,2013 年于美國惠普公司「HP Inc.」中分離出來,著力發展云計算解決方案)進行研究撥款,命其根據 The Machine 項目現有的技術來制訂百億億級超級計算機的參考設計方案。
這個 The Machine 項目是什么呢?它是由惠普企業在 2014 年開啟的一個旨在「徹底改造基礎計算結構」的一個科研項目。然而該項目喜憂參半,以至于惠普企業后來并不打算將 The Machine 完整推向市場,而是將其精粹與革新部分融合到其他惠普企業的商業服務器和技術當中。
(The Machine 設備一角)
回到正題。縱觀歷史,我們不難發現世界上絕大多數的頂級超級計算機都是由美國能源部掌握并操控的。但近年來,中國開始以疾風驟雨之勢占據這份榜單。中國的頂級超級計算機「神威·太湖之光」的最佳性能(每秒 93 千萬億次浮點運算,petaflops:peta,10 的 15 次方,表千萬億次;flops,每秒浮點運算次數)是美國第一超級計算機「泰坦」運算速率(每秒 18 千萬億次浮點運算)的五倍。
美國曾「桀驁不馴」地宣稱其將于 2021 年左右完成世界首個百億億級(相當于每秒 1000 千萬億次浮點運算速率)超級計算機的研發并將其投入使用,重新奪回美國在超級計算機領域的王座。但中國似要先聲奪人,今年一月份,我國超級計算機中心宣稱中國首臺百億億級超級計算機原型機將會在 2017 年年底研發完成,并預計在 2020 年之前投入使用。
(「泰坦」超級計算機)
想要從無到有地研制一臺百億億級的超級計算機,研究者們必須解決三個主要問題:一、極大的電力消耗(數十億瓦特)與極高的冷卻要求;二、計算機的構造與連接線必須設計精巧,以保證成百上千的處理器與內存芯片能夠有效運轉;三、設計制造一組能夠真正能夠在每秒百億億次運算的狀態下仍可正常運行的操作系統與客戶端軟件。
要是較起真來,不解決上述三個問題也是可以架構一個「所謂的」百億億級超級計算機的——只要把無數個 CPU 連接在一起,直到運算速率足夠就行了——但其實,這樣「搭建」起來的「超級計算機」是無法做到每秒進行百億億次運算的。即使可以,它每次的運行成本也都會達到令人咋舌的天文數字,對其實際應用造成了巨大限制。
(「神威·太湖之光」超級計算機)
據外媒 Ars Technica 稱,中國現在就是在以這種「累加堆砌」的方式制造超級計算機:先在 2017 年把所需的硬件安在一起,然后用接下來的幾年試圖使這些硬件運轉起來。
Ars Technica 同樣稱,美國國家能源局選擇了一種更為「沉著穩健」的方式來研制超級計算機,那就是為惠普企業撥款來研發百億億級超級計算機的參考設計方案。撥款的資金來自于美國國家能源局一項名為「PathForward(前途)」的項目,該項目是 ECP 項目(Exascale Computing Project,百億億級計算項目)的子項目之一。
ECP 項目由當時的奧巴馬政府組織建立,已對美國的各項針對百億億級計算機的研究項目給予了數千萬美元的資金支持。惠普企業所收到的資金援助也由此可見一斑。
超算是如何架構的?它又能做什么?
因此,惠普企業的計劃是什么?它有希望在美國國家能源局的三輪資金援助申請中過關斬將,并且在中國之前將百億億級超級計算機研制出來嗎?
惠普企業稱他們將基于一個稱為「記憶驅動計算(Memory-Driven Computing)」的架構來研制這款百億億級超級計算機。「記憶驅動計算」架構就是從 The Machine 中導出的。
簡單說來,惠普企業已有一整套成型的技術使得不計其數的可尋址存儲器(其總存儲量可達 4096 堯字節,1 堯等于 2 的 80 次方,4096 堯大約是全宇宙原子的數量)可被一個高速、低能耗的光互聯器件連接起來。而該光互聯器件是由一個全新的硅光子芯片驅動的。
(惠普企業的 X1 硅光子互聯器件)
現在,由此構建的整個存儲器還極不穩定,但假以時日——一旦惠普企業將其憶阻器技術投放市場,或者引入英特爾的 3D XPoint 內存技術——該存儲器將會穩定下來。
更重要的是,惠普企業宣稱他們已經研發出可以真正使用如此大量存儲空間的軟件工具。該工具可以從龐大的數據集(比如:Facebook 上所有人發的所有內容;全世界網絡上的全部內容;地球上所有人的健康數據,等等)中推引出隱含信息和科學價值。
惠普企業 CTO Mark Potter 毫不質疑地表示其公司的科技將成為拯救人類的曙光。他說道:「我們堅信記憶驅動計算是推動科技產業前進的重要舉措。我們將由此迎來惠及全社會的進步。我們此次揭露的存儲架構可以應用到所有類型的計算中——從尖端智能設備到超級計算機,不一而足。」
中美交鋒,奪魁者誰?
實際上,我們還是離 Potter 的理想有一定距離的,但是惠普企業的技術確實是實現研制百億億級超級計算機的重要一步。
如果你是評委,需要為惠普企業所做的努力點評一二,倘若以本文之前提到的三大問題的解決程度為評判標準,估計「差強人意」或許是你會使用的字眼:他們在軟件使用、能源消耗、和規模升級上都取得了一定的突破。但前路漫漫,研制超級計算機所需要解決的問題很多,尤其是像提高運算速率這樣的難題,更是復雜棘手。
美國已全面禁止英特爾、Nvidia、和 AMD 的超級計算機芯片向中國出口,在此之后,中國國家芯片設計中心研發出專為超級計算機設計的 256 核 RISC(精簡指令集計算機)芯片。惠普企業目前能提供的就是可用于不同芯片交流的 Gen-Z 協議,他們同樣承諾會研制出邏輯芯片,使超級計算機的實現更進一步。
(The Machine 原型機,有著核輻射般詭異的綠光)
盡管如此,目前美國超級計算機的研制仍是在最初的籌資階段,惠普企業對百億億級超級計算機技術的研發目前也只是紙上談兵。只有當超級計算機項目進入到第二和第三階段,惠普企業才會真正開始設計并研制超級計算機。
如果所有程序都按部就班地進行,英特爾最新的 72 核/288 線程 Xeon Phi 芯片可能會使美國領先一步于中國完成百億億級超級計算機的研造。但是由于其單個芯片的建議零售價為 6400 美元,而研造一部百億億級的超級計算機大約需要 30 萬個這樣的芯片,這不菲的價格或許也是美國需要考量的因素。
美國國家能源局的大多數超級計算機項目撥款針對的都是可應用于其上的軟件程序。這次,美國國家能源局還將為加入到「PathForward」項目中的包括 AMD,Cray(「泰坦」超算制造商),IBM,英特爾,以及 Nvidia 等知名公司提供研發資金支援。美國國家能源局預計在三年內為 PathForward 共撥出 2 億 5 千 8 百萬美元。因為此次研究將對受資企業的發展大有裨益,受該項撥款資助的企業在這三年期間也需自付共計至少 1 億 7 千 2 百萬美元的研究經費。
雖然美國卷土重來之勢已顯,中國方面并不會束手就擒。我國已將百億億次超級計算機及相關技術的研究寫入國家「十三五」規劃,并采用「三頭并進」的方式,由中科曙光、國防科技大學及江南計算技術研究所來牽頭研制百億億級超算的原型系統。「史上第一臺百億億級超算」究竟花落誰家,且讓我們拭目以待。
-
惠普
+關注
關注
0文章
594瀏覽量
37696 -
超級計算機
+關注
關注
2文章
462瀏覽量
41948
發布評論請先 登錄
相關推薦
評論