美國南方衛理公會大學使用 NVIDIA DGX SuperPOD 推動德克薩斯州北部地區進入 AI 時代;密西西比州立大學和德克薩斯農工大學準備使用 NVIDIA Quantum-2 網絡;英國的一所大學則升級了其 InfiniBand 網絡。
正如達拉斯/沃斯堡機場已成為全美旅行樞紐一樣,南方衛理公會大學(SMU)將助力德克薩斯州北部地區在 AI 行業發展中處于領先地位。
南方衛理公會大學正在安裝一臺 NVIDIA DGX SuperPOD 超級計算機。該大學希望這臺超級計算機為這個擁有 12000 多名學生和 2400 名教職員工的龐大社區推動機器學習項目的發展。
除了該大學之外,美國中南部還有兩所大學也宣布計劃使用 NVIDIA 技術以推動研究高速發展。
德克薩斯農工大學和密西西比州立大學均計劃使用 NVIDIA 的 400 Gbit/s InfiniBand 網絡平臺,NVIDIA Quantum-2 將作為其最新高性能計算機的主干網。此外,英國的一臺超級計算機剛剛升級了其 InfiniBand 網絡。
德克薩斯州喜獲 SuperPOD
提到今年早期在佛羅里達大學安裝的另一個系統時,南方衛理公會大學首席信息官 Michael Hites 表示:“我們是美國第二所獲得 DGX SuperPOD 系統的大學,它將助力本社區在使用 AI 技術推動學位課程,以及校企合作方面,均處于領先地位。”
9 月,一篇報導稱,達拉斯地區因缺乏主要的 AI 研究而 “步履蹣跚”。巧合的是,報導登上當地報紙之時,也正是南方衛理公會大學敲定其 DGX SuperPOD 計劃之日。
南方衛理公會大學在 3 月的一份計劃預覽報告中表示,AI 是 “數字化轉型的核心……沒有任何社會部門能夠不受該技術的影響。AI 對 K-12 教育行業和勞動力發展具有巨大的改善潛力,這將有助于該地區經濟的持續增長。”
一項 15 億美元的籌款活動 —— SMU Ignite —— 于 9 月正式啟動。SMU Ignite 將推動 AI 倡議,幫助南方衛理公會大學邁入全國頂級研究型大學的行列。該大學正在聘請一位首席創新官來協助指導此項工作。
打造一個計算煉金爐
南方衛理公會大學研究者 IT 支持團隊主管 Jason Warner 表示,這項工作的核心是人才。因此,他為南方衛理公會大學福特研究與創新中心的一個新中心聘請了一批具有重大影響力的數據科學專家。Warner 將這座新中心稱為南方衛理公會大學的 “計算煉金爐”。
這支團隊由 Eric Godat 領導,他在南方衛理公會大學使用大型強子對撞機的數據為核結構建模,并因此獲得了粒子物理學博士學位。
而今,他正協助南方衛理公會大學的學生了解 DGX SuperPOD 所帶來的新機會。第一步,他邀請兩名南方衛理公會大學的學生使用 NVIDIA Jetson 模塊建造一個 DGX SuperPOD 的微型模型。
Godat 表示:“我們想讓大家感受一下未來的工作會是什么樣子的,尤其是那些沒有做過 AI 方面工作的非技術領域人員。”
南方衛理公會大學本科生 Connor Ozenne 協助建立了一個微型 DGX SuperPOD,南方衛理公會大學年度報告中對其進行了介紹。這臺微型系統由 16 個 Jetson 模塊組成,學生們將把它看作一個 TOP500 系統來運行 benchmark 測試
這臺全尺寸超級計算機由建立在NVIDIA Quantum InfiniBand網絡上的20個NVIDIA DGX A100 系統組成。憑借其積木式的模塊化結構,這臺超級計算機最早可以在 1 月啟動和運行。它將提供高達 100PFlops 的計算力,足以使其在全球最快超級計算機榜單 TOP500上位居前列。
德克薩斯農工大學為其 ACES
使用 NVIDIA Quantum-2 InfiniBand 技術
位于南面約 200英里的德克薩斯農工大學高性能計算中心,將成為首批接入 NVIDIA Quantum-2 InfiniBand 平臺的機構之一。其 ACES 超級計算機由戴爾科技建造,將使用 400G InfiniBand 網絡為研究者連接來自四家廠商的五個加速器。
NVIDIA Quantum-2 確保“在 ACES 上單項工作即可以擴展到所有計算核和加速器。除了在吞吐量上比 NVIDIA Quantum-1 InfiniBand 的 200G 翻倍之外,它還具有更低的總擁有成本、更強大的網絡計算功能和更高的擴展性”,ACES 首席研究員兼項目總監 Honggao Liu 表示。
德克薩斯農工大學已經為研究者提供了四套加速計算系統,這四套系統包含 600多個 NVIDIA A100 Tensor Core 和上一代 GPU,其中兩個系統使用了較早版本的 NVIDIA InfiniBand 技術。
密西西比州立大學乘上 400G 網速列車
密西西比州立大學也將使用 NVIDIA Quantum-2 InfiniBand 平臺。它是構建 Orion 新系統的首選網絡,Orion 是密西西比州立大學管理的四個集群中最大的一個集群,這四個集群全部使用較早版本的 InfiniBand 網絡所構建。
Orion 和新系統均由美國國家海洋和大氣管理局(NOAA)所資助,由戴爾科技建造。Orion 和新系統將承擔 NOAA 的工作任務,以及密西西比州立大學的各項研究課題。
Orion 在 2019 年 6 月首次登上 TOP500榜單,并被列為美國第四大學術超級計算機。
密西西比州立大學高性能計算總監 Trey Breckenridge 表示:“我們在密西西比州立大學的四代超級計算機中都使用了 InfiniBand,所以我們知道它既強大又成熟,可以可靠地運行我們需要的大型工作。”
他補充道:“我們正在添加一套使用 NVIDIA Quantum-2 的新系統,以保持在高性能計算領域的領先優勢。”
Quantum 在英國掀起風潮
在大洋彼岸的英國,萊斯特大學的數據密集型超級計算機—— DIaL 系統——已經升級到 200G 版本的 NVIDIA Quantum InfiniBand。
萊斯特大學理論天體物理學教授兼高性能計算中心總監 Mark Wilkinson 表示:“ DIaL專為解決復雜的數據密集型問題而設計,我們需要解決這些問題,才能推進對周圍宇宙的理解。”
“這些專業應用對帶寬和延遲的要求都是前所未有的,只有 InfiniBand 能夠滿足要求,使研究工作有效開展。”
DIaL 是英國 DiRAC 設施中使用 InfiniBand 的四臺超級計算機之一,另外還包括愛丁堡大學的 Tursa 系統。
InfiniBand 在技術評估上表現出色
在一次技術評估中,研究人員發現與使用另一種互連方式的純CPU系統Tesseract相比,在由Quantum網絡和NVIDIA GPU加速器構建的Tursa系統上運行應用性能可達5倍提升。
基準應用測試顯示,Tursa系統上16個節點的性能是Tesseract系統上512個節點性能的兩倍。Tursa系統的每個節點提供10 TFlops計算性能,使用90%的網絡帶寬,每千瓦性能相比Tesseract有顯著的提高。
這也說明了為什么世界上大多數 TOP500 系統都在使用NVIDIA的技術。
責任編輯:haq
-
NVIDIA
+關注
關注
14文章
5025瀏覽量
103266 -
網絡
+關注
關注
14文章
7583瀏覽量
88950
原文標題:SC21 | 多所大學采用 NVIDIA 系統和網絡拓展研究工作
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論