隨著計算模擬在新材料研發(fā)方法和模式中扮演越來越重要的角色,材料研發(fā)領(lǐng)域也正尋求更高效、更便捷的材料計算模擬平臺來加速計算模擬任務(wù),提升新材料問世和落地的效率。來自騰訊量子實驗室的材料計算模擬平臺 TEFS(Tencent Elastic First-principles Simulation),借助騰訊云提供的強勁、易用和彈性可擴展的算力,以及對主流優(yōu)秀材料計算模擬軟件的編譯集成,為高校和企業(yè)的材料研究人員提供了科學(xué)計算、數(shù)據(jù)可視化、工作流與機器學(xué)習(xí)以及項目管理等能力,使基于計算模擬方式的材料研發(fā)更具效率。
這一過程中,來自英特爾的先進產(chǎn)品與技術(shù)也從軟硬件兩方面入手,助力騰訊 TEFS 平臺提升工作效能。在雙方的合作中,第四代英特爾 至強 可擴展處理器和英特爾 oneAPI HPC 工具套件的加入,讓平臺的計算性能得到了顯著提升,雙方隨后開展的驗證測試也有力地證明了這一點。
“
利用計算模擬方式來加速新材料的研發(fā)進程,已成為材料設(shè)計領(lǐng)域的一個新趨勢。騰訊 TEFS 平臺的推出,正是借助騰訊云服務(wù)彈性可擴展的特性,幫助高校和企業(yè)的材料研發(fā)人員更高效、便捷地開展材料計算模擬任務(wù)。來自英特爾的第四代至強 可擴展處理器和英特爾 oneAPI HPC 工具套件,為 TEFS 平臺計算性能的提升提供了更加強勁的助力。
張勝譽
騰訊量子實驗室負責(zé)人、騰訊杰出科學(xué)家
”
材料計算模擬發(fā)展普及
亟需更強平臺予以支撐
作為新能源、半導(dǎo)體、智能制造以及生物醫(yī)藥等前沿科技的基石之一,新材料研究正在過去的數(shù)十年中獲得極大的關(guān)注和高速發(fā)展,并擁有令人期待的市場發(fā)展?jié)摿Α?shù)據(jù)表明,至2022年,中國新材料行業(yè)的市場總產(chǎn)值已達6.8萬億,近年來年均復(fù)合增長率接近 20%1。
強勁的市場潛力推動新材料的研究方法與驅(qū)動模式發(fā)生了巨大的變化,從傳統(tǒng)的經(jīng)驗驅(qū)動、理論驅(qū)動轉(zhuǎn)向計算驅(qū)動和數(shù)據(jù)驅(qū)動。如圖一所示,一系列優(yōu)秀材料計算模擬軟件,包括 VASP、Quantum ESPRESSO、LAMMPS 以及 GROMACS 等基于第一性原理和分子動力學(xué)等理論,形成以計算模擬為核心的新型材料研發(fā)模式。這些模式一方面有效解決了以往材料研發(fā)中研發(fā)周期長、實驗成功率低以及投入成本高昂等問題,另一方面也積極推動著逆向材料設(shè)計、逆向物性預(yù)測、多尺度設(shè)計等新方法的發(fā)展。
圖一 常見的材料計算模擬軟件
今天,無論是高校這樣的科研、教學(xué)機構(gòu),還是專注于儲能電池等產(chǎn)品研發(fā)的新能源廠商,都會把材料計算模擬軟件的高效運行看成是材料研發(fā)的重要助力,而這無疑需要高性能的算力予以支持。傳統(tǒng)上,研究者通常會通過自建的方式來構(gòu)建科學(xué)計算模擬平臺,但這一過程中,平臺的使用也會面臨以下一系列的挑戰(zhàn),包括:
算力層面:自有計算模擬平臺的建設(shè)通常屬于資本支出(Capital Expenditure,CapEX),在建設(shè)完成后,算力資源較為固定。當(dāng)材料研究所需的算力發(fā)生變化時,往往缺乏足夠的靈活性造成資源不足或資源浪費;
軟件層面:不同的材料研究往往需要不同的計算模擬軟件,使用者需根據(jù)軟件特性分別開展相應(yīng)的編譯優(yōu)化,其過程不僅需要耗費大量的時間成本且后期運維難度也更大;
使用層面:傳統(tǒng)平臺通常采用默認的命令行操作方式,不僅運行門檻高,同時后續(xù)環(huán)節(jié)所需的專業(yè)數(shù)據(jù)提取、分析也較為繁瑣復(fù)雜,并缺乏便捷的數(shù)據(jù)可視化方案。
為助力新材料領(lǐng)域的企業(yè)、高校等有效應(yīng)對以上挑戰(zhàn),騰訊旗下的騰訊量子實驗室,以騰訊云為基礎(chǔ),通過融合科學(xué)計算系統(tǒng)、先進Web技術(shù)和人工智能(Artificial Intelligence,AI)能力,向研究人員推出具備一站式材料計算模擬服務(wù)的TEFS平臺,并引入第四代英特爾 至強 可擴展處理器及其內(nèi)置的英特爾 AMX 加速器、英特爾 oneAPI HPC 工具套件,以有效的性能優(yōu)化助力研究人員在基于 TEFS 平臺進行各類材料研究和探索時獲得強勁助力。
至強 與 oneAPI軟硬協(xié)同
助騰訊TEFS平臺打造先進科學(xué)計算能力
如圖二所示,騰訊材料計算模擬平臺 TEFS 從算力硬件、計算模擬軟件和功能模塊等不同維度出發(fā),為企業(yè)、高校等的材料研究提供高效能支撐。首先在底層的算力硬件上,騰訊云為平臺提供了彈性可擴展的計算資源。騰訊云以第四代英特爾 至強可擴展處理器等高性能的處理器作為算力引擎,為平臺提供了數(shù)十種服務(wù)器供使用者按需調(diào)用,其中單臺服務(wù)器最多可達 192 超線程,512 GB 內(nèi)存2。而內(nèi)置的 TEFS HPC 算力調(diào)度系統(tǒng),也令平臺能靈活應(yīng)對各類算力需求(例如材料計算模擬常用的高通量計算)有著大幅波動的場景。
圖二 騰訊材料計算模擬平臺TEFS基本架構(gòu)
在騰訊云之上,通過與計算軟件生態(tài)合作伙伴的緊密協(xié)作,TEFS 平臺預(yù)編輯了 VASP、LAMMPS 等數(shù)十種專業(yè)計算模擬軟件,并集成了 Jupyter Notebook、VS Code 等計算環(huán)境,為研究人員打造了“開箱即用”的便捷使用體驗。同時,平臺還集成了騰訊自研的量子計算模擬軟件 TensorCircuit 和量子計算化學(xué)軟件 TenCirChem 。
基于以上軟硬件基礎(chǔ)能力,TEFS 平臺為材料研究人員提供了科學(xué)計算、數(shù)據(jù)可視化、工作流與機器學(xué)習(xí)以及項目管理等多個功能模塊。其中:
科學(xué)計算:通過全面打通算力、存儲、網(wǎng)絡(luò)以及軟件能力,平臺能以公有云、混合云等模式向企業(yè)和高校的材料研究人員提供兼具靈活性和可擴展性的科學(xué)計算能力,計算過程同步可見、計算結(jié)束結(jié)果自動下載,且支持 Slurm 和 PBS 兩種作業(yè)調(diào)度系統(tǒng)。而基于 Web 頁面的操作界面,也便于研究人員快速輕松上手;數(shù)據(jù)可視化:如圖三所示,平臺原生支持 VASP、PWmat和 LAMMPS 等計算結(jié)果的可視化,并引入了基于第一性原理的高通量材料物性分析軟件 VASPKIT Pro等來進一步增強平臺的數(shù)據(jù)可視化能力。同時平臺對Pymatgen、ASE和Matplotlib 等軟件的繪圖操作有著友好地支持;
圖三 TEFS平臺數(shù)據(jù)可視化示例
工作流與機器學(xué)習(xí):平臺能根據(jù)研發(fā)實際需求提供定制化的工作流,便于高通量計算篩選與材料數(shù)據(jù)庫搭建。同時也能按需彈性調(diào)度計算資源,優(yōu)化算力效率。而對于所生成的數(shù)據(jù),平臺提供了一站式的機器學(xué)習(xí)模型搭建、調(diào)試和訓(xùn)練等流程; 項目管理:平臺以項目為單元,提供了豐富的管理功能,包括成員管理、資源監(jiān)控、實驗管理、數(shù)據(jù)管理以及文檔管理等,能有效提升項目執(zhí)行效率。
而在 TEFS 平臺為企業(yè)和高校的材料研究提供有效助力的過程中,引入強勁的算力核心,并開展有針對性的優(yōu)化也必不可少。而與英特爾的合作,正是 TEFS 平臺在這一方向上的“殺手锏”。一方面, TEFS 平臺底層構(gòu)建于騰訊云之上,騰訊云在其中引入多款先進英特爾 架構(gòu)的處理器作為核心算力引擎。
以騰訊云 S7 中部署的第四代英特爾 至強 可擴展處理器為例,其全新的架構(gòu)帶來了更強的性能輸出,不僅擁有更多的內(nèi)核,更強的單核性能,性能更優(yōu)越的內(nèi)存子系統(tǒng),并內(nèi)置了多個加速引擎來支持科學(xué)計算中嚴苛的工作負載,例如其內(nèi)置的英特爾 AMX 加速器可提高 CPU 的深度學(xué)習(xí)訓(xùn)練和推理性能,以及執(zhí)行多線程任務(wù)時數(shù)據(jù)的高吞吐性能等。
值得一提的是,在材料計算模擬中通常會產(chǎn)生大量內(nèi)存數(shù)據(jù)訪存的需求,因此對內(nèi)存子系統(tǒng)的性能有著更高要求。處理器具備大容量末級緩存,并支持 DDR5 內(nèi)存,有效應(yīng)對了這一需求。新一代 DDR5 內(nèi)存不僅頻率更高、工作電壓更低,還具有遠超 DDR4 內(nèi)存的帶寬速度。與 DDR4 內(nèi)存 25.6GBps(3,200MHz)的帶寬相比,DDR5內(nèi)存帶寬達到了 38.4GBps(4,800MHz)以上,提升幅度超過了 50%3,能有效支撐材料計算模擬過程對內(nèi)存性能的巨大依賴,同時處理器加強的 AI 能力也為新興的通用人工智能計算提供了更多可能和算力選項。
另一項來自英特爾的助力是英特爾 oneAPI 工具套件。作為基于新一代標準的英特爾軟件開發(fā)工具,這一工具套件能幫助使用者充分利用英特爾 架構(gòu)硬件特性來加速不同計算進程,從而跨架構(gòu)構(gòu)建和部署高性能的應(yīng)用程序。而騰訊與英特爾攜手在 TEFS 平臺中引入的英特爾 oneAPI HPC工具套件,是英特爾 oneAPI Base 工具套件的附加組件(需使用英特爾 oneAPI Base 工具套件才能實現(xiàn)全部功能),其包含了一系列性能更強大的編譯器、功能更強大的庫及高級分析工具,能幫助 TEFS 平臺借助矢量化、多線程、多節(jié)點并行化以及內(nèi)存優(yōu)化方面的最新技術(shù),在材料研發(fā)中實現(xiàn)更優(yōu)的計算模擬性能。
騰訊TEFS平臺性能顯著提升
通過在眾多企業(yè)、高校的部署實踐,來自一線材料研究人員的反饋表明,TEFS平臺能為材料研發(fā)領(lǐng)域的計算模擬帶來顯著優(yōu)勢:
高易用性:平臺提供了基于瀏覽器/命令行的交互方式,具有友好的數(shù)據(jù)可視化界面和豐富的項目管理功能;
強擴展性:平臺可基于不同類型騰訊云服務(wù)器開啟任務(wù),對多種材料計算模擬軟件有著良好兼容,并具有存儲動態(tài)擴容和計算節(jié)點彈性伸縮能力;
運維簡單:平臺支持一鍵升級與回退功能,擁有快速恢復(fù)與重啟計算環(huán)境的鏡像,無需硬件運維,按需調(diào)用資源;
高安全性:平臺具備企業(yè)級數(shù)據(jù)安全保障,主機安全基礎(chǔ)防護和基礎(chǔ)DDoS防護能力,可做到資源高度隔離以及服務(wù)高可用。
同時,為驗證第四代英特爾 至強 可擴展處理器和英特爾 oneAPI HPC 工具套件的引入,為 TEFS 平臺的計算模擬性能提升帶來的有效助力,騰訊與英特爾一起攜手開展了驗證測試,測試分為三個配置組進行對比:
基準組:基于第三代英特爾 至強 可擴展處理器的騰訊云S6服務(wù)器,實例規(guī)格:32 vCPU/64GB 內(nèi)存;使用原生版本VASP,VASP參數(shù)設(shè)置:NPAR=2,KPAR=1, NSIM=4; 測試組1:基于第三代英特爾 至強 可擴展處理器的騰訊云S6服務(wù)器,實例規(guī)格:32 vCPU/64GB 內(nèi)存;使用英特爾 oneAPI HPC工具套件最新版優(yōu)化的VASP,VASP參數(shù)設(shè)置:NPAR=2,KPAR=1, NSIM=4; 測試組2:基于第四代英特爾 至強 可擴展處理器的騰訊云S7服務(wù)器,實例規(guī)格:32 vCPU/64GB 內(nèi)存;使用英特爾 oneAPI HPC工具套件最新版優(yōu)化的VASP,VASP參數(shù)設(shè)置:NPAR=2,KPAR=1, NSIM=4。
圖四 英特爾軟硬件產(chǎn)品與技術(shù)帶來的性能提升(歸一化)4
測試結(jié)果如圖四所示5,經(jīng)數(shù)據(jù)歸一化對比后,在同樣使用騰訊云 S6 服務(wù)器(基于第三代至強 可擴展處理器)的情況下,使用英特爾 oneAPI HPC工具套件最新版優(yōu)化后,VASP 計算任務(wù)的執(zhí)行性能相比基準組提升了約 13.39%。而將算力設(shè)備升級為騰訊云S7服務(wù)器(基于第四代至強 可擴展處理器)后,性能相比基準組提升了約 43.87%,這表明,第四代至強 可擴展處理器與英特爾 oneAPI HPC 工具套件能顯著提升 TEFS 平臺上材料計算模擬中 VASP 計算任務(wù)的處理效率。
隨著計算模擬方式在材料研發(fā)中顯現(xiàn)出更大的優(yōu)勢,以 TEFS 平臺為代表的材料計算模擬云服務(wù)平臺,也將在未來新材料研發(fā)中發(fā)揮出更為重要的作用,而計算性能的持續(xù)提升,也將為這一趨勢持續(xù)提供助力。面向未來,騰訊還將與英特爾展開更多合作,將更多先進計算產(chǎn)品與技術(shù)應(yīng)用到該領(lǐng)域中,助力更多新材料的問世與落地。
同時,雙方在“科學(xué)計算+云服務(wù)”上的共同努力,也將運用于新材料研究之外的更多領(lǐng)域,包括基于電子設(shè)計自動化(Electronic Design Automation,EDA)的工業(yè)設(shè)計、計算機科學(xué)、基因組學(xué)、量子模擬以及生物制藥等,從而讓更多領(lǐng)域從科學(xué)計算能力中獲益,加速產(chǎn)業(yè)發(fā)展。
參考資料:
1數(shù)據(jù)援引自公開媒體報道:https://www.chinairn.com/news/20230831/165403490.shtml2數(shù)據(jù)來源于騰訊,如欲了解更多詳情,請訪問:https://www.tencent.com/3根據(jù) DDR4 與 DDR5 產(chǎn)品技術(shù)特性計算得到4、5數(shù)據(jù)來源于騰訊未公開的內(nèi)部測試,如欲了解更多詳情,請訪問:https://www.tencent.com/法律聲明英特爾并不控制或?qū)徲嫷谌綌?shù)據(jù)。請您審查該內(nèi)容,咨詢其他來源,并確認提及數(shù)據(jù)是否準確。英特爾技術(shù)特性和優(yōu)勢取決于系統(tǒng)配置,并可能需要支持的硬件、軟件或服務(wù)得以激活。產(chǎn)品性能會基于系統(tǒng)配置有所變化。沒有任何產(chǎn)品或組件是絕對安全的。更多信息請從原始設(shè)備制造商或零售商處獲得,或請見 intel.com。沒有任何產(chǎn)品或組件是絕對安全的。描述的成本降低情景均旨在在特定情況和配置中舉例說明特定英特爾產(chǎn)品如何影響未來成本并提供成本節(jié)約。情況均不同。英特爾不保證任何成本或成本降低。
-
英特爾
+關(guān)注
關(guān)注
61文章
9975瀏覽量
171846 -
cpu
+關(guān)注
關(guān)注
68文章
10871瀏覽量
211943
原文標題:至強? 可擴展處理器與 oneAPI工具套件強強聯(lián)合,助力騰訊材料計算模擬平臺TEFS實現(xiàn)更優(yōu)計算效能
文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論