CAE(Computer Aided Engineering,計(jì)算機(jī)輔助工程)始于50年代,由數(shù)學(xué)家、科學(xué)家和工程師共同開發(fā),可用于求解分析復(fù)雜工程和產(chǎn)品。起先,CAE旨在改善航空和汽車行業(yè)的設(shè)計(jì),例如,模擬飛機(jī)周遭的沖擊波、氣流、溫度數(shù)據(jù),計(jì)算汽車模型表面的壓力系數(shù)等。
隨著半導(dǎo)體工藝對(duì)摩爾定律的進(jìn)一步推動(dòng)、內(nèi)存的每一次進(jìn)步以及CPU和GPU并行處理能力的倍增,CAE性能隨之?dāng)U展,其應(yīng)用范圍也逐漸延展至制造業(yè)的方方面面,并有勢(shì)頭成為 “數(shù)字孿生”、“工業(yè)互聯(lián)網(wǎng)”、“智能制造”,乃至“工業(yè)元宇宙”的引擎。
1/CAE轉(zhuǎn)型:從CPU走向GPU,這頭巨獸已邁出兩個(gè)十年
作為一種資源密集型技術(shù),即便歷經(jīng)大半個(gè)世紀(jì)的發(fā)展,CAE領(lǐng)域仍然充滿挑戰(zhàn),始終向新技術(shù)與新解決方案敞開大門。
·精益求精的工程師們提出需求:更真實(shí)!更復(fù)雜!更大規(guī)模!
Altair、Ansys、Autodesk、Dassault Systèmes (Simulia)、Hexagon MSC和Siemens等主要工程仿真軟件提供商長(zhǎng)期依賴將CPU作為驅(qū)動(dòng)計(jì)算的主要引擎時(shí)開發(fā)出的技術(shù)。最初,模型已經(jīng)過簡(jiǎn)化,可適應(yīng)計(jì)算系統(tǒng),但制造業(yè)對(duì)仿真度有著孜孜不倦的追求。
然而,如若以基于CPU的工作流程來處理這些問題,則必須考慮到CPU的功能——必須縮小模型的大小、簡(jiǎn)化設(shè)計(jì)并管理網(wǎng)格大小,因此,最終評(píng)估的實(shí)體可能與要分析的真實(shí)事物大相徑庭。顯然,這又將我們帶回了原點(diǎn)。1999年,NVIDIA發(fā)明了GPU (圖形處理器),這為CAE實(shí)現(xiàn)重大轉(zhuǎn)型創(chuàng)造了舞臺(tái)。就像許多受益于并行處理的領(lǐng)域一樣,CAE的主要任務(wù)是執(zhí)行大規(guī)模并行進(jìn)程。CAE通過在模型上創(chuàng)建節(jié)點(diǎn)網(wǎng)格來評(píng)估模型,然后對(duì)節(jié)點(diǎn)應(yīng)用力和條件,評(píng)估設(shè)計(jì)是否適合其用途。網(wǎng)格越密集,仿真就越可靠。對(duì)于GPU來說,這是一個(gè)顯而易見的應(yīng)用領(lǐng)域,軟件供應(yīng)商和硬件開發(fā)者在GPU出現(xiàn)的初期就已經(jīng)認(rèn)識(shí)到了這一點(diǎn)。
·半導(dǎo)體巨頭推動(dòng)GPU加速的普及
GPU的優(yōu)勢(shì)在于單個(gè)芯片上的處理單元數(shù)量遠(yuǎn)超CPU,從處理器的角度上來比較,GPU的成本遠(yuǎn)低于CPU,但GPU和CPU的工作方式各不相同,需要針對(duì)兩者采用特定的編程方法,因而,為GPU調(diào)整這些程序卻并非易事。 這時(shí),GPU的發(fā)明者NVIDIA做出表率,于2006年發(fā)布NVIDIA CUDA (Compute Unified Device Architecture)——一種并行計(jì)算平臺(tái)和編程模型,并于2008年之后,與業(yè)內(nèi)領(lǐng)先的公司合作推進(jìn)OpenCL (Open Computing Language,開放設(shè)計(jì)語言)——專為異構(gòu)平臺(tái)(CPU/GPU/DSP/FPGA等)編程設(shè)計(jì)的框架。這些編程工具讓開發(fā)者能夠更輕松地利用GPU來大幅提升計(jì)算性能。
NVIDIA一直與CAE開發(fā)者合作,創(chuàng)建為仿真分析可視化常見任務(wù)量身打造的工具。公司獨(dú)樹一幟,專注于GPU,推動(dòng)其進(jìn)入專用工具開發(fā)領(lǐng)域。2023年,隨著NVIDIA的Grace CPU的推出,其將在GPU+CPU的道路上發(fā)展得更加深遠(yuǎn)。
2/軟件生態(tài)向GPU算力靠攏
半導(dǎo)體發(fā)展趨勢(shì)、GPU在并行計(jì)算方面的獨(dú)特優(yōu)勢(shì),以及NVIDIA等GPU廠商為CAE搭建的開發(fā)工具,讓入局以GPU為基礎(chǔ)的CAE變得更加容易。
·CAE不斷迭代:提高自動(dòng)化水平,注入AI
除了對(duì)更復(fù)雜、更逼真、更大規(guī)模的CAE應(yīng)用的需求外,21世紀(jì)初,計(jì)算機(jī)輔助設(shè)計(jì) (CAD) 軟件供應(yīng)商也開始獲取CAE技術(shù)以添加到設(shè)計(jì)工作流。集成到CAD流程中的分析工具具有更高的自動(dòng)化水平,這讓設(shè)計(jì)師能夠在工作時(shí)執(zhí)行簡(jiǎn)單分析。
要實(shí)現(xiàn)上述兩個(gè)愿景,需要構(gòu)建插件和附加組件來實(shí)現(xiàn)GPU加速,并進(jìn)一步添加云資源、推進(jìn)高性能計(jì)算 (HPC) 的應(yīng)用。同時(shí),人們也越來越關(guān)注使用機(jī)器學(xué)習(xí) (ML) 和人工智能 (AI) 來預(yù)處理和識(shí)別模型中值得關(guān)注的領(lǐng)域。
·軟件廠商爭(zhēng)先“吃螃蟹”
自2014年以來,各個(gè)主要CAE供應(yīng)商都在某種程度上利用了GPU加速。
Ansys和Hexagon專門針對(duì)GPU設(shè)計(jì)并編寫了應(yīng)用程序。
Ansys針對(duì)GPU從頭開始設(shè)計(jì)了應(yīng)用Discovery,這一互動(dòng)實(shí)時(shí)仿真解決方案允許在流體、熱力學(xué)、結(jié)構(gòu)和模態(tài)應(yīng)用中進(jìn)行迭代設(shè)計(jì)探索。此后,PTC與Ansys在2018年的LiveWorx 18數(shù)字化轉(zhuǎn)型會(huì)議上宣布,PTC的Creo 3D CAD軟件中將實(shí)現(xiàn)Ansys Discovery Live實(shí)時(shí)模擬功能,這消除了CAD與模擬活動(dòng)之間的界限。
Ansys Discovery典型應(yīng)用(圖片來源:Ansys)
同樣,Hexagon也決定從一開始就為GPU編寫其新產(chǎn)品MSC Apex Generative Design,NVIDIA的CUDA框架為Hexagon的開發(fā)者提供了一個(gè)輕松的切入點(diǎn),他們能夠立即開始編碼,不僅能夠更快生成產(chǎn)品,而且將設(shè)計(jì)、網(wǎng)格化和分析功能融于一體。
MSC Apex Generative Design的工作流程
西門子則是致力于讓其CFD軟件可以在CPU與GPU之間無縫切換。2022年初,西門子發(fā)布了首個(gè)GPU版本的Simcenter STAR-CCM+,這一版本在一開始專注于車輛外部空氣動(dòng)力學(xué)應(yīng)用,隨后,Siemens工程師投入巨資,移植所有可在未來數(shù)年從GPU中受益的物理、求解器和相關(guān)軟件部件。
達(dá)索系統(tǒng)(Dassault Systèmes)和Altair選擇將GPU加速逐漸應(yīng)用于原有產(chǎn)品中。
達(dá)索發(fā)現(xiàn),GPU的架構(gòu)非常適合基于有限差時(shí)域仿真算法的CST Studio Suite電磁仿真和分析,且從工作站GPU到數(shù)據(jù)中心計(jì)算GPU的擴(kuò)展效果非常出色。而Altair在實(shí)踐過程中得出,與用來處理類似工作負(fù)載的12個(gè)CPU相比,添加GPU可將AltairEDEM的性能提升20倍。
CST Studio Suite允許客戶訪問多種電磁仿真解算器
Altair EDEM的主要功能
迄今為止,已有來自10多個(gè)ISV的120多個(gè)CAE應(yīng)用通過GPU進(jìn)行加速。結(jié)果令人印象深刻,根據(jù)應(yīng)用和工作負(fù)載不同,結(jié)果的交付速度最高可提升100倍。此外,隨著GPU的添加,性能提升會(huì)進(jìn)一步飛躍。隨著越來越多的求解器移植到GPU上,可以預(yù)見性能會(huì)取得更大的突破。
·GPU自身的升級(jí)將為前期軟件投資帶來持續(xù)紅利
以NVIDIA為例,在今年9月的GTC大會(huì)上,其推出了基于全新Ada Lovelace架構(gòu)的NVIDIA RTX 6000工作站GPU,具有最先進(jìn)的NVIDIA RTX技術(shù),特點(diǎn)包括:
1)第三代RT Core:吞吐量是上一代的2倍,能夠同時(shí)運(yùn)行具有著色或去噪功能的光線追蹤技術(shù)。
2)第四代Tensor Core:相比上一代AI訓(xùn)練性能提升近2倍,擴(kuò)展支持FP8數(shù)據(jù)格式。
3)CUDA core:?jiǎn)尉雀↑c(diǎn)吞吐量最高達(dá)到上一代的2倍。
4)GPU顯存:具有48GB GDDR6顯存,可處理大規(guī)模的3D模型、圖像渲染、模擬和AI數(shù)據(jù)集。
5)虛擬化:將支持用于多個(gè)高性能虛擬工作站實(shí)例的NVIDIA虛擬GPU(vGPU)軟件,使遠(yuǎn)程用戶能夠共享資源并驅(qū)動(dòng)高端設(shè)計(jì)、AI和計(jì)算工作負(fù)載。
6)XR(擴(kuò)展現(xiàn)實(shí)):視頻編碼性能相比上一代產(chǎn)品提升近3倍,可使用NVIDIA CloudXR流式傳輸實(shí)現(xiàn)多個(gè)XR會(huì)話同步。
NVIDIA RTX 6000 Ada架構(gòu)GPU提供了實(shí)時(shí)渲染、圖形和AI功能,可以幫助設(shè)計(jì)師和工程師推動(dòng)基于仿真的尖端工作流程,以構(gòu)建和驗(yàn)證更復(fù)雜的設(shè)計(jì)。
憑借更大的二級(jí)緩存、更多的新一代核心和更高的內(nèi)存帶寬,Ansys Discovery和Ansys Fluent的用戶可以通過釋放NVIDIA RTX 6000的48GB GPU顯存的全部威力,進(jìn)行互動(dòng)式仿真驅(qū)動(dòng)的設(shè)計(jì)研究和高保真CFD仿真。NVIDIA針對(duì)這一應(yīng)用發(fā)布了演示視頻:
3/制造業(yè)利用GPU加速的CAE向工業(yè)元宇宙延伸
在CAE借助GPU過程中,沒有一家軟件公司采取相同的路線來實(shí)施GPU:他們都有自己的方法,對(duì)分析和仿真的作用有自己的理念,并有自身特別感興趣的領(lǐng)域。但我們確實(shí)看到,隨著GPU的出現(xiàn),CAE及制造業(yè)產(chǎn)品設(shè)計(jì)流程正在迅速變化。
同時(shí),在元宇宙概念席卷各行各業(yè)的背景下,GPU加速CAE的結(jié)果呈現(xiàn)方式將百花齊放。通過與XR相結(jié)合,設(shè)計(jì)師和審查人員可開啟沉浸式工作;采用虛擬GPU技術(shù),將讓工作流程在不局限于本地算力的同時(shí),保障數(shù)據(jù)安全性;將其置于協(xié)作平臺(tái)(例如NVIDIA Omniverse)中,則能打通制造業(yè)產(chǎn)品設(shè)計(jì)鏈路,大幅縮短正式投產(chǎn)前的準(zhǔn)備時(shí)間。
審核編輯 :李倩
-
gpu
+關(guān)注
關(guān)注
28文章
4752瀏覽量
129055 -
仿真
+關(guān)注
關(guān)注
50文章
4099瀏覽量
133716
原文標(biāo)題:GPU加速成為共識(shí),CAE和仿真模擬的未來將走向何方?
文章出處:【微信號(hào):baixiu01,微信公眾號(hào):制造界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論