由于仿真軟件需要耗費(fèi)大量計(jì)算資源,許多計(jì)算機(jī)輔助工程 (CAE) 應(yīng)用都可以從 GPU 的并行處理能力中大受裨益。與 CPU 相比,GPU 的密度更高而總體擁有成本更低,因此具有明顯的性價(jià)比優(yōu)勢(shì),今天為大家分享基于CFD領(lǐng)域的GPU加速體驗(yàn)。
計(jì)算流體仿真力學(xué),英文全稱Computational Fluid Dynamics,縮寫為CFD,它是數(shù)值數(shù)學(xué)和計(jì)算機(jī)科學(xué)結(jié)合的產(chǎn)物,通過空間離散和數(shù)值求解的思路,對(duì)流體力學(xué)的各類問題進(jìn)行數(shù)值實(shí)驗(yàn)、模擬和分析研究,以解決學(xué)習(xí)、科研或者工程設(shè)計(jì)中的問題。
面對(duì)一個(gè)具體的工程問題,CFD工程師在應(yīng)用CFD工具進(jìn)行仿真分析時(shí)的基本流程,通常可以總結(jié)為五步:前處理、網(wǎng)格劃分、邊界條件加載、求解計(jì)算和后處理。但如何去平衡計(jì)算量(網(wǎng)格數(shù)量)和計(jì)算時(shí)間,對(duì)于很多CFD工程師都是個(gè)挑戰(zhàn)。
在實(shí)際解決問題的過程中,CFD工程師除了希望能選擇一款稱手的軟件工具外,當(dāng)然也希望計(jì)算機(jī)的主頻越高越好,核心越多越好。但是,核心與計(jì)算速度并非線性關(guān)系,不會(huì)因?yàn)楹诵牡缺壤鲩L(zhǎng)。若想在單臺(tái)電腦上發(fā)揮極限運(yùn)算能力,還需要使用GPU加速,因?yàn)镚PU加速通過協(xié)調(diào)處理器并行運(yùn)算,能夠極大地提升計(jì)算能力,尤其適合多個(gè)項(xiàng)目同時(shí)進(jìn)行,這樣獲得的時(shí)間收益較大。
流體仿真為什么要選擇GPU?
CFD始終向處理更高精確度、更復(fù)雜的幾何結(jié)構(gòu)方向發(fā)展。但現(xiàn)階段,CFD軟件應(yīng)用于復(fù)雜流體問題方面還有待拓展,受到的阻礙主要源自以下三個(gè)方面:
● 隱式算法的高內(nèi)存要求——一些CFD分析工程師總是希望得到完美的殘差收斂曲線,以證明計(jì)算結(jié)果的可靠性,因此,他們會(huì)首選隱式算法,這意味著高內(nèi)存的需求;
● CFD結(jié)果對(duì)網(wǎng)格的強(qiáng)依賴性——網(wǎng)格的合理設(shè)計(jì)和高質(zhì)量生成是CFD計(jì)算的前提條件,是影響CFD計(jì)算結(jié)果的最主要的決定性因素之一,是CFD工作中人工工作量最大的部分,也是制約CFD工作效率的瓶頸問題之一。即使在CFD高度發(fā)達(dá)的國(guó)家,網(wǎng)格生成仍占整個(gè)CFD計(jì)算任務(wù)全部人力時(shí)間的70%~80%。
● 工程流體仿真問題復(fù)雜多變——在流體力學(xué)模擬中,由于流體力學(xué)模擬是個(gè)復(fù)雜的過程,存在極端變形、自由液面以及物質(zhì)運(yùn)動(dòng)交界面等問題,在應(yīng)用網(wǎng)格數(shù)值模擬時(shí),會(huì)出現(xiàn)網(wǎng)格扭曲導(dǎo)致計(jì)算不收斂或者產(chǎn)生很大的計(jì)算誤差,需要重新模擬,這使得計(jì)算成本大大增加。
為了使CFD仿真發(fā)揮最大效用,CFD工程師往往需要快速得到計(jì)算結(jié)果。而借助于GPU加速計(jì)算所提供的非凡應(yīng)用程序性能,能將CFD程序計(jì)算密集部分的工作負(fù)載轉(zhuǎn)移到GPU,同時(shí)仍有CPU運(yùn)行其余程序代碼,這樣計(jì)算速度大大提升。另外,從計(jì)算性能來看,在CFD應(yīng)用中單個(gè)GPU的性能遠(yuǎn)遠(yuǎn)優(yōu)于CPU,基于GPU加速的CFD計(jì)算速度明顯加快,很多復(fù)雜的CFD難題得以解決,因此,越來越多的CFD工程師選擇GPU加速。
流體仿真分析GPU評(píng)測(cè)
CFD是一個(gè)計(jì)算需求強(qiáng)烈的領(lǐng)域,GPU的選擇將從根本上決定CFD分析過程的體驗(yàn)。在CFD分析中,工程師前期花費(fèi)的時(shí)間主要在模型建立和修改上,后期真正的分析時(shí)間消耗在計(jì)算機(jī)上,因此,選擇一款適合自身的CFD軟件和高性能建模工作站就顯得尤為重要。接下來分享來自e-works平臺(tái)基于Altair CFD應(yīng)用軟件以及一些案例模型的實(shí)際評(píng)測(cè),供大家參考:
基于Altair AcuSolve軟件的 GPU加速
【軟件環(huán)境介紹】Altair AcuSolve是一款基于GLS-FEM算法的通用熱流體求解器,不但有快速良好的收斂速度,還能達(dá)到很高的求解精度,同時(shí)對(duì)網(wǎng)格有良好的兼容性,特別方便于復(fù)雜模型網(wǎng)格的劃分,廣泛應(yīng)用于汽車、流體機(jī)械和海洋平臺(tái)等工業(yè)和科學(xué)應(yīng)用問題的解決。值得一提的是,最新版本的AcuSolve,不僅通過GPU加速提高了3~4倍的計(jì)算速度,同時(shí)也支持核態(tài)沸騰、熱輻射、冷凝/蒸發(fā)多相流和流固耦合(FSI)等CFD難題的解決。
【硬件環(huán)境介紹】CPU采用單顆Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU選用Quadro RTX 8000,它采用了NVIDIA Turing架構(gòu)和NVIDIA RTX平臺(tái)支持,對(duì)于追求以高穩(wěn)健性、高精度為目標(biāo)的CFD仿真分析帶來了卓越的計(jì)算性能體驗(yàn)。
【測(cè)試模型】在新能源汽車、醫(yī)療設(shè)備、軍工設(shè)備等大功率密度的應(yīng)用場(chǎng)合,設(shè)備運(yùn)行時(shí)會(huì)產(chǎn)生大量的熱損耗,為保證設(shè)備的安全運(yùn)行,需要采用各種冷卻措施來對(duì)設(shè)備進(jìn)行冷卻,水冷是其中一種方式。以新能源車的水冷板為例,其設(shè)計(jì)直接影電池的溫度均勻性,進(jìn)而影響車輛的續(xù)航里程和安全性。本測(cè)試模型擁有網(wǎng)格數(shù)量4300萬,求解方程采用湍流+固體傳熱組合,湍流模型選擇基于SA一方程的模型,設(shè)置穩(wěn)態(tài)迭代步為200步,分別采用無GPU和1塊GPU加速進(jìn)行計(jì)算時(shí)間對(duì)比。
動(dòng)力電池水冷板模型
計(jì)算時(shí)間對(duì)比
【測(cè)試結(jié)果】數(shù)據(jù)表明,無GPU加速時(shí),水冷板分析的計(jì)算時(shí)間需要21小時(shí);采用單塊Quadro RTX 8000加速,水冷板分析的計(jì)算時(shí)間只需要4小時(shí)。由此可見,采用Altair AcuSolve進(jìn)行水冷板仿真分析,并提供RTX GPU的增強(qiáng)支持,計(jì)算速度與無GPU加速相比提高了4.25倍。顯然,這種方式對(duì)于CFD工程師快速探索水冷板的設(shè)計(jì),并根據(jù)準(zhǔn)確的計(jì)算結(jié)果做出決策非常有益。
基于Altair nanoFluidX軟件的 GPU加速
【軟件環(huán)境介紹】Altair nanoFluidX是一款基于粒子的流體動(dòng)力學(xué) (SPH) 仿真工具,用于預(yù)測(cè)運(yùn)動(dòng)軌跡復(fù)雜的幾何結(jié)構(gòu)周圍的流體。以整車CFD仿真為例,傳統(tǒng)CFD方法需要建立網(wǎng)格耗時(shí)巨大,但Altair nanoFluidX基于粒子的特性,無需建立網(wǎng)格,還可基于GPU顯卡計(jì)算,非常有助于工程師獲得簡(jiǎn)潔而高效的CFD解決方案。
【硬件環(huán)境介紹】CPU采用單顆Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU選用Quadro RTX 8000和Tesla V100,由于Altair nanoFluidX采用的粒子方法,其計(jì)算是由一系列的流體粒子的相互作用完成,在計(jì)算中每個(gè)粒子所執(zhí)行的計(jì)算是完全相同的,而在不同的數(shù)據(jù)上執(zhí)行相同的程序,恰恰是GPU計(jì)算最擅長(zhǎng)的。
【測(cè)試模型】整車涉水分析是近年來新興的CFD仿真領(lǐng)域,主要研究汽車以一定速度涉水時(shí),關(guān)鍵零部件的進(jìn)水風(fēng)險(xiǎn),如防火墻滲水,傳統(tǒng)的發(fā)動(dòng)機(jī)進(jìn)氣口進(jìn)水,電動(dòng)汽車電氣短路等問題。整車涉水模型往往需要消耗大量的計(jì)算資源和時(shí)間進(jìn)行求解,以本次建立的整車涉水模型為例,擁有粒子數(shù)量為4100萬,設(shè)置車速為50公里/小時(shí)、瞬態(tài)物理時(shí)間為4秒,建立單相流模型,本次測(cè)試分別采用1塊RTX 8000 、2塊RTX 8000、4塊RTX 8000和4塊Tesla V100加速,對(duì)比計(jì)算時(shí)間。
整車涉水模型
計(jì)算時(shí)間對(duì)比
【測(cè)試結(jié)果】數(shù)據(jù)表明,采用1塊、2塊、4塊RTX 8000加速,整車涉水分析分別需要花費(fèi)48小時(shí)、28小時(shí)、13小時(shí);采用4塊V100,則需要16個(gè)小時(shí)。從計(jì)算時(shí)間來看,采用4塊RTX 8000加速,計(jì)算時(shí)間最少,與采用1塊RTX 8000加速相比,計(jì)算速度提升了約2.7倍。計(jì)算結(jié)果也表明,采用基于GPU加速和Altair nanoFluidX的組合方式,允許CFD工程師在一個(gè)更可接受的短時(shí)間內(nèi)研究類似整車涉水這樣的復(fù)雜流體問題。
基于Altair ultraFluidX軟件的 GPU加速
【軟件環(huán)境介紹】Altair ultraFluidX專用于超快預(yù)測(cè)乘用車、輕型卡車、賽車和重型車輛的空氣動(dòng)力特性的仿真分析,它基于格子玻爾茲曼(LBM)技術(shù),無需建立網(wǎng)格,這大大縮短了建模時(shí)間,使得設(shè)計(jì)變得更加容易,同時(shí)保留了所有重要的幾何細(xì)節(jié)。
【硬件環(huán)境介紹】CPU采用單顆Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU選用NVIDIA RTX8000和NVIDIA Tesla V100,由于Altair ultraFluidX采用的LBM方法,非常適合大規(guī)模并行架構(gòu),而采用GPU加速,可以明顯提高吞吐量,達(dá)到Altair ultraFluidX的周轉(zhuǎn)時(shí)間,同時(shí)降低硬件和能源成本。
【測(cè)試模型】對(duì)于車輛的早期開發(fā)優(yōu)化,采用CFD手段無疑是最有效且最經(jīng)濟(jì)的方法,但這類CFD分析往往是高內(nèi)存和高計(jì)算資源消耗的典型代表,需要使用GPU來優(yōu)化計(jì)算性能。以此次建立的汽車虛擬風(fēng)洞模型為例,擁有格子數(shù)量1億6千萬,格子的最小尺寸為1.8mm,設(shè)置車速為140公里/小時(shí)、瞬態(tài)物理時(shí)間為2秒,分別采用2塊NVIDIA RTX 8000、4塊NVIDIA RTX 8000和4塊V100加速,對(duì)比計(jì)算時(shí)間。
汽車虛擬風(fēng)洞模型
計(jì)算時(shí)間對(duì)比
【測(cè)試結(jié)果】數(shù)據(jù)表明,采用2塊、4塊NVIDIA RTX8000加速,模擬汽車虛擬風(fēng)洞分別需要花費(fèi)14小時(shí)、8小時(shí);采用4塊V100,則需要8.4個(gè)小時(shí)。三種GPU加速中,采用4塊NVIDIA RTX8000加速,計(jì)算時(shí)間最少,與采用2塊NVIDIA RTX8000加速相比,計(jì)算速度提升了約0.75倍。計(jì)算結(jié)果也表明,基于GPU和Altair ultraFluidX的組合方式,可以明顯加速汽車虛擬風(fēng)洞分析,有效縮短汽車開發(fā)周期。
總結(jié)
作為當(dāng)前最重要的三大協(xié)處理加速技術(shù)之一,GPU已經(jīng)成為數(shù)值分析的新寵,廣泛應(yīng)用于各個(gè)領(lǐng)域。以流體仿真領(lǐng)域?yàn)槔S著CFD分析對(duì)計(jì)算能力的要求日益增高,越來越多的CFD工程師傾向于采用GPU加速,例如借助 RTX 8000 GPU加速,能以遠(yuǎn)低于傳統(tǒng) CPU 解決方案的成本、空間和功耗,獲得無與倫比的計(jì)算性能。
同時(shí),在渲染方面,利用RTX 8000強(qiáng)大的運(yùn)算能力,將流場(chǎng)和流體構(gòu)件建立數(shù)學(xué)模型,并用數(shù)字化可視化的形式表現(xiàn)出來,可以獲得任意位置的結(jié)果值,這無疑也極大地提高了設(shè)計(jì)的精確性。e-works認(rèn)為,優(yōu)秀的計(jì)算性能和尖端的數(shù)值方法的組合,在更短的時(shí)間內(nèi)研究復(fù)雜的流體問題,將成為未來CFD領(lǐng)域高效而主流的方式。
編輯:hfy
-
gpu
+關(guān)注
關(guān)注
28文章
4760瀏覽量
129129 -
CFD
+關(guān)注
關(guān)注
1文章
120瀏覽量
18441
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論