第二代異構(gòu)計(jì)算與未來應(yīng)用愿景 - 給CPU直接開掛!從OpenPOWER的CAPI+FPGA看第二代異構(gòu)計(jì)算
第二代異構(gòu)計(jì)算與未來應(yīng)用愿景
如果說以GPGPU為主,大幅度提高系統(tǒng)浮點(diǎn)運(yùn)算能力是第一代異構(gòu)加速計(jì)算的典型特征的話,我們現(xiàn)在可以基本總體出以FPGA為主,所謂的第二代異構(gòu)計(jì)算的一些重要特征:第一:具備緩存一致性的內(nèi)存訪問能力,這是最為重要的特征,與第一代異構(gòu)計(jì)算有了本質(zhì)的不同,并對(duì)應(yīng)用編程具備了明顯的友好性;第二:基于FPGA可靈活配置加速模塊,毫無疑問,在第二代異構(gòu)計(jì)算中,F(xiàn)PGA將是一大主角,它本身靈活的可編程性為應(yīng)用加速提供了豐富的應(yīng)用場(chǎng)景;第三、它將隆重開啟整數(shù)運(yùn)算加速的大門,隨著FPGA編程的便利性進(jìn)一步提高,F(xiàn)PGA的整數(shù)型加速將會(huì)迅速普及(當(dāng)然絕不是說FPGA不能用于浮點(diǎn)加速,只是看應(yīng)用比例),這對(duì)于當(dāng)前的大數(shù)據(jù)、海量視頻處理、圖像匹配等新興需求不謀而合,就像當(dāng)初GPGPU與科學(xué)計(jì)算的發(fā)展相得益彰一樣,第二代異構(gòu)計(jì)算將把相應(yīng)的整數(shù)型應(yīng)用的性能帶到新的高度。
當(dāng)然,看到這一趨勢(shì)的不僅僅是IBM與OpenPOWER,CPU巨頭英特爾以167億美元收購FPGA第二大廠Altera的用意也不言自明。在不久前結(jié)束的IDF15上(英特爾信息技術(shù)峰會(huì)2015美國站),英特爾正式發(fā)布了CPU通過QPI直聯(lián)FPGA的方案設(shè)計(jì)。
?
采用QPI接口與CPU互聯(lián),明擺著是沖著緩存一致性而來,這與CAPI的思路異曲同工,并且在服務(wù)器的配置上給出了新的可能(比如FPGA芯片Socket化或直接板載),這與CAPI有了明顯的不同,可謂各有利弊,但共同點(diǎn)都是開啟了第二代異構(gòu)計(jì)算的時(shí)代
當(dāng)越來越多的FPGA加速芯片以各種緩存一致性的方式接入系統(tǒng)之后,由于FPGA的SRAM高速編程模式,理論上講FPGA可以迅速的且無限次的更新內(nèi)置的AFU,以應(yīng)對(duì)不同的應(yīng)用加速需求。這就給我們打開了一個(gè)想像空間——能否像Docker管理容器鏡像那樣,基于云+端的概念建立起一個(gè)AFU鏡像的集散中心呢?事實(shí)上,OpenPOWER聯(lián)盟也正在為此而努力——建立AFU鏡像商店。
?
OpenPOWER CAPI-FPGA加速卡AFU鏡像商店的更新流程(筆者猜想繪制,謹(jǐn)供參考)
屆時(shí),任何相關(guān)的開發(fā)者、ISV都可以將自己針對(duì)某些具體的FPGA卡(經(jīng)CAPI認(rèn)證)所編寫的AFU鏡像(其實(shí)就是FPGA的編程配置文件),上傳至AFU商店供其他用戶免費(fèi)或有償使用。相關(guān)的AFU用戶則可以像Docker那樣,根據(jù)自己應(yīng)用加速的需求與FPGA加速卡的型號(hào),免費(fèi)或付費(fèi)下載相應(yīng)的AFU鏡像,通過全局的管理平臺(tái),分發(fā)給指定服務(wù)器上的CAPI更新控制器,由后者與指定的FPGA加速卡(一臺(tái)服務(wù)器可以有多塊加速卡,選擇更新)PSL內(nèi)的AFU更新模塊一起加載AFU鏡像。加載的方式有兩種,一種是完整的FPGA重寫(所有的門電路重寫,包括PSL),另一種則是AFU單獨(dú)更新。前者需要重起服務(wù)器,而后者則可以在線動(dòng)態(tài)更新。目前100萬門的FPGA的配置文件容量也就在50MB左右,由于是基于SRAM的硬件編程,100ms內(nèi)即可更新完畢,用戶幾乎沒有察覺,但服務(wù)器的加速功能就已經(jīng)完全改變了。
我們可以試想一下這樣的場(chǎng)景,對(duì)于某個(gè)內(nèi)置CAPI+FPGA加速器的服務(wù)器集群,可以靈活的根據(jù)工作負(fù)載的需求改變FPGA中的AFU模塊,讓這個(gè)集群迅速具備針對(duì)新負(fù)載的加速能力,這對(duì)于集群高效的多場(chǎng)景靈活復(fù)用顯然是很有幫助的,而這種模式也是GPGPU、DSP、ASIC等加速方式很難做到的。
展望未來,從某種角度上講,GPGPU與FPGA在未來的應(yīng)用系統(tǒng)中,將根據(jù)自身的特長(zhǎng)有所側(cè)重。如果將CPU比作人的話,GPGPU更像是高級(jí)計(jì)算器,為人類提供強(qiáng)大的科學(xué)計(jì)算的能力,做好學(xué)術(shù)研究,而FPGA更像是為某類工作定制的效率工具,執(zhí)行大量的固定而高度重復(fù)化的工作,大幅度提高人類的日常生活與工作效率(比如洗衣機(jī)、生產(chǎn)機(jī)器人),而人在未來更多的就是負(fù)責(zé)管理,用好計(jì)算器與效率工具——CPU的角色相信也會(huì)如此,隨著技術(shù)的不斷發(fā)展,更多的浮點(diǎn)與整數(shù)運(yùn)算任務(wù)將會(huì)被GPGPU、FPGA、DSP、ASIC等不同的加速器所分擔(dān)。
從第二代異構(gòu)計(jì)算至第二代分布式計(jì)算?
基于上文所分析的CAPI+FPGA所展現(xiàn)出來的能力,我們進(jìn)一步從單服務(wù)器延展至整個(gè)分布式計(jì)算的架構(gòu),這就需要我們從一個(gè)更為廣闊的全局視角來看待第二代異構(gòu)計(jì)算所帶來的關(guān)鍵影響。不久前,IBM提出的“第二代分布式計(jì)算”理念也正是基于這一全局的層次來建立的(據(jù)說在9月16日會(huì)召開發(fā)布會(huì)進(jìn)行專門的闡述 )。
IBM中國研究院的高級(jí)研究員陳飛表示,IBM提出的第二代分布式計(jì)算要有四個(gè)重要的特征,第一個(gè)特征:加速器的軟硬件接口有統(tǒng)一的接口規(guī)范,以便于更好的協(xié)同管理與普適(第一代分布式計(jì)算的接口標(biāo)準(zhǔn)較為統(tǒng)一,畢竟只有CPU本身,相對(duì)更標(biāo)準(zhǔn)化),這方面CAPI就是一個(gè)標(biāo)準(zhǔn)化接口的嘗試。第二個(gè)特征:加速器可以被動(dòng)態(tài)的在線被設(shè)備發(fā)現(xiàn)以及加載。比如不需要要求系統(tǒng)的重啟,但現(xiàn)在的加速器如果要改變功能,一般都要要求重啟,或者是重啟一些軟件服務(wù),但CAPI+FPGA則沒有這個(gè)顧慮。第三個(gè)特征:分布式的系統(tǒng)要具備全局異構(gòu)資源的調(diào)度能力,也就是說它能決定哪些應(yīng)用運(yùn)行在一個(gè)具有這種加速硬件的計(jì)算節(jié)點(diǎn)上,還是跑在一個(gè)普通的純CPU的計(jì)算節(jié)點(diǎn)上。第四個(gè)特征:應(yīng)該軟件本身,具備兼容CPU運(yùn)行模式和異構(gòu)硬件運(yùn)行模式的能力。
NVIDIA推出NVLINK互聯(lián)總線,除了可作為GPU之間的互聯(lián)外,還可用于CPU與GPU的互聯(lián),并也將具備緩存一致性的內(nèi)存訪問能力,IBM的POWER9處理器(預(yù)計(jì)2017年下半年發(fā)布)將具備這一接口,這就意味著在POWER9平臺(tái)上NVIDIA的GPU也會(huì)獲得與CAPI同樣的對(duì)等訪問能力,這樣的GPGPU加速能力也將是POWER9獨(dú)有的(在英特爾x86平臺(tái)上,與CPU的互聯(lián)連接仍然是傳統(tǒng)的PCIe模式,NVLINK僅用于NVIDIA GPU之間的互聯(lián)),對(duì)IBM所提出的第二代分布式計(jì)算理念無疑是一個(gè)有力支撐
從以上定義中,我們可以看出,正是CAPI+FPGA所具備的一些關(guān)鍵特性(緩存一致性、在線更新性、AFU替換能力等)為IBM所提出的第二代分布式計(jì)算打下了理論基礎(chǔ)。當(dāng)然,對(duì)于這個(gè)定義,我仍然有一些異議,畢竟從總體上講,這個(gè)分布式處理的基礎(chǔ)架構(gòu)與應(yīng)用分布處理的模式,和第一代相比并沒有本質(zhì)的不同,更多是分布式節(jié)點(diǎn)上處理模式的創(chuàng)新,并且由于加速體系標(biāo)準(zhǔn)的更加多樣化,也讓其普適性受到懷疑,除非有非常強(qiáng)大的全局管理平臺(tái)來屏蔽掉底層的硬件差異性,否則全局上的“加速孤島”現(xiàn)象不可避免(雖然對(duì)于具體的用戶來說,這可能不是問題)。
但是,不管怎樣,第二代異構(gòu)計(jì)算的模式,的確打開了我們的想像空間,它是否真的帶來理想中的第二代分布式計(jì)算體系,還要看IBM、英特爾以及加速器、方案集成等前沿廠商的共同努力!不過,可以肯定的是,不管這種新興的處理模式將如何稱謂,它對(duì)于新時(shí)代下的信息處理平臺(tái)(大數(shù)據(jù)分析、物聯(lián)網(wǎng)、人工智能、機(jī)器學(xué)習(xí)等)所帶來的明顯幫助,以及為最終用戶創(chuàng)造的巨大價(jià)值,都將是毋庸置疑的!
- 第 1 頁:給CPU直接開掛!從OpenPOWER的CAPI+FPGA看第二代異構(gòu)計(jì)算
- 第 2 頁:OpenPOWER CAPI簡(jiǎn)介
- 第 3 頁:第二代異構(gòu)計(jì)算與未來應(yīng)用愿景
本文導(dǎo)航
非常好我支持^.^
(1) 100%
不好我反對(duì)
(0) 0%
相關(guān)閱讀:
- [電子說] Blackwell GB100能否在超級(jí)計(jì)算機(jī)和AI市場(chǎng)保持領(lǐng)先優(yōu)勢(shì)? 2023-10-24
- [電子說] 3線串行數(shù)據(jù)通訊EEPROM的使用 2023-10-23
- [電子說] 浩辰軟件深耕CAD領(lǐng)域 致力于成為行業(yè)標(biāo)桿企業(yè) 2023-10-23
- [電子說] SymPy:四行代碼秒解微積分 2023-10-21
- [電子說] 強(qiáng)固型智慧工廠解決方案:BOXER-6406-AND 2023-10-21
- [電子說] 飛秒激光器在醫(yī)學(xué)上的應(yīng)用 2023-10-21
- [電子說] TCP/IP協(xié)議和OPC協(xié)議的區(qū)別 2023-10-20
- [電子說] 機(jī)器視覺系統(tǒng)的基本原理 機(jī)器視覺技術(shù)的發(fā)展現(xiàn)狀和應(yīng)用 2023-10-19
( 發(fā)表人:郭婷 )