在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>電子百科>主機(jī)配件>cpu>

第二代異構(gòu)計(jì)算與未來應(yīng)用愿景 - 給CPU直接開掛!從OpenPOWER的CAPI+FPGA看第二代異構(gòu)計(jì)算

2017年11月17日 11:49 ZD至頂網(wǎng)服務(wù)器頻道 作者:趙效民 用戶評(píng)論(0
關(guān)鍵字:計(jì)算機(jī)(82752)

第二代異構(gòu)計(jì)算與未來應(yīng)用愿景

如果說以GPGPU為主,大幅度提高系統(tǒng)浮點(diǎn)運(yùn)算能力是第一代異構(gòu)加速計(jì)算的典型特征的話,我們現(xiàn)在可以基本總體出以FPGA為主,所謂的第二代異構(gòu)計(jì)算的一些重要特征:第一:具備緩存一致性的內(nèi)存訪問能力,這是最為重要的特征,與第一代異構(gòu)計(jì)算有了本質(zhì)的不同,并對(duì)應(yīng)用編程具備了明顯的友好性;第二:基于FPGA可靈活配置加速模塊,毫無疑問,在第二代異構(gòu)計(jì)算中,F(xiàn)PGA將是一大主角,它本身靈活的可編程性為應(yīng)用加速提供了豐富的應(yīng)用場(chǎng)景;第三、它將隆重開啟整數(shù)運(yùn)算加速的大門,隨著FPGA編程的便利性進(jìn)一步提高,F(xiàn)PGA的整數(shù)型加速將會(huì)迅速普及(當(dāng)然絕不是說FPGA不能用于浮點(diǎn)加速,只是看應(yīng)用比例),這對(duì)于當(dāng)前的大數(shù)據(jù)、海量視頻處理、圖像匹配等新興需求不謀而合,就像當(dāng)初GPGPU與科學(xué)計(jì)算的發(fā)展相得益彰一樣,第二代異構(gòu)計(jì)算將把相應(yīng)的整數(shù)型應(yīng)用的性能帶到新的高度。

當(dāng)然,看到這一趨勢(shì)的不僅僅是IBM與OpenPOWER,CPU巨頭英特爾以167億美元收購FPGA第二大廠Altera的用意也不言自明。在不久前結(jié)束的IDF15上(英特爾信息技術(shù)峰會(huì)2015美國站),英特爾正式發(fā)布了CPU通過QPI直聯(lián)FPGA的方案設(shè)計(jì)。

采用QPI接口與CPU互聯(lián),明擺著是沖著緩存一致性而來,這與CAPI的思路異曲同工,并且在服務(wù)器的配置上給出了新的可能(比如FPGA芯片Socket化或直接板載),這與CAPI有了明顯的不同,可謂各有利弊,但共同點(diǎn)都是開啟了第二代異構(gòu)計(jì)算的時(shí)代

?

采用QPI接口與CPU互聯(lián),明擺著是沖著緩存一致性而來,這與CAPI的思路異曲同工,并且在服務(wù)器的配置上給出了新的可能(比如FPGA芯片Socket化或直接板載),這與CAPI有了明顯的不同,可謂各有利弊,但共同點(diǎn)都是開啟了第二代異構(gòu)計(jì)算的時(shí)代

當(dāng)越來越多的FPGA加速芯片以各種緩存一致性的方式接入系統(tǒng)之后,由于FPGA的SRAM高速編程模式,理論上講FPGA可以迅速的且無限次的更新內(nèi)置的AFU,以應(yīng)對(duì)不同的應(yīng)用加速需求。這就給我們打開了一個(gè)想像空間——能否像Docker管理容器鏡像那樣,基于云+端的概念建立起一個(gè)AFU鏡像的集散中心呢?事實(shí)上,OpenPOWER聯(lián)盟也正在為此而努力——建立AFU鏡像商店。

OpenPOWER CAPI-FPGA加速卡AFU鏡像商店的更新流程(筆者猜想繪制,謹(jǐn)供參考)

?

OpenPOWER CAPI-FPGA加速卡AFU鏡像商店的更新流程(筆者猜想繪制,謹(jǐn)供參考)

屆時(shí),任何相關(guān)的開發(fā)者、ISV都可以將自己針對(duì)某些具體的FPGA卡(經(jīng)CAPI認(rèn)證)所編寫的AFU鏡像(其實(shí)就是FPGA的編程配置文件),上傳至AFU商店供其他用戶免費(fèi)或有償使用。相關(guān)的AFU用戶則可以像Docker那樣,根據(jù)自己應(yīng)用加速的需求與FPGA加速卡的型號(hào),免費(fèi)或付費(fèi)下載相應(yīng)的AFU鏡像,通過全局的管理平臺(tái),分發(fā)給指定服務(wù)器上的CAPI更新控制器,由后者與指定的FPGA加速卡(一臺(tái)服務(wù)器可以有多塊加速卡,選擇更新)PSL內(nèi)的AFU更新模塊一起加載AFU鏡像。加載的方式有兩種,一種是完整的FPGA重寫(所有的門電路重寫,包括PSL),另一種則是AFU單獨(dú)更新。前者需要重起服務(wù)器,而后者則可以在線動(dòng)態(tài)更新。目前100萬門的FPGA的配置文件容量也就在50MB左右,由于是基于SRAM的硬件編程,100ms內(nèi)即可更新完畢,用戶幾乎沒有察覺,但服務(wù)器的加速功能就已經(jīng)完全改變了。

我們可以試想一下這樣的場(chǎng)景,對(duì)于某個(gè)內(nèi)置CAPI+FPGA加速器的服務(wù)器集群,可以靈活的根據(jù)工作負(fù)載的需求改變FPGA中的AFU模塊,讓這個(gè)集群迅速具備針對(duì)新負(fù)載的加速能力,這對(duì)于集群高效的多場(chǎng)景靈活復(fù)用顯然是很有幫助的,而這種模式也是GPGPU、DSP、ASIC等加速方式很難做到的。

展望未來,從某種角度上講,GPGPU與FPGA在未來的應(yīng)用系統(tǒng)中,將根據(jù)自身的特長(zhǎng)有所側(cè)重。如果將CPU比作人的話,GPGPU更像是高級(jí)計(jì)算器,為人類提供強(qiáng)大的科學(xué)計(jì)算的能力,做好學(xué)術(shù)研究,而FPGA更像是為某類工作定制的效率工具,執(zhí)行大量的固定而高度重復(fù)化的工作,大幅度提高人類的日常生活與工作效率(比如洗衣機(jī)、生產(chǎn)機(jī)器人),而人在未來更多的就是負(fù)責(zé)管理,用好計(jì)算器與效率工具——CPU的角色相信也會(huì)如此,隨著技術(shù)的不斷發(fā)展,更多的浮點(diǎn)與整數(shù)運(yùn)算任務(wù)將會(huì)被GPGPU、FPGA、DSP、ASIC等不同的加速器所分擔(dān)。

從第二代異構(gòu)計(jì)算至第二代分布式計(jì)算?

基于上文所分析的CAPI+FPGA所展現(xiàn)出來的能力,我們進(jìn)一步從單服務(wù)器延展至整個(gè)分布式計(jì)算的架構(gòu),這就需要我們從一個(gè)更為廣闊的全局視角來看待第二代異構(gòu)計(jì)算所帶來的關(guān)鍵影響。不久前,IBM提出的“第二代分布式計(jì)算”理念也正是基于這一全局的層次來建立的(據(jù)說在9月16日會(huì)召開發(fā)布會(huì)進(jìn)行專門的闡述 )。

IBM中國研究院的高級(jí)研究員陳飛表示,IBM提出的第二代分布式計(jì)算要有四個(gè)重要的特征,第一個(gè)特征:加速器的軟硬件接口有統(tǒng)一的接口規(guī)范,以便于更好的協(xié)同管理與普適(第一代分布式計(jì)算的接口標(biāo)準(zhǔn)較為統(tǒng)一,畢竟只有CPU本身,相對(duì)更標(biāo)準(zhǔn)化),這方面CAPI就是一個(gè)標(biāo)準(zhǔn)化接口的嘗試。第二個(gè)特征:加速器可以被動(dòng)態(tài)的在線被設(shè)備發(fā)現(xiàn)以及加載。比如不需要要求系統(tǒng)的重啟,但現(xiàn)在的加速器如果要改變功能,一般都要要求重啟,或者是重啟一些軟件服務(wù),但CAPI+FPGA則沒有這個(gè)顧慮。第三個(gè)特征:分布式的系統(tǒng)要具備全局異構(gòu)資源的調(diào)度能力,也就是說它能決定哪些應(yīng)用運(yùn)行在一個(gè)具有這種加速硬件的計(jì)算節(jié)點(diǎn)上,還是跑在一個(gè)普通的純CPU的計(jì)算節(jié)點(diǎn)上。第四個(gè)特征:應(yīng)該軟件本身,具備兼容CPU運(yùn)行模式和異構(gòu)硬件運(yùn)行模式的能力。

NVIDIA推出NVLINK互聯(lián)總線,除了可作為GPU之間的互聯(lián)外,還可用于CPU與GPU的互聯(lián),并也將具備緩存一致性的內(nèi)存訪問能力,IBM的POWER9處理器(預(yù)計(jì)2017年下半年發(fā)布)將具備這一接口,這就意味著在POWER9平臺(tái)上NVIDIA的GPU也會(huì)獲得與CAPI同樣的對(duì)等訪問能力,這樣的GPGPU加速能力也將是POWER9獨(dú)有的(在英特爾x86平臺(tái)上,與CPU的互聯(lián)連接仍然是傳統(tǒng)的PCIe模式,NVLINK僅用于NVIDIA GPU之間的互聯(lián)),對(duì)IBM所提出的第二代分布式計(jì)算理念無疑是一個(gè)有力支撐

NVIDIA推出NVLINK互聯(lián)總線,除了可作為GPU之間的互聯(lián)外,還可用于CPU與GPU的互聯(lián),并也將具備緩存一致性的內(nèi)存訪問能力,IBM的POWER9處理器(預(yù)計(jì)2017年下半年發(fā)布)將具備這一接口,這就意味著在POWER9平臺(tái)上NVIDIA的GPU也會(huì)獲得與CAPI同樣的對(duì)等訪問能力,這樣的GPGPU加速能力也將是POWER9獨(dú)有的(在英特爾x86平臺(tái)上,與CPU的互聯(lián)連接仍然是傳統(tǒng)的PCIe模式,NVLINK僅用于NVIDIA GPU之間的互聯(lián)),對(duì)IBM所提出的第二代分布式計(jì)算理念無疑是一個(gè)有力支撐

從以上定義中,我們可以看出,正是CAPI+FPGA所具備的一些關(guān)鍵特性(緩存一致性、在線更新性、AFU替換能力等)為IBM所提出的第二代分布式計(jì)算打下了理論基礎(chǔ)。當(dāng)然,對(duì)于這個(gè)定義,我仍然有一些異議,畢竟從總體上講,這個(gè)分布式處理的基礎(chǔ)架構(gòu)與應(yīng)用分布處理的模式,和第一代相比并沒有本質(zhì)的不同,更多是分布式節(jié)點(diǎn)上處理模式的創(chuàng)新,并且由于加速體系標(biāo)準(zhǔn)的更加多樣化,也讓其普適性受到懷疑,除非有非常強(qiáng)大的全局管理平臺(tái)來屏蔽掉底層的硬件差異性,否則全局上的“加速孤島”現(xiàn)象不可避免(雖然對(duì)于具體的用戶來說,這可能不是問題)。

但是,不管怎樣,第二代異構(gòu)計(jì)算的模式,的確打開了我們的想像空間,它是否真的帶來理想中的第二代分布式計(jì)算體系,還要看IBM、英特爾以及加速器、方案集成等前沿廠商的共同努力!不過,可以肯定的是,不管這種新興的處理模式將如何稱謂,它對(duì)于新時(shí)代下的信息處理平臺(tái)(大數(shù)據(jù)分析、物聯(lián)網(wǎng)、人工智能、機(jī)器學(xué)習(xí)等)所帶來的明顯幫助,以及為最終用戶創(chuàng)造的巨大價(jià)值,都將是毋庸置疑的!

非常好我支持^.^

(1) 100%

不好我反對(duì)

(0) 0%

( 發(fā)表人:郭婷 )

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?
      主站蜘蛛池模板: 中国特黄一级片 | 在线观看a网站 | 国产美女精品三级在线观看 | hs网站在线观看 | 亚洲夜夜操 | 男啪女色黄无遮挡免费观看 | 天堂网www中文天堂在线 | 狠狠干狠狠艹 | 丁香天堂网 | 俄罗斯毛片基地 | 视频在线色 | 亚洲天天做夜夜做天天欢人人 | 扒开双腿猛进湿润18p | 欧美婷婷六月丁香综合色 | 久视频在线观看久视频 | 天天爽爽 | 亚洲综合丁香婷婷六月香 | 国产精品久久久香蕉 | 国产一级久久免费特黄 | 日本亚洲欧美国产日韩ay高清 | 天天摸夜夜操 | 在线女同免费观看网站 | free性欧美video69 | 午夜黄色毛片 | 美女视频黄.免费网址 | 伊人色综合久久天天爱 | 性色欧美xo影院 | 天天搞夜夜 | 天天做天天爱天天干 | 国产美女视频爽爽爽 | 视频二区在线观看 | 九九热在线精品视频 | 天天摸天天摸天天躁 | 2020av在线播放 | 六月丁香六月婷婷 | 97在线亚洲 | 在线观看亚洲专3333 | 色老成人精品视频在线观看 | 三级毛片在线播放 | 亚洲一卡2卡4卡5卡6卡在线99 | 看毛片网站 |