?

首頁: 電子電路圖,電子技術(shù)資料網(wǎng)站首頁

電子資料下載: 電子資料下載頻道 -- 為電子工程師提供激發(fā)創(chuàng)新靈感的新方案、新的參考設(shè)計(jì)、新的設(shè)計(jì)構(gòu)想等可下載的電子資料！

電子技術(shù)應(yīng)用: 電子技術(shù)應(yīng)用頻道 -- 為電子工程師提供電子產(chǎn)品設(shè)計(jì)所需的技術(shù)分析、設(shè)計(jì)技巧、設(shè)計(jì)工具、測(cè)試工具等技術(shù)文章！

電子元器件: 專業(yè)的電子元器件平臺(tái) -- 及時(shí)發(fā)布大量最新IC、分立器件、模組等電子元器件產(chǎn)品信息！

電子電路圖: 電路圖頻道 -- 提供電子電路圖,原理圖,汽車電路圖,手機(jī)電路圖,功放電路圖,電源電路圖等電路圖紙

電子技術(shù)論壇: 構(gòu)建電子工程師交流的平臺(tái) -- 在交流中進(jìn)一步學(xué)習(xí)設(shè)計(jì)技巧、規(guī)劃技術(shù)人生、提升自我價(jià)值！

電子百科: 電子百科頻道 -- 全民同參與，一起動(dòng)手添詞條。以我們自己的名義撰寫電子行業(yè)最強(qiáng)的開放式百科全書！; 電腦硬件主機(jī)配件數(shù)碼產(chǎn)品外接配件辦公設(shè)備網(wǎng)絡(luò) 數(shù)字家電汽車電子無線通信網(wǎng)絡(luò)布線耗材存儲(chǔ)設(shè)備通訊產(chǎn)品語音視頻通信技術(shù)

您的位置：電子發(fā)燒友網(wǎng)>電子百科>主機(jī)配件>cpu>

第二代異構(gòu)計(jì)算與未來應(yīng)用愿景 - 給CPU直接開掛！從OpenPOWER的CAPI+FPGA看第二代異構(gòu)計(jì)算

2017年11月17日 11:49 ZD至頂網(wǎng)服務(wù)器頻道作者：趙效民用戶評(píng)論（0）

關(guān)鍵字：計(jì)算機(jī)(82752)

第二代異構(gòu)計(jì)算與未來應(yīng)用愿景

如果說以GPGPU為主，大幅度提高系統(tǒng)浮點(diǎn)運(yùn)算能力是第一代異構(gòu)加速計(jì)算的典型特征的話，我們現(xiàn)在可以基本總體出以FPGA為主，所謂的第二代異構(gòu)計(jì)算的一些重要特征：第一：具備緩存一致性的內(nèi)存訪問能力，這是最為重要的特征，與第一代異構(gòu)計(jì)算有了本質(zhì)的不同，并對(duì)應(yīng)用編程具備了明顯的友好性；第二：基于FPGA可靈活配置加速模塊，毫無疑問，在第二代異構(gòu)計(jì)算中，F(xiàn)PGA將是一大主角，它本身靈活的可編程性為應(yīng)用加速提供了豐富的應(yīng)用場(chǎng)景；第三、它將隆重開啟整數(shù)運(yùn)算加速的大門，隨著FPGA編程的便利性進(jìn)一步提高，F(xiàn)PGA的整數(shù)型加速將會(huì)迅速普及（當(dāng)然絕不是說FPGA不能用于浮點(diǎn)加速，只是看應(yīng)用比例），這對(duì)于當(dāng)前的大數(shù)據(jù)、海量視頻處理、圖像匹配等新興需求不謀而合，就像當(dāng)初GPGPU與科學(xué)計(jì)算的發(fā)展相得益彰一樣，第二代異構(gòu)計(jì)算將把相應(yīng)的整數(shù)型應(yīng)用的性能帶到新的高度。

當(dāng)然，看到這一趨勢(shì)的不僅僅是IBM與OpenPOWER，CPU巨頭英特爾以167億美元收購FPGA第二大廠Altera的用意也不言自明。在不久前結(jié)束的IDF15上（英特爾信息技術(shù)峰會(huì)2015美國站），英特爾正式發(fā)布了CPU通過QPI直聯(lián)FPGA的方案設(shè)計(jì)。

采用QPI接口與CPU互聯(lián)，明擺著是沖著緩存一致性而來，這與CAPI的思路異曲同工，并且在服務(wù)器的配置上給出了新的可能（比如FPGA芯片Socket化或直接板載），這與CAPI有了明顯的不同，可謂各有利弊，但共同點(diǎn)都是開啟了第二代異構(gòu)計(jì)算的時(shí)代

?

采用QPI接口與CPU互聯(lián)，明擺著是沖著緩存一致性而來，這與CAPI的思路異曲同工，并且在服務(wù)器的配置上給出了新的可能（比如FPGA芯片Socket化或直接板載），這與CAPI有了明顯的不同，可謂各有利弊，但共同點(diǎn)都是開啟了第二代異構(gòu)計(jì)算的時(shí)代

當(dāng)越來越多的FPGA加速芯片以各種緩存一致性的方式接入系統(tǒng)之后，由于FPGA的SRAM高速編程模式，理論上講FPGA可以迅速的且無限次的更新內(nèi)置的AFU，以應(yīng)對(duì)不同的應(yīng)用加速需求。這就給我們打開了一個(gè)想像空間——能否像Docker管理容器鏡像那樣，基于云+端的概念建立起一個(gè)AFU鏡像的集散中心呢？事實(shí)上，OpenPOWER聯(lián)盟也正在為此而努力——建立AFU鏡像商店。

OpenPOWER CAPI-FPGA加速卡AFU鏡像商店的更新流程（筆者猜想繪制，謹(jǐn)供參考）

?

OpenPOWER CAPI-FPGA加速卡AFU鏡像商店的更新流程（筆者猜想繪制，謹(jǐn)供參考）

屆時(shí)，任何相關(guān)的開發(fā)者、ISV都可以將自己針對(duì)某些具體的FPGA卡（經(jīng)CAPI認(rèn)證）所編寫的AFU鏡像（其實(shí)就是FPGA的編程配置文件），上傳至AFU商店供其他用戶免費(fèi)或有償使用。相關(guān)的AFU用戶則可以像Docker那樣，根據(jù)自己應(yīng)用加速的需求與FPGA加速卡的型號(hào)，免費(fèi)或付費(fèi)下載相應(yīng)的AFU鏡像，通過全局的管理平臺(tái)，分發(fā)給指定服務(wù)器上的CAPI更新控制器，由后者與指定的FPGA加速卡（一臺(tái)服務(wù)器可以有多塊加速卡，選擇更新）PSL內(nèi)的AFU更新模塊一起加載AFU鏡像。加載的方式有兩種，一種是完整的FPGA重寫（所有的門電路重寫，包括PSL），另一種則是AFU單獨(dú)更新。前者需要重起服務(wù)器，而后者則可以在線動(dòng)態(tài)更新。目前100萬門的FPGA的配置文件容量也就在50MB左右，由于是基于SRAM的硬件編程，100ms內(nèi)即可更新完畢，用戶幾乎沒有察覺，但服務(wù)器的加速功能就已經(jīng)完全改變了。

我們可以試想一下這樣的場(chǎng)景，對(duì)于某個(gè)內(nèi)置CAPI+FPGA加速器的服務(wù)器集群，可以靈活的根據(jù)工作負(fù)載的需求改變FPGA中的AFU模塊，讓這個(gè)集群迅速具備針對(duì)新負(fù)載的加速能力，這對(duì)于集群高效的多場(chǎng)景靈活復(fù)用顯然是很有幫助的，而這種模式也是GPGPU、DSP、ASIC等加速方式很難做到的。

展望未來，從某種角度上講，GPGPU與FPGA在未來的應(yīng)用系統(tǒng)中，將根據(jù)自身的特長(zhǎng)有所側(cè)重。如果將CPU比作人的話，GPGPU更像是高級(jí)計(jì)算器，為人類提供強(qiáng)大的科學(xué)計(jì)算的能力，做好學(xué)術(shù)研究，而FPGA更像是為某類工作定制的效率工具，執(zhí)行大量的固定而高度重復(fù)化的工作，大幅度提高人類的日常生活與工作效率（比如洗衣機(jī)、生產(chǎn)機(jī)器人），而人在未來更多的就是負(fù)責(zé)管理，用好計(jì)算器與效率工具——CPU的角色相信也會(huì)如此，隨著技術(shù)的不斷發(fā)展，更多的浮點(diǎn)與整數(shù)運(yùn)算任務(wù)將會(huì)被GPGPU、FPGA、DSP、ASIC等不同的加速器所分擔(dān)。

從第二代異構(gòu)計(jì)算至第二代分布式計(jì)算？

基于上文所分析的CAPI+FPGA所展現(xiàn)出來的能力，我們進(jìn)一步從單服務(wù)器延展至整個(gè)分布式計(jì)算的架構(gòu)，這就需要我們從一個(gè)更為廣闊的全局視角來看待第二代異構(gòu)計(jì)算所帶來的關(guān)鍵影響。不久前，IBM提出的“第二代分布式計(jì)算”理念也正是基于這一全局的層次來建立的（據(jù)說在9月16日會(huì)召開發(fā)布會(huì)進(jìn)行專門的闡述）。

IBM中國研究院的高級(jí)研究員陳飛表示，IBM提出的第二代分布式計(jì)算要有四個(gè)重要的特征，第一個(gè)特征：加速器的軟硬件接口有統(tǒng)一的接口規(guī)范，以便于更好的協(xié)同管理與普適（第一代分布式計(jì)算的接口標(biāo)準(zhǔn)較為統(tǒng)一，畢竟只有CPU本身，相對(duì)更標(biāo)準(zhǔn)化），這方面CAPI就是一個(gè)標(biāo)準(zhǔn)化接口的嘗試。第二個(gè)特征：加速器可以被動(dòng)態(tài)的在線被設(shè)備發(fā)現(xiàn)以及加載。比如不需要要求系統(tǒng)的重啟，但現(xiàn)在的加速器如果要改變功能，一般都要要求重啟，或者是重啟一些軟件服務(wù)，但CAPI+FPGA則沒有這個(gè)顧慮。第三個(gè)特征：分布式的系統(tǒng)要具備全局異構(gòu)資源的調(diào)度能力，也就是說它能決定哪些應(yīng)用運(yùn)行在一個(gè)具有這種加速硬件的計(jì)算節(jié)點(diǎn)上，還是跑在一個(gè)普通的純CPU的計(jì)算節(jié)點(diǎn)上。第四個(gè)特征：應(yīng)該軟件本身，具備兼容CPU運(yùn)行模式和異構(gòu)硬件運(yùn)行模式的能力。

NVIDIA推出NVLINK互聯(lián)總線，除了可作為GPU之間的互聯(lián)外，還可用于CPU與GPU的互聯(lián)，并也將具備緩存一致性的內(nèi)存訪問能力，IBM的POWER9處理器（預(yù)計(jì)2017年下半年發(fā)布）將具備這一接口，這就意味著在POWER9平臺(tái)上NVIDIA的GPU也會(huì)獲得與CAPI同樣的對(duì)等訪問能力，這樣的GPGPU加速能力也將是POWER9獨(dú)有的（在英特爾x86平臺(tái)上，與CPU的互聯(lián)連接仍然是傳統(tǒng)的PCIe模式，NVLINK僅用于NVIDIA GPU之間的互聯(lián)），對(duì)IBM所提出的第二代分布式計(jì)算理念無疑是一個(gè)有力支撐

從以上定義中，我們可以看出，正是CAPI+FPGA所具備的一些關(guān)鍵特性（緩存一致性、在線更新性、AFU替換能力等）為IBM所提出的第二代分布式計(jì)算打下了理論基礎(chǔ)。當(dāng)然，對(duì)于這個(gè)定義，我仍然有一些異議，畢竟從總體上講，這個(gè)分布式處理的基礎(chǔ)架構(gòu)與應(yīng)用分布處理的模式，和第一代相比并沒有本質(zhì)的不同，更多是分布式節(jié)點(diǎn)上處理模式的創(chuàng)新，并且由于加速體系標(biāo)準(zhǔn)的更加多樣化，也讓其普適性受到懷疑，除非有非常強(qiáng)大的全局管理平臺(tái)來屏蔽掉底層的硬件差異性，否則全局上的“加速孤島”現(xiàn)象不可避免（雖然對(duì)于具體的用戶來說，這可能不是問題）。

但是，不管怎樣，第二代異構(gòu)計(jì)算的模式，的確打開了我們的想像空間，它是否真的帶來理想中的第二代分布式計(jì)算體系，還要看IBM、英特爾以及加速器、方案集成等前沿廠商的共同努力！不過，可以肯定的是，不管這種新興的處理模式將如何稱謂，它對(duì)于新時(shí)代下的信息處理平臺(tái)（大數(shù)據(jù)分析、物聯(lián)網(wǎng)、人工智能、機(jī)器學(xué)習(xí)等）所帶來的明顯幫助，以及為最終用戶創(chuàng)造的巨大價(jià)值，都將是毋庸置疑的！

上一頁 1 23全文

本文導(dǎo)航

第 1 頁：給CPU直接開掛！從OpenPOWER的CAPI+FPGA看第二代異構(gòu)計(jì)算
第 2 頁：OpenPOWER CAPI簡(jiǎn)介
第 3 頁：第二代異構(gòu)計(jì)算與未來應(yīng)用愿景

非常好我支持^.^

(1) 100%

不好我反對(duì)

(0) 0%

分享到:

加入收藏(0) + 推薦給朋友 + 挑錯(cuò)

用戶評(píng)論

發(fā)表評(píng)論即可獲得積分！ 詳見積分規(guī)則

發(fā)表評(píng)論

用戶評(píng)論

評(píng)價(jià):好評(píng)中評(píng)差評(píng)

發(fā)表評(píng)論，獲取積分！請(qǐng)遵守相關(guān)規(guī)定！

or

注冊(cè)會(huì)員

游客:

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

第二代異構(gòu)計(jì)算與未來應(yīng)用愿景 - 給CPU直接開掛！從OpenPOWER的CAPI+FPGA看第二代異構(gòu)計(jì)算

本文導(dǎo)航

相關(guān)閱讀：

用戶評(píng)論

發(fā)表評(píng)論

深度閱讀

相關(guān)下載

電子百科閱讀排行

熱門詞