當您在天貓/手淘上買買買的時,圖片會以不同格式或分辨率來轉碼呈現,這就要求后臺系統需要強大的算力來保障數倍于平時的轉碼需求。FPGA是可編程芯片中處理這類并行計算的最佳能耗比方案,這位曾經高冷的“王謝堂前燕”,通過云計算的價值加成,正在賦能越來越多的科技創新。
在今年的XDF 2018大會上,阿里云的工程師首次向業界揭開了阿里云FPGA平臺“舜天”的神秘面紗,這臺云端計算加速的新引擎初露鋒芒。
圖 1:XDF 2018 上,阿里云 “舜天” FPGA 平臺初露鋒芒
初識FPGA:計算加速新引擎
FPGA最大的特點是直接基于硬件編程,擁有高吞吐和低延時等特性,可以很容易搭建出數據并行通道,同時完成流水線并行;相對于ASIC,又具有軟件的可編程性和靈活性,這讓它能完美適應AI等對大算力有剛性需求并且尚處于快速迭代期的場景。
圖 2:FPGA能力模型
然而,傳統的FPGA線下開發,過程非常繁瑣。對于IP提供商或方案集成商來說,需要自己開發和維護硬件,推廣難、成本高。對于客戶來說,開發時也繞不開硬件環節,試錯成本大、周期長。
FPGA+云正好是解決這些難題的最佳方案。
“舜天”平臺整合了傳統FPGA產業鏈的多個環節:從芯片原廠商,硬件,IP供應商等等,將它們統一打包成平臺資源,使客戶可以專注于算力的實現,而IP供應商可以簡化交付流程,大幅優化交付周期和運營成本。
—— 阿里云工程師,張振祥
“舜天”平臺整合了傳統FPGA產業鏈的多個環節:從芯片原廠商,硬件,IP供應商等等,將它們統一打包成平臺資源,使客戶可以專注于算力的實現,而IP供應商可以簡化交付流程,大幅優化交付周期和運營成本。
從2017年8月開始,“舜天”已經歷經三代產品迭代,最新上線的F3系列實例,可提供超過1000萬邏輯單元和高達47 TeraMACs的DSP計算能力。
以時序數據庫為例,舜天平臺的處理效率比CPU高出30倍以上:單路FPGA實現的實測峰值性能為2.97GB/s,相比之下,單核CPU壓縮的實測性能約為90M/s。在圖片識別場景下,舜天F3提供的算力約相當于7臺CPU服務器,大幅降低了Capex成本,相比CPU服務器,TCO降低超40%。
而且,這個能力還可以擴展,當開發者在處理高性能計算和機器學習時,往往需要多芯片共同計算。“舜天”提供了各類高速接口,可完成1/2/4片芯片互聯拓撲,并支持動態配置。以卡內雙芯片通信為例,帶寬高達600Gbps,同時支持多種輕量級傳輸協議,傳輸效率達95%。
一睹真容:久經沙場的悍將
在阿里巴巴內部,“舜天”其實已經久經沙場,支撐了包括雙11在內的超大型計算場景、城市大腦、時序數據庫、高清視頻編解碼等等明星業務都涉及FPGA加速。
以雙11舉例,在客戶通過淘寶/天貓APP或者網頁端瀏覽商品時,圖片需要以不同格式或分辨率來呈現。舜天平臺的并行計算能力,直接將圖片處理的延時縮減到CPU服務器的50%,將吞吐能力提升了數倍。
在基因賽場里,“舜天“的表現也很出色,100Gbp全基因組分析時間被縮短至兩小時,速度比過去提升了10倍,單位成本也大大降低。全基因,指的就是把物種細胞里面完整的基因組序列從第1個DNA開始一直分析到最后一個DNA,這種技術幾乎能夠鑒定出基因組上任何類型的突變。
化繁為簡:大幅降低開發門檻
在傳統軟件工程師眼里,FPGA芯片的開發門檻是很高的,一方面需要了解HDL硬件編程,一方面需要對底層硬件和接口了如指掌。
在此次的XDF大會上,阿里云工程師潘岳介紹了舜天平臺的解決方案。
首先,“舜天”增加了對高級系統語言的支持,包括C, C++, OpenCL等。這意味著開發者可以在他們熟悉的編程語言和工作流程中順暢使用,而且確保原本基于CPU或GPU的開發可以輕松移植到云上的FPGA器件中。同時,阿里云還提供了大量的參考設計和開發包,幫助開發者快速建立系統。
接口方面,“舜天”提供了統一的標準總線接口,包括:DDR4/5、PCIe、DMA等等,開發者無需動手,只需要關心內部邏輯實現(圖中灰色部分)。
此外,阿里云還支持多種主流FPGA的Shell+Role實現,可以適配跨平臺的Multi-boot方案,讓用戶能夠輕松完成跨平臺遷移。
IP加密隔離:安全不打折
作為FPGA生態的最重要一環,IP廠商非常在意云上的多租戶環境。既要需要確保IP產品不泄露,又要保證用戶購買的IP只能被自己使用。
為此,阿里云采用了IP加密、網絡隔離、IP所屬權和使用權分離等方式確保了用戶的源碼(或IP源碼)、發行包、部署環境全程對第三方完全不可見,同時還提供健康監控能力,及時感知底層故障并實時報警。
作為最早入住舜天平臺的IP提供商之一,聯捷計算科技CTAccel CEO俞海樂博士表示,上云后安全是我們最關注的問題,阿里云的安全隔離做得非常到位,這也是我們優先選擇阿里云進行部署的原因。
不變的使命:共建普惠異構生態
此前阿里云的Slogan“為了無法計算的價值”一直深入人心,積極布道普惠計算。自推出異構計算依賴,開發者在阿里云上能以更少的價格使用性能更強的GPU/FPGA實例,在深度學習領域將開發成本降低了一半以上。
為了讓更多開發者能夠享受到FPGA的收益,阿里云推出了FPGA彈性云服務器,并建立了FPGA鏡像市場,讓具有創新思路和成熟解決方案的IP產品通過平臺脫穎而出,擴大市場規模,加快研發進度,提高設計穩定性。
“舜天”是阿里云使能人工智能產業的一大利器,我們歡迎更多的開發者加入阿里云FPGA生態,推動技術落地到產業中去。
—— 阿里云工程師,張振祥
-
賽靈思
+關注
關注
32文章
1794瀏覽量
131369 -
引擎
+關注
關注
1文章
361瀏覽量
22598 -
硬件編程
+關注
關注
0文章
3瀏覽量
9260
發布評論請先 登錄
相關推薦
評論