面對每個月27億活躍用戶產生的數據量,Facebook將重心從通用硬件轉向AI專用硬件。在今天的開放計算項目全球峰會上,發布并開源了3款AI硬件,分別是面向訓練的Zion、面向推理的Kings Canyon及面向視頻轉碼的Mount Shasta。
一個全家桶app,每個月要服務27億人,不容易吶!不信你問Facebook。
為了應對大量的算力要求,這家位于Menlo Park的技術巨頭,硬是從通用硬件轉移到了專用加速器。這些加速器的作用,是保證其數據中心的性能,功耗和效率,特別是在AI領域。
今天,Facebook一口氣推出了3款硬件產品,分別是用于AI模型培訓的“下一代”硬件平臺Zion;以及針對AI推理優化的定制專用集成電路Kings Canyon;以及視頻轉碼Mount Shasta。并捐贈給旗下的開放計算項目使用。
Open Compute Project(OCP)是Facebook在2011年4月發起的一個數據中心開放架構技術發展組織,目前成員包括Intel、Red Hat、Facebook、Mozilla、Rackspace、NTT Data、百度、高盛以及Google等。https://benchlife.info/8597-2/
Facebook稱這三款硬件產品將大大加速AI的訓練和推理?!?a href="http://www.xsypw.cn/v/tag/150/" target="_blank">人工智能用于各種服務,以幫助人們進行日常互動,并為他們提供獨特的個性化體驗,” Facebook工程師Kevin Lee,Vijay Rao和William Christie Arnold在博客文章中寫道,“在整個Facebook的基礎設施中使用人工智能工作負載,能夠增強各服務之間的相關性,并改善我們的用戶體驗?!?/p>
Zion
Zion為AI訓練創建Block
和Block之間通信
Zion專為處理包括CNN,LSTM和SparseNN在內的神經網絡架構的“頻譜”而量身定制。包括三個部分:擁有8個NUMA CPU插槽的服務器;配備了8加速器芯片組,以及一個廠商中立(vendor-agnostic )的OCP加速器模塊(OAM)。
Zion的高內存容量和高帶寬,得益于兩個高速fabric,一個用來連接所有的CPU,另一個用來連接所有的加速器。除此之外,還得益于其靈活的架構,可以使用頂部擴展到單個機架中的多個服務器機架式(TOR)網絡交換機。
“加速器內存帶寬高但容量低,所以我們通過對模型進行分區來解決這個問題:將頻繁訪問的數據駐留在加速器上,而訪問頻率較低的數據駐留在帶有CPU的DDR內存里,“Lee,Rao和Arnold解釋道,“所有CPU和加速器的計算和通信都是平衡的,并通過高速和低速互連,極大地提高了效率?!?/p>
Kings Canyon
Zion為AI推理創建Block
和Block之間通信
至于專為推理任務而設計的Kings Canyon共分四個部分:Kings Canyon推理M.2模塊;Twin Lakes單插槽服務器;Glacier Point v2載卡;以及Facebook的Yosemite v2機箱。Facebook表示正在與Esperanto、Habana,英特爾,Marvell和高通公司合作,開發能夠同時支持INT8和高精度FP16工作負載的ASIC芯片。
ASIC不運行通用代碼,需要專門的編譯器將圖形轉換為在這些加速器上執行的指令。Glow編譯器的目標是從更高級別的軟件堆棧中抽象出特定于供應商的硬件,以使基礎架構與供應商無關。它接受來自PyTorch 1.0等框架的計算圖,并為這些ML加速器生成高度優化的代碼。
Glow編譯器
Kings Canyon中的每臺服務器都結合了M.2 Kings Canyon加速器,以及一個連接Twin Lakes服務器的Glacier Point v2載卡。其中兩個被安裝到Yosemite v2 sled中,并通過NIC鏈接到TOR開關。Kings Canyon模塊包括一個ASIC,一個內存及其他支持組件,比如通過PCIe通道與加速器模塊通信的CPU。而Glacier Point v2包含一個集成的PCIe交換機,允許服務器同時訪問所有模塊。
“通過適當的將模型進行分割,我們得以運行非常大的深度學習模型。例如,對于SparseNN模型,如果單個節點的內存容量不夠用,就在兩個節點之間對模型進行分片,從而增加模型可用的內存量?!癓ee,Rao和Arnold說過,“這兩個節點通過多主機NIC連接,允許高速交換?!?/p>
Mount Shasta
Mount Shasta是與Broadcom和Verisilicon合作開發的ASIC,專為視頻轉碼而開發。在Facebook的數據中心內,它將被安裝在帶有集成散熱器的M.2模塊上,位于可容納多個M.2模塊的Glacier Point v2(GPv2)載板中。
Facebook表示,平均而言,預計這些芯片的效率會比目前的服務器“高出許多倍”。它的目標是在10W功率范圍內,以60fps速度輸入流編碼效率至少比4K高出一倍。
“我們希望Zion、Kings Canyon和Mount Shasta的設計,能夠滿足我們在AI訓練、AI推理和視頻轉碼方面不斷增長的工作量?!盠ee,Rao和Arnold寫道,“我們將采取硬件和軟件協同設計,不斷改進硬件產品的效率。但一家廠商的能力終歸有限,希望更多的廠商都能夠進入Facebook的生態中,共同努力?!?/p>
-
加速器
+關注
關注
2文章
804瀏覽量
37980 -
Facebook
+關注
關注
3文章
1429瀏覽量
54848 -
ai硬件
+關注
關注
0文章
12瀏覽量
2410
原文標題:Facebook開源AI硬件,一口氣推出“三件套”
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論