Meta取消了大規(guī)模推出內(nèi)部推理芯片的計劃,并開始著手開發(fā)能夠執(zhí)行訓(xùn)練和推理的芯片。
據(jù)悉,Meta之前發(fā)展AI業(yè)務(wù)時,一直沒有接受使用GPU,相反,直到去年,Meta都在主要使用CPU隊列運行人工智能工作負載,這也是Meta在AI進程上落后對手的關(guān)鍵原因之一。目前,Meta內(nèi)部已開始計劃開發(fā)一款新型芯片,類似GPU,既能訓(xùn)練AI模型,又能進行推理,該項目將于2025年左右完成。
Meta Platforms今天分享了其數(shù)據(jù)中心項目的新細節(jié),以更好地支持人工智能工作,包括內(nèi)部開發(fā)的定制芯片“系列”。
以下是 MTIA v1 芯片的基本規(guī)格:基于一個雙核 RISC-V 處理元件,包含25 瓦芯片和 35 瓦雙 M.2 外圍卡。
因為它是低頻率的,MTIA v1 芯片消耗的功率也相當?shù)停⑶也捎?7 納米工藝實現(xiàn)意味著該芯片足夠小,可以運行得非常酷,而無需采用臺積電最先進的工藝。臺積電的從 5 納米到 3 納米不這些更昂貴的工藝,可以留到以后再使用。就像谷歌的TPU那樣,當工藝更便宜時使用在新一代設(shè)備上進行訓(xùn)練和推理。
MTIA v1 推理芯片有一個由 64 個處理元件組成的網(wǎng)格,這些處理元件周圍環(huán)繞著 128 MB 的 SRAM 內(nèi)存,可用作主存儲器或前端有 16 個低功耗 DDR5 (LPDDR5) 內(nèi)存控制器的高速緩存。
這種 LPDDR5 內(nèi)存用于筆記本電腦,也用于 Nvidia 即將推出的 Grace Arm 服務(wù)器CPU。這 16 個 LPDDR5 內(nèi)存通道可以提供高達 64 GB 的外部內(nèi)存。
這 64 個處理元素基于一對 RISC-V 內(nèi)核,一個是普通的,另一個是帶有矢量數(shù)學(xué)擴展的。每個處理元件都有 128 KB 的本地內(nèi)存和固定功能單元,用于執(zhí)行 FP16 和 INT8 數(shù)學(xué)運算、處理非線性函數(shù)和移動數(shù)據(jù)。
這是 MTIA v1 板的外觀
這是 MTIA 服務(wù)器設(shè)計中的巧妙之處。Yosemite 服務(wù)器中有一個 PCI-Express 交換機的葉/脊網(wǎng)絡(luò),它不僅可以讓 MTIA 連接到主機,還可以相互連接,并連接到 96 GB 的主機 DRAM,必要時可以存儲更大的嵌入。(就像 Nvidia 打算對 Grace-Hopper 做的那樣。)
Meta一系列博文中表示,它在 2020 年設(shè)計了第一代芯片,作為元訓(xùn)練和推理加速器 (MTIA) 計劃的一部分。目的是提高它用于在新聞提要中投放廣告和其他內(nèi)容的推薦模型的效率。
第一個 MTIA 芯片專門專注于推理AI 的過程,在該過程中,根據(jù)大量數(shù)據(jù)訓(xùn)練的算法會判斷是否將舞蹈視頻或貓表情包顯示為用戶提要中的下一個帖子。Meta 的軟件工程師 Joel Coburn 在介紹新芯片時表示,Meta 最初將圖形處理單元或 GPU 用于推理任務(wù),但發(fā)現(xiàn)它們不太適合推理工作。
“盡管對軟件進行了重大優(yōu)化,但它們對于真實模型的效率仍然很低。這使得它們在實踐中部署起來具有挑戰(zhàn)性且成本高昂,”Coburn 說。“這就是我們需要 MTIA 的原因。”
Meta 發(fā)言人拒絕就新芯片的部署時間表發(fā)表評論,也拒絕詳細說明開發(fā)可以訓(xùn)練模型的芯片的計劃。
Meta 還更新了圍繞更現(xiàn)代的面向 AI 的網(wǎng)絡(luò)和冷卻系統(tǒng)重新設(shè)計其數(shù)據(jù)中心的計劃,并表示將在今年破土動工其首個此類設(shè)施。一名員工在解釋這些變化的視頻中表示,新設(shè)計的成本將降低 31%,而且建造速度可能是公司目前數(shù)據(jù)中心的兩倍。
Meta 表示,它擁有一個人工智能系統(tǒng)來幫助其工程師創(chuàng)建計算機代碼,類似于微軟公司、亞馬遜公司和 Alphabet 公司提供的工具。
值得注意的是,前不久,Meta從英國人工智能(AI)芯片公司Graphcore挖來了一個團隊,該團隊此前在挪威奧斯陸工作,直到去年年底還在Graphcore開發(fā)AI網(wǎng)絡(luò)技術(shù)。
據(jù)悉,該團隊共有10人,他們在Graphcore工作到去年12或今年1月,隨后在今年2月或3月加入Meta。在回應(yīng)媒體置評要求時,Meta發(fā)言人Jon Carvill證實,該公司確實招聘了上述團隊。Carvill表示:“最近,我們在奧斯陸迎接了一些高度專業(yè)化的工程師加入Meta的基礎(chǔ)設(shè)施團隊。他們帶來了超級計算機系統(tǒng)設(shè)計和開發(fā)方面的深厚專業(yè)知識,以支持Meta數(shù)據(jù)中心大規(guī)模的AI和機器學(xué)習。”Carvill拒絕透露這些員工將在Meta從事的具體工作。
自去年11月發(fā)布以來,ChatGPT掀起了一股科技熱潮,幾乎所有科技巨頭都參與到了生成式AI領(lǐng)域,而Meta目前在該領(lǐng)域落后于微軟和谷歌等競爭對手。Meta開發(fā)新AI芯片是一個重要舉措,表明該公司正加大投資,提升其人工智能技術(shù)的競爭力。
審核編輯:劉清
-
ARM芯片
+關(guān)注
關(guān)注
1文章
126瀏覽量
21500 -
TPU
+關(guān)注
關(guān)注
0文章
142瀏覽量
20746 -
RISC-V
+關(guān)注
關(guān)注
45文章
2292瀏覽量
46247 -
LPDDR5
+關(guān)注
關(guān)注
2文章
89瀏覽量
12085
原文標題:Meta自研RISC-V AI推理芯片
文章出處:【微信號:ICViews,微信公眾號:半導(dǎo)體產(chǎn)業(yè)縱橫】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論