大主宰天蚕土豆,魔天记忘语小说,千年殇

“不管是在今天 GPU 能夠做的事情上，還是 GPU 不能做的事情上，IPU 都有它的價(jià)值點(diǎn)和價(jià)值定位。” 日前，在英國 AI 芯片初創(chuàng)公司 Graphcore 中國區(qū)的媒體溝通會(huì)上，Graphcore 高級副總經(jīng)理兼中國區(qū)總經(jīng)理盧濤和 Graphcore 中國工程總負(fù)責(zé)人、AI 算法科學(xué)家金琛，就 Graphcore 的新產(chǎn)品性能以及該公司在中國的落地策略向 DeepTech 等媒體進(jìn)行了同步。

溝通會(huì)上，Graphcore 解讀了其于本月公布的大規(guī)模系統(tǒng)級產(chǎn)品 IPU-M2000 的應(yīng)用測試數(shù)據(jù)。公布數(shù)據(jù)顯示，在典型 CV 模型 ResNet、基于分組卷積的 ResNeXt、EfficientNet、語音模型、BERT-Large 等自然語言處理模型以及 MCMC 等傳統(tǒng)機(jī)器學(xué)習(xí)模型中，IPU-M2000 在吞吐量、訓(xùn)練時(shí)間和學(xué)習(xí)結(jié)果生成時(shí)間方面都有較好表現(xiàn)。比如，在 IPU-M2000 上 EfficientNet 的吞吐量達(dá)到 A100 的 18 倍。

圖 | IPU-M2000 與 GPU 的吞吐量、訓(xùn)練及結(jié)果生成時(shí)間對比（來源：Graphcore）

此前，IPU-M2000 與 Graphcore 第二代 IPU 處理器 GC200 已于今年 7 月 15 日發(fā)布。據(jù)介紹，GC200 芯片基于臺積電的 7nm 工藝制造，集成 250 TFlops AI-Float 算力和 900MB 處理器內(nèi)存，相較第一代產(chǎn)品性能提升 8 倍。而對于第三代 IPU，盧濤在此次溝通會(huì)上并未透露發(fā)布的具體時(shí)間表，不過他表示下一代產(chǎn)品正在研發(fā)中，將依舊重點(diǎn)解決存儲(chǔ)問題。

支持 PyTorch、TensorFlow，在 IPU 與 GPU 間無縫銜接

另外，Graphcore 還發(fā)布了 Poplar SDK 1.4 版本和 PyTorch 的 IPU 版本。

Graphcore 對 Poplar SDK 1.4 版本在易用性和速度上進(jìn)行了優(yōu)化，能夠支持模型和數(shù)據(jù)并行，同時(shí)能夠?qū)崿F(xiàn)模型的橫向擴(kuò)展 —— 從 1 個(gè) IPU 橫向擴(kuò)展到 64 個(gè) IPU。金琛表示，下一版本的 Poplar SDK 有望實(shí)現(xiàn)橫向擴(kuò)展到 128 個(gè) IPU。

值得關(guān)注的是，除支持 Graphcore 的自研框架 PopART 外，Poplar SDK 1.4 還支持 Facebook 的 PyTorch 框架、以及 Google 的 TensorFlow 框架。

據(jù)金琛介紹，Graphcore 在 PyTorch 代碼中引入了 PopTorch 輕量級接口，通過這一接口，用戶可基于當(dāng)前的 PyTorch 模型進(jìn)行封裝，以實(shí)現(xiàn) IPU 和 CPU 之間的無障礙銜接。

對于實(shí)現(xiàn)這一功能的核心技術(shù)，金琛做進(jìn)一步解釋說，Graphcore 采用 PyTorch 里的 jit.trace 機(jī)制對計(jì)算圖進(jìn)行編譯，轉(zhuǎn)化為 IPU 和 PyTorch 兼容的表達(dá)格式，最后用 Graphcore 自研框架 PopART 后端的 audiff 功能自動(dòng)生成反向圖，便可以實(shí)現(xiàn)同一個(gè)模型在不同平臺的無差別運(yùn)行。

目前，PyTorch 因其直觀易懂、靈活易用等優(yōu)勢受到開發(fā)者的廣泛喜愛和應(yīng)用。Poplar SDK 1.4 增加了對 PyTorch 的支持，策略上是希望用戶在 IPU 上也能體驗(yàn) PyTorch，讓用戶多一個(gè)轉(zhuǎn)戰(zhàn) IPU 的理由。不過目前英偉達(dá)的 GPU 已經(jīng)在 AI 計(jì)算領(lǐng)域占據(jù)大部分市場，此時(shí) IPU 能夠提供的價(jià)值、轉(zhuǎn)場到 IPU 的成本等，都是用戶所要考慮的問題。

在遷移成本上，盧濤表示，經(jīng)過幾年來對 Poplar SDK 的打磨，現(xiàn)在從 GPU 到 IPU 的軟硬件遷移難度已經(jīng)比大家認(rèn)為的小得多。

金琛補(bǔ)充道，在訓(xùn)練上，針對一個(gè)不太復(fù)雜的模型，一般一周可以遷移完成，對于復(fù)雜的模型大概需要兩周；在推理上，基本上是 1-2 天的工作量。

談及性能，盧濤表示：“IPU 在訓(xùn)練推理、語音、圖像模型處理上基本全面超越 GPU。” 不過他也坦言：“不能說 100% 超越了 GPU，因?yàn)樗惴Ｐ痛_實(shí)非常多，比如說語音有不同的語音模型、圖像也是有不同的圖像模型。”

未來：持續(xù)優(yōu)化性能，進(jìn)一步壓縮遷移成本

IPU 在機(jī)器學(xué)習(xí)性能上的明顯優(yōu)勢是不可否認(rèn)的，但前有身強(qiáng)體壯且努力奔跑的巨頭英偉達(dá)，Graphcore 更是一刻也不容懈怠。盧濤在溝通會(huì)上也多次提到，“目前 Graphcore 面對的壓力最主要還是來自英偉達(dá)”。

“重壓” 之下，Graphcore 短期內(nèi)的計(jì)劃是聚焦在數(shù)據(jù)中心高性能訓(xùn)練和推理市場上，持續(xù)打磨 IPU 和軟件平臺，持續(xù)優(yōu)化性能和提高可用性。盧濤說，“只有在我們聚焦的領(lǐng)域跑得更快，Graphcore 和英偉達(dá)之間的距離才會(huì)越來越短，甚至在某些領(lǐng)域超過英偉達(dá)”。

他還表示，Graphcore 希望未來數(shù)年內(nèi)，能在數(shù)據(jù)中心的 AI 訓(xùn)練、推理批量部署、以及發(fā)貨和體量上做到除英偉達(dá)以外的另一個(gè)頭部地位。

為實(shí)現(xiàn)該目標(biāo)，Graphcore 也將從增加 AI 框架支持、以及模型覆蓋兩個(gè)維度著手，以期進(jìn)一步減少用戶的遷移成本。此外，除目前 AI 應(yīng)用最廣泛的互聯(lián)網(wǎng)和云計(jì)算兩個(gè)場景外，盧濤表示公司明年還將在金融、汽車、智慧醫(yī)療、智慧教育、智慧城市和政府服務(wù)等領(lǐng)域，至少突破一到兩個(gè)比較主流的領(lǐng)域。

原文標(biāo)題：二代IPU性能超過GPU、全面支持PyTorch，Graphcore接下來將聚焦數(shù)據(jù)中心的AI訓(xùn)練和推理部署

文章出處：【微信公眾號：DeepTech深科技】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

責(zé)任編輯：haq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

gpu

gpu

+關(guān)注

關(guān)注
28

文章
4744

瀏覽量
129018
AI

AI

+關(guān)注

關(guān)注
87

文章
31028

瀏覽量
269381
IPU

IPU

+關(guān)注

關(guān)注
0

文章
34

瀏覽量
15576
pytorch

pytorch

+關(guān)注

關(guān)注
2

文章
808

瀏覽量
13246

原文標(biāo)題：二代IPU性能超過GPU、全面支持PyTorch，Graphcore接下來將聚焦數(shù)據(jù)中心的AI訓(xùn)練和推理部署

文章出處：【微信號：deeptechchina，微信公眾號：deeptechchina】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

Windows端USB讀二代身份證C#樣例程序

本開發(fā)包支持USB免驅(qū)型、串口型這2種類型的讀卡器，支持讀取二代居民身份證、M1和CPU卡等。提供動(dòng)態(tài)連接庫dll，提供C++（MFC）和C#下的演示程序執(zhí)行文件和示例源碼。動(dòng)態(tài)庫文件說明

發(fā)表于 12-21 14:47

簡單認(rèn)識第二代高通Oryon CPU

在不久前的2024驍龍峰會(huì)上，備受矚目的新一代驍龍旗艦移動(dòng)平臺——驍龍8至尊版正式發(fā)布。這款以“至尊版”命名的全新平臺也是首個(gè)采用第二代高通Oryon CPU的移動(dòng)平臺。憑借領(lǐng)先的CPU、GPU

發(fā)表于 11-13 09:43 ?361次閱讀

AMD推出第二代Versal Premium系列

近日，AMD（超威，納斯達(dá)克股票代碼：AMD ）今日宣布推出第二代 AMD Versal Premium 系列，這款自適應(yīng) SoC 平臺旨在面向各種工作負(fù)載提供最高水平系統(tǒng)加速。第二代 Versal

發(fā)表于 11-13 09:27 ?389次閱讀

AYANEO Pocket EVO搭載第二代驍龍G3x游戲平臺

此前，配備7英寸1080P OLED 165Hz高刷屏、搭載第二代驍龍G3x游戲平臺的旗艦安卓掌機(jī)AYANEO Pocket EVO正式發(fā)布。全新掌機(jī)在性能表現(xiàn)、屏幕體驗(yàn)、外觀設(shè)計(jì)和系統(tǒng)軟件體驗(yàn)上全面進(jìn)化，為玩家?guī)碛纱笃粮咚Ⅱ?qū)

發(fā)表于 11-08 10:44 ?364次閱讀

PyTorch GPU 加速訓(xùn)練模型方法

在深度學(xué)習(xí)領(lǐng)域，GPU加速訓(xùn)練模型已經(jīng)成為提高訓(xùn)練效率和縮短訓(xùn)練時(shí)間的重要手段。PyTorch作為一個(gè)流行的深度學(xué)習(xí)框架，提供了豐富的工具和方法來利用GPU進(jìn)行模型訓(xùn)練。 1. 了解GPU

發(fā)表于 11-05 17:43 ?580次閱讀

路暢科技發(fā)布百秘盾二代加密記錄儀,全面升級汽車數(shù)據(jù)安全防護(hù)

10月25日，路暢科技正式揭曉了其最新的研發(fā)成果——百秘盾二代加密記錄儀，并宣布該產(chǎn)品將于10月28日全面登陸各大電商平臺。這一舉動(dòng)標(biāo)志著路暢科技在強(qiáng)化汽車記錄儀音視頻數(shù)據(jù)安全領(lǐng)域取得了重大進(jìn)展。

發(fā)表于 11-05 11:28 ?565次閱讀

強(qiáng)茂發(fā)布高效低耗第二代ESD保護(hù)二極管

強(qiáng)茂科技近日宣布推出其最新一代靜電保護(hù)元件——第二代ESD保護(hù)二極管，該產(chǎn)品在性能上實(shí)現(xiàn)了重大飛躍。這款新品不僅融合了高效率與低漏電流的雙重優(yōu)勢，更在高頻環(huán)境下展現(xiàn)出卓越

發(fā)表于 09-12 17:48 ?640次閱讀

二代身份證識別儀身份證閱讀器讀卡器

：106kBd ?供電電壓：3.3V~5V ?待機(jī)電流：<40mA ?讀卡電流：<100mA 1.3應(yīng)用范圍 ?適用于需要二代居民身份證讀卡類功能終端 ?適用于辦公區(qū)域、酒店

發(fā)表于 09-07 15:09

高通推出第二代驍龍4s移動(dòng)平臺

高通技術(shù)公司今日宣布推出第二代驍龍4s移動(dòng)平臺，旨在讓5G更普及、更可靠。這一全新平臺再次展示了高通致力于用工程技術(shù)創(chuàng)新推動(dòng)進(jìn)步的承諾，引領(lǐng)全球從4G向5G演進(jìn)，賦能各個(gè)社區(qū)和千行百業(yè)。第二代驍龍

發(fā)表于 08-01 10:12 ?731次閱讀

tensorflow和pytorch哪個(gè)更簡單?

PyTorch更簡單。選擇TensorFlow還是PyTorch取決于您的具體需求和偏好。如果您需要一個(gè)易于使用、靈活且具有強(qiáng)大社區(qū)支持的框架，Py

發(fā)表于 07-05 09:45 ?900次閱讀

第二代SiC碳化硅MOSFET關(guān)斷損耗Eoff

第二代SiC碳化硅MOSFET關(guān)斷損耗Eoff

發(fā)表于 06-20 09:53 ?517次閱讀

瑞芯微第二代8nm高性能AIOT平臺 RK3576 詳細(xì)介紹

ArmSoM-Sige5采用Rockchip 第二代8nm高性能AIOT處理器 RK3576，主頻高達(dá)2.2GHz，6 TOPS算力NPU , 支持ufs ，雙USB，雙網(wǎng)口，全功能typec，兼容樹莓派40pin arms

發(fā)表于 03-12 13:45

Bose推出全新Ultra開放式耳機(jī)，搭載第二代高通S5音頻平臺

全球知名音頻品牌Bose近日宣布推出其全新音頻可穿戴設(shè)備——Bose Ultra開放式耳機(jī)。這款耳機(jī)采用第二代高通?S5音頻平臺，并支持Snapdragon Sound驍龍暢聽技術(shù)，旨在為用戶帶來無與倫比的高清音頻體驗(yàn)、快速穩(wěn)健的連接性

發(fā)表于 03-11 10:30 ?1157次閱讀

airpods一代和二代區(qū)別充電倉

一代和二代AirPods的充電倉有許多顯著的區(qū)別。 AirPods是由蘋果公司推出的一款無線耳機(jī)。隨著技術(shù)的發(fā)展，AirPods也得到了一些更新和改進(jìn)。一代AirPods于2016年推出，二代

發(fā)表于 02-01 13:52 ?3838次閱讀

高通第二代驍龍XR2+平臺支持4.3K單眼分辨率

高通技術(shù)公司近日宣布推出全新第二代驍龍?XR2+平臺，這一創(chuàng)新平臺旨在為MR和VR設(shè)備帶來更出色的性能和體驗(yàn)。第二代驍龍XR2+平臺具備強(qiáng)大的硬件配置，支持高達(dá)4.3K的單眼分辨率和1

發(fā)表于 01-08 15:22 ?977次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

二代IPU性能超過GPU且全面支持PyTorch

評論

Windows端USB讀二代身份證C#樣例程序

簡單認(rèn)識第二代高通Oryon CPU

AMD推出第二代Versal Premium系列

AYANEO Pocket EVO搭載第二代驍龍G3x游戲平臺

PyTorch GPU 加速訓(xùn)練模型方法

路暢科技發(fā)布百秘盾二代加密記錄儀,全面升級汽車數(shù)據(jù)安全防護(hù)

強(qiáng)茂發(fā)布高效低耗第二代ESD保護(hù)二極管

二代身份證識別儀身份證閱讀器讀卡器

高通推出第二代驍龍4s移動(dòng)平臺

tensorflow和pytorch哪個(gè)更簡單?

第二代SiC碳化硅MOSFET關(guān)斷損耗Eoff

瑞芯微第二代8nm高性能AIOT平臺 RK3576 詳細(xì)介紹

Bose推出全新Ultra開放式耳機(jī)，搭載第二代高通S5音頻平臺

airpods一代和二代區(qū)別充電倉

高通第二代驍龍XR2+平臺支持4.3K單眼分辨率