在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

二代IPU性能超過GPU且全面支持PyTorch

hl5C_deeptechch ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2020-12-30 15:43 ? 次閱讀

“不管是在今天 GPU 能夠做的事情上,還是 GPU 不能做的事情上,IPU 都有它的價(jià)值點(diǎn)和價(jià)值定位。” 日前,在英國 AI 芯片初創(chuàng)公司 Graphcore 中國區(qū)的媒體溝通會(huì)上,Graphcore 高級副總經(jīng)理兼中國區(qū)總經(jīng)理盧濤和 Graphcore 中國工程總負(fù)責(zé)人、AI 算法科學(xué)家金琛,就 Graphcore 的新產(chǎn)品性能以及該公司在中國的落地策略向 DeepTech 等媒體進(jìn)行了同步。

溝通會(huì)上,Graphcore 解讀了其于本月公布的大規(guī)模系統(tǒng)級產(chǎn)品 IPU-M2000 的應(yīng)用測試數(shù)據(jù)。公布數(shù)據(jù)顯示,在典型 CV 模型 ResNet、基于分組卷積的 ResNeXt、EfficientNet、語音模型、BERT-Large 等自然語言處理模型以及 MCMC 等傳統(tǒng)機(jī)器學(xué)習(xí)模型中,IPU-M2000 在吞吐量、訓(xùn)練時(shí)間和學(xué)習(xí)結(jié)果生成時(shí)間方面都有較好表現(xiàn)。比如,在 IPU-M2000 上 EfficientNet 的吞吐量達(dá)到 A100 的 18 倍。

bf6a28a2-4a2e-11eb-8b86-12bb97331649.jpg

圖 | IPU-M2000 與 GPU 的吞吐量、訓(xùn)練及結(jié)果生成時(shí)間對比(來源:Graphcore)

此前,IPU-M2000 與 Graphcore 第二代 IPU 處理器 GC200 已于今年 7 月 15 日發(fā)布。據(jù)介紹,GC200 芯片基于臺積電的 7nm 工藝制造,集成 250 TFlops AI-Float 算力和 900MB 處理器內(nèi)存,相較第一代產(chǎn)品性能提升 8 倍。而對于第三代 IPU,盧濤在此次溝通會(huì)上并未透露發(fā)布的具體時(shí)間表,不過他表示下一代產(chǎn)品正在研發(fā)中,將依舊重點(diǎn)解決存儲(chǔ)問題。

支持 PyTorch、TensorFlow,在 IPU 與 GPU 間無縫銜接

另外,Graphcore 還發(fā)布了 Poplar SDK 1.4 版本和 PyTorch 的 IPU 版本。

Graphcore 對 Poplar SDK 1.4 版本在易用性和速度上進(jìn)行了優(yōu)化,能夠支持模型和數(shù)據(jù)并行,同時(shí)能夠?qū)崿F(xiàn)模型的橫向擴(kuò)展 —— 從 1 個(gè) IPU 橫向擴(kuò)展到 64 個(gè) IPU。金琛表示,下一版本的 Poplar SDK 有望實(shí)現(xiàn)橫向擴(kuò)展到 128 個(gè) IPU。

值得關(guān)注的是,除支持 Graphcore 的自研框架 PopART 外,Poplar SDK 1.4 還支持 Facebook 的 PyTorch 框架、以及 Google 的 TensorFlow 框架。

據(jù)金琛介紹,Graphcore 在 PyTorch 代碼中引入了 PopTorch 輕量級接口,通過這一接口,用戶可基于當(dāng)前的 PyTorch 模型進(jìn)行封裝,以實(shí)現(xiàn) IPU 和 CPU 之間的無障礙銜接。

對于實(shí)現(xiàn)這一功能的核心技術(shù),金琛做進(jìn)一步解釋說,Graphcore 采用 PyTorch 里的 jit.trace 機(jī)制對計(jì)算圖進(jìn)行編譯,轉(zhuǎn)化為 IPU 和 PyTorch 兼容的表達(dá)格式,最后用 Graphcore 自研框架 PopART 后端的 audiff 功能自動(dòng)生成反向圖,便可以實(shí)現(xiàn)同一個(gè)模型在不同平臺的無差別運(yùn)行。

目前,PyTorch 因其直觀易懂、靈活易用等優(yōu)勢受到開發(fā)者的廣泛喜愛和應(yīng)用。Poplar SDK 1.4 增加了對 PyTorch 的支持,策略上是希望用戶在 IPU 上也能體驗(yàn) PyTorch,讓用戶多一個(gè)轉(zhuǎn)戰(zhàn) IPU 的理由。不過目前英偉達(dá)的 GPU 已經(jīng)在 AI 計(jì)算領(lǐng)域占據(jù)大部分市場,此時(shí) IPU 能夠提供的價(jià)值、轉(zhuǎn)場到 IPU 的成本等,都是用戶所要考慮的問題。

在遷移成本上,盧濤表示,經(jīng)過幾年來對 Poplar SDK 的打磨,現(xiàn)在從 GPU 到 IPU 的軟硬件遷移難度已經(jīng)比大家認(rèn)為的小得多。

金琛補(bǔ)充道,在訓(xùn)練上,針對一個(gè)不太復(fù)雜的模型,一般一周可以遷移完成,對于復(fù)雜的模型大概需要兩周;在推理上,基本上是 1-2 天的工作量。

談及性能,盧濤表示:“IPU 在訓(xùn)練推理、語音、圖像模型處理上基本全面超越 GPU。” 不過他也坦言:“不能說 100% 超越了 GPU,因?yàn)樗惴P痛_實(shí)非常多,比如說語音有不同的語音模型、圖像也是有不同的圖像模型。”

未來:持續(xù)優(yōu)化性能,進(jìn)一步壓縮遷移成本

IPU 在機(jī)器學(xué)習(xí)性能上的明顯優(yōu)勢是不可否認(rèn)的,但前有身強(qiáng)體壯且努力奔跑的巨頭英偉達(dá),Graphcore 更是一刻也不容懈怠。盧濤在溝通會(huì)上也多次提到,“目前 Graphcore 面對的壓力最主要還是來自英偉達(dá)”。

“重壓” 之下,Graphcore 短期內(nèi)的計(jì)劃是聚焦在數(shù)據(jù)中心高性能訓(xùn)練和推理市場上,持續(xù)打磨 IPU 和軟件平臺,持續(xù)優(yōu)化性能和提高可用性。盧濤說,“只有在我們聚焦的領(lǐng)域跑得更快,Graphcore 和英偉達(dá)之間的距離才會(huì)越來越短,甚至在某些領(lǐng)域超過英偉達(dá)”。

他還表示,Graphcore 希望未來數(shù)年內(nèi),能在數(shù)據(jù)中心的 AI 訓(xùn)練、推理批量部署、以及發(fā)貨和體量上做到除英偉達(dá)以外的另一個(gè)頭部地位。

為實(shí)現(xiàn)該目標(biāo),Graphcore 也將從增加 AI 框架支持、以及模型覆蓋兩個(gè)維度著手,以期進(jìn)一步減少用戶的遷移成本。此外,除目前 AI 應(yīng)用最廣泛的互聯(lián)網(wǎng)和云計(jì)算兩個(gè)場景外,盧濤表示公司明年還將在金融、汽車、智慧醫(yī)療、智慧教育、智慧城市和政府服務(wù)等領(lǐng)域,至少突破一到兩個(gè)比較主流的領(lǐng)域。

原文標(biāo)題:二代IPU性能超過GPU、全面支持PyTorch,Graphcore接下來將聚焦數(shù)據(jù)中心的AI訓(xùn)練和推理部署

文章出處:【微信公眾號:DeepTech深科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4744

    瀏覽量

    129018
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31028

    瀏覽量

    269381
  • IPU
    IPU
    +關(guān)注

    關(guān)注

    0

    文章

    34

    瀏覽量

    15576
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    808

    瀏覽量

    13246

原文標(biāo)題:二代IPU性能超過GPU、全面支持PyTorch,Graphcore接下來將聚焦數(shù)據(jù)中心的AI訓(xùn)練和推理部署

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Windows端USB讀二代身份證C#樣例程序

    本開發(fā)包支持USB免驅(qū)型、串口型這2種類型的讀卡器,支持讀取二代居民身份證、M1和CPU卡等。提供動(dòng)態(tài)連接庫dll,提供C++(MFC)和C#下的演示程序執(zhí)行文件和示例源碼。動(dòng)態(tài)庫文件說明
    發(fā)表于 12-21 14:47

    簡單認(rèn)識第二代高通Oryon CPU

    在不久前的2024驍龍峰會(huì)上,備受矚目的新一驍龍旗艦移動(dòng)平臺——驍龍8至尊版正式發(fā)布。這款以“至尊版”命名的全新平臺也是首個(gè)采用第二代高通Oryon CPU的移動(dòng)平臺。憑借領(lǐng)先的CPU、GPU
    的頭像 發(fā)表于 11-13 09:43 ?361次閱讀

    AMD推出第二代Versal Premium系列

    近日,AMD(超威,納斯達(dá)克股票代碼:AMD )今日宣布推出第二代 AMD Versal Premium 系列,這款自適應(yīng) SoC 平臺旨在面向各種工作負(fù)載提供最高水平系統(tǒng)加速。第二代 Versal
    的頭像 發(fā)表于 11-13 09:27 ?389次閱讀

    AYANEO Pocket EVO搭載第二代驍龍G3x游戲平臺

    此前,配備7英寸1080P OLED 165Hz高刷屏、搭載第二代驍龍G3x游戲平臺的旗艦安卓掌機(jī)AYANEO Pocket EVO正式發(fā)布。全新掌機(jī)在性能表現(xiàn)、屏幕體驗(yàn)、外觀設(shè)計(jì)和系統(tǒng)軟件體驗(yàn)上全面進(jìn)化,為玩家?guī)碛纱笃粮咚Ⅱ?qū)
    的頭像 發(fā)表于 11-08 10:44 ?364次閱讀

    PyTorch GPU 加速訓(xùn)練模型方法

    在深度學(xué)習(xí)領(lǐng)域,GPU加速訓(xùn)練模型已經(jīng)成為提高訓(xùn)練效率和縮短訓(xùn)練時(shí)間的重要手段。PyTorch作為一個(gè)流行的深度學(xué)習(xí)框架,提供了豐富的工具和方法來利用GPU進(jìn)行模型訓(xùn)練。 1. 了解GPU
    的頭像 發(fā)表于 11-05 17:43 ?580次閱讀

    路暢科技發(fā)布百秘盾二代加密記錄儀,全面升級汽車數(shù)據(jù)安全防護(hù)

    10月25日,路暢科技正式揭曉了其最新的研發(fā)成果——百秘盾二代加密記錄儀,并宣布該產(chǎn)品將于10月28日全面登陸各大電商平臺。這一舉動(dòng)標(biāo)志著路暢科技在強(qiáng)化汽車記錄儀音視頻數(shù)據(jù)安全領(lǐng)域取得了重大進(jìn)展。
    的頭像 發(fā)表于 11-05 11:28 ?565次閱讀

    強(qiáng)茂發(fā)布高效低耗第二代ESD保護(hù)極管

    強(qiáng)茂科技近日宣布推出其最新一靜電保護(hù)元件——第二代ESD保護(hù)極管,該產(chǎn)品在性能上實(shí)現(xiàn)了重大飛躍。這款新品不僅融合了高效率與低漏電流的雙重優(yōu)勢,更在高頻環(huán)境下展現(xiàn)出卓越
    的頭像 發(fā)表于 09-12 17:48 ?640次閱讀

    二代身份證識別儀身份證閱讀器讀卡器

    :106kBd ?供電電壓:3.3V~5V ?待機(jī)電流:<40mA ?讀卡電流:<100mA 1.3應(yīng)用范圍 ?適用于需要二代居民身份證讀卡類功能終端 ?適用于辦公區(qū)域、酒店
    發(fā)表于 09-07 15:09

    高通推出第二代驍龍4s移動(dòng)平臺

    高通技術(shù)公司今日宣布推出第二代驍龍4s移動(dòng)平臺,旨在讓5G更普及、更可靠。這一全新平臺再次展示了高通致力于用工程技術(shù)創(chuàng)新推動(dòng)進(jìn)步的承諾,引領(lǐng)全球從4G向5G演進(jìn),賦能各個(gè)社區(qū)和千行百業(yè)。第二代驍龍
    的頭像 發(fā)表于 08-01 10:12 ?731次閱讀

    tensorflow和pytorch哪個(gè)更簡單?

    PyTorch更簡單。選擇TensorFlow還是PyTorch取決于您的具體需求和偏好。如果您需要一個(gè)易于使用、靈活具有強(qiáng)大社區(qū)支持的框架,Py
    的頭像 發(fā)表于 07-05 09:45 ?900次閱讀

    二代SiC碳化硅MOSFET關(guān)斷損耗Eoff

    二代SiC碳化硅MOSFET關(guān)斷損耗Eoff
    的頭像 發(fā)表于 06-20 09:53 ?517次閱讀
    第<b class='flag-5'>二代</b>SiC碳化硅MOSFET關(guān)斷損耗Eoff

    瑞芯微第二代8nm高性能AIOT平臺 RK3576 詳細(xì)介紹

    ArmSoM-Sige5采用Rockchip 第二代8nm高性能AIOT處理器 RK3576,主頻高達(dá)2.2GHz,6 TOPS算力NPU , 支持ufs ,雙USB,雙網(wǎng)口,全功能typec,兼容樹莓派40pin arms
    發(fā)表于 03-12 13:45

    Bose推出全新Ultra開放式耳機(jī),搭載第二代高通S5音頻平臺

    全球知名音頻品牌Bose近日宣布推出其全新音頻可穿戴設(shè)備——Bose Ultra開放式耳機(jī)。這款耳機(jī)采用第二代高通?S5音頻平臺,并支持Snapdragon Sound驍龍暢聽技術(shù),旨在為用戶帶來無與倫比的高清音頻體驗(yàn)、快速穩(wěn)健的連接
    的頭像 發(fā)表于 03-11 10:30 ?1157次閱讀

    airpods一二代區(qū)別充電倉

    二代AirPods的充電倉有許多顯著的區(qū)別。 AirPods是由蘋果公司推出的一款無線耳機(jī)。隨著技術(shù)的發(fā)展,AirPods也得到了一些更新和改進(jìn)。一AirPods于2016年推出,二代
    的頭像 發(fā)表于 02-01 13:52 ?3838次閱讀

    高通第二代驍龍XR2+平臺支持4.3K單眼分辨率

    高通技術(shù)公司近日宣布推出全新第二代驍龍?XR2+平臺,這一創(chuàng)新平臺旨在為MR和VR設(shè)備帶來更出色的性能和體驗(yàn)。第二代驍龍XR2+平臺具備強(qiáng)大的硬件配置,支持高達(dá)4.3K的單眼分辨率和1
    的頭像 發(fā)表于 01-08 15:22 ?977次閱讀
    主站蜘蛛池模板: 韩国精品视频| 国产成人精品高清免费| 国产网站免费| 色噜噜狠狠狠综合曰曰曰| 色综合综合色| 激情五月婷婷丁香| 欧美在线色视频| 四虎国产精品免费久久影院| 嗯好舒服好爽好快好大| 国产操视频| haodiaose在线精品免费观看| 色天天天天| 国产女人水多白浆| 国产一级大片免费看| 欧美成人午夜毛片免费影院 | 免费啪视频在线观看| yy8090韩国日本三理论免费| 久久天天躁狠狠躁夜夜| 天天爱天天做色综合| 天天搞天天爽| 午夜小网站| 亚洲福利午夜| 97干干| 成人综合网址| 成人亚洲欧美在线电影www色| 小雪被撑暴黑人黑人与亚洲女人 | 久青草免费视频| 美女污污网站| 美女h片| 国产在线观看网址你懂得| 4hu影院最新地址www| 77788色淫视频免费观看| 日日夜夜狠狠干| 奇米影视亚洲四色8888| 国产xxxx极品bbw视色| 国产毛片精品| 欧美在线三级| 亚洲人成网站色7799在线观看 | 国产美女主播在线观看| 国产福利你懂的| 99久久网站|