在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一款基準測量工具的雛形——MLPerf

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-05-09 05:41 ? 次閱讀

AI基準大戰已經開始。

5月2日,由各大領先的科技公司和大學組成的團隊發布了一款基準測量工具的雛形——MLPerf,其目的是測量各種AI框架和芯片中不同機器學習任務的訓練速度和推理時間。

在這一任務的參與者中,有許多知名公司和大學,其中既有谷歌、英特爾、百度、AMD這樣的巨頭,也有一些AI硬件創企,例如SambaNova和Wave Computing。同時還有世界頂尖大學:斯坦福大學、哈佛大學、加州大學伯克利分校、明尼蘇達大學和多倫多大學。

MLPerf的誕生是小部分公司自我組織進行產品對比的結果。上周,RiseML的博客對比了谷歌的TPUv2和NVIDIA V100的性能。5月4日,英特爾發表博客,展示了為機器翻譯所用的RNN的數據,題目稱“英特爾Xeon大規模處理器表現出令人驚訝的推理性能”。這種對比會給人一些參考,但通常也會讓人覺得供應商自認為比其他廠商優越。而一個標準化的基準可以讓測試簡單化,得到人們想要的結果。

除此之外,想要跟蹤記錄各大公司和創企的芯片制造以及軟件更新是非常困難的,更不要說在市場的夸大作用下還能進行真實評估了。某些芯片廠商經常承諾達到了革命性的提速,但從來不透露產品規格(咳咳,英特爾注意)。

在很長一段時間內,人們都在討論是否有必要設立一個有意義的AI基準。支持者認為,標準的缺失限制了AI的應用。MLPerf的推動者之一吳恩達表示:“AI正在改變多個行業,但是為了發揮它最大的潛能,我們仍需要更快的硬件和軟件?!敝С终邆兿M鶞实拇_立能幫助AI開發者創造出更好的產品,讓使用者充分了解所需產品。

MLPerf聲明它的基礎目標是:

用公平、有幫助的測量方法加速機器學習的發展

對各競爭系統進行公平對比,以鼓勵機器學習的發展

保證讓所有人都能參與基準評比

既服務于商業群體,也服務于研究領域

基準要可復制,確保結果的可靠

MLPerf是仿效過去其他的基準測試,例如SPEC(The Standard Performance Evaluation Corporation)。該基準于1988年由一家計算公司的財團提出,它有效提高了通用計算的速度。而MLPerf結合了此前許多基準的標準,例如SPEC的程序,SORT用于對比和培育新思想的方法,DeepBench對軟件應用的評估,以及DAWNBench的精確度標準。

Intersect360的CEO Addison Snell注意到:“現在許多企業都想部署AI,所以推出一套中立的基準非常重要,尤其在多種技術爭相競爭的時代。但是,AI領域多種多樣,我不禁懷疑是否最后只剩一種標準。想想五年前人們對大數據和分析的熱情,盡管人人都想定義它,但是至今也沒有一個通用的衡量標準。我認為AI也會面臨這種情況?!?/p>

Hyperion研究公司的高級研究副總裁Steve Conway認為:“MLPerf是一款有用、優秀的工具。因為近些年一直缺少針對買賣雙方的真正標準。這個基準似乎是針對人工智能早期問題指定的,大多都是有邊界問題。后來我們需要其他標準,因為人工智能開始出現了無邊界的問題。有邊界的問題比較簡單,如語音、圖像識別或游戲。而無界線問題包括癌癥診斷和閱讀磁核共振報告;現在,人工智能能為復雜問題提出推薦方案了。“

MLPerf現已在GitHub上發布,但仍處于初期階段,為α版本,未來將在許多方面得到改進。目前,MLPerf套件上能進行測試的有七個方面:

每個參考都提供了以下內容:至少在一個框架中實現模型的代碼;一個可在container中運行基準測試的Dockerfile;一個可下載適當數據集的腳本;一個可以運行并計時模型訓練的腳本;數據集、模型和機器設置的文檔記錄。

根據GitHub上的記錄,基準測試已經在以下配置中進行測試:

16個CPU,一個NVIDIA P100

Ubuntu 16.04,包括具有NVIDIA支持的docker

600GB的硬盤(盡管很多基準要求的硬盤更?。?/p>

在這樣一個年輕的市場,如果有更多的AI基準出現,那將變得很有趣。例如,斯坦福大學是MLPerf的其中一個成員,他最近運行了第一個DAWNBenchv1深度學習結果。

斯坦福報道說:“2018年4月20日表示第一個衡量深度學習端到端性能的基準和競爭的開始:測量深度學習任務達到最佳精確度時所需要的時間和成本是多少,以及在這個最先進的精確度水平下進行推理的成本是多少。對端到端性能的關注提供了一種客觀的方法,用于對計算框架、硬件、優化算法、超參數設置以及影響性能的其他因素進行標準化?!?/p>

DAWN的一個競爭對手——fast.ai(一家提供人工智能培訓和開發人工智能軟件工具的初創公司)在HPCwire上宣傳它的產品性能。所以這些基準很重要,應該認真對待,像MLPerf這樣的工具能幫助清除AI產品對比中的干擾因素。

“基準提高了產品可信度,并展示了更好的性能或能帶來更多益處的地方。如果你正在考慮為一個數百萬美元的項目使用硬件加速器或軟件框架,那么你會不會更喜歡’榜上有名’的產品?”谷歌工程師Peter Mattson表示。

MLPerf希望用可復制的、公平可靠的基準測量方法來推動機器學習行業和研究的發展。產品之間的對比還應促進供應商和學者之間的競爭。同時還應該為沒人提供做實驗的條件,讓更多人參與其中。

Mattson補充道:“基準在短期內很重要,因為不管是對研發公司還是想要購買產品的公司來說,硬件是一項巨大的投資。長期來看,基準有助于研究者和供應商將性能作為共同的發展目標,這樣才能解鎖更多機器學習的能量,造福更多人。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31192

    瀏覽量

    269557
  • 機器學習
    +關注

    關注

    66

    文章

    8428

    瀏覽量

    132820
  • 深度學習
    +關注

    關注

    73

    文章

    5508

    瀏覽量

    121314
  • MLPerf
    +關注

    關注

    0

    文章

    35

    瀏覽量

    647

原文標題:MLPerf——機器學習新基準能否驅動AI向前?

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一款Cursor開源替代工具之Roo-Cline

    本文將介紹一款 Cursor 的開源替代工具。 Roo-Cline 是個在 IDE 中運行的自主編碼 Agent,屬于?Cline 的分支,針對速度和靈活性進行了優化,主要特點如下: 命令、寫入
    的頭像 發表于 01-09 10:27 ?175次閱讀
    <b class='flag-5'>一款</b>Cursor開源替代<b class='flag-5'>工具</b>之Roo-Cline

    使用ADS1220設計一款電路用來采集個電阻橋式傳感器,使用內部的2.048V基準作為基準電壓?

    請教個問題。我使用ADS1220設計一款電路用來采集個電阻橋式傳感器。設計的時候我想使用內部的2.048V基準作為基準電壓,以下為電路
    發表于 01-06 06:00

    MLCommons推出AI基準測試0.5版

    開放式機器學習工程聯盟 MLCommons 在美國加州當地時間公布推出適用于消費類 PC 的 AI 性能的 MLPerf Client 基準測試的 0.5 版,這是該測試的第個公開版本
    的頭像 發表于 12-12 16:47 ?358次閱讀

    ADS131A04內部基準電壓有毛刺是怎么回事?

    目前在使用ADS131A04設計一款數據采集電路,使用內部基準電壓2.442V,使用TPS79133給ADS131供電。 1.在ADC采集數據的時候對VREFP引腳電壓測量發現有
    發表于 12-03 06:06

    一款高性能內網穿透工具——P2link

    P2link是一款面向高性能需求的內網穿透工具,采用了P2P技術和穿透協議,各節點(用戶或設備)可以直接進行數據傳輸和通信,而不需要通過中心服務器,能夠實現局域網內部設備與外網的快速、高效連接
    的頭像 發表于 11-08 10:59 ?741次閱讀
    <b class='flag-5'>一款</b>高性能內網穿透<b class='flag-5'>工具</b>——P2link

    如果設計一款桌面的機器玩具,最吸引人的外觀與功能要有哪些?

    初步設想制作如下其中一款,有感興趣的朋友可以幫提提意見。 A一款圓敦敦的音響狀的“個人日程助手”,具備番茄鬧鐘、音樂播放、減壓交互、語言對話、工作日報生成。 B一款迷你瓦利機器人,有
    發表于 10-19 18:25

    DaVinci系統級基準測試測量

    電子發燒友網站提供《DaVinci系統級基準測試測量.pdf》資料免費下載
    發表于 10-16 11:32 ?0次下載
    DaVinci系統級<b class='flag-5'>基準</b>測試<b class='flag-5'>測量</b>

    浪潮信息AS13000G7榮獲MLPerf? AI存儲基準測試五項性能全球第

    北京2024年9月27日?/美通社/ -- 9月25日,MLCommons協會發布最新MLPerf? Storage v1.0 AI存儲基準測試成績。浪潮信息分布式存儲平臺AS13000G7表現出
    的頭像 發表于 09-28 16:46 ?227次閱讀
    浪潮信息AS13000G7榮獲<b class='flag-5'>MLPerf</b>? AI存儲<b class='flag-5'>基準</b>測試五項性能全球第<b class='flag-5'>一</b>

    TPS手指觸感測量一款可以精準測量力和時間變化的系統

    TPS手指觸感測量一款可以精準測量力和時間變化的系統 它是一款高靈敏度傳感器,采用高敏感電容式壓力傳感器,能夠精確感知手指與物體接觸時的微小壓力變化,甚至可以檢測到非常細微的觸感差異,
    發表于 09-13 09:46

    Adobe將推出一款人工智能視頻生產工具

    Adobe即將在今年晚些時候震撼發布其最新力作——Adobe Firefly Video Model,一款專為創意專業人士打造的生成式視頻創作與編輯神器。作為Firefly圖像生成系列的新成員,該工具以測試版形式率先亮相,旨在通過人工智能技術,為視頻創作領域帶來前所未有的
    的頭像 發表于 09-12 16:37 ?508次閱讀

    精密串聯基準中的噪聲測量技術

    電子發燒友網站提供《精密串聯基準中的噪聲測量技術.pdf》資料免費下載
    發表于 08-23 10:16 ?0次下載
    精密串聯<b class='flag-5'>基準</b>中的噪聲<b class='flag-5'>測量</b>技術

    如何設計一款50HZ陷波電路?

    如何設計一款50HZ陷波電路,有現成的參考電路設計嗎
    發表于 07-30 06:12

    Synopsys推出一款低功耗靜態規則檢查工具—VCLP

    VCLP(VC Low Power)是Synopsys提供的一款低功耗靜態規則檢查工具,它能夠幫助驗證和清潔IEEE 1801 Unified Power Format (UPF)低功耗設計意圖,并確保UPF中的功耗意圖與實現
    的頭像 發表于 04-15 11:25 ?2552次閱讀
    Synopsys推出<b class='flag-5'>一款</b>低功耗靜態規則檢查<b class='flag-5'>工具</b>—VCLP

    一款適合嵌入式工程師使用的在線工具

    一款適合嵌入式工程師使用的在線工具,工具有如下功能,如下圖所示: 1. 報文校驗功能,如下圖所示 2. UDP服務端測試工具:該UDP服務端
    發表于 04-09 22:20

    安森美推出一款基于PLECS的具有獨特功能的領先在線仿真工具

    Elite Power仿真工具是安森美(onsemi)推出的一款基于PLECS的具有獨特功能的領先在線仿真工具,適用于軟/硬開關應用,使工程師在開發周期的早期階段,
    的頭像 發表于 03-20 09:58 ?697次閱讀
    主站蜘蛛池模板: 天堂中文在线资源| 免费视频大全| 日本在线视频二区| 国产亚洲高清视频| 天天色天天爽| 永久视频在线观看| 国产全肉乱妇杂乱视频| 欧美一级高清片在线| 婷婷色九月| 欲色视频| 高清一区二区| 日本视频一区在线观看免费| 美女又黄又www| 欧美19禁| 男女那啥的视频免费| 优优色综合| 色午夜视频| 日本三级高清| 色www视频永久免费软件| 四虎影裤| 色噜噜狠狠网站| 日韩三级中文| 青草久草视频| 日本电影在线观看黄| 色视频免费看| 久久天天躁综合夜夜黑人鲁色| 你懂的网站在线播放| 拍真实国产伦偷精品| 精品三级视频| 国产色中色| 国产高清视频免费最新在线| 国产欧美一区二区三区观看| 在线观看天堂| 狠狠操操| 好紧好爽太大了h视频| 丁香婷婷综合五月六月| 久久水蜜桃网| 亚洲成在线| 四虎亚洲精品| 九色欧美| 日本三级456|