在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度學習接近芯片算力極限?如何擺脫被淘汰的命運

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2020-10-30 08:13 ? 次閱讀

關于深度學習,它正在快速接近其極限。雖然事實可能的確如此,但我們仍未能在日常生活中感受到全面部署深度學習的影響。

MIT:算力將探底,算法需改革

MIT 發出警告:深度學習正在接近現有芯片的算力極限,如果不變革算法,深度學習恐難再進步。

根據麻省理工學院,MIT-IBM Watson AI 實驗室,Underwood 國際學院和巴西利亞大學的研究人員在最近的研究中發現,持續不斷的進步將需要通過改變現有技術或通過尚未發現的新方法來更有效地使用深度學習方法。

目前深度學習的繁榮過度依賴算力的提升,在后摩爾定律時代可能遭遇發展瓶頸,在算法改進上還需多多努力。

深度學習不是偶然的計算代價,而是設計的代價。共同的靈活性使它能夠出色地建模各種現象,并且性能優于專家模型,這也使其在計算上的成本大大提高。

研究人員估計,三年的算法改進相當于計算能力提高 10 倍。總體而言,在深度學習的許多領域中,訓練模型的進步取決于所使用的計算能力的大幅度提高。另一種可能性是,要改善算法本身可能需要互補地提高計算能力。

在研究過程中,研究人員還對預測進行了推斷,以了解達到各種理論基準所需的計算能力以及相關的經濟和環境成本。

即使是最樂觀的計算,要降低 ImageNet 上的圖像分類錯誤率,也需要進行 10 的五次方以上的計算。

根據多項式和指數模型的預測,通過深度學習獲得相應性能基準所需的算力(以 Gflops 為單位),碳排放量和經濟成本,最樂觀的估計,ImageNet 分類誤差要想達到 1%,需要 10^28 Gflops 的算力,這對硬件來說是不小的壓力。

爆炸式增長結束,頂部提升有機會

用于深度學習模型的計算能力的爆炸式增長已經結束了,并為各種任務的計算機性能樹立了新的基準。但是這些計算限制的可能影響迫使機器學習轉向比深度學習更高效的技術。

過去算力的提升歸納了兩個原因:

一個是底部的發展,即計算機部件的小型化,其受摩爾定律制約;

另一個是頂部的發展,是上面提到的軟件、算法、硬件架構的統稱。

在后摩爾定律時代,提升計算性能的方法,雖然底部已經沒有太多提升的空間,但頂部還有機會。

在軟件層面,可以通過性能工程(performance engineering)提高軟件的效率,改變傳統軟件的開發策略,盡可能縮短軟件運行時間,而不是縮短軟件開發時間。另外,性能工程還可以根據硬件的情況進行軟件定制,如利用并行處理器和矢量單元。

在算法層面,在已有算法上的改進是不均勻的,而且具有偶然性,大量算法進展可能來源于新的問題領域、可擴展性問題、根據硬件定制算法。

在硬件層面,由于摩爾定律的制約,顯然需要改進的是硬件的架構,主要問題就是如何簡化處理器和利用應用程序的并行性。

通過簡化處理器,可以將復雜的處理核替換為晶體管數量需求更少的簡單處理核。由此釋放出的晶體管預算可重新分配到其他用途上,比如增加并行運行的處理核的數量,這將大幅提升可利用并行性問題的效率。

深度學習時代 AI 模型需規模化擴展

現代 AI 模型需要消耗大量電力,而且對電力的需求正以驚人的速度增長。在深度學習時代,構建一流 AI 模型所需要的計算資源平均每 3.4 個月翻一番。

在當今以深度學習為中心的研究范式當中,AI 的主要進步主要依賴于模型的規模化擴展:數據集更大、模型更大、計算資源更大。

在訓練過程中,神經網絡需要為每一條數據執行一整套冗長的數學運算(正向傳播與反向傳播),并以復雜的方式更新模型參數

在現實環境中部署并運行 AI 模型,所帶來的能源消耗量甚至高于訓練過程。實際上,神經網絡全部算力成本中的 80%到 90%來自推理階段,而非訓練階段。

因此,數據集規模越大,與之對應的算力與能源需求也在飛速增長。模型中包含的參數量越大,推理階段所帶來的電力需求就越夸張。

深度學習是 AI 核心,但局限性明顯

AI 領域需要在根本上做出長期轉變。需要退后一步,承認單純建立越來越龐大的神經網絡并不是通往廣義智能的正確路徑。

深度學習是近年來人工智能技術發展的核心,雖然取得了巨大成功,但它具有明顯的局限性。與人類視覺系統相比,深度學習在通用性、靈活性和適應性上要差很多,而在遇到復雜的自然圖像時,深度學習可能還會遇到機制性困難。

研究人員表示,目前形式的深度神經網絡似乎不太可能是未來建立通用智能機器或理解思維的最佳解決方案,但深度學習的很多機制在未來仍會繼續存在。

深度網絡還存在巨大挑戰,而我們要實現通用人工智能和理解生物視覺系統,就必須克服這些挑戰。

雖然深度網絡會是解決方案的一部分,但還需要涉及組合原則和因果模型的互補方法,以捕捉數據的基本結構。此外,面對組合性爆炸,需要要再次思考如何訓練和評估視覺算法。

每一次人工智能低谷來臨之前,都會有科學家夸大和炒作他們創造的潛力,僅僅說他們的算法就能夠很好地完成某項任務是不夠的。

對大多數問題來說,深度學習并不是正確的解決方法,不要試圖為所有的問題尋找通用人工智能解決方案,因為它根本就不存在。

結尾:

深度學習的發展可能已達極限,但其影響還將持續深遠。為了避免在“人工智能冬天”中被淘汰的命運,能做的最好的事情就是明確你要解決的問題,并理解其本質;然后,尋找為特定問題提供解決方案的直觀路徑的方法。

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    456

    文章

    50873

    瀏覽量

    424080
  • 深度學習
    +關注

    關注

    73

    文章

    5504

    瀏覽量

    121213
收藏 人收藏

    評論

    相關推薦

    調度的基礎知識

    編者按 “調度”的概念,這幾年越來越多的提及。剛聽到這個概念的時候,我腦海里一直拐不過彎。作為底層芯片出身的我,一直認為:
    的頭像 發表于 11-27 17:13 ?192次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>調度的基礎知識

    億鑄科技熊大鵬探討AI大芯片的挑戰與解決策略

    在SEMiBAY2024《HBM與存儲器技術與應用論壇》上,億鑄科技的創始人、董事長兼CEO熊大鵬博士發表了題為《超越極限:大芯片的技術挑戰與解決之道》的演講,深入剖析了AI大模型
    的頭像 發表于 10-25 11:52 ?411次閱讀

    芯片 高性能 CPU/GPU/NPU 微架構分析》第1-4章閱讀心得——之巔:從基準測試到CPU微架構的深度探索

    學習。不過我相信學習之路,I am not alone!在此,我首先分享我計劃第一部分(本書1-4章)的閱讀心得。 1 從TOP500到MLPerf:
    發表于 10-19 01:21

    GPU租用平臺怎么樣

    GPU租用平臺以其成本效益、靈活性與可擴展性、簡化運維以及即時訪問等優勢,在深度學習、科學計算、圖形渲染等多個領域發揮著重要作用。
    的頭像 發表于 10-17 10:03 ?220次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    詳細。了解芯片機制原理、架構組織形式邏輯等,對我們軟件開發芯片方案能起到很好的促進作用。
    發表于 10-15 22:08

    名單公布!【書籍評測活動NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架構分析

    這個想法否決了,因為投入較大、難以落地,且客戶對的認同遠不及今天這種高度。 這幾年間其實我們聯系甚少,但是作者一直沒有脫離對芯片的應用和關注。特別是目睹GPU從消費電子轉向
    發表于 09-02 10:09

    力系列基礎篇——與計算機性能:解鎖超能力的神秘力量!

    在《力系列基礎篇——101:從零開始了解》中,相信各位粉絲初步了解到人工智能的“發動機”和核心驅動力:
    的頭像 發表于 07-11 08:04 ?104次閱讀
    <b class='flag-5'>算</b>力系列基礎篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>與計算機性能:解鎖超能力的神秘力量!

    芯耀輝科技解讀高速互連對于AI和大芯片而言意味著什么?

    近年來,隨著人工智能技術的迅猛發展,大芯片已成為推動AI技術創新的關鍵力量。然而,隨著芯片內部計算單元數量的增加和任務復雜度的提升,互連已成為一個嚴重的瓶頸,制約著
    的頭像 發表于 07-08 11:39 ?979次閱讀

    商湯科技采購40000顆英偉達芯片,縮小中美差距

    徐冰認為,國產芯片崛起以及商品化帶來的投資價值,使中美差距有望逐步縮小。只要中國持續在
    的頭像 發表于 05-28 11:25 ?1287次閱讀

    摩爾線程張建中:以國產助力數智世界,滿足大模型需求

    摩爾線程創始人兼CEO張建中在會上透露,為了滿足國內對AI的迫切需求,他們正在積極尋求與國內頂尖科研機構的深度合作,共同推動更大規模的AI智集群項目。
    的頭像 發表于 05-10 16:36 ?969次閱讀

    揭秘芯片:為何它如此關鍵?

    在數字化時代,芯片作為電子設備的核心組件,其性能直接關系到設備的運行速度和處理能力。而芯片,即其計算能力,更是衡量芯片性能的重要指標。
    的頭像 發表于 05-09 08:27 ?1112次閱讀
    揭秘<b class='flag-5'>芯片</b><b class='flag-5'>算</b><b class='flag-5'>力</b>:為何它如此關鍵?

    芯片:未來科技的加速器?

    在數字化時代,芯片作為電子設備的核心組件,其性能直接關系到設備的運行速度和處理能力。而芯片,即其計算能力,更是衡量芯片性能的重要指標。
    的頭像 發表于 02-27 09:42 ?943次閱讀
    高<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>:未來科技的加速器?

    智能規模超通用,大模型對智能提出高要求

    電子發燒友網報道(文/李彎彎)是設備通過處理數據,實現特定結果輸出的計算能力,常用FLOPS作為計量單位。FLOPS是Floating-point Operations Per Second
    的頭像 發表于 02-06 00:08 ?6381次閱讀

    大茉莉X16-P,5800M大稱王稱霸

    Rykj365
    發布于 :2024年01月25日 14:54:52

    ChatGPT芯片如何做輸出

    卡的核心當然還是計算芯片,會搭配大容量高帶寬的內存、緩存,以及搭載CPU用于調度,為了幫助數據傳輸,便會使用高速通道,這便是PCIe(高速串行計算機擴展總線標準)在系統中的作用:提供總線通道。
    發表于 01-11 10:01 ?510次閱讀
    ChatGPT<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>如何做<b class='flag-5'>算</b><b class='flag-5'>力</b>輸出
    主站蜘蛛池模板: 欧美性第一页| 久久精品国产6699国产精| 91福利国产在线观看网站| www.色多多| 成 人色 网 站999| 毛片免费观看| 日韩在线视频一区| 欧美爱爱帝国综合社区| 精品国产第一国产综合精品gif| xxx86日本人| 一本到中文字幕高清不卡在线| 97午夜理伦片在线影院| 天天爽天天爽| 国产香蕉98碰碰久久人人| 日本加勒比在线视频| 7777在线| 天天干天天干天天色| 成人性色生活影片| 黄 色 免费网 站 成 人| 国产gaysexchina男同men1068| 久久夜色精品国产飘飘| 国产香港三级理论在线| 黄频网站免费大全在线观看| 国产成人精品日本亚洲直接| 午夜毛片网站| 天天综合亚洲| 国产免费爽爽视频免费可以看| 久久久久国产精品| 欧美30p| 国产亚洲一区二区三区在线| 热99久久| 香焦视频在线观看黄| 亚洲国产成人久久三区| 99精品热女视频专线| 色五夜婷婷| 日本天堂网在线观看| 日本成片免费高清| 欧美在线视频免费| 国产精品黄网站免费观看| 天堂网www| 国产情侣露脸|