在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

專用NPU是發揮端側人工智能潛力的捷徑

YCqV_FPGA_EETre ? 來源:cg ? 2019-01-09 09:44 ? 次閱讀

1971年,第一顆劃時代的大規模集成電路產品Intel4004出現,它使用MOSFET集成電路技術,采用10μm工藝,集成了2300個MOSFET。雖然這顆IC僅僅集成了2300個晶體管,但它標志著人類大規模集成電路時代正式開啟,而且它開辟了一條提升IC性能的路徑——同樣面積下,要提升性能就要集成更多晶體管,要集成更多晶體管只要升級工藝就可以實現。

自此之后,人類一直就享用著IC工藝升級帶來的紅利。根據Intel的創始人之一戈登·摩爾(GordonMoore)提出的摩爾定律:集成電路上可容納的晶體管數目,約每隔18個月便會增加一倍,性能也將提升一倍。50 年來,IC工藝在摩爾定律的指導下飛速發展,我們也一直在享用工藝技術升級帶來的好處——性能升級,功耗降低,尺寸越來越小。

但是,當工藝scaling到10nm以下時,由于工藝復雜度大幅度提升,摩爾定律已經趨緩。2018年11月,AMD CTO發表言論認為摩爾定律已經減緩;6月份美國舉辦的DAC大會上,著名計算機領域專家2018圖靈獎獲得者David Patterson(開源CPU RISC-V發明人之一)也明確認為摩爾定律已經減緩;而且,英特爾自己的10nm工藝連續跳票,不能按時交付新工藝芯片。這些言行都說明,依靠半導體工藝升級帶來IC器件性能提升,已經不可能再像以前那樣繼續維持高速提升了,那該如何提升處理器性能?尤其是提升人工智能的處理效率?

架構創新是出路,AI時代需要專用處理單元

David Patterson 認為現在是計算機系統架構的黃金時代,單靠工藝升級難以實現大的性能突破,未來處理器必須從架構上尋求出口。

而根據業內眾多半導體專家的觀點,異構架構是未來IC發展的必由之路。*** 半導體產業協會理事長盧超群博士(Nicky Lu)就認為,異構集成設計系統架構(HIDAS, Heterogeneous Integration Design Architecture System)將大量促進IC創新,要提升IC性能就要集成新的異質單元。 同理,對于目前熱門的人工智能處理需求來說,通過工藝升級CPU或者GPU、DSP、FPGA都不是好辦法,更合理的方案是就集成人工智能處理單元。

人工智能到底需要一種什么樣的處理單元?想要尋找答案,我們可以回頭看看GPU的發展歷程。

1962年,麻省理工學院的博士伊凡?蘇澤蘭發表的論文以及他的畫板程序奠定了計算機圖形學的基礎。在隨后的近20年里,計算機圖形學在不斷發展,但是當時的計算機卻沒有配備專門的圖形處理芯片,圖形處理任務都是CPU來完成的。

1999年8月,NVIDIA公司發布了一款代號為NV10的圖形芯片Geforce 256。Geforce 256是圖形芯片領域開天辟地的產品,因為它是第一款提出GPU概念的產品。Geforce 256所采用的核心技術有“T&L”硬件、立方環境材質貼圖和頂點混合、紋理壓縮和凹凸映射貼圖、雙重紋理四像素256位渲染引擎等?!癟&L”硬件的出現,讓顯示芯片具備了以前只有高端工作站才有的頂點變換能力,同時期的OpenGL和DirectX 7都提供了硬件頂點變換的編程接口,GPU的概念因此而出現。由此開始,CPU、GPU 才正式確立了各自的屬性和工作內容。

從結構上來說,CPU和GPU不同之處體現在他們處理任務的方式不同。CPU由專為串行任務而優化的幾個核心組成;GPU則由數以千計的更小、更高效的核心組成,這些核心專為同時處理多任務而設計。稍微深入一點來講,CPU和GPU的不同,是因為它們的使命不同。CPU需要很強的通用性來處理各種不同的數據類型,同時又要邏輯判斷,又會引入大量的分支跳轉中斷的處理,這使CPU的內部結構異常復雜。而GPU需要處理的則是類型高度統一、相互依賴的大規模數據和不需要被打斷的計算環境。因此,GPU和CPU就呈現出非常不同的架構。

從GPU的發展來看,它的出現在于首先要應對新的處理需求——圖形處理,其次是要以不同于CPU的架構來完成處理效率最大化。這兩點對人工智能處理也有借鑒意義:首先,人工智能處理是不同于CPU和GPU的新處理需求;其次,人工智能處理需要新的架構,因為無論CPU、GPU還是FPGA都不是最好的架構,尤其是在手機領域FPGA更不適合。

我們知道,手機是消費電子中最大的品類,在工藝、封裝、集成、架構方面都走在行業最前沿,它的技術也在引導著整個半導體行業的發展。一方面,手機SoC使用最新的工藝制程;另外一方面,手機也是對功耗、面積特別敏感的產品品類。用CPU,GPU這些面向傳統指令計算、浮點運算的計算單元,去執行以張量計算為主的AI運算,效率和能效都不能達到最好,同時隨著傳統半導體工藝制程不斷逼近極限,如果還用摩爾定律的增長紅利去滿足日益提升的AI運算量,代價會越來越高。

另外,AI的框架、算法網絡模型發展也非常快,如果采用CPU,GPU適配日新月異的AI框架和算子,軟件適配等工作也非常繁多,這不僅為開發者帶來更高的開發成本,更同時加大了產品上市的時間成本。如果采用FPGA,雖然人工智能的處理效率會大大提升,但是FPGA的面積和功耗都不適合集成在手機平臺;如果采用DSP,雖然有一定的靈活性,但是效能還不是最大。因此,借鑒GPU的發展,從最優能效角度考慮,手機平臺需要集成專用的NPU,讓專業的器件干專業的事情。

專用NPU性能強勁,麒麟芯片引領端側AI應用潮流

毫無疑問,手機平臺需要專用的NPU。在這方面,華為大膽嘗試,在2017年9月率先推出了集成專用NPU處理單元的麒麟970。麒麟 970采用了創新的HiAI移動計算架構,能夠用更少的能耗更快地完成AI計算任務。實際對比顯示:性能上,NPU 是 CPU 的 25 倍,是GPU 的 6.25 倍(25/4);能效比上,NPU 更是達到了 CPU 的 50 倍,GPU 的 6.25 倍(50/8)。

實測中,麒麟 970 的 NPU 每分鐘可以識別出 2005 張照片,而在沒有NPU的情況下每分鐘只能識別 97 張,優勢對比非常明顯。

麒麟970是史上首個在端側實現人工智能推理應用的手機芯片平臺。筆者在芯片發布之初就判斷,華為將憑借這個新的計算平臺領先高通的驍龍平臺,并將在人工智能應用方面,幫助華為手機與其他手機拉開至少4個月的領先期。事實果真如此,麒麟970開啟了端側人工智能應用的新篇章,并助力華為Mate10手機率先實現了拍照場景識別、翻譯等人工智能應用,引領了整個智能手機的AI應用大潮。

2018年9月,華為在2018德國柏林消費電子展(IFA)上正式發布麒麟980處理器。麒麟980在AI方面有了更大的突破:首度采用了雙核NPU,提供147個算子,人工智能算力大幅度提升;每分鐘識別4500張圖片,識別速度相比上一代提升120%,遠高于業界同期水平。

麒麟980的發布,標志著華為在端側人工智能領域的成熟與進步。獨立的雙核NPU處理單元讓麒麟980在人臉識別、物體識別、物體檢測、圖像分割、智能翻譯等AI場景下應用更流暢。例如華為Mat 20系列可實現多人姿態實時識別,實時幀率高達30 FPS,無論是表演節奏感極強的舞蹈,還是在鏡頭前快速跑步,麒麟980都能夠實時繪制出人體的關節和線條??梢哉f,麒麟980再次引領了全球端側AI應用的潮流。

另外,基于獨立的NPU處理單元,華為從麒麟970開始就推出了HUAWEI HiAI。HiAI是面向移動終端的AI能力開放平臺,是專門為了配合NPU進行開發的第三方開發者平臺,能夠給開發者提供AI計算庫以及API,并且能夠便捷地編寫APP上的AI應用。

HUAWEI HiAI能力開放平臺分為三層架構,除了我們熟知的HUAWEI HiAI Foundation的運算能力、HUAWEI HiAI Engine端側應用能力,還有海量的HUAWEI HiAI service服務能力。此外,HiAI能夠讓開發者快速遷移模型,并且對于普通APP開發者來說,HiAI會提供已封裝好的語音識別等技術,開發者能夠直接應用。

HUAWEI HiAI堪稱是一個開發人工智能APP的神器,能幫助小白用戶迅速開發出AI應用,而且能用上麒麟芯片的NPU能力。開發者可以利用這個開放架構開發新的人工智能應用,并通過華為認證后集成進麒麟平臺。這是超越APP應用的新機制,開放的架構讓華為率先擁有了大量編外人工智能開發者,這也意味著麒麟平臺可以集成大量第三方的人工智能算法和應用。

如今,專用NPU在人工智能領域的應用已成燎原之勢。筆者觀察到,業界其他芯片廠商也在采用這樣的獨立NPU架構,例如蘋果A12、聯發科的P系列平臺等。在安防領域,獨立NPU已經推動智能安防發展,一些IP公司也開發出了專用NPU IP如Imagination的PowerVR 2NX NNA加速器、PowerVR 3NX NNA等。反之,某些沒有集成獨立NPU的芯片平臺,依舊在通過CPUGPU和DSP進行人工智能運算,不但增加了功耗,影響其他運算任務的處理,還加大了第三方人工智能算法和應用接入的難度。

目前,人工智能已成人類的一項通用技術。人類會用AI技術和理念去解決現在和未來的問題, AI也必將會與更多產業應用結合,從而改變所有行業,更將改變每個組織。人工智能在語音識別、圖像識別、工業、汽車自動駕駛、農業、AR、VR等領域的應用潛力無限,而華為麒麟系列芯片在端側人工智能領域的探索處于全球領先,華為手機卓越的人工智能應用體驗也應證了專用NPU架構的選擇是非常明智和正確的,期待華為在這個領域的探索更深入,帶給我們更多驚喜。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • MOSFET
    +關注

    關注

    147

    文章

    7212

    瀏覽量

    213810
  • 人工智能
    +關注

    關注

    1793

    文章

    47532

    瀏覽量

    239293
  • NPU
    NPU
    +關注

    關注

    2

    文章

    288

    瀏覽量

    18683

原文標題:發揮端側人工智能潛力,專用NPU才是王道

文章出處:【微信號:FPGA-EETrend,微信公眾號:FPGA開發圈】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Banana Pi 攜手 ArmSoM 推出人工智能加速 RK3576 CM5 計算模塊

    的直接替代品。 ArmSoM 在其創建過程中寫道:“ArmSoM-CM5 是一款由 Rockchip RK3576 第二代 8nm 高性能 AIOT(人工智能物聯網)平臺驅動的計算模塊。它集成了四核
    發表于 12-11 18:38

    NPU的未來技術發展方向

    NPU(神經處理單元)作為專用的硬件加速器,在人工智能和機器學習領域發揮著越來越重要的作用。 一、定制化設計和靈活可編程性 定制化設計 : 隨著人工
    的頭像 發表于 11-15 09:27 ?936次閱讀

    NPU的工作原理解析

    隨著人工智能技術的快速發展,深度學習算法在各個領域得到了廣泛應用。為了滿足日益增長的計算需求,NPU應運而生。 NPU的基本概念 NPU是一種專用
    的頭像 發表于 11-15 09:17 ?845次閱讀

    嵌入式和人工智能究竟是什么關系?

    人工智能的結合,無疑是科技發展中的一場革命。在人工智能硬件加速中,嵌入式系統以其獨特的優勢和重要性,發揮著不可或缺的作用。通過深度學習和神經網絡等算法,嵌入式系統能夠高效地處理大量數據,從而實現
    發表于 11-14 16:39

    AI應用趨熱:NPU如何解決其關鍵痛點

    當前,AI大模型正逐步從云端遷移至邊緣,甚至深入至日常生活中的手機、個人電腦(PC)、汽車等終端。在這場變革中,智能正逐漸嶄露頭角,預示著未來的智能設備將能夠更實時、高效地理解和服
    的頭像 發表于 10-31 15:00 ?590次閱讀

    《AI for Science:人工智能驅動科學創新》第6章人AI與能源科學讀后感

    幸得一好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅動科學創新》的第6章后,我深刻感受到人工智能在能源科學領域中的巨大潛力和廣泛應用。這一章詳細
    發表于 10-14 09:27

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    研究的進程。從蛋白質結構預測到基因測序與編輯,再到藥物研發,人工智能技術在生命科學的各個層面都發揮著重要作用。特別是像AlphaFold這樣的工具,成功解決了困擾生物學界半個多世紀的蛋白質折疊問題,將
    發表于 10-14 09:21

    《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得

    ,無疑為讀者鋪設了一條探索人工智能(AI)如何深刻影響并推動科學創新的道路。在閱讀這一章后,我深刻感受到了人工智能技術在科學領域的廣泛應用潛力以及其帶來的革命性變化,以下是我個人的學習心得: 1.
    發表于 10-14 09:12

    risc-v在人工智能圖像處理應用前景分析

    、RISC-V在人工智能圖像處理中的應用案例 目前,已有多個案例展示了RISC-V在人工智能圖像處理中的應用潛力。例如: Esperanto技術公司 :該公司制造的首款高性能RISC-V AI處理器旨在
    發表于 09-28 11:00

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅動科學創新

    ! 《AI for Science:人工智能驅動科學創新》 這本書便將為讀者徐徐展開AI for Science的美麗圖景,與大家一起去了解: 人工智能究竟幫科學家做了什么? 人工智能將如何改變我們所生
    發表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產業博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領域集產品
    發表于 08-22 15:00

    FPGA在人工智能中的應用有哪些?

    FPGA(現場可編程門陣列)在人工智能領域的應用非常廣泛,主要體現在以下幾個方面: 一、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行性和低延遲特性
    發表于 07-29 17:05

    Arm終端CSS革新,加速人工智能時代

    在當今信息化與智能化的交匯點,人工智能的發展勢頭正盛。尤其是在人工智能領域,其對于計算平臺的性能、能效以及集成度的要求日益提升。近日,全
    的頭像 發表于 06-24 18:23 ?1517次閱讀

    5G智能物聯網課程之Aidlux下人工智能開發(SC171開發套件V1)

    課程類別 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 人工智能 參賽基礎知識指引 14分50秒 https://t.elecfans.com/v/25508.html *附件:參賽基礎知識指引
    發表于 04-01 10:40

    嵌入式人工智能的就業方向有哪些?

    嵌入式人工智能的就業方向有哪些? 在新一輪科技革命與產業變革的時代背景下,嵌入式人工智能成為國家新型基礎建設與傳統產業升級的核心驅動力。同時在此背景驅動下,眾多名企也紛紛在嵌入式人工智能領域布局
    發表于 02-26 10:17
    主站蜘蛛池模板: 一本大道一卡二卡四卡| 国产女人18毛片水真多18精品| 亚州视频一区二区| 久久午夜国产片| 黄色福利站| 欧美国产黄色| 成年女人毛片| 欧美xx高清| 亚洲视频免费一区| 最新日韩中文字幕| 亚洲色图在线观看视频| 四虎影院台湾辣妹| 一级特黄色毛片免费看| 亚洲美女黄视频| 久久久久国产一级毛片高清版| 在线观看亚洲免费视频| 日本69xxxxx| 在线观看视频h| 中文字幕精品一区二区2021年 | 天天插天天透| 欧美爱爱网址| 日本免费观看网站| 四虎影院欧美| 欧美sese| 成人在线免费| 99久久99久久免费精品蜜桃| 国产婷婷色| 午夜免费片| 福利视频自拍| 2022国产情侣真实露脸在线| 成人影院在线观看| 日本一区二区视频| 婷婷丁香综合网| 色香婷婷| 日本三级日本三级日本三级极 | 一级做a爰片久久毛片免费| 色网站免费看| 国产一级特黄| 人操人| 久久久久久久成人午夜精品福利| 色5566|