在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何讓這些乘加器高效地進行并行計算?

pmkA_arm_china ? 來源:lp ? 2019-03-27 08:42 ? 次閱讀

隨著Arm生態系統的發展壯大,各種各樣的應用場景層出不窮。為了更好地在特定場景下得到更好的性能,能耗比等指標,針對特定應用場景的加速器市場也在蓬勃發展,近年來火熱的人工智能加速器(Artificial Intelligence Accelerator)就是一個典型例子。

一個高效的加速器,需要精心設計的硬件以及與之搭配的軟件,兩者缺一不可,否則用戶體驗會大打折扣,這也是為什么我們常常看到某些指標非常驚艷的加速器,在實際使用中體驗卻不盡如人意的原因。以人工智能加速器為例,其中基本的硬件加速單元就是乘加器的組合,但如何讓這些乘加器高效地進行并行計算,涉及到上層數據的打包、調度,需要大量的驅動軟件工作,而且大部分軟件開發者都是基于某種框架進行應用開發,具體見圖 1,所以驅動到框架的適配也很重要,甚至有一些框架不能滿足應用的需求,需要專門開辟通道進行優化。

圖1:ArmNPU軟硬件框架

開發一款高性能加速器,需要投入大量人力物力,如果不能大規模使用,那么投入回報比會大大降低,甚至虧本。如果加速器能和不同Arm系統輕松組合,拓展Arm系統的應用范圍,那么應用場景將會大大增加,生命周期也會延長。讓加速器適配不同的Arm系統,這對軟硬件接口和驅動提出了非常大的挑戰,因為今天的Arm產品非常豐富,從低功耗的微處理器,主流的移動平臺,到高端的服務器,高性能計算處理器都有相應產品。對于一個加速器團隊來說,針對盡可能多的Arm配置組合進行開發驗證成本將非常高昂,這里面不單單涉及IP/EDA的采購,還有系統的搭建維護,但如果沒有這些IP又無法將整個業務流程完整驗證,甚至影響軟硬件接口的設計優化。

有沒有方法高效地解決加速器配套驅動,框架,應用軟件開發的問題呢?Fast Model!

圖2:使用DS-5調試運行在Fast Model中的系統軟件

在Fast Model的例子系統中,Arm給出了一系列Arm核,相關IP組合的子系統模型,以及相應OS,開發工具DS-5,方便客戶快速搭建軟件開發平臺,調整軟硬件接口,進行驅動以及上層軟件的開發,具體參考圖3。

整個開發流程如下:

1.在Fast Model的例子系統中找到你需要的平臺,和對應的Bootloader, Firmware,OS軟件,并將他們順利運行

2.將Fast Model的子系統導出生成SystemC的模型子系統模塊

3.編寫加速器的功能模型,通過AMBA PV總線和Fast Model導出的子系統模塊進行連接

4.編寫驅動在目標OS中操作加速器

5.在模型平臺上進行軟件框架,應用匹配移植

Arm提供了絕大部分市面可見設計的類似子系統,無論是基于Arm v7/v8單核,多核,多cluster系統,還是包含最新架構特性的CPU系統,加速器開發團隊都可以在Fast Model的例子程序里面找對類似子系統范例進行適配,在設計之初就可以解決不同系統的適配性問題。Fast Model也提供工具讓開發者對例子系統進行修改,生成新的子系統以滿足需要。在加速器設計之初,軟件硬件人員就可以一起利用豐富多樣的例子系統進行架構的探索,對穩定軟硬件接口非常有幫助,而穩定的接口定義對長期的產品演進至關重要。

圖3:基于Fast Model的加速器軟件開發

至此開發者已經完成了大部軟硬件接口,驅動以及框架軟件開發工作,但驅動中的時序問題還沒有完全解決,因為Fast Model是一款功能型模型,它為了提高運行速度(50-200MHz),犧牲了時序信息。對于時序信息,開發者可以最后去仿真平臺甚至最終芯片上去調節,而此時軟件測試用例和框架都已經完成,這將大大節省占用仿真平臺(MHz)進行調試排錯的時間,從而降低成本。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 加速器
    +關注

    關注

    2

    文章

    799

    瀏覽量

    37881
  • 人工智能
    +關注

    關注

    1791

    文章

    47294

    瀏覽量

    238578
  • 生態系統
    +關注

    關注

    0

    文章

    702

    瀏覽量

    20727
收藏 人收藏

    評論

    相關推薦

    arm系統中并行計算優化

    fpga的硬件換成我們自己的arm設備。不過經過研究這種設想不可行。個人看法,也許不對哦。!!!!arm是一款多核心,單進程處理,目前為止arm處理都不支持多線程。所以多線程概念不能將并行計算優化
    發表于 12-30 14:33

    什么是異構并行計算

    先了解什么是異構并行計算同構計算是使用相同類型指令集和體系架構的計算單元組成系統的計算方式。而異構計算主要是指使用不同類型指令集和體系架構的
    發表于 07-19 08:27

    基于Fast Model的加速軟件開發

    非常驚艷的加速,在實際使用中體驗卻不盡如人意的原因。以人工智能加速為例,其中基本的硬件加速單元就是的組合,但如何
    發表于 07-29 15:38

    基于MPI的結晶傳熱并行計算方法

    針對連鑄結晶傳熱數值模擬計算量較大、耗時長的特點,基于自行構建的并行計算環境,對計算數據域采用對等模式劃分成塊,設計了用于結晶傳熱數值模
    發表于 12-18 16:53 ?7次下載

    THE MATHWORKS推出新版并行計算工具箱

    THE MATHWORKS推出新版并行計算工具箱 The MathWorks 近日宣布推出新版 Parallel Computing Toolbox(并行計算工具箱),該版本提供了改進的分布式數組,可以 MATLAB 用戶直
    發表于 11-25 09:17 ?1127次閱讀

    并行計算和嵌入式系統實踐教程

    Linux微機應用十分普遍. 高性能并行計算機數量多. 并行計算,我國有自己的理論. 對并行計算的基本原理,算法,程序設計與實現,優化,成熟軟件應用的推廣不夠. 制約并行計算在研究和工
    發表于 05-09 15:54 ?48次下載

    并行計算和分布式計算的區別和聯系

    并行計算或稱平行計算是相對于串行計算來說的。所謂并行計算可分為時間上的并行和空間上的并行。 時間
    發表于 12-08 09:59 ?3.7w次閱讀

    基于Matlab和GPU的BESO方法的全流程并行計算策略

    針對傳統并行計算方法實現結構拓撲優化快速計算的硬件成本高、程序開發效率低的問題,提出了一種基于Matlab和圖形處理(GPU)的雙向漸進結構優化(BESO)方法的全流程并行計算策略。
    發表于 12-21 15:04 ?2次下載
    基于Matlab和GPU的BESO方法的全流程<b class='flag-5'>并行計算</b>策略

    基于異構并行計算的兩個子概念異構和并行的簡單分析

    異構并行計算包含兩個子概念:異構和并行。 1異構是指異構并行計算需要同時處理多個不同架構的計算平臺的問題。 2并行是指異構
    的頭像 發表于 01-25 16:37 ?6608次閱讀
    基于異構<b class='flag-5'>并行計算</b>的兩個子概念異構和<b class='flag-5'>并行</b>的簡單分析

    基于云計算的電磁問題并行計算方法

    并行計算所需的彈性集群。計算節點通過千兆路由相連,節點之間使用SSH通信協議。選取感應電機和變壓作為計算案例,使用Fortran編寫靜
    發表于 03-20 13:56 ?1次下載
    基于云<b class='flag-5'>計算</b>的電磁問題<b class='flag-5'>并行計算</b>方法

    如何使用Web在Java上進行并行計算的資料說明

    并行計算需要解決的問題,最后簡要研究并行計算模型的實例JET平臺。該系統可以使用Java小應用程序及一系列服務在Web上執行并行程序。它解決本文提出的一些問題,并且允許基于web與
    發表于 02-15 10:28 ?6次下載
    如何使用Web在Java上<b class='flag-5'>進行</b><b class='flag-5'>并行計算</b>的資料說明

    C編程的并行計算詳細資料說明

    在過去的幾十年間,人們對并行計算產生了越來越多的興趣。并行計算的主要目標是提高運算速度。從純粹的計算視角來看,并行計算可以被定義為計算的一種
    發表于 08-02 17:34 ?2次下載
    C編程的<b class='flag-5'>并行計算</b>詳細資料說明

    CUDA的異構并行計算詳細資料介紹

    小問題,然后在不同的計算資源上并行處理這些小問題。并行計算的軟件和硬件層面是緊密聯系的。事實上,并行計算通常涉及兩個不同的
    發表于 07-04 17:41 ?0次下載
    CUDA的異構<b class='flag-5'>并行計算</b>詳細資料介紹

    并行計算的黃金時代到了?

    “未來幾十年將進入并行計算黃金時代,并行計算軟件和算法的開發將從技術驅動轉向應用驅動,需要計算與應用等不同領域的專家共同合作開發。”中國工程院院士李國杰日前表示。
    的頭像 發表于 04-03 17:18 ?2296次閱讀

    淺析云計算并行計算

    并行計算可以劃分成時間并行和空間并行。時間并行即流水線技術,空間并行使用多個處理執行并發
    的頭像 發表于 05-03 12:01 ?4662次閱讀
    淺析云<b class='flag-5'>計算</b>和<b class='flag-5'>并行計算</b>
    主站蜘蛛池模板: 国产一区二区在线视频播放| 色多多入口| 欧美亚洲视频一区| 色婷婷激情五月| 老师受不了了好硬好大| 字幕网中文aⅴ资源站| 亚洲韩国在线一卡二卡| 婷婷午夜影院| 日本三级日产三级国产三级| 女人张开腿让男人桶免费最新| 女人张开腿让男人桶免费网站 | 羞羞漫画喷水漫画yy漫画| 男男污肉高h坐便器调教| 一级毛片一级毛片一级毛片| 四虎国产欧美成人影院| 六月丁香婷婷综合| 成人欧美一区二区三区小说| 天天射天天做| 福利视频自拍| 日本毛片大全| 我想看一级黄色片| 欧洲人体超大胆露私视频| 国产午夜大片| 午夜影院三级| 国产精品人人爱一区二区白浆| 欧美最猛黑人xxxx黑人猛交69| 久久精品国产99久久72| 四虎影院永久网站| 久久视频免费| 五月婷婷丁香色| 91网站网站网站在线| 久99频这里只精品23热 视频| 视频在线色| 国产一级大片在线观看| 天天色天天搞| 免费看h的网站| 国产美女作爱| 天天夜天干天天爽| 啪啪91视频| 亚洲国产精品乱码一区二区三区| 欧美一级黄视频|