在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

賽靈思AI引擎簡介

YCqV_FPGA_EETre ? 來源:FPGA開發圈 ? 2020-09-03 09:35 ? 次閱讀

Versal ACAP 簡介

Versal 自適應計算加速平臺 (ACAP) 是基于 TSMC 7nm FinFET 工藝技術構建的最新一代賽靈思器件。它利用高帶寬片上網絡 (NoC) 將代表處理器系統 (PS) 的標量引擎、代表可編程邏輯 (PL) 的自適應引擎與智能引擎有機結合在一起。

本文將著重介紹智能引擎中所包含的 AI 引擎。

賽靈思 AI 引擎簡介

在部分賽靈思 Versal ACAP 中包含了 AI 引擎。這些 AI 引擎可排列組合為一組與內存、數據流和級聯接口相連的二維AI 引擎拼塊陣列。在當前 ACAP 器件(例如,VC1902 器件)上,此陣列最多可包含 400 個拼塊。此陣列中還包含AI 引擎接口(位于最后一行),以便于陣列中的其它器件(PS、PL 和 NoC)進行交互。

AI 引擎接口包含PL 和 NoC 接口拼塊以及配置拼塊。從 PL 到 AI 引擎陣列的連接是使用 AXI4-Stream 接口通過 PL 和 NoC 接口拼塊來實現的。從 NoC 到 AI 引擎陣列的連接是使用 AXI4 存儲器映射接口通過 NoC 接口拼塊來實現的。

有趣的是,從中可以看到,只有在 NoC 到 AI 引擎拼塊之間才存在 AXI4 存儲器映射直接通信通道,在 AI 引擎拼塊到 NoC 之間卻并不存在。

注:PL 和 NoC 接口拼塊的精確數量因器件而異。《Versal 架構和產品數據手冊:簡介》(DS950)中羅列了 AI 引擎陣列的大小。

https://china.xilinx.com/support/documentation/data_sheets/ds950-versal-overview.pdf

AI 引擎拼塊架構

現在,我們來詳細了解下此陣列,看看 AI 引擎拼塊的內部。

每個 AI 引擎拼塊都包含:

1 個拼塊互連模塊,用于處理 AXI4-Stream 和存儲器映射 AXI4 輸入/輸出

1 個存儲器模塊,其中包含 32 KB 數據內存,細分為 8 個內存 bank、1 個內存接口、DMA 和各種鎖定。

1 個 AI 引擎

AI 引擎可訪問全部 4 個方向中的多達 4 個內存模塊(作為 1 個連續存儲器塊)。這意味著除了拼塊本地的內存,AI 引擎還可以訪問 3 個相鄰拼塊的本地內存(除非拼塊位于陣列邊緣)。

北側內存模塊

南側內存模塊

東側或西側內存模塊(取決于 AI 引擎和內存模塊所在的行和相對布局)。

AI 引擎架構

AI 引擎屬于高度優化的處理器,包含下列主要特色:

32 位標量 RISC 處理器(名為 Scalar Unit)

1 個 512b SIMD 矢量單元(可提供矢量定點/整數單元)和 1 個單精度浮點 (SPFP) 矢量單元

3 個地址生成器單元 (AGU)

超長指令字 (VLIW) 功能

3 個數據內存端口(2 個負載端口,1 個存儲端口)

直接流傳輸接口(2 個輸入流,2 個輸出流)

AI 引擎陣列編程

AI 引擎拼塊按 10 或 100 為單位組成陣列。創建嵌入多項指令的單一程序用于指定并行性將是一項冗長且近乎不可能的任務。因此 AI 引擎陣列模型編程與 Kahn 處理網絡 (Kahn Process Networks) 之間的共通之處在于自主計算進程通過通信邊緣實現彼此互連,從而生成處理網絡。

(請參閱https://perso.ensta-paris.fr/~chapoutot/various/kahn_networks.pdf)

在 AI 引擎框架中,Graph 邊緣是緩存和數據流,而計算進程則被稱為內核。在Graph中,內核經過例化,彼此相連并連接到設計其余部分(NoC 或 PL)。

編程流程分為 2 個階段:

單內核編程:

內核用于描述特定計算進程。每個內核都將在單一 AI 引擎拼塊上運行。但請注意,多個內核可在同一個 AI 引擎拼塊上運行,并共享處理時間。任意 C/C++ 代碼均可用于對 AI 引擎進行編程。標量處理器將處理大部分代碼。如果您的目標是設計高性能內核,那么應考慮采用矢量處理器,它使用稱為內部函數的專用函數。這些函數專用于 AI 引擎的矢量處理器,支持您從 AI 引擎中發掘出巨大的處理性能。賽靈思將提供預構建內核(包含在庫內),以供用戶在其定制 Graph 中使用。

Graph 編程:

賽靈思將提供 C++ 框架以從內核創建Graph。此框架包含 Graph 節點和連接聲明。這些節點可包含在 AI 引擎陣列內或可編程邏輯(HLS 內核)中。為了完全掌握內核位置,將有一系列方法可用來約束布局(內核、緩存、系統內存等)。Graph 將例化并使用緩存和數據流將內核連接在一起。它還將描述 AI 引擎陣列與其它ACAP 器件(PL 或 DDR)之間的雙向往來數據傳輸。

賽靈思將提供預構建 Graph(包含在庫內),以供用戶在其應用中使用。

在運行時以及仿真期間,AI 引擎應用由 PS 進行控制。

賽靈思將根據應用的操作系統提供多種 API,如下所述。

Xilinx Run Time (XRT) 和 OpenCL,適用于 Linux 應用

裸機驅動程序

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 智能引擎
    +關注

    關注

    0

    文章

    4

    瀏覽量

    7086
  • 處理器系統
    +關注

    關注

    0

    文章

    9

    瀏覽量

    7798
  • Versal
    +關注

    關注

    1

    文章

    158

    瀏覽量

    7668

原文標題:【工程師必看】 Versal ACAP AI 引擎入門

文章出處:【微信號:FPGA-EETrend,微信公眾號:FPGA開發圈】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    FPGA產品的主要特點

    近年來,全球半導體供應鏈屢受挑戰,芯片短缺問題一度對行業產生深遠影響。易通過優化供應鏈管理、強化產能規劃,確保客戶的FPGA需求得到及時滿足。面向工業控制、機器視覺、醫療影像、消費電子、汽車智駕等一眾終端領域,易
    的頭像 發表于 12-04 14:20 ?428次閱讀
    易<b class='flag-5'>靈</b><b class='flag-5'>思</b>FPGA產品的主要特點

    使用 AMD Versal AI 引擎釋放 DSP 計算的潛力

    “Versal AI 引擎可以在降低功耗預算的情況下提高 DSP 計算密度,”高級產品營銷經理 Udayan Sinha 表示。這種效率使 Versal AI 引擎能夠在嚴格的功耗預算
    的頭像 發表于 11-29 14:07 ?499次閱讀

    快手“可AI”軟件著作權獲批

    近日,天眼查知識產權信息顯示,北京快手科技有限公司自主研發的“可AI”軟件著作權已成功獲得登記批準,版本號確定為V1.0。這一消息標志著快手在人工智能領域的技術研發取得了新的進展。 據公開資料顯示
    的頭像 發表于 11-29 13:50 ?268次閱讀

    戴爾越14龍采用第二代AMD AI PC處理器

    2024年,如果你想購入一臺用于學習、辦公、輕創作、輕游戲的高性價比全能AI PC,戴爾越14「龍」全戰力AMD輕薄本可以滿足你的需求。
    的頭像 發表于 09-20 15:36 ?560次閱讀

    AI引擎機器學習陣列指南

    AMD Versal AI Core 系列和 Versal AI Edge 系列旨在憑借 AI 引擎機器學習 ( ML ) 架構來提供突破性的 AI
    的頭像 發表于 09-18 09:16 ?399次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>機器學習陣列指南

    快訊 | 發展新質生產力問道如何下好“創新棋”?

    7月11日,南湖區委宣傳部、清華大學馬克主義學院共同帶隊一行蒞臨圍繞時頻新質生產力創新層面進行實地調研,副總經理田永和、對外合作部
    的頭像 發表于 07-12 13:31 ?502次閱讀
    <b class='flag-5'>賽</b><b class='flag-5'>思</b>快訊 | 發展新質生產力問道<b class='flag-5'>賽</b><b class='flag-5'>思</b>?<b class='flag-5'>賽</b><b class='flag-5'>思</b>如何下好“創新棋”?

    FPGA下載問題

    在ARM開發中,通常可供選擇的下載器有多種。清華的FPGA,除了官方的專用下載器,有其他的下載器可以使用嗎?使用下載器可以嗎?
    發表于 06-23 12:28

    快訊 | 熱烈歡迎嘉興市政協一行領導蒞臨總部調研指導工作!

    近日,嘉興市政協一行領導蒞臨總部調研指導工作,副總經理王文濤、田永和全程陪同。嘉興市政協一行領導蒞臨
    的頭像 發表于 05-17 13:22 ?527次閱讀
    <b class='flag-5'>賽</b><b class='flag-5'>思</b>快訊 | 熱烈歡迎嘉興市政協一行領導蒞臨<b class='flag-5'>賽</b><b class='flag-5'>思</b>總部調研指導工作!

    FPGA flash操作原理

    FPGA flash操作原理分享
    的頭像 發表于 04-09 15:03 ?1007次閱讀

    勒科技新型高性能800G硅光引擎即將亮相OFC 2024

    南通勒光電科技有限公司(簡稱“勒科技”)在近日重磅推出了專為AI集群和數據中心設計的新一代產品——新型高性能800G硅光引擎。這款備受矚目的創新產品即將在盛大的2024年度光纖通信
    的頭像 發表于 03-22 10:07 ?880次閱讀

    勒科技聯合劍橋科技發布新型800G硅光引擎

    南通勒光電科技有限公司,業界簡稱“勒科技”,近日正式揭曉了其專為AI集群和數據中心量身打造的新一代產品——高性能800G硅光引擎。這款創新產品即將在美國圣地亞哥的年度盛事——202
    的頭像 發表于 03-22 10:00 ?950次閱讀

    開放原子開源大賽—基于OpenHarmony的團結引擎應用開發正式啟動!

    “基于OpenHarmony的團結引擎應用開發”是開放原子全球開源大賽下開設的新興及應用題之一,本次題旨在鼓勵更多開發者基于Ope
    發表于 03-13 10:45

    AMD收購兩周年之際,全新Embedded+進一步彰顯協同效應

    融合、AI推理方面進行卓越的升級,應用于工業、醫療、智慧城市以及汽車等領域。 ? AMD工業、視覺、醫療與科學高級總監Chetan Khona接受媒體采訪時說道,再過兩周將會是AMD收購
    的頭像 發表于 02-07 20:20 ?3358次閱讀
    AMD收購<b class='flag-5'>賽</b><b class='flag-5'>靈</b><b class='flag-5'>思</b>兩周年之際,全新Embedded+進一步彰顯協同效應

    快訊 | 熱烈歡迎嘉興市人民政府咨詢委員會蒞臨總部調研!

    近日,嘉興市人民政府咨詢委員會主任周楚興率隊蒞臨總部進行調研,綜合中心副總經理王文濤陪同。嘉興咨詢委到訪
    的頭像 發表于 02-05 10:27 ?1378次閱讀
    <b class='flag-5'>賽</b><b class='flag-5'>思</b>快訊 | 熱烈歡迎嘉興市人民政府咨詢委員會蒞臨<b class='flag-5'>賽</b><b class='flag-5'>思</b>總部調研!

    AI引擎內核與計算圖編程指南

    電子發燒友網站提供《AI引擎內核與計算圖編程指南.pdf》資料免費下載
    發表于 01-03 10:50 ?0次下載
    <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>內核與計算圖編程指南
    主站蜘蛛池模板: 香蕉色综合| 色视频在线观看在线播放| 日韩精品一级a毛片| 国产毛片农村妇女aa板| 九九天天影视| 中文字幕在线资源| 久久国产成人精品国产成人亚洲| 午夜免费片| 亚洲视频在线一区二区| 三级毛片在线| 天天看天天碰| 乱码一区二区三区完整视频| 久久www免费人成看片色多多| 欧洲不卡一卡2卡三卡4卡网站| 日韩一级片在线观看| 一级毛片女人喷潮| 123成人网| 欧美性一区二区三区| 天天色综合2| 很黄很污的视频网站| 激情六月综合| 国产福利影视| 四虎国产精品免费视| 亚洲第一视频在线观看| 欧洲不卡一卡2卡三卡4卡网站| 快色视频在线观看| 高清视频在线观看+免费| 婷婷中文网| 污视频日本| 在线天堂视频| 成年女人在线观看| 亚州一级毛片| 黄色一级毛片网站| 免费免费啪视频视频观看| 欧美在线视频二区| 久操免费在线| 四大名著成人高h肉版| 天天摸天天操天天干| 伊人伊成久久人综合网777| 99久久99久久久99精品齐| 欧美另类亚洲一区二区|