啟動人工智能應用從來沒有像現在這樣容易!受益于像Xilinx Zynq UltraScale+ MPSoC 這樣的FPGA,AI現在也可以離線使用或在邊緣部署、使用。瑞蘇盈科核心板模塊結合Vitis AI開發工具給用戶提供了便利工具,可用于開發和部署用于實時推理的機器學習應用,因此將AI集成到應用中變得輕而易舉。圖像檢測或分類、模式或語音識別推動了制造業、醫療、汽車和金融服務等產業的升級。
快速開啟基于AI的FPGA應用
人工智能正在占據越來越多的應用和生活場景,例如圖像檢測和分類,翻譯和推薦系統等等。基于機器學習技術的應用數量龐大且還在不斷增長。采用瑞蘇盈科結合FPGA和ARM處理器的核心板模塊,在離線和邊緣使用AI前所未有的容易。
人工智能(AI)歷史悠久,自1955年便被公認為一門學科。人工智能是計算機模仿人類智能、從經驗中學習、適應新信息并執行類似人類活動的能力。人工智能的應用包括專家系統、自然語言處理(NLP)、語音識別和機器視覺。
AI的復興
在經歷了幾波樂觀和失望之后,人們對人工智能產生了新的興趣,而且越來越感興趣。在過去15年左右的時間里,成千上萬的人工智能初創公司成立了,而且速度在不斷增長。這背后有幾個驅動因素:可能最重要的一個是現在可以以承擔得起的價格獲得巨大的計算能力。不僅硬件更快,而且現在每個人都可以訪問云中的超級計算機。這使得運行人工智能所需的硬件平臺變得大眾化,使得初創企業得以大量涌現。
圖1:一種具有2個隱含層的前饋人工神經網絡的簡化視圖
人工神經網絡(圖1)現在擴展到幾十到幾百個隱藏層節點(圖2)。即使是有10000個隱藏層的網絡也已經實現了。這種進化正在增加神經網絡的抽象能力,并使新的應用成為可能。如今,神經網絡可以在數萬個CPU或GPU核上進行訓練,大大加快了開發廣義學習模型的過程。
圖2: ImageNet識別挑戰獲勝者展示了在新的神經網絡架構中不斷增加的隱藏層
人們對人工智能興趣增加的另一個原因是近年來機器學習方面的突破性進展。這有助于吸引科技投資和初創企業的興趣,進一步加速人工智能的發展和完善。
機器如何學習
人工神經網絡是一種受人腦啟發的計算模型。它由一個簡單的處理單元相互連接的網絡組成,這些網絡可以通過修改它們的連接來學習經驗(圖1)。所謂的深度神經網絡(DNN -具有許多隱藏層的神經網絡)目前為許多大型計算問題提供了最佳解決方案。
目前應用最廣泛的深度學習系統是卷積神經網絡(Convolutional Neural Network, CNNs)。這些系統使用前饋的人工神經元網絡將輸入特征映射到輸出,他們使用反向饋入系統進行學習(即訓練),并產生一組權重來校準CNN(反向傳播,圖3)。
圖3:神經網絡需要經過訓練來學習如何解決問題或挑戰
機器學習中計算強度最大的過程是訓練神經網絡。對于一個最先進的網絡來說,它可能需要數天到數周的時間,需要數十億的浮點計算和大量的訓練數據(GByte到數百GByte),直到網絡達到所需的精度。幸運的是,這個步驟在大多數情況下都不需要時間限制,并且可以轉移到云上。
當網絡接受訓練時,它可以被輸入一個新的、未標記的數據集,并根據它之前學習的數據對數據進行分類。這一步稱為推斷,是開發應用的實際目標。
告訴我你看到了什么
輸入的分類可以在云中進行,也可以在邊緣(大部分是離線)進行。雖然通過神經網絡處理數據通常需要專用加速器(FPGA、GPU、DSP或ASIC),但額外的任務最好由CPU處理,CPU可以用傳統的編程語言編程。這就是帶有集成CPU(所謂的片上系統(SoC))的FPGA的優勢所在,尤其是在邊緣。SoC將推理加速器(FPGA陣列)和CPU組合在一塊芯片中。CPU運行控制算法和數據流管理。同時,與基于GPU或ASIC的解決方案相比,FPGA提供了許多優勢,其中包括易于集成多個接口和傳感器,以及適應新神經網絡架構的靈活性(圖4)。
圖4:人工智能推理應用的不同技術的比較
FPGA固有的可重構性也使其能夠利用不斷演化的神經網絡拓撲、更新的傳感器類型和配置,以及更新的軟件算法。使用SoC可以在需要時保證低而確定的延遲,例如,用于實時對象檢測。同時,SoC也非常節能。從FPGA中獲得最佳性能的主要挑戰是在不失去精度的情況下將浮點模型有效地映射到定點FPGA實現(圖5),這就是供應商工具的作用所在。
-
圖5:將浮點模型有效映射到定點FPGA實現的過程稱為壓縮
選擇合適的工具
現在有很多工具可以幫助我們降低實現第一個AI項目的門檻。例如,Vitis AI開發工具為用戶提供了在FPGA上開發和部署用于實時推理的機器學習應用程序的工具。它們支持許多常見的機器學習框架,如Caffe和TensorFlow,PyTorch支持也將很快推出。它們使最先進的神經網絡能夠有效適應FPGA,用于嵌入式人工智能應用(圖5)。
圖6:瑞蘇盈科火星XU3核心板模塊
結合標準的核心板模塊(SoM),如瑞蘇盈科的火星XU3(圖6)(基于Xilinx Zynq UltraScale+ MPSoC),插入火星ST3底板,人工智能應用可以比以往更快地實現(圖7)。
圖7:已被業界證實的人工智能應用解決方案,基于Xilinx Zynq UltraScale+ MPSoC
為了展示這種組合的性能和快速上市能力,瑞蘇盈科在短短幾天內開發了一個基于人工智能的圖像識別系統。這些圖像是用一個連接到火星ST3底板的標準USB攝像頭拍攝的。如需更高的性能,可使用底板上的MIPI接口。
該神經網絡以低延遲的方式對圖像進行分類、在火星XU3核心板模塊上運行。該系統支持流行的神經網絡如ResNet-50和DenseNet,兩者分別用于圖像分類和實時人臉檢測。
單個FPGA模塊不僅可以運行神經網絡推理,還可以并行處理許多其他任務,如與主機PC和其他外圍設備通信。而且,同時控制各種高動態驅動器是FPGA技術發揮其優勢的地方。例如,添加瑞蘇盈科通用驅動控制器IP核來控制無刷直流電機或步進電機將是輕而易舉的事。在邊緣利用AI的力量從未如此容易,所以,即刻開啟您的項目吧!
評論
查看更多