女强穿越玄幻完结小说,盗墓笔记同人小说,已完本玄幻小说排行榜

電子發(fā)燒友網(wǎng)報道（文/李彎彎）在人工智能時代，越來越多的AI應(yīng)用需要從云端擴(kuò)展到邊緣端，比如智能耳機(jī)、智能攝像機(jī)、智能手環(huán)、物流機(jī)器人等，在邊緣端部署AI已經(jīng)成為趨勢。如今AI大模型迅猛發(fā)展，AI大模型在端側(cè)的部署也成了業(yè)界關(guān)注的焦點。

如何把AI模型在邊緣端部署

首先得軟硬件適配，硬件方面，適配的AI芯片越多越好，這樣對于工程師來說，就降低了端側(cè)模型適配遷移的難度，即使換一個設(shè)備也可以輕松部署上去；軟件方面，主要的操作系統(tǒng)需要做適配，包括Linux、Windows、Android 、iOS等，這樣無論是手機(jī)、PC都可以部署。還有框架適配，也是越全越好，比如PaddlePaddle、TensorFlow、PyTorch、Caffe、MXNet等。

其次是需要對模型進(jìn)行壓縮，在保證高精度的同時，最好也能夠讓模型跑得更快更省內(nèi)存，這里需要采用模型壓縮技術(shù)，比如模型量化、剪枝和蒸餾技術(shù)。尤其是如今AI大模型迅猛發(fā)展，未來大模型在端側(cè)的部署也少不了要用到壓縮技術(shù)。

可以說，模型壓縮技術(shù)是實現(xiàn)AI大模型在邊/端部署的核心技術(shù)。模型壓縮技術(shù)可在保有大模型原有性能和精度基本不變前提下降低對推理算力的需求。

具體來看，量化，即將浮點計算轉(zhuǎn)成低比特定點計算；網(wǎng)絡(luò)剪枝，即去除神經(jīng)網(wǎng)絡(luò)中冗余的通道、神經(jīng)元節(jié)點等；知識蒸餾，即將大模型作為教師模型，用其輸出訓(xùn)練性能接近、結(jié)構(gòu)更簡的模型。

以清華大學(xué)唐杰教授團(tuán)隊2022年8月發(fā)布的1300億參數(shù)模型 GLM-130B 為例，原模型支持在一臺 A100 40G*8或 V100 32G*8 服務(wù)器上進(jìn)行推理，而將模型量化至 INT 4精度后，相較INT 8精度其所需 GPU 內(nèi)存降低50%，且可在一臺4×RTX 3090（24G）或 8×RTX 2080Ti （11G ）服務(wù)器上進(jìn)行推理。

眾多廠商實現(xiàn)AI大模型的端側(cè)部署

谷歌、高通、華為等廠商已經(jīng)實現(xiàn)AI大模型在端側(cè)的部署。今年5月份，在Google/O開發(fā)者大會上，Google宣布了一個專門針對移動設(shè)備優(yōu)化系統(tǒng)的TensorFlow新版本TensorFlowLite。這款被稱為TensorFlowLite的軟件庫，是可在移動設(shè)備上運(yùn)行的深度學(xué)習(xí)工具，它允許開發(fā)人員在用戶的移動設(shè)備上實時地運(yùn)行人工智能應(yīng)用。

該軟件庫在設(shè)計上追求高速度和小儲存，支持iOS和Android系統(tǒng)。如果開發(fā)者使用其他系統(tǒng)，也可以經(jīng)過一系列復(fù)雜而冗長的編譯流程，將TensorFlow編譯成移動操作系統(tǒng)所支持的軟件庫，這樣并不會改變TensorFlow的功能。

TensorFlowLite還提供了有限的預(yù)訓(xùn)練人工智能模型，包括MobileNet和InceptionV3物體識別計算機(jī)模型，以及SmartReplay自然語言處理模型。開發(fā)者用自己的數(shù)據(jù)集做的定制模型也可以部署在上面。TensorFlowLite使用Android神經(jīng)網(wǎng)絡(luò)應(yīng)用程序界面（API），可以在沒有加速硬件時直接調(diào)用CPU來處理，確保其可以兼容不同設(shè)備。

高通技術(shù)公司產(chǎn)品管理高級副總裁兼AI負(fù)責(zé)人Ziad Asghar此前表示，隨著生成式AI的飛速普及，混合處理的重要性空前突顯。混合處理AI的重要性空前突顯，正如傳統(tǒng)計算從大型主機(jī)和瘦客戶端演變?yōu)楫?dāng)前云端和邊緣終端相結(jié)合的模式，AI處理必須在云端和終端混合進(jìn)行才能發(fā)揮其最大潛能。

根據(jù)高通的演示，將手機(jī)設(shè)置成“飛行模式”，再通過手機(jī)端全棧AI優(yōu)化，這一模型能夠完全在終端側(cè)運(yùn)行，實現(xiàn)在15秒內(nèi)完成20步推理，生成飽含細(xì)節(jié)的圖像。很重要的是，即便在飛行模式下，這些AI能力都可以得到實現(xiàn)，例如將Stable Diffusion的能力集成到相機(jī)應(yīng)用中之后，用戶在任何一個地點拍攝照片，再要求AI將照片背景改為夕陽之下的萬里長城。

Ziad Asghar透露，如果在云端運(yùn)行一個超過10億參數(shù)的生成式AI模型，可能需要數(shù)百瓦的功耗，而在終端側(cè)運(yùn)行需要的功耗僅有幾毫瓦。這賦予了高通在生成式AI領(lǐng)域的獨特優(yōu)勢。不久的將來，擁有 100 億或更高參數(shù)的模型將能夠在終端上運(yùn)行。

在今年3月春季旗艦新品發(fā)布會上，華為帶來全新智慧搜圖功能，基于多模態(tài)大模型技術(shù)，在手機(jī)端側(cè)對模型進(jìn)行小型化處理，在業(yè)界率先實現(xiàn)了首創(chuàng)的、精準(zhǔn)的自然語言手機(jī)圖庫搜索體驗。用戶可以像與人對話一樣，通過語音喚醒小藝，使用自然語言在手機(jī)圖庫中搜索出匹配如 “山頂看日出”、“圍爐煮茶”、“藍(lán)色珊瑚中的小丑魚”等描述的照片。

相較于傳統(tǒng)圖庫使用標(biāo)簽進(jìn)行照片搜索，存在準(zhǔn)確率低、響應(yīng)速度慢等問題，智慧搜圖更加“聰明”。結(jié)合多模態(tài)大模型技術(shù)，智慧搜圖對億級的圖文數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練，增加了對泛化通用語義的理解，支持包含顏色、形狀、物體、行為、時間和地點等多信息組合的自然語言搜索，同時還實現(xiàn)了端側(cè)輕量化應(yīng)用。

小結(jié)

由于AI在邊緣或者端側(cè)的部署具有諸多優(yōu)勢，近年來AI在邊緣側(cè)的應(yīng)用滲透率也越來越高。AI大模型迅猛發(fā)展，未來在終端的部署也是必然趨勢，眾多廠商已經(jīng)對此進(jìn)行探索，并有所突破，期待AI大模型未來能夠是實實在在賦能各行各業(yè)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
30896

瀏覽量
269086

企業(yè)AI模型部署攻略

當(dāng)下，越來越多的企業(yè)開始探索和實施AI模型，以提升業(yè)務(wù)效率和競爭力。然而，AI模型的部署并非易事

發(fā)表于 12-23 10:31 ?104次閱讀

AI模型部署邊緣設(shè)備的奇妙之旅：目標(biāo)檢測模型

以及邊緣計算能力的增強(qiáng)，越來越多的目標(biāo)檢測應(yīng)用開始直接在靠近數(shù)據(jù)源的邊緣設(shè)備上運(yùn)行。這不僅減少了數(shù)據(jù)傳輸延遲，保護(hù)了用戶隱私，同時也減輕了云端服務(wù)器的壓力。然而，在

發(fā)表于 12-19 14:33

AI模型部署邊緣設(shè)備的奇妙之旅：如何在邊緣端部署OpenCV

的算法和模型來解析圖像的意義。在實際應(yīng)用中，這兩者往往是緊密結(jié)合的，共同作用于解決復(fù)雜的問題。例如，在一個自動駕駛系統(tǒng)中，圖像處理可能會用于清理傳感器輸入的數(shù)據(jù)，而計算機(jī)視覺則負(fù)責(zé)識別道路上的行人

發(fā)表于 12-14 09:31

AI模型部署邊緣設(shè)備的奇妙之旅：如何實現(xiàn)手寫數(shù)字識別

系統(tǒng)的智能化水平，還極大地拓展了其應(yīng)用范圍，使得嵌入式系統(tǒng)在智能家居、智能交通、智能醫(yī)療等領(lǐng)域有了更深層次的運(yùn)用。AI技術(shù)的嵌入，已經(jīng)成為未來嵌入式系統(tǒng)發(fā)展的一個重要趨勢。踏入邊緣端

發(fā)表于 12-06 17:20

研華科技打造整體邊緣AI服務(wù)器解決方案

近年來，在AIoT數(shù)據(jù)量快速成長、硬件效能提升、綠色低碳意識抬頭等趨勢影響下，邊緣AI應(yīng)用的系統(tǒng)架構(gòu)也出現(xiàn)改變。隨著越來越多企業(yè)將AI

發(fā)表于 11-18 15:35 ?231次閱讀

什么是邊緣AI？邊緣AI的供電挑戰(zhàn)

RECOM 的 RACM1200-V 采用數(shù)字通信，可輕松集成到邊緣 AI設(shè)計中。

發(fā)表于 09-02 11:52 ?480次閱讀

ai邊緣盒子有哪些用途？ai視頻分析邊緣計算盒子詳解

近年來，隨著人工智能和邊緣計算的發(fā)展，一種名為AI邊緣盒子的新型設(shè)備正逐漸引起廣泛關(guān)注。作為一種集成了邊緣計算和AI算法處理能力的設(shè)備，

發(fā)表于 05-29 14:24 ?983次閱讀

支持大模型部署和運(yùn)行的邊緣計算SoC芯片

電子發(fā)燒友網(wǎng)報道（文/李彎彎）如今，AI在邊緣側(cè)的應(yīng)用越來越廣泛，這其中少不了AI SoC芯片的支持，邊

發(fā)表于 05-27 08:00 ?3433次閱讀

主流邊緣AI算法，在安防、零售、交通等領(lǐng)域的應(yīng)用

電子發(fā)燒友網(wǎng)報道（文/李彎彎）邊緣AI，是在邊緣設(shè)備部署AI算法，其計算發(fā)生在靠近用戶和數(shù)據(jù)的網(wǎng)

發(fā)表于 05-13 01:56 ?2986次閱讀

部署在邊緣設(shè)備上的輕量級模型

電子發(fā)燒友網(wǎng)報道（文/李彎彎）邊緣AI算法是一種將人工智能（AI）算法和計算能力放置在接近數(shù)據(jù)源的終端設(shè)備中的策略。這種算法通常被部署

發(fā)表于 05-11 00:17 ?2608次閱讀

NVIDIA與恩智浦聯(lián)手，在邊緣設(shè)備上部署AI模型

恩智浦工業(yè)及IoT邊緣高級副總裁Charles Dachs表示，人工智能的創(chuàng)新將塑造智能互聯(lián)世界的未來，融入Nvidia先進(jìn)的AI培訓(xùn)技術(shù)以及恩智浦在工業(yè)及物聯(lián)網(wǎng)邊緣科研實力，將產(chǎn)生協(xié)

發(fā)表于 03-25 16:05 ?885次閱讀

英特爾發(fā)布全新邊緣計算平臺，解決AI邊緣落地難題

電子發(fā)燒友網(wǎng)報道（文/李彎彎）AI越來越多地在邊緣側(cè)部署。Gartner最新預(yù)測數(shù)據(jù)顯示，到2025年，50%以上的企業(yè)管理數(shù)據(jù)將在數(shù)據(jù)中心

發(fā)表于 03-12 09:06 ?4350次閱讀

Supermicro全新系統(tǒng)產(chǎn)品組合將前沿AI性能推向邊緣計算環(huán)境

模型（Pre-trained Model）及將AI推論解決方案部署在產(chǎn)生數(shù)據(jù)的邊緣端，進(jìn)而縮短響

發(fā)表于 02-24 09:10 ?996次閱讀

AI邊緣計算機(jī)應(yīng)用場景廣泛！大語言模型與數(shù)字人結(jié)合方案在邊緣側(cè)落地

。 ? 當(dāng)下，AI在邊緣側(cè)的部署正在成為趨勢，包括近年來備受矚目的大語言模型，在

發(fā)表于 01-16 01:11 ?4441次閱讀

邊緣側(cè)部署大模型優(yōu)勢多！模型量化解決邊緣設(shè)備資源限制問題

設(shè)備上，可以減少數(shù)據(jù)傳輸?shù)难舆t和帶寬需求，提高模型的實時性和響應(yīng)速度。 ? 邊緣端部署大模型的優(yōu)勢 ?

發(fā)表于 01-05 00:06 ?3557次閱讀