在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

詳談PyTorch OCR模型的安卓端部署

電子設(shè)計(jì) ? 來源:電子設(shè)計(jì) ? 作者:電子設(shè)計(jì) ? 2020-12-08 23:07 ? 次閱讀
文章轉(zhuǎn)載于微信公眾號(hào):GiantPandaCV
作者: 阿呆

開發(fā)環(huán)境選擇

  1. 本文操作系統(tǒng)為Windows,因?yàn)閃indows上的安卓模擬器選擇較多,并且真機(jī)調(diào)試也比較方便;
  2. 交叉編譯在Windows和Ubuntu上都進(jìn)行了嘗試,都可行,但是如果是Ubuntu上交叉編譯之后再挪到Windows的話,容易出幺蛾子;
  3. 我目前使用的最穩(wěn)定的工具版本組合是:ndk18、androidstudio4.1、cmake3.10、gradle6.5、MinGW(CodeBlocks自帶)。

1. PyTorch模型轉(zhuǎn)NCNN

這一小節(jié)是介紹如何將自己重新訓(xùn)練過的PyTorch模型轉(zhuǎn)成ncnn,如果沒有重訓(xùn)練需求的話,可以直接跳過這一節(jié)。

(1) 整體步驟

理想情況下,從PyTorch轉(zhuǎn)到ncnn只需要下面兩步:

  • PyTorch轉(zhuǎn)ONNX
torch.onnx._export(model,x,path,opset_version=11)  
  • ONNX轉(zhuǎn)NCNN
./onnx2ncnnmodel.onnxmodel.parammodel.bin  

遇到問題的適合解決思路如下:

convert.png

下面介紹一下我在做ChineseOCRLite中的PSENet模型轉(zhuǎn)換的過程中遇到的問題。

(2)實(shí)際操作的時(shí)候可能會(huì)遇到各種問題

問題1:ReLU6不支持

概述:ReLU6算子在轉(zhuǎn)換的時(shí)候容易出現(xiàn)不支持的情況,需要使用其他算子替代

解決:使用torch.clamp替代(雖然ReLU6可以通過組合ReLU的方式實(shí)現(xiàn),但是組合得到的ReLU6在NCNN中容易轉(zhuǎn)換失敗,不建議使用。)

defrelu6(x,inplace=True):  
returntorch.clamp(x,0,6)  

問題2:Resize算子轉(zhuǎn)換問題

概述:因?yàn)楦鱾€(gè)框架對(duì)Resize算子的支持都不盡相同,在轉(zhuǎn)換過程中總會(huì)出現(xiàn)一些問題,pytorch中的interpolate算子轉(zhuǎn)換成ONNX之后變成很多零散的算子,如cast、shape等,這些在ncnn里面不支持。你可以選擇手動(dòng)修改文件,也可以使用下面這個(gè)自動(dòng)的方法:

解決:使用onnx/_simplifier對(duì)onnx模型進(jìn)行簡(jiǎn)化,可以合并這些零散的算子。

python-monnxsimmodel.onnxmodel_sim.onnx  

問題3:關(guān)于轉(zhuǎn)ONNX及使用onnx/_simplifier過程中出現(xiàn)的一系列奇怪問題

概述:使用不同版本的ONNX可能會(huì)遇到不同的問題,比如提示conv層無輸入等(具體錯(cuò)誤名稱記不清了)。

解決:下載最新ONNX源碼編譯安裝(onnx/_simplifier中出現(xiàn)的一些錯(cuò)誤也可以通過安裝最新ONNX來解決)

gitclonehttps://github.com/onnx/onnx.git  
sudoapt-getinstallprotobuf-compilerlibprotoc-dev  
cdONNX  
pythonsetup.pyinstall  

問題4:模型輸出結(jié)果的尺寸固定

概述:直接轉(zhuǎn)換得到的onnx模型的Resize算子都是固定輸出尺寸的,無論輸入多大的圖片都會(huì)輸出同樣大小的特征圖,這無疑會(huì)影響到模型的精度及靈活性。

解決:修改NCNN模型的param文件,將Resize算子修改成按比例resize。

直接轉(zhuǎn)換得到的param文件中的Interp算子是這樣的:

Interp913119019130=21=1.000000e+002=1.000000e+003=6404=640  

從下面的ncnn源碼中可以看到,0代表resize/_type,1和2分別是高和寬的縮放比例,3和4分別是輸出的高和寬。

intInterp::load_param(constParamDict&pd)  
{  
resize_type=pd.get(0,0);  
height_scale=pd.get(1,1.f);  
width_scale=pd.get(2,1.f);  
output_height=pd.get(3,0);  
output_width=pd.get(4,0);  
return0;  
}  

我們只需將其修改成如下格式即可實(shí)現(xiàn)按比例resize:

Interp913119019130=11=4.000000e+002=4.000000e+00  

問題5:NCNN模型輸出結(jié)果與ONNX模型不同

解決:逐層對(duì)比NCNN與onnx模型的輸出結(jié)果

使用onnxruntime(Python)和NCNN(C++)分別提取每個(gè)節(jié)點(diǎn)的輸出,進(jìn)行對(duì)比。對(duì)于ncnn比較簡(jiǎn)單,可以使用

extractor.extract(node_name,preds);  

來提取不同節(jié)點(diǎn)的輸出。

問題5衍生問題1:ONNX沒有提供提取中間層輸出的方法

解決:給要提取的層添加一個(gè)輸出節(jié)點(diǎn),代碼如下:

deffind_node_by_name(graph,node_name):  
fornodeingraph.node:  
ifnode.output[0]==node_name:  
returnnode  
returnNone  
  
defadd_extra_output_node(model,target_node,output_name):  
extra_output=helper.make_empty_tensor_value_info(output_name)  
target_output=target_node.output[0]  
identity_node=helper.make_node("Identity",inputs=[target_output],outputs=[output_name],name=output_name)  
model.graph.node.append(identity_node)  
model.graph.output.append(extra_output)  
returnmodel  

修改模型之后再使用

out=sess.run([output_name],{"input.1":img.astype(np.float32)})  

就可以獲取到模型的中間層輸出了。

問題5衍生問題2:發(fā)現(xiàn)最后一個(gè)Resize層的輸出有差異

解決:參考chineseocr/_lite里面的代碼把mode由bilinear改成了nearest(這里錯(cuò)誤的原因可能是wenmuzhou/PSENet.pytorch中的模型最后一個(gè)F.interpolate中的align/_corners參數(shù)設(shè)置成了True。據(jù)說NCNN只實(shí)現(xiàn)了align/_corners為False的情況)。

這里修改之后的模型跟原模型之間是會(huì)有少許誤差的,如果誤差不可接受,就要重新訓(xùn)練才行。

2. 交叉編譯opencv與ncnn

交叉編譯工作可以在windows上進(jìn)行,使用的是MinGW + cmkae3.10 + AndroidNDK18。可以參考Windows下編譯OpenCV android(https://www.cnblogs.com/zhxmdefj/p/13094954.html)

沒有windows C++環(huán)境的話,也可以選擇在linux上進(jìn)行。

如果是在linux交叉編譯,然后復(fù)制到windows的話,需要修改一下opencv中cmake配置文件中的路徑。

(1)android ndk下載

最初選擇的是r20b,因?yàn)楹虲Make之間的兼容問題,切換到了18b。

wgethttps://dl.google.com/android/repository/android-ndk-r18b-linux-x86_64.zip?hl=zh_cn  
mvandroid-ndk-r18b-linux-x86_64.zip?hl=zh_cnandroid-ndk-r18b-linux-x86_64.zip  
unzipandroid-ndk-r18b-linux-x86_64.zip  

(2)編譯opencv

利用android中提供的android.toolchain.cmake 工具鏈可以快速的編譯opencv的arm版。

這里選擇的arm平臺(tái)是armeabi-v7a,便于在老舊手機(jī)上運(yùn)行。

folde  
if[[!-d"$folder"]];then  
echo"$foldernotfound,creatingfolder..."  
mkdirbuild_arm  
fi  
cdbuild_arm  
cmake/  
-DCMAKE_TOOLCHAIN_FILE=/  
/home/dai/soft/android-ndk-r18b/build/cmake/android.toolchain.cmake/  
-DANDROID_NDK=/home/dai/soft/android-ndk-r18b/  
-DCMAKE_BUILD_TYPE=Release/  
-DBUILD_ANDROID_PROJECTS=OFF/  
-DBUILD_ANDROID_EXAMPLES=OFF/  
-DANDROID_ABI=armeabi-v7a/  
-DANDROID_NATIVE_API_LEVEL=21..  
make-j4  

(3)編譯ncnn

編譯選項(xiàng)參考ncnn wiki(https://github.com/Tencent/nc...

folde  
if[[!-d"$folder"]];then  
echo"$foldernotfound,creatingfolder..."  
mkdirbuild_arm  
fi  
cdbuild_arm  
cmake/  
-DCMAKE_TOOLCHAIN_FILE=/  
/home/dai/soft/android-ndk-r18b/build/cmake/android.toolchain.cmake/  
-DANDROID_AB/  
-DANDROID_ARM_NEON=ON/  
-DANDROID_PLATFORM=android-14/  
..  
make-j4  

(4)chineseocr/_lite的PC端測(cè)試

與ncnn有關(guān)的代碼位于ncnn/_project目錄下。在有opencv和ncnn庫的基礎(chǔ)上,可以先在pc端跑一下識(shí)別代碼。

cdncnn_project/ocr  
mkdirbuild_arm  
cdbuild_arm  
cmake..  
make-j4  

編譯完成之后

./TextRecognition../test1.jpg  

可以看到輸出結(jié)果:

psenet前向時(shí)間:0.462291s  
psenetdecode時(shí)間:0.0604791s  
boxzie10  
預(yù)測(cè)結(jié)果:  
一  
統(tǒng)  
;名  
稱  
丹正珍  
類住  
型  
有限責(zé)  
所  
中山市  
角度檢測(cè)和文字識(shí)別總時(shí)間:1.52042s  

3. NCNN模型的安卓端部署

因?yàn)榇a較長(zhǎng),這一部分只介紹把PC端代碼遷移到安卓端的思路,想看詳細(xì)代碼的同學(xué)請(qǐng)移步文末的Github地址。

遷移的整體思路如下圖所示:


android/_flow.png

下面一一介紹圖中內(nèi)容

UI界面

這個(gè)demo的UI界面中至少應(yīng)包含三個(gè)元件:

Button——用于選擇相冊(cè)圖片

ImageView——用于展示圖片及文本檢測(cè)框

TextView——用于展示識(shí)別結(jié)果

界面截圖如下(TextView在沒有文字的時(shí)候是不顯示的):


UI.jpg

界面res/layout/activity/_main.xml文件修改。

Java部分

模型推理是在C++中完成的,Java部分的代碼主要是利用安卓的API實(shí)現(xiàn)圖片讀取、文本檢測(cè)框繪制和結(jié)果展示等功能。

需要傳入到C++函數(shù)的內(nèi)容包括Bitmap圖片和AssetManager對(duì)象。

從C++接收到的是一個(gè)包含文本框和識(shí)別結(jié)果的字符串。

C++部分

C++負(fù)責(zé)模型推理,推理代碼與PC端無異,只是安卓端的文件讀取與PC端不同,需要修改文件讀取代碼,比如crnn的模型加載代碼就需要改成下面的樣子:

intmodel::init(AAssetManager*mgr,conststd::stringcrnn_param,conststd::stringcrnn_bin)  
{  
intret1=crnn.load_param(mgr,crnn_param.c_str());  
intret2=crnn.load_model(mgr,crnn_bin.c_str());  
LOGI("ret1is%d,ret2is%d",ret1,ret2);  
return(ret1||ret2);  
}  

另外還需要把Java部分傳過來的Bitmap轉(zhuǎn)換成cv::Mat,代碼如下:

//convertbitmaptomat  
int*data=NULL;  
AndroidBitmapInfoinfo={0};  
AndroidBitmap_getInfo(env,bitmap,&info);  
AndroidBitmap_lockPixels(env,bitmap,(void**)&data);  
  
//這里偷懶只寫了RGBA格式的轉(zhuǎn)換  
LOGI("infoformatRGBA?%d",info.format==ANDROID_BITMAP_FORMAT_RGBA_8888);  
cv::Mattest(info.height,info.width,CV_8UC4,(char*)data);//RGBA  
cv::Matimg_bgr;  
cvtColor(test,img_bgr,CV_RGBA2BGR);  

最終識(shí)別結(jié)果

最終得到的demo識(shí)別結(jié)果如下圖所示:

result.jpg

本項(xiàng)目完整代碼請(qǐng)移步github:

https://github.com/Arctanxy/D...

推薦閱讀

更多嵌入式AI技術(shù)干貨請(qǐng)關(guān)注嵌入式AI專欄。

審核編輯:符乾江
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31262

    瀏覽量

    269631
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5510

    瀏覽量

    121338
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    808

    瀏覽量

    13283
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測(cè)模型

    以及邊緣計(jì)算能力的增強(qiáng),越來越多的目標(biāo)檢測(cè)應(yīng)用開始直接在靠近數(shù)據(jù)源的邊緣設(shè)備上運(yùn)行。這不僅減少了數(shù)據(jù)傳輸延遲,保護(hù)了用戶隱私,同時(shí)也減輕了云端服務(wù)器的壓力。然而,在邊緣部署高效且準(zhǔn)確的目標(biāo)檢測(cè)模型
    發(fā)表于 12-19 14:33

    如何在 PyTorch 中訓(xùn)練模型

    PyTorch 是一個(gè)流行的開源機(jī)器學(xué)習(xí)庫,廣泛用于計(jì)算機(jī)視覺和自然語言處理等領(lǐng)域。它提供了強(qiáng)大的計(jì)算圖功能和動(dòng)態(tài)圖特性,使得模型的構(gòu)建和調(diào)試變得更加靈活和直觀。 數(shù)據(jù)準(zhǔn)備 在訓(xùn)練模型之前,首先需要
    的頭像 發(fā)表于 11-05 17:36 ?372次閱讀

    新手小白怎么通過云服務(wù)器跑pytorch

    安裝PyTorch的步驟可以根據(jù)不同的操作系統(tǒng)和需求有所差異,通過云服務(wù)器運(yùn)行PyTorch的過程主要包括選擇GPU云服務(wù)器平臺(tái)、配置服務(wù)器環(huán)境、部署和運(yùn)行PyTorch
    的頭像 發(fā)表于 09-25 11:35 ?323次閱讀

    基于Pytorch訓(xùn)練并部署ONNX模型在TDA4應(yīng)用筆記

    電子發(fā)燒友網(wǎng)站提供《基于Pytorch訓(xùn)練并部署ONNX模型在TDA4應(yīng)用筆記.pdf》資料免費(fèi)下載
    發(fā)表于 09-11 09:24 ?0次下載
    基于<b class='flag-5'>Pytorch</b>訓(xùn)練并<b class='flag-5'>部署</b>ONNX<b class='flag-5'>模型</b>在TDA4應(yīng)用筆記

    PyTorch中搭建一個(gè)最簡(jiǎn)單的模型

    PyTorch中搭建一個(gè)最簡(jiǎn)單的模型通常涉及幾個(gè)關(guān)鍵步驟:定義模型結(jié)構(gòu)、加載數(shù)據(jù)、設(shè)置損失函數(shù)和優(yōu)化器,以及進(jìn)行模型訓(xùn)練和評(píng)估。
    的頭像 發(fā)表于 07-16 18:09 ?2119次閱讀

    pytorch中有神經(jīng)網(wǎng)絡(luò)模型

    當(dāng)然,PyTorch是一個(gè)廣泛使用的深度學(xué)習(xí)框架,它提供了許多預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型PyTorch中的神經(jīng)網(wǎng)絡(luò)模型 1. 引言 深度學(xué)習(xí)是一種基于人工神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)技術(shù),它在圖像
    的頭像 發(fā)表于 07-11 09:59 ?733次閱讀

    PyTorch神經(jīng)網(wǎng)絡(luò)模型構(gòu)建過程

    PyTorch,作為一個(gè)廣泛使用的開源深度學(xué)習(xí)庫,提供了豐富的工具和模塊,幫助開發(fā)者構(gòu)建、訓(xùn)練和部署神經(jīng)網(wǎng)絡(luò)模型。在神經(jīng)網(wǎng)絡(luò)模型中,輸出層是尤為關(guān)鍵的部分,它負(fù)責(zé)將
    的頭像 發(fā)表于 07-10 14:57 ?530次閱讀

    基于AX650N/AX630C部署側(cè)大語言模型Qwen2

    本文將分享如何將最新的側(cè)大語言模型部署到超高性價(jià)比SoC上,向業(yè)界對(duì)側(cè)大模型部署的開發(fā)者提供
    的頭像 發(fā)表于 07-06 17:43 ?3647次閱讀
    基于AX650N/AX630C<b class='flag-5'>部署</b><b class='flag-5'>端</b>側(cè)大語言<b class='flag-5'>模型</b>Qwen2

    解讀PyTorch模型訓(xùn)練過程

    PyTorch作為一個(gè)開源的機(jī)器學(xué)習(xí)庫,以其動(dòng)態(tài)計(jì)算圖、易于使用的API和強(qiáng)大的靈活性,在深度學(xué)習(xí)領(lǐng)域得到了廣泛的應(yīng)用。本文將深入解讀PyTorch模型訓(xùn)練的全過程,包括數(shù)據(jù)準(zhǔn)備、模型
    的頭像 發(fā)表于 07-03 16:07 ?1121次閱讀

    如何使用PyTorch建立網(wǎng)絡(luò)模型

    PyTorch是一個(gè)基于Python的開源機(jī)器學(xué)習(xí)庫,因其易用性、靈活性和強(qiáng)大的動(dòng)態(tài)圖特性,在深度學(xué)習(xí)領(lǐng)域得到了廣泛應(yīng)用。本文將從PyTorch的基本概念、網(wǎng)絡(luò)模型構(gòu)建、優(yōu)化方法、實(shí)際應(yīng)用等多個(gè)方面,深入探討使用
    的頭像 發(fā)表于 07-02 14:08 ?441次閱讀

    使用PyTorch搭建Transformer模型

    Transformer模型自其問世以來,在自然語言處理(NLP)領(lǐng)域取得了巨大的成功,并成為了許多先進(jìn)模型(如BERT、GPT等)的基礎(chǔ)。本文將深入解讀如何使用PyTorch框架搭建Transformer
    的頭像 發(fā)表于 07-02 11:41 ?1716次閱讀

    請(qǐng)問電腦Pytorch訓(xùn)練的模型如何轉(zhuǎn)化為能在ESP32S3平臺(tái)運(yùn)行的模型

    由題目, 電腦Pytorch訓(xùn)練的模型如何轉(zhuǎn)化為能在ESP32S3平臺(tái)運(yùn)行的模型? 如何把這個(gè)Pytorch
    發(fā)表于 06-27 06:06

    模型側(cè)部署加速,都有哪些芯片可支持?

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)大模型側(cè)部署是指將大型神經(jīng)網(wǎng)絡(luò)模型部署在移動(dòng)終端設(shè)備上,使這些設(shè)備能夠直接運(yùn)行這些
    的頭像 發(fā)表于 05-24 00:14 ?4249次閱讀

    5G智能物聯(lián)網(wǎng)課程之環(huán)境開發(fā)

    *附件:開發(fā)環(huán)境搭建之Android Studio安裝V1.0.pdf 開發(fā)環(huán)境 開發(fā)環(huán)境搭建之基本工程創(chuàng)建 13分04秒 https://t.elecfans.com/v/25515.html
    發(fā)表于 04-01 10:39

    谷歌計(jì)劃將先進(jìn)大模型Gemini明年嵌入手機(jī)

    谷歌對(duì)其人工智能大模型在智能手機(jī)上的應(yīng)用前景持樂觀態(tài)度,并預(yù)計(jì)其更先進(jìn)的大模型Gemini將于明年嵌入手機(jī)。這一消息由谷歌Pixel部門產(chǎn)品管理副總裁布萊恩·拉科夫斯基(Brian
    的頭像 發(fā)表于 03-06 11:37 ?786次閱讀
    主站蜘蛛池模板: 永久免费看www色视频| 午夜免费小视频| 日本黄色免费在线| 在线成人看片| 一级毛片ab片高清毛片| 亚洲第一成年网| 日毛片| 欧美精品二区| 国产综合图区| 97久久综合九色综合| 天天爱天天做天天爽天天躁 | 中日韩毛片| 午夜看大片| 一级毛片一级黄片| 天天噜噜色| 欧美性久久| 成人在线综合网| 天天免费视频| 91md天美精东蜜桃传媒在线| 久久亚洲国产成人精品性色| 超级乱淫小黄文小说| 中文一区二区在线观看| 一级毛片视屏| 欧美人与动性行为网站免费| 国产成人a一区二区| 国产伦子系列视频6| 午夜在线视频免费| 国产成人影院在线观看| 欧美日韩亚洲一区| 日本中文字幕在线播放| 日本午夜片成年www| 国产怡红院| 色综合色综合| 免费看欧美理论片在线| 丁香五月情| 香蕉久久夜色精品国产2020| 久青草国产免费观看| 国产农村妇女毛片精品久久| 天天摸天天做天天爽在线| 狂野欧美性猛交xxxx免费| 日本在线免费|