01簡介
《在 AI 愛克斯開發板上用 OpenVINO加速 YOLOv8 目標檢測模型》介紹了在AI 愛克斯開發板上使用 OpenVINO開發套件部署并測評 YOLOv8 的目標檢測模型,本文將介紹在AI 愛克斯開發板上使用 OpenVINO加速 YOLOv8-seg 實例分割模型。
請先下載本文的范例代碼倉,并搭建好 YOLOv8 的 OpenVINO推理程序開發環境。
02導出 YOLOv8-seg 實例分割
OpenVINOIR 模型
YOLOv8-seg 的實例分割模型有5種,在COCO數據集完成訓練,如下表所示。
首先使用命令:
yoloexport model=yolov8n-seg.pt format=onnx
完成 yolov8n-seg.onnx 模型導出,如下圖所示:
然后使用命令:
mo -m yolov8n-seg.onnx --compress_to_fp16
優化并導出 FP16 精度的 OpenVINOIR 格式模型,如下圖所示:
03用 benchmark_app 測試
YOLOv8-seg 實例分割模型的推理計算性能
benchmark_app 是 OpenVINO工具套件自帶的 AI 模型推理計算性能測試工具,可以指定在不同的計算設備上,在同步或異步模式下,測試出不帶前后處理的純 AI 模型推理計算性能。
使用命令:
benchmark_app -m yolov8n-seg.xml -d GPU
獲得 yolov8n-seg.xml 模型在AI 愛克斯開發板的集成顯卡上的異步推理計算性能,如下圖所示:
YOLOv8-seg 實例分割模型推理程序
用 Netron 打開 yolov8n-seg.onnx 可以看到模型的輸入和輸出,跟YOLOv5-seg模型的輸入輸出定義很類似:
輸入節點名字:“images”;
數據:float32[1,3,640,640]
輸出節點 1 的名字:“output0”;
數據:float32[1,116,8400]。其中 116 的前 84 個字段跟 YOLOv8 目標檢測模型輸出定義完全一致,即cx,cy,w,h 和 80 類的分數;后 32 個字段用于計算掩膜數據。
輸出節點 2 的名字:“output1”;
數據:float32[1,32,160,160]。output0 后 32 個字段與 output1 的數據做矩陣乘法后得到的結果,即為對應目標的掩膜數據。
基于 OpenVINOPython API 的 YOLOv8-seg 實例分割模型范例程序 yolov8_seg_ov_sync_infer_demo.py 的核心源代碼,如下所示:
# Initialize the VideoCapture cap = cv2.VideoCapture("store-aisle-detection.mp4") # Initialize YOLOv5 Instance Segmentator model_path = "yolov8n-seg.xml" device_name = "GPU" yoloseg = YOLOSeg(model_path, device_name, conf_thres=0.3, iou_thres=0.3) while cap.isOpened(): # Read frame from the video ret, frame = cap.read() if not ret: break # Update object localizer start = time.time() boxes, scores, class_ids, masks = yoloseg(frame) # postprocess and draw masks combined_img = yoloseg.draw_masks(frame) end = time.time() # show FPS fps = (1 / (end - start)) fps_label = "Throughput: %.2f FPS" % fps cv2.putText(combined_img, fps_label, (10, 25), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2) # show ALL cv2.imshow("YOLOv8 Segmentation OpenVINO inference Demo", combined_img) # Press Any key stop if cv2.waitKey(1) > -1: print("finished by user") break
向右滑動查看完整代碼
運行結果,如下圖所示:
向右滑動查看完整圖片
05結論
AI 愛克斯開發板借助 N5105 處理器的集成顯卡(24個執行單元)和 OpenVINO,可以在 YOLOv8-seg 的實例分割模型上獲得相當不錯的性能。
通過異步處理和AsyncInferQueue,還能進一步提升計算設備的利用率,提高 AI 推理程序的吞吐量。
-
英特爾
+關注
關注
61文章
9964瀏覽量
171773 -
AI
+關注
關注
87文章
30895瀏覽量
269086 -
開發板
+關注
關注
25文章
5050瀏覽量
97471 -
模型
+關注
關注
1文章
3243瀏覽量
48840
原文標題:開發者實戰 | 在AI愛克斯開發板上用OpenVINO?加速YOLOv8-seg實例分割模型
文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論