近日,在國際計算機視覺競賽PASCAL VOC,中星微以89.0分的總成績位列第一,獲得目標檢測單模型第一名。獲勝的模型是一步法的目標檢測模型,本文帶來技術詳解。
近日,在PASCAL VOC comp4目標檢測競賽中,中星微再創佳績,獲得了目標檢測單模型第一名。
Pascal VOC是世界計算機視覺領域知名的競賽,比賽中,參賽者要對人、貓、鳥、飛機、汽車、船、盆栽等20類物體進行檢測。由于訓練樣本較少,場景變化多端,非常具有挑戰性。中星微人工智能參賽團隊VIM_SSD以89.0分的總成績位列第一。
中星微人工智能芯片技術公司董事長兼總經理張韻東表示:“本次參賽的模型適合終端設備部署的簡單模型一步法算法,能夠取得與云端服務器復雜多模型算法相媲美的結果,實屬不易。作為人工智能芯片公司,我們不僅要在芯片設計方面精益求精,同時更要在算法的精簡優化方面取得突破,為客戶提供前端智能設備的整體解決方案。”
一步法目標檢測模型
中星微本次提交的深度學習模型和上次參加比賽的深度學習模型基本一致,仍然沿用了一步法的目標檢測模型,基礎網絡采用VGG16,并未使用ResNet-101, ResNet-152等更復雜的網絡,保證精度的情況下速度更快。第一次參加比賽的成績是87.6,這次是89.0,精度提高很多。該結果不僅領先于所有的一步法算法,同時擊敗了所有的二步法算法。
中星微人工智能芯片技術公司研發副總裁艾國表示:“本次我們深度學習模型是上次模型的全面升級,仍然沿用了一步法的網絡架構,重點改進和優化了訓練相關的方法和技術,在不增加算法復雜度的情況下,使得網絡的精度越來越高,這是我們公司要打造的核心技術。在前端嵌入式設備計算資源受限的情況下,我們通過調整網絡結構和訓練的方法提高精度,而不是不斷增加網絡復雜度。”
VOC 2012數據集圖片測試結果
不僅是單模型,而且是一步法,尤其適用于嵌入式NPU
多模型融合是深度學習比賽中經常使用到的一個利器,它通常可以在各種不同的機器學習任務中使結果獲得提升。顧名思義,多模型融合就是綜合考慮多個不同模型的情況,并將它們的結果融合到一起。
雖然通過模型進行融合往往效果較好,但是其實現代價和計算開銷也比較大。目前,中星微主要是從實際項目應用的角度來考慮,特別是前端應用,一般都是單模型。當然,后期也會考慮使用模型融合,來提升比賽結果的精度。
下表是目前PASCAL VOC競賽前十名,可以看出,下面算法中大部分應用了更復雜的基礎網絡ResNet-101和ResNet-152,并且是兩步法,也有多模型融合(ensemble)。而中星微的模型不僅是單模型,而且是一步法,在嵌入式NPU可以達到很高的幀率。
Method | Backbone | mAP (%) | ||
Ali_DCN_SSD_ENSEMBLE | ResNet-101 | 89.2 | ensemble | |
VIM_SSD(COCO+07++12, single model, one-stage) | VGG16 | 89.0 | one-stage | single |
FOCAL_DRFCN(VOC+COCO, single model) | ResNet-152 | 88.8 | two-stage | single |
R4D_faster_rcnn | - | 88.6 | - | - |
FF_CSSD(VOC+COCO, one-stage, single model) [?] | ResNet101 | 88.4 | one-stage | single |
R-FCN, ResNet Ensemble(VOC+COCO) | ResNet | 88.4 | two-stage | ensemble |
HIK_FRCN | ResNet-101 | 87.9 | two-stage | single |
VIM_SSD | VGG16 | 87.6 | one-stage | single |
Deformable R-FCN, ResNet-101 (VOC+COCO) | ResNet-101 | 87.1 | two-stage | single |
RefineDet(VOC+COCO,singlemodel,VGG16,one-stage) | VGG16 | 86.8 | one-stage | single |
阿里巴巴達摩院多模型融合網絡Ali_DCN_SSD_ENSEMBLE的得分是89.2,只比中星微單模型網絡高了0.2點,而阿里巴巴達摩院FF_CSSD(VOC+COCO, one-stage, single model)一步法單模型的精度是88.4,基礎網絡是ResNet101,和中星微差了0.6個點。
從安防監控到保護瀕危野生動物,應用場景廣泛
目標檢測技術應用廣泛,是AI場景落地的關鍵性技術之一。中星微的深度學習模型運行在前端智能設備(如智能攝像頭上),廣泛用于安防監控、安全生產、環境保護、個人健康監測等領域。
下面是一個環境保護的例子,在我國西部及藏區應用,其采用人工智能、深度學習對野生保護動物進行檢測、識別、統計。從而達到對野生動物保護,生態環境平衡的目標。根據國家要求,增強保護野生動物、保護環境的意識,特別是對瀕臨滅絕的野生動物的研究和保護,更要加大力度;要從科研、技術角度解決野生動物保護和數量的實時狀態。
如下圖,是對藏羚羊的檢測、識別、統計:
如下圖,是對藏野驢的監測、識別、統計:
概念說明
精度:目標檢測中衡量識別精度的指標是mAP(mean average precision)。在多個類別物體檢測中,每一個類別都可以根據recall和precision繪制一條曲線,AP就是該曲線下的面積,mAP是多個類別AP的平均值,理論上最高mAP為1.0,也就是我們說的100分,89分其實就是0.89 mAP,下面是示例說明。
前端智能和云端智能:前端智能是將智能分析算法嵌入到前端設備,拿安防攝像機舉例,就是攝像機采集的視頻內容立即進行分析,提取出畫面中關鍵的、感興趣的、有效的信息,形成結構化的數據。前端智能因受各種資源限制,需要對算法復雜度、網絡模型大小等有限制。
云端智能是將前端傳感器采集的數據通過云端來完成智能分析,一般通過大型的GPU服務器來完成。因此相對于前端智能,計算資源、內存資源、存儲資源、網絡資源等都較大,因此對算法模型的限制比較小,可以部署很大的很復雜網絡模型。
-
中星微
+關注
關注
0文章
30瀏覽量
11261 -
人工智能
+關注
關注
1792文章
47484瀏覽量
239162 -
計算機視覺
+關注
關注
8文章
1699瀏覽量
46049
原文標題:目標檢測競賽利器:中星微一步法模型獲國際算法競賽第一名!
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論