據麥姆斯咨詢報道,東芝已成功研發出具有3D識別功能的單目攝像頭人工智能(AI)技術,測量距離的精度不輸立體攝像頭。東芝的方案采用市售單目攝像頭拍攝圖像,然后利用獨特設計的鏡頭造成圖像模糊,通過深度學習分析來實現。該技術降低了對立體攝像頭的需求,成本和尺寸都有所降低。
近年來,圖像傳感技術在眾多領域變得越來越重要:例如可抓取和移動物體的機器人、無人駕駛車輛、無人機基礎設施檢測等。諸如此類的應用需要的不僅僅是拍攝物體的圖像,還需要有個小型設備來分析3D數據,包括形狀和距離。因此,使用體積更易小型化的單目攝像頭測量技術受到了極大關注。目前的研究越來越集中于使用單目攝像頭,通過深度學習來改進測距技術,更好地了解成像物體的形狀、背景和其它場景數據。
然而,該技術也存在缺點:單目攝像頭的測距精度取決于深度學習訓練的場景數據,因此對于不同場景中拍攝的圖像,測距精度會大大降低。為了消除對這些數據的依賴性,東芝開發了一種分色濾鏡(color-filtered aperture)拍攝技術。該技術通過在鏡頭上安裝兩個分色濾鏡,然后根據與被攝物體之間的距離來分析最終圖像模糊的顏色和大小。雖然這種方法解決了數據依賴性問題,但整改現有鏡頭需要花費大量時間和金錢(圖1)。
圖1 東芝開發的新技術在3D識別方案中的優勢
東芝現已克服這一問題,他們開發的具有3D識別技術的人工智能,采用普通的單目攝像頭,無需場景數據,僅利用深度學習來分析圖像模糊(模糊的形狀)如何根據其在鏡頭上的位置而變化,從而實現與立體攝像頭同樣高精度的距離測量(圖2)。
圖2 東芝研發出的具有3D識別功能的單目攝像頭方案
到目前為止,從理論上講,根據圖像模糊的形狀進行測距還是非常困難的,因為當物體與焦點等距時,物體無論遠近都是一樣的(圖3)。然而分析結果表明,即使與焦點等距,近距物體和遠距物體的模糊形狀也存在很大差異(圖4)。在此基礎上,東芝成功地利用深度神經網絡模型訓練的深度學習模塊對采集到的圖像進行模糊數據分析。
圖3 固定思維:物體與焦點等距時,無法通過模糊形狀測距
圖4 實驗證明:物體與焦點等距時,模糊形狀其實差異較大
當光通過鏡頭時,所產生的模糊形狀會根據光的波長及其在鏡頭中的位置而改變。在東芝開發的網絡中,位置和顏色數據被分開處理,從而正確感知模糊形狀的變化,然后再通過對注意力機制(attention mechanism)進行加權后,用于控制亮度梯度上的焦點,以正確測量距離(圖5)。通過學習,對網絡進行更新,以減少測量距離和實際距離之間的誤差。
圖5 東芝開發的神經網絡,用于單目攝像頭的3D識別功能
東芝已證實,通過使用此AI模塊,用市面上可買到的單目攝像頭拍攝的單張圖像,可實現與立體攝像頭同樣的測距精度。
接下來,東芝將利用市面上的相機和鏡頭確認該系統的普適性,并加快圖像處理速度,以期在2020年正式售賣?!?br />
-
3D
+關注
關注
9文章
2904瀏覽量
107744 -
攝像頭
+關注
關注
60文章
4859瀏覽量
96058 -
人工智能
+關注
關注
1793文章
47567瀏覽量
239436
原文標題:東芝成功研發具有3D識別功能的單目攝像頭AI技術
文章出處:【微信號:MEMSensor,微信公眾號:MEMS】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論