(文章來源:中國光學工程學會)
人類所處的物理世界空間是三維的,對三維信息的獲取和處理技術體現了人類對客觀世界的把握能力,因而從某種程度上來說它是體現人類智慧的一個重要標志。傳統光探測器僅對被測場景的二維強度敏感而無法感知其三維形貌與深度信息。人類雖可通過自己的雙眼來感知三維的世界,但無法對客觀事物的三維形貌進行準確量化的描述。
三維成像與傳感技術作為感知真實三維世界的重要信息獲取手段,為重構物體真實幾何形貌及后續的三維建模、檢測、識別等方面提供數據基礎。近年來,隨著計算機技術、光學和光電技術的發展,以光信號為載體的光學三維傳感技術,融合光電子學、圖像處理、計算機視覺與現代信號處理等多學科為一體,已發展成為光學計量和信息光學的最重要的研究領域和研究方向之一。
互聯網技術的蓬勃發展指引著大數據時代的來臨,以數據為推動的深度學習技術無疑是大數據時代的算法利器。相比于傳統的機器學習技術,深度學習技術首先可利用不斷增多的數據不斷提升其性能,而傳統機器學習技術無法做到這一點。其次,有別于傳統方法需要手動提取特征,深度學習技術是一項全自動的技術,它可以從海量數據中直接抽取特征。并且,對于不同的任務,不再需要設計獨特的特征提取器,所有工作都是深度學習自動完成。這是智能機器逐漸代替人工操作的一個顯著體現,因此深度學習已成為大數據時代的一項熱點技術,無論學術界還是工業界都對這項技術產生了濃厚的興趣。
深度學習技術已在光學成像、計算成像、全息顯微等諸多領域逐步滲透,并展現了巨大的潛力。條紋投影三維成像因其非接觸、高精度、全場測量、點云重建效率高等優點,目前已成為一種主流的三維傳感技術。在深度學習技術的輔助下,條紋投影三維成像的相位測量效率、相位測量精度與三維成像穩定性得到進一步提升。基于人工智能的新型條紋投影三維成像將有望為高端制造、在線檢測、生物醫療等領域提供“即快又準”的三維數據。
作者首先簡要回顧條紋投影三維成像的基本原理,包括條紋分析、相位展開以及三維重建。隨后,列舉了深度學習技術在條紋投影三維成像中的典型應用,包括基于深度學習的條紋分析、條紋圖像去噪、相位展開、系統標定、三維重建以及超快三維成像。最后,作者從以下5個方面分析與總結了利用深度學習技術實現高性能條紋投影三維成像面臨的挑戰和未來的走向:
深度學習到底學到了什么?作者認為當前研究人員正嘗試著用深度學習技術替代傳統方法以實現條紋投影三維成像的某一基本過程,或者全部內容(端對端的策略)。然而對于大多數研究人員而言,深度學習方法預測最終結果的過程仍是一個“黑箱子”——只能通過最終的測試結果來判斷神經網絡的優劣。由于難以把握神經網絡的推演機理,使得優化和提升神經網絡性能的目標淪為了大量的試錯。
深度神經網絡的架構設計與優化。針對具體的條紋投影應用(如計算包裹相位、相位展開、高動態范圍成像等),到底什么樣的神經網絡合適?盡管從前人相似工作中能找到網絡結構設計的靈感,但是在神經網絡后期的調試與優化過程中,如何調整超參數(如神經網絡的類型、卷積神經網絡中濾波器的尺寸、抽取特征的數量等)使得能夠在自己的應用上表現出色仍是一個難以回答的問題。
訓練數據的獲取與標注成本高。對于條紋投影技術領域,訓練數據的大規模獲取與正確標注仍需要耗費大量的人力和物力成本。加之公開的數據集稀少,這都增加了深度學習技術的實施難度。盡管采用仿真的方式獲取數據集可在一定程度上降低訓練數據采集過程中的成本。但是仿真數據受制于有限的預設參數,它并不能完全等于真實數據。而深度學習的強大能力就在于學習與發掘輸入數據與輸出數據之間的潛在聯系。因此,如何快速獲得準確可靠的訓練數據是提高深度學習技術在條紋投影技術領域應用效率的一個重要問題。
(責任編輯:fqj)
-
三維成像
+關注
關注
0文章
35瀏覽量
11116 -
深度學習
+關注
關注
73文章
5507瀏覽量
121299
發布評論請先 登錄
相關推薦
評論