Qualcomm AI研究人員獲得ICLR殊榮:“球面卷積神經網絡(spherical Convolutional Neural Networks,縮寫CNNs)”榮獲ICLR 2018年度最佳論文獎。
深度學習中的技術進展幫助機器能像人類一樣“看”世界,這是人工智能研究中最具吸引力的部分之一。目前,一種突破性技術將讓機器能夠通過被稱為球面卷積神經網絡(spherical Convolutional Neural Networks,縮寫CNNs)的處理,去看到并識別三維空間中的物體。從識別極小分子的機器到分析外太空最龐大結構的工具,我們對這項新發現的能力所能實現的種種可能的想象才剛剛開始。當然,這其中還包括了許多介乎兩者之間的用例,比如指導機器人在人群中安全導航。
正如最近這次獲獎所展現的,該研究領域是人工智能(AI)發展的前沿領域。Qualcomm Technologies荷蘭研究人員Taco Cohen和Max Welling及其合作伙伴,通過與阿姆斯特丹大學聯合撰寫的《球面CNNs》論文榮獲“國際學習表征大會(ICLR:International Conference for Learning Representations)2018年度最佳論文獎”。ICLR主要發布人工智能(AI)和機器學習方面的最新研究,現已舉辦到第六屆。蒙特利爾大學的Yoshua Bengio和紐約大學/Facebook的Yann LeCun共同擔任ICLR 2018的主席。在全球頂尖AI實驗室提交的約1,000篇投稿中,AI領域最具創新性和影響力的研究被授予最佳論文獎的殊榮。
該球面CNN論文引入了構建CNNs的新型數學架構,可魯棒地分析球面圖像,并不會受到曲面失真的影響。這是因為:球面CNN具有針對旋轉的“等變”特性,它意味著該網絡學習到的內部表征會與輸入信息同步旋轉。從實驗的結果來看,球面CNNs在兩項截然不同的任務上可實現出色的預測精度:球面圖像3D模型識別和原子化能量預測(一項重要的化學問題)。
球面CNNs為什么重要
為了理解球面CNNs的重要性,我們介紹一些背景:過去幾年,深度學習——尤其是CNNs——已徹底變革了AI,語音識別、視覺對象識別、自然語言處理及其他領域均出現突破性成果。CNNs很擅長分析線性信號,例如音頻或文本、圖像、或視頻,因其具備可識別模式的內在能力,而不管其空間或時間位置如何。這能支持CNNs學習并識別如視覺對象,無論它在圖像中位于什么位置,并無需在深度學習模型訓練階段觀看同一對象的多個移動版本。但在最近受到關注的多個應用中,我們都希望學習的信號留存在球體上,如汽車、無人機和其他機器人拍攝其整個周邊環境的球面圖像所使用的全向攝像頭。在科學應用中也存在大量球面信號,從地球科學到天體物理學都有相關案例。
分析此類球面信號的一個方法是把信號投影到平面上,并借助CNN來分析結果。但根據制圖學,任何此類“地圖投影”都會導致扭曲失真,讓部分區域看起來比實際尺寸更大或更小。這會使CNN變得無效,因為隨著對象在球體上移動,它們看上去不僅只是在地圖上移動,而且還會顯得縮小和拉伸。
如何使用球面CNNs
球面CNNs在物聯網(IoT)、機器人、自動駕駛汽車、增強現實(AR)和虛擬現實(VR)領域都有諸多應用。如今,自動駕駛無人機已向消費者出售,或許有一天它將能在幾分鐘內把包裹送到你的家門口,這就是球面CNNs可改善物體偵測與識別,以及視覺運動分析的一個自然應用。在AR方面,一整組攝像頭所拍攝的360度房間全景可融入至單球面圖像中,借助球面CNN的高效分析,精確覆蓋虛擬物體。
Qualcomm對此項工作可能帶來的上述應用和其他轉換應用倍感興奮,我們也正在積極推動此項研究及其他數據高效學習研究。
-
機器人
+關注
關注
211文章
28524瀏覽量
207544 -
AI
+關注
關注
87文章
31155瀏覽量
269487 -
Qualcomm
+關注
關注
8文章
676瀏覽量
52162 -
深度學習
+關注
關注
73文章
5507瀏覽量
121298
發布評論請先 登錄
相關推薦
評論