對于通常的機器學習問題來說,我們會通過給定的提前收集好的數據來解答。但對于某些任務,我們需要自己去收集數據來解答問題。雖然我們可以集中收集與問題最相關的數據收集,但要確認哪個數據源可以獲取有效的測量卻十分困難。此外,當我們使用機器人、無人機、衛星等收集數據時,還需要考慮如何結合主體的運動來規劃測量問題,這個問題通常被抽象為具象自適應感知問題。
自適應感知在機器人領域有著廣泛的研究,包括快速識別污染泄露和放射源、救援搜索等任務。這些任務的關鍵在于規劃出一條感知路徑,盡可能快的得到正確的結果。為了進一步提高這一問題的解決效率,伯克利的研究人員以放射源檢測問題為例子,利用無人機來進行搜索。這一任務不僅要面臨各異的背景噪聲、以及建立一個符合統計置信區間的傳感器模型。
在這一研究中,研究者提出了一個用于自適應感知問題的連續剔除框架AdaSearch( successive-elimination framework for general adaptive sensing problems)來解決這一問題。它可以清晰的根據放射源的發射率來建立一個置信度區間,并通過這一區間來識別并保留最具可能性的放射源,同時剔除其他點。
搜索與假設測試
機器人研究領域一般將具象搜索問題看做是連續的運動規劃問題,機器人必須平衡好探索環境和路徑選擇效率之間的關系。這使得軌跡優化和探索融合到了同一目標函數中來優化。在這一研究中,伯克利的研究人員將這一問題通過假設檢驗的方式轉換為了一個“序列最佳行動識別的問題”。
通過迭代的收集數據,序列假設可以從多個不同的問題中得到綜合結論。那么可以將機器人的搜索測量過程看做是N個測量行為,每個觀測都符合不同的但確定的分布。
例如在A/B測試中N=2,兩個產品對應著兩個測量行為,需要解決的問題是消費者更喜歡哪個產品。為了解決這個問題,我們可以不斷的追蹤A、B產品受喜好的均值,并不斷通過最低/最高置信度邊界來更新置信度區間。隨著測量數據的增加,我們對于產品的估計就會變得越來越準確。當產品A的上界小于產品B的下界時,我們就可以以很高的概率得出B比A更好的結論。
在環境感知中,每個測量行為對應著利用傳感器以特定的方向和位姿讀取數據。主體希望得知哪次測量或者哪k次測量是最有意義的觀測結果。這時候就可以通過先前的觀測結果來確定下一步要怎樣走才能獲取最多的信息。為了使用精確的統計語言描述搜索問題,研究人員提出了行為置信區間來描述與感知行為相關的觀測均值,這就決定了在確定目標被確信地檢測到之前需要進行一系列的感知行為。
放射源搜索
這一工作中,研究人員們展示了如何在一個柵格平面環境中搜索一個高強度的放射源。定位這個放射源的困難在于測量面臨著背景輻射的干擾。放射信號是通過四旋翼無人機上的傳感器進行測量的。這一任務的目標是規劃出一條測量線路,把隱藏在背景噪聲中的放射源盡可能快的找出來。下面我們就來具體看看AdaSearch是如何工作的。
AdaSearch結合了全局規劃和基于假設測試的自適應感知規則來定義飛行軌跡。在首次測量時無人機需要對整個空間進行如下圖所示的均勻采樣:
在第一次測量后可以通過觀測結果來剔除某些點。如果某個點置信區間估計的上界小于最大值置信區間的下界,這在很大概率上意味著它不是期望搜索的射線源,將它剔除。
接下來在剩下的點中進行更為仔細的測量(飛行速度變慢),它們是放射源的可能性更高。
隨著這一過程的迭代,放射源可能的位置不斷收縮直到只剩下一個點。Ada算法將會返回這個點作為搜索結果。
由于統計學的置信概率保證我們可以在很高精度上確定算法返回的結果的正確性,并可以通過置信區間(例如±σ)的大小來獲得固定大小的置信度。
研究人員將這一算法與通用的自適應搜索方法——最大化信息法和樸素搜索法做了比較,在一個64*64m柵格4m分辨率的環境對單一放射源進行搜索下得到了下面的結果。
我們可以從上面左圖中看到自適應方法所帶來的優勢,本文的方法耗時短且置信度更高。Ada方法在全局覆蓋的前提下保證了精度和速度。
未來,研究人員希望將這一算法應用于更多領域。Ada算法在收集數據時應對多源噪聲環境有著很好的表現,它可以適應不同的噪聲模型。在不同的置信區間下計算出可靠的邊界將有助于提高測量的精度與效率,更快更準確地搜尋到目標所在的位置。
-
傳感器
+關注
關注
2552文章
51320瀏覽量
755330 -
機器人
+關注
關注
211文章
28575瀏覽量
207751 -
無人機
+關注
關注
230文章
10491瀏覽量
181434
原文標題:伯克利大學提出新感知技術AdaSearch,幫助機器人實現高效自適應感知
文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論