隨著網格細胞、位置細胞及頭朝向細胞等類腦認知導航細胞的作用被揭示、人工智能的快速發展以及群體智能感知定位機理的蓬勃發展,為研究無人機集群編隊復雜飛行環境下的類腦編隊協同導航技術提供了理論基礎。針對無人機類腦集群編隊導航技術的研究進展進行如下綜述。
1) 論述無人機類腦編隊導航系統的研究現狀;
2) 分析無人機類腦感知定位機理及智能自適應建模方法的研究,包括基于深度強化學習的類腦導航模型;
3) 提出目前類腦編隊導航系統中面臨的重難點及未來發展趨勢。
引言
無人機的飛行任務已逐步從單無人機自主飛行向多無人機集群編隊自主飛行方向發展。在軍事領域,多無人機集群編隊協同飛行可以有效克服復雜戰場飛行環境下僅依賴單架無人機執行任務能力有限、抗毀傷性不足等問題。在民用領域,多無人機密集集群編隊協同飛行可應用于災害救援、科學考察和航空飛行表演等多種應用領域,特別是采用多旋翼無人機按照預定的飛行航路實現密集集群編隊飛行在民用航空飛行表演等領域得到成功應用。由于無人機具備功能分布化、體系生存率高、成本低、效率高等優勢,必將在軍事作戰、救災搶險、精密農業、線路巡檢、測繪測量、安全監視等軍民領域獲得廣泛應用,有著廣闊的應用前景。
現有的無人機集群編隊協同導航普遍基于GPS或差分GPS等衛星導航信號進行編隊協同導航定位,這種導航定位方式對衛星導航信號以及地面主控站表現出較強的依賴性,當GPS信號受到干擾或者主控站信號丟失時,無人機集群導航性能將無法得到保障。此外,除GPS等衛星導航傳感器外,雖然還能夠在每架編隊無人機上進一步裝載慣性傳感器、地磁、大氣傳感器、視覺、光流、UWB和WIFI等多種傳感器以進一步提高無人機自身的感知定位精度與可靠性,但是面對集群編隊多源傳感器海量數據的處理,依靠現有的有中心節點式的無人機編隊集群導航技術顯然還無法滿足對海量可用導航信息的甄別篩選以實現對海量感知定位信息的最優融合。近年來,類腦感知和認知機理的研究得到迅猛發展。神經科學家逐漸揭示了人體大腦中位置細胞、頭朝向細胞、網格細胞之間的作用機理,并進一步闡明了人體大腦進行位置定位和方向感知的方式。此外,鳥群、蜂群、魚群和蟻群等生物腦的感知定位機理研究也正處于蓬勃發展的階段,為類腦處理的人工智能發展提供了新的思路和發展方向,類腦感知智能已成為近年來人工智能領域研究的熱點,為無人機集群導航提供了新的思路和途徑。
1、類腦集群導航系統的研究現狀
1.1 無人機集群導航系統研究現狀
美國等西方發達國家在基于類腦感知的人工智能編隊無人機導航方面開展了很多探索性研究。2016年10月,美國國防部采用3架F/A-18戰斗機發射了103架“山鶉”( Perdix) 微型固定翼無人機并組成集群,通過空中實驗驗證了無人機集群飛行的能力,研究者通過對鳥集群飛行時的腦機理研究出共享分布式大腦,通過相互協調行動,盡管在實際飛行過程中仍然依賴一臺地面站作為數據中心,但是也表明了“山鶉”無人機已經初步具備了集群編隊協同環境類腦感知定位能力; 2010年賓夕法尼亞大學完成20架四旋翼無人機的類腦編隊控制; 2015年法國達索飛機制造公司實現神經元無人機與陣風戰斗機、“獵鷹7X”商務機的有人機/無人機類腦協同編隊飛行。
美軍“蟬”微型無人機集群編隊
美海軍“低成本無人機集群技術項目”
國內也高度重視人工智能與無人機導航相結合的研究,其中控制領域的類腦感知研究者較多,還未將類腦應用于導航領域。與國外相比,在技術實現上還存在一定差距。
1.2 類腦導航系統研究現狀
類腦感知定位不是單純地復制生物大腦,而是從原理及結構上尋找生物大腦的優勢,從而對人工神經網絡進行完善。在類腦導航細胞機理基礎上,昆士蘭大學開發了類腦機器人視覺導航算法,首次用低成本相機實現了城市級的車載導航與定位能力,相比傳統視覺導航,具有惡略環境( 暗光強光、粉塵等) 適應性 強、無需精確導航計算模型等優勢。波士頓大學提出一種仿大腦海馬結構認知機理的面向目標導航模型,通過分析頭朝向細胞、網格細胞、位置細胞以及前額葉皮層細胞各自的功能和聯系,建立對應作用機理的分 級人工神經網絡模型,實現了基于慣性/視覺的類腦認知導航。昆士蘭科技大學提出了基于視覺/WIFI /氣壓計的類腦多源信息融合算法,具有不依賴精確導航建模能力。谷歌DeepMind人工智能研究團隊驗證了把神經網絡模型用于空間導航和定位時,其隱節點的物理意義類似于大腦位置細胞、網格細胞、邊界細胞等導航細胞,首次證明了類腦認知導航與大腦導航生理機制等價。哥倫比亞大學首次采用類腦芯片IBM TrueNorth實現了智能小車環境感知、空間導航認知、路徑規劃一體化硬件測試,具有硬件體積小、功耗小等優勢。
1.3 國內外研究現狀總結
上述國內外的研究工作動態為進一步深入開展基于類腦感知定位的無人機密集集群編隊協同導航研究提供了可借鑒的參考。但從上述國內外的類腦集群編隊協同自主導航技術研究成果來看,大部分研究是對于無人機協同集群編隊中控制技術領域的探索,主要采用了慣性和 GPS 等導航技術實現集群編隊協同導航和控制; 在類腦導航方面,國內外各研究者也正將類腦導航原理應用到無人機、車輛導航中,但針對基于類腦感知定位的無人機密集集群編隊協同導航技術的研究還鮮有文獻報道,關于深度學習、神經網絡等人工智能方法的應用也主要集中于單架無人機導航領域。的內容,
2 、類腦感知定位機理及智能自適應建模
2.1 類腦感知定位機理
大自然中動物導航感知的例子比比皆是,像人們熟知的GPS系統一樣,大腦定位系統也是通過自身的位姿信息、目標信息進行定位導航。生物腦中存在3種主要導航細胞位置細胞、頭朝向細胞及網格細胞。其中,海馬體中的位置細胞繪制所處地點的地圖; 頭朝向細胞指明方向( 將位置細胞和頭朝向細胞合并為一個新細胞類型,位姿細胞) ; 大腦內嗅皮層中的網格細胞由位置細胞激活并通過標記被激活細胞的位置對環境進行重定位。此外,在內嗅皮層還存在邊界細胞、條紋細胞、速度細胞等輔助導航定位的細胞。大腦通過感官從外界獲取環境中的特征信息,其中位置細胞能夠與海馬體中其他細胞合作,將輸入的特征信息與記憶的特征信息進行比對,如果信息匹配成功,與匹配位置對應的特定位置細胞就會被激活。
2.2 群體動物感知定位機理
自然界中,鳥群編隊飛行的現象比較常見,其群聚行為包含自然社會、回避、探測以及防御掠奪等。鳥群經常以“V”、“J”或梯形的線性編隊飛行,其中“J”形和 梯形編隊是“V”形編隊的變形,線性編隊行為可以通過鳥群成員間的視覺信息交互提高導航能力。
無人機編隊飛行形式與生物群體社會性行為存在相似性,通過研究生物群體行為規律,為無人機編隊飛行提供關鍵有效理論及技術思考,其中將生物集群編隊理論與無人機集群相對協同導航的研究在不斷推進。以鴿群為例,在導航方式方面,鴿子在旅程不同階段會使用不同導航工具,前期依賴地磁場判斷大致的方向,后期通過地標對實際方向進行修正,太陽高度也會影響鴿子導航。研究表明,鴿群編隊系統與狼群等 陸地群體的模式區別甚大,在鴿群中,所有的鴿子包括頭鴿及跟隨鴿都存在層次等級,區別是頭鴿的地位不容撼動,為群體的絕對領導者,跟隨鴿只能服從上層,跟隨鴿所受影響來自于頭鴿及其上層鴿,而來自于上層鴿的影響實時性更高、效果更強。
無人機編隊集群類腦導航的研究者從鴿群層級行為得到了很多啟發,表現為:
1)鴿群編隊系統區別于陸地群體的單一首領制度。原因是視野及通訊最高距離的限制,鴿子只能與臨近上層的鴿子實時通訊并相對跟隨。無人機編隊類腦協同導航系統的研究受此啟發,由于長機不能時刻在僚機的通訊及視野范圍內,采用長機與僚機通訊、僚機與僚機通訊的方式實現編隊飛行;
2)鴿群個體間不是任意兩鴿均可通訊聯系,而是具有森嚴制度。無人機編隊類腦協同導航系統的研究受此啟發,采用類似等級制度,可以增強集群通訊的可靠性,即使出現干擾甚至故障,仍可迅速實現集群系統重構,使系統不受影響; 而且各無人機個體的通訊空間可大幅度減少。
2.3 類腦導航智能自適應建模的發展現狀
未來類腦導航的主要發展趨勢之一是類腦認知,認知智能導航可以使智能導航系統進行理解與思考,在復雜環境下快速識別附近環境,自我判斷最優路徑。典型例子有谷歌 DeepMind 的最新研究,其中文獻[8]說明了強化學習訓練的深度神經網絡在導航方面,仍不能與人腦的空間行為的熟練度相媲美的原因是缺乏內嗅皮層網格細胞的支撐,網格細胞可以提供一個多維度周期表示基礎,其作用類似于編碼空間,并且對于路徑集成( 集成自運動) 及計劃直接軌跡到目標( 基于矢量的導航) 有重要作用。實驗證明,網格單元自發地出現在神經網絡中,使智能體獲得空間自導航能力,這與在哺乳動物中觀察到的神經活動模式驚人的一致,也與網格細胞為空間提供高效代碼的觀點一致。
研究者首先利用網格細胞的計算功能設計一種類腦深度強化學習單元,訓練一個具有長短期記憶 ( LSTM) 架構的循環網絡,使之出現類似于網格細胞的特征,以及其他內嗅皮層細胞特征。速度作為輸入提供給該循環網絡,該網絡隨時間的反向傳播進行訓練,允許網絡動態地將當前輸入信號與反映過去事件的活動模式組合。正如預期的那樣,網絡能在涉及覓食行為的環境中準確進行路徑整合,其中25.2%的線性層單元類似于網格單元,在保守的場改組程序產生的零分布中表現出來顯著的六邊形活動模式,與嚙齒動物網格細胞的經驗結果一致。線性層還表現出類似于頭部方向單元( 10.2%) ,邊界單元( 8.7% ) 和少量位置單元以及這些表示的連接單元。為了確定這些表示的穩健性,文獻[5-6]表明對網絡進行了100次重新訓練,每次都找到類似比例的網格狀單元( 平均23%, s.d.2.8% ,具有顯著網格特征的單元) 和其他空間調制單元。
為了開發具有矢量導航潛力的智能體,文獻[8]將上述“網格網絡”整合到一個用深度強化學習訓練的更大的架構中。和以前一樣,網格網絡是使用監督學習訓練的,如圖6所示,但為了更好地近似可用于導航哺乳動物的信息,它現在接收受隨機噪聲和視覺輸入擾動的速度信號。發現智能體能在有挑戰性的、不熟悉的、變化的環境中定位目標,具有類似于網格特征的智能體的性能超過了人類專家和其他對比個體,其基于矢量的導航所需的度量尺度來自于網絡中的網格狀單元。而且,網格細胞的特征使得智能體能夠執行與哺乳動物類似的走捷徑的行為。研究結果表明,網格狀單元為個體提供了歐幾里德空間度量和相關的向量運算,為精確導航提供了基礎。因此,結果支持將網格單元視為基于矢量導航的關鍵的神經科學理論,證明后者可以與基于路徑的策略相結合,以支持在具有挑戰性的環境中進行導航。
有監督學習實驗中的網絡框架
網格單元的循環層是具有128個隱層單元的LSTM,該循環層的輸入為向量[v,sin(φ) ,cos(φ) ],初始時刻的地面真實位置,活動c0和頭朝向活動 h0 分別經過線性變換后得到 LSTM的初始單元狀態和隱藏狀態的初始化值 l0和m0.LSTM的輸出是一個經過正則化的線性層,該線性層的輸出gt是由線性變化得到的,并通過兩個softmax函數計算出預測的頭朝向單元活動zt和位置單元活動yt。研究表明線性層激活gt中含有網格狀單元及頭朝向狀單元。
傳統的同步定位與建圖(SLAM) 技術通常需要構建準確且完整的地圖,從外部定義目標的性質和位置。相比之下,文獻中描述的深度強化學習方法能夠從稀疏獎勵中端到端地學習復雜的控制策略,以超過以往深度強化學習方法的自主能力直接引導個體到達目標甚至采用走捷徑的方式,而這些若在SLAM系統中則需要手動編碼。文獻中提出了一種解決城市級現實環境中任務的深度強化學習導航方法,并分析了一項新的信使任務,提出了一個多城市網絡智能體架構,演示了該如何將神經網絡遷移到新的環境。
目前有4點需要進一步研究:
1)如果神經網絡的損失函數中不包括正則項,那么神經網絡無法表現出網格細胞功能,這一發現給了我們一個全新的角度去思考正則項的作用;
2)深度神經網絡的黑盒特性阻礙了進一步分析網格細胞活動特性對路徑整合的作用,由于無法在模型內進行原理分析、定性定量分析算法和編碼策略,使得研究網格細胞成為有效的導航方案異常困難,這一點再次強調了研究神經網絡的必要性以及神經科學家的重要性;
3)還需要進一步分析深度學習系統的內部工作機理,研究輔助類腦之空間導航的通用計算原理;
4)目前只涉及了單個智能體的類腦導航,編隊類腦方面,只涉及到了與人工智能相關的導航,但離真正的類腦還是有一定距離。
3、 類腦集群導航系統中面臨的重難點
國內外研究者對無人機集群類腦導航系統開展了大量分析研究,針對目前存在的關鍵問題和發展趨勢,無人機編隊集群類腦導航系統的難點及重點主要是:
1)在密集編隊飛行應用環境下,導航系統誤差傳播特性的變化對不同時空下的模型自適應表達提出了新的要求,如何借鑒生物腦導航機理建立無人機類腦定位感知定位模型,以及對適應密集集群編隊飛行環境的導航系統誤差建模這一問題亟待解決。
2) 密集集群編隊中的無人機飛行密度高,隊形控制復雜,對相對導航定位精度和魯棒性要求極高,因此需要解決密集集群飛行環境量測特征下基于類腦感知機理的相對導航信息融合方法。
3) 針對密集集群編隊對高可靠導航測量信息的要求,為確保無人機密集集群編隊導航系統對編隊無人機飛行狀態的可靠測量,必須解決在參考信息可用性變化的條件下,導航系統對故障信息的快速診斷和智能主動容錯的問題。
4) 在仿真驗證方面,實現從單機類腦到群體類腦的編隊導航仿真,及從簡單任務到復雜編隊任務場景的驗證。
4、 結束語
類腦編隊導航是當前人工智能的研究熱點,但是我們必須認識到,當前我們對于大腦內部功能的實現和大腦內部神經元細胞之間的信息傳遞機制等研究仍不夠深入,因此,要完全弄清類腦導航機理我們還有很多的工作要做。我們需要在已有認知機理的基礎上進行更深層次意義上的研究,并將相關成果應用于類腦導航、醫學研究等意義重大。希望本文的綜述能為其他研究者豐富無人機編隊集群類腦導航理論及應用時提供參考價值。
責任編輯:gt
評論
查看更多