在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計(jì)算機(jī)視覺如何在復(fù)雜環(huán)境中進(jìn)行有效感知

3D視覺工坊 ? 來源:3D視覺工坊 ? 2022-12-22 09:23 ? 次閱讀

計(jì)算機(jī)視覺如何在復(fù)雜環(huán)境中進(jìn)行有效感知?

近年來,計(jì)算機(jī)視覺在智能交通系統(tǒng)(ITS)和自動(dòng)駕駛AD)中的應(yīng)用逐漸轉(zhuǎn)向深度神經(jīng)網(wǎng)絡(luò)架構(gòu)。雖然在基準(zhǔn)數(shù)據(jù)集上的性能似乎有所改善,但在研究中還沒有充分考慮到許多現(xiàn)實(shí)世界中的挑戰(zhàn)。本文對計(jì)算機(jī)視覺在ITS和AD中的應(yīng)用進(jìn)行了廣泛的調(diào)研,并討論了與數(shù)據(jù)、模型和復(fù)雜城市環(huán)境相關(guān)的挑戰(zhàn)。數(shù)據(jù)的挑戰(zhàn)與訓(xùn)練數(shù)據(jù)的收集和標(biāo)記及其與現(xiàn)實(shí)世界條件的相關(guān)性、數(shù)據(jù)集固有的偏向、需要處理的大量數(shù)據(jù)以及隱私問題有關(guān)。深度學(xué)習(xí)(DL)模型對于嵌入式硬件上的實(shí)時(shí)處理來說通常過于復(fù)雜,缺乏可解釋性和可推廣性,并且難以在真實(shí)環(huán)境中進(jìn)行測試。

9f7a13b0-8184-11ed-8abf-dac502259ad0.png

雖然在一些文獻(xiàn)中提到了這些問題,但只開發(fā)了一些方法來解決這些問題。智能交通中的計(jì)算機(jī)視覺是一個(gè)非常活躍的研究領(lǐng)域,本文選擇并綜述了200多篇論文。圖1概述了應(yīng)用程序和挑戰(zhàn),以供快速參考,而表1總結(jié)了每個(gè)應(yīng)用程序中使用的方法和相關(guān)挑戰(zhàn)。以下章節(jié)(II、III、IV)討論了數(shù)據(jù)、模型和復(fù)雜交通環(huán)境的具體挑戰(zhàn)。第五節(jié)解釋了應(yīng)對挑戰(zhàn)的一些代表性應(yīng)用和解決方案。第六節(jié)是這一領(lǐng)域研究應(yīng)采取的未來方向,最后,第七節(jié)提出了一些結(jié)論性意見。

9f827b90-8184-11ed-8abf-dac502259ad0.png

數(shù)據(jù)的挑戰(zhàn)

1)數(shù)據(jù)通信

數(shù)據(jù)通信雖然在大多數(shù)ITS和AV計(jì)算機(jī)視覺研究中沒有考慮,但在實(shí)際應(yīng)用中至關(guān)重要。在實(shí)踐中,單個(gè)基于相機(jī)的深度學(xué)習(xí)任務(wù)通常需要在TMC的相機(jī)和云服務(wù)器之間進(jìn)行數(shù)據(jù)通信。視頻數(shù)據(jù)量很大,這可能導(dǎo)致潛在的數(shù)據(jù)通信問題,如傳輸延遲和數(shù)據(jù)包丟失。在協(xié)作攝像機(jī)傳感環(huán)境中,不僅與服務(wù)器進(jìn)行數(shù)據(jù)通信,而且在不同傳感器之間進(jìn)行數(shù)據(jù)通信。因此,另外兩個(gè)問題是多傳感器校準(zhǔn)和數(shù)據(jù)同步,協(xié)作環(huán)境中的校準(zhǔn)旨在確定傳感器之間的透視轉(zhuǎn)換,以便能夠在給定幀合并來自多個(gè)視圖的采集數(shù)據(jù)。這項(xiàng)任務(wù)在多用戶環(huán)境中非常具有挑戰(zhàn)性,因?yàn)閭鞲衅髦g的變換矩陣隨著車輛的移動(dòng)而不斷變化。在協(xié)作環(huán)境中,校準(zhǔn)依賴于背景圖像中元素的同步,以確定靜態(tài)或移動(dòng)傳感器之間的轉(zhuǎn)換。存在多個(gè)去同步源,例如時(shí)鐘之間的偏移或可變通信延遲。雖然時(shí)鐘可能是同步的,但很難確保在同一時(shí)刻觸發(fā)數(shù)據(jù)采集,這增加了合并采集數(shù)據(jù)的不確定性。同樣,不同的采樣率需要在采集或預(yù)測數(shù)據(jù)之間進(jìn)行插值,這也增加了不確定性。

2)訓(xùn)練數(shù)據(jù)和benchmark的質(zhì)量

交通攝像頭廣泛部署在道路和車輛上,DOT和城市的TMC不斷收集網(wǎng)絡(luò)范圍內(nèi)的交通攝像頭數(shù)據(jù),這些數(shù)據(jù)對各種ITS應(yīng)用(如事件識別和車輛檢測)都很有價(jià)值。然而,標(biāo)記的訓(xùn)練數(shù)據(jù)遠(yuǎn)不如未標(biāo)記的數(shù)據(jù)常見。隨著圖形逼真度和模擬物理變得越來越現(xiàn)實(shí),許多應(yīng)用程序缺少注釋數(shù)據(jù)集的問題正慢慢被合成數(shù)據(jù)所克服。例如,[9]中的GT 3D信息在單目3D檢測和跟蹤的訓(xùn)練期間需要高精度,因此使用了視頻游戲數(shù)據(jù)。除了真實(shí)的外觀,模擬場景不需要手動(dòng)標(biāo)記,因?yàn)?a target="_blank">標(biāo)簽已經(jīng)由模擬生成,并且可以支持各種照明、視點(diǎn)和車輛行為。然而,如果使用合成數(shù)據(jù),真實(shí)世界的應(yīng)用仍然需要額外的學(xué)習(xí)過程,例如領(lǐng)域自適應(yīng)。低保真度模擬數(shù)據(jù)用于訓(xùn)練具有域隨機(jī)化轉(zhuǎn)移學(xué)習(xí)的真實(shí)世界目標(biāo)檢測器。缺乏高質(zhì)量的碰撞和接近碰撞數(shù)據(jù)通常被認(rèn)為是一個(gè)實(shí)際的限制,更多的碰撞數(shù)據(jù)將更新AD中的注意力指南,使其能夠捕捉長期碰撞特征,從而提高碰撞風(fēng)險(xiǎn)評估。

3)數(shù)據(jù)偏差

盡管當(dāng)前的車輛檢測算法在平衡數(shù)據(jù)集上表現(xiàn)良好,但當(dāng)面對不平衡數(shù)據(jù)集時(shí),它們在尾部類別上的性能會(huì)下降。在現(xiàn)實(shí)世界場景中,數(shù)據(jù)往往服從Zipfian分布,其中大量尾部類別的樣本很少。在長尾數(shù)據(jù)集中,少數(shù)頭部類(頻繁類)貢獻(xiàn)了大部分訓(xùn)練樣本,而尾部類(罕見類)的代表性不足。大多數(shù)使用此類數(shù)據(jù)訓(xùn)練的DL模型將長尾訓(xùn)練數(shù)據(jù)的經(jīng)驗(yàn)風(fēng)險(xiǎn)降至最低,并且偏向于頭部類別,因?yàn)樗鼈冐暙I(xiàn)了大部分訓(xùn)練數(shù)據(jù)。一些方法,如數(shù)據(jù)重采樣[22]和損失重加權(quán)[23],可以補(bǔ)償不足的類別。然而,他們需要根據(jù)類別頻率將類別劃分為幾個(gè)組。頭尾類之間的這種硬性劃分帶來了兩個(gè)問題:相鄰類別之間的訓(xùn)練不一致,以及對罕見類別缺乏辨別力。

模型挑戰(zhàn)

1)復(fù)雜性

DL計(jì)算機(jī)視覺模型在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練過程方面具有很高的復(fù)雜性。許多DL模型設(shè)計(jì)用于在高性能云中心AI工作站上運(yùn)行,而一個(gè)好的模型需要數(shù)周或數(shù)月的訓(xùn)練,以及由GPUTensor處理單元(TPU)驅(qū)動(dòng)的高功耗。實(shí)時(shí)應(yīng)用程序通常會(huì)進(jìn)行一些修改,如調(diào)整視頻大小以降低分辨率或模型量化和修剪,這可能會(huì)導(dǎo)致性能損失。為了滿足效率和精度要求,在許多實(shí)際應(yīng)用中需要降低最先進(jìn)DL方法的模型復(fù)雜性。例如,多尺度可變形注意力已與視覺vit一起用于目標(biāo)檢測,以實(shí)現(xiàn)高性能和快速收斂,從而加快訓(xùn)練和推理。

2)缺乏可解釋性

DNN在很大程度上被視為具有多個(gè)處理層的黑盒,其工作情況可以使用統(tǒng)計(jì)數(shù)據(jù)進(jìn)行檢查,但學(xué)習(xí)到的網(wǎng)絡(luò)內(nèi)部表示基于數(shù)百萬或數(shù)十億個(gè)參數(shù),使得分析極其困難。這意味著,行為本質(zhì)上是不可預(yù)測的,而且對決策的解釋很少,這也使得自動(dòng)駕駛等關(guān)鍵用例無法進(jìn)行系統(tǒng)驗(yàn)證。普遍認(rèn)為,復(fù)雜的黑盒是良好性能所必需的,這一假設(shè)受到了挑戰(zhàn)。最近的研究試圖使DNN更易于解釋,[41]中介紹了視覺transformer的可視化工具,可用于查看內(nèi)部機(jī)制,如隱藏參數(shù),并深入了解影響預(yù)測的輸入的特定部分。

3)可轉(zhuǎn)移性和可推廣性

對非分布數(shù)據(jù)的泛化對人類來說是自然的,但對機(jī)器來說卻具有挑戰(zhàn)性,因?yàn)榇蠖鄶?shù)學(xué)習(xí)算法都強(qiáng)烈依賴于測試數(shù)據(jù)的獨(dú)立和相同分布假設(shè)訓(xùn)練,而這在實(shí)踐中常常因域轉(zhuǎn)移而被違反。域泛化旨在將模型泛化到新的領(lǐng)域,已經(jīng)提出了學(xué)習(xí)可推廣和可轉(zhuǎn)移表示的不同方法。大多數(shù)現(xiàn)有方法都屬于域?qū)R的范疇,其中的主要思想是最小化源域之間的差異,以學(xué)習(xí)域不變表示。對源域移位不變的特征也應(yīng)該對任何未發(fā)現(xiàn)的目標(biāo)域移位都是魯棒的,數(shù)據(jù)增強(qiáng)是一種常見的做法,用于規(guī)范機(jī)器學(xué)習(xí)模型的訓(xùn)練,以避免過度擬合并提高泛化能力[45],這對于過度參數(shù)化的DNN尤為重要。神經(jīng)網(wǎng)絡(luò)中的視覺注意力可用于突出決策中涉及的圖像區(qū)域,并進(jìn)行因果過濾以找到最相關(guān)的部分[46]。[47]中通過使用圖像的隨機(jī)屏蔽版本并比較輸出預(yù)測來估計(jì)單個(gè)像素的重要性,這種方法不適用于時(shí)空方法或那些考慮復(fù)雜環(huán)境中對象之間關(guān)系的方法!

4)真實(shí)世界測試

一般來說,DL方法容易出現(xiàn)不規(guī)范,無論模型類型或應(yīng)用如何,都會(huì)出現(xiàn)這種問題。在其它領(lǐng)域中,[48]分析了計(jì)算機(jī)視覺中的不規(guī)范性,特別是針對DL模型,如常用的ResNet-50和縮放轉(zhuǎn)移學(xué)習(xí)圖像分類模型Big transfer(BiT)[49]。研究表明,雖然基準(zhǔn)分?jǐn)?shù)隨著模型復(fù)雜度和訓(xùn)練數(shù)據(jù)的增加而提高,但使用真實(shí)世界的失真進(jìn)行測試會(huì)導(dǎo)致較差且高度變化的性能,這嚴(yán)重依賴于用于初始化訓(xùn)練的隨機(jī)種子。實(shí)際系統(tǒng)需要在各種低成本硬件上實(shí)時(shí)處理的內(nèi)存和計(jì)算方面高效[50]。一些實(shí)現(xiàn)高效和低成本計(jì)算的方法包括參數(shù)修剪、網(wǎng)絡(luò)量化、低秩因子分解和模型蒸餾。像[51]這樣的方法是有效的,能夠?qū)崟r(shí)預(yù)測軌跡,但不是端到端的,因?yàn)樗鼈兗僭O(shè)預(yù)先存在目標(biāo)跟蹤系統(tǒng)來估計(jì)周圍車輛的狀態(tài)。

行人和騎自行車者等弱勢道路使用者(VRU)存在一個(gè)獨(dú)特的問題,因?yàn)樗麄兛梢苑浅?焖俚馗淖兎较蚝退俣龋⑴c車輛不同地與交通環(huán)境交互。在ITS中實(shí)際部署計(jì)算機(jī)視覺模型的一些主要障礙是數(shù)據(jù)源和軟件的異質(zhì)性、傳感器硬件故障以及極端或異常傳感情況。此外,最近的框架(例如基于邊緣計(jì)算的框架)直接暴露了具有各種安全實(shí)現(xiàn)的大量異構(gòu)設(shè)備的無線通信信號,為惡意行為者創(chuàng)造了不斷增加的潛在攻擊面。已經(jīng)開發(fā)了深度學(xué)習(xí)模型來檢測這些攻擊,但實(shí)時(shí)應(yīng)用和在線學(xué)習(xí)仍然是積極研究的領(lǐng)域。IoV面臨著基本的實(shí)際問題,這是由于移動(dòng)車輛將在邊緣節(jié)點(diǎn)上呈現(xiàn)高度可變的處理要求,而每輛車也可以同時(shí)運(yùn)行許多邊緣和云相關(guān)的應(yīng)用程序,以及惡劣的無線通信環(huán)境。與自動(dòng)駕駛汽車邊緣計(jì)算相關(guān)的其它挑戰(zhàn)包括協(xié)作感知、協(xié)作決策和網(wǎng)絡(luò)安全,攻擊者可以使用激光和明亮的紅外光干擾相機(jī)和激光雷達(dá),改變交通標(biāo)志,并通過通信信道回放攻擊,模型挑戰(zhàn)的可視化描述如圖3所示!

9f8cde3c-8184-11ed-8abf-dac502259ad0.png

復(fù)雜的環(huán)境

1)陰影、照明、天氣

陰影、惡劣天氣、背景和前景之間的相似性、現(xiàn)實(shí)世界中的強(qiáng)烈或不足照明等情況被引用為常見問題[59],[60]。眾所周知,相機(jī)圖像的外觀受到不利天氣條件的影響,如大霧、雨夾雪、暴風(fēng)雪和沙塵暴[61]。[62]中的一種實(shí)時(shí)碰撞檢測方法使用高斯混合模型進(jìn)行前景提取,然后使用平均移動(dòng)算法跟蹤車輛。車輛的位置、速度和加速度通過閾值函數(shù)來確定碰撞的檢測。雖然計(jì)算效率很高,但這種方法在噪聲、復(fù)雜的交通環(huán)境和天氣變化的情況下會(huì)受到嚴(yán)重影響。在惡劣的天氣條件下,相機(jī)捕捉到的車輛會(huì)出現(xiàn)曝光不足、模糊和部分遮擋等問題。同時(shí),出現(xiàn)在交通場景中的雨滴和雪花增加了算法提取車輛目標(biāo)的難度。在夜間,或在車輛朝著攝像頭行駛的隧道中,由于遠(yuǎn)光眩光,場景可能被完全掩蓋。

2)Occlusion

遮擋是最具挑戰(zhàn)性的問題之一,其中由于另一個(gè)前景目標(biāo)的遮擋,目標(biāo)對象僅部分可用于相機(jī)或傳感器。遮擋以多種形式存在,從部分遮擋到重度遮擋。在AD中,目標(biāo)對象可以被建筑物和燈柱等靜態(tài)對象遮擋,諸如移動(dòng)車輛或其它道路使用者之類的動(dòng)態(tài)對象可能會(huì)彼此遮擋,例如在人群中。遮擋也是物體跟蹤中的一個(gè)常見問題,因?yàn)橐坏┍桓欆囕v從視野中消失并再次出現(xiàn),它就被視為不同的車輛,導(dǎo)致跟蹤和軌跡信息不準(zhǔn)確。

3)攝像機(jī)角度

在交通基礎(chǔ)設(shè)施的應(yīng)用中,監(jiān)控?cái)z像機(jī)的多樣性及其視角對在有限類型的攝像機(jī)視圖上訓(xùn)練的DL方法提出了挑戰(zhàn)。雖然[68]中的算法在計(jì)算上是有效的,并且可以在不同的照明條件和交通密度場景下工作,但較低的間距相機(jī)視圖和道路標(biāo)記拐角可能會(huì)引入顯著的錯(cuò)誤。[69]中的模型可以識別攝像機(jī)附近的異常,包括它們的開始和結(jié)束時(shí)間,但對于距離中的異常來說并不準(zhǔn)確,因?yàn)檐囕v只占幾個(gè)像素。早期對監(jiān)控視頻異常檢測的一項(xiàng)調(diào)查得出結(jié)論,照明、攝像機(jī)角度、異質(zhì)對象和缺乏真實(shí)世界數(shù)據(jù)集是主要挑戰(zhàn)[67]。用于稀疏和密集交通條件的方法是不同的,并且缺乏可推廣性。在多視圖視覺場景中,匹配不同視圖中的對象是另一個(gè)主要問題,因?yàn)槎嘁晥DITS應(yīng)用程序需要處理不同相機(jī)同時(shí)捕獲的不同圖像中的數(shù)據(jù)[70]。

4)相機(jī)模糊和圖像降級

監(jiān)控?cái)z像機(jī)受天氣因素影響。水、灰塵和顆粒物質(zhì)可能積聚在鏡頭上,導(dǎo)致圖像質(zhì)量下降。強(qiáng)風(fēng)會(huì)導(dǎo)致相機(jī)抖動(dòng),導(dǎo)致整個(gè)圖像的運(yùn)動(dòng)模糊。自動(dòng)駕駛汽車上的前置攝像頭也面臨這一問題,因?yàn)槔ハx會(huì)砸到玻璃上,導(dǎo)致攝像頭視野中的盲點(diǎn)。具體而言,目標(biāo)檢測和分割算法受到極大影響,除非在模型中做好準(zhǔn)備,否則錯(cuò)誤檢測可能會(huì)導(dǎo)致AD中的嚴(yán)重安全問題,并錯(cuò)過監(jiān)視應(yīng)用中的重要事件。解決這一問題的一些方法包括使用退化圖像進(jìn)行訓(xùn)練、圖像恢復(fù)預(yù)處理和微調(diào)預(yù)訓(xùn)練網(wǎng)絡(luò)以從退化圖像中學(xué)習(xí)。例如,[72]中使用了密集的Gram網(wǎng)絡(luò),其提高了退化圖像中的圖像分割性能。

5)異構(gòu)的城市交通條件

密集的城市交通場景充滿了復(fù)雜的視覺元素,不僅在數(shù)量上,而且在各種不同的車輛及其交互中,如圖4所示。汽車、公共汽車、自行車和行人在同一個(gè)十字路口的存在是自動(dòng)導(dǎo)航和軌跡計(jì)算的一個(gè)重要問題。不同的尺寸、轉(zhuǎn)彎半徑、速度和駕駛員行為因這些道路使用者之間的互動(dòng)而進(jìn)一步復(fù)雜化。從DL的角度來看,很容易找到異構(gòu)城市交通的視頻,但標(biāo)記地面真相非常耗時(shí)。模擬軟件通常無法捕捉此類場景的復(fù)雜動(dòng)態(tài),尤其是在密集的城市中心出現(xiàn)的交通規(guī)則破壞行為。事實(shí)上,[74]中創(chuàng)建了一個(gè)特定的數(shù)據(jù)集來表示這些行為。[75]中創(chuàng)建了一個(gè)用于無管制密集交通的模擬器,該模擬器對自動(dòng)駕駛感知和控制很有用,但不代表真實(shí)道路使用者的軌跡和交互。

9f9a2d94-8184-11ed-8abf-dac502259ad0.png

應(yīng)用

1)交通流量估算

模型和算法:交通流量變量包括交通量、密度、速度和排隊(duì)長度。用于檢測和跟蹤目標(biāo)以從視頻中估計(jì)交通流量變量的算法和模型,可分為一階段和兩階段方法。在一階段方法中,根據(jù)檢測結(jié)果估計(jì)變量,并且沒有進(jìn)一步的分類和位置優(yōu)化,例如:1) YOLOv3+DeepSORT跟蹤器;2) YOLOv2+空間金字塔池化;3) AlexNet+光流+高斯混合模型;4) 基于無人機(jī)視頻的CNN+光流;5) 基于無人機(jī)視頻的SSD(單鏡頭檢測)。兩階段方法首先生成包含輸入圖像中所有潛在目標(biāo)的區(qū)域建議,然后進(jìn)行分類和位置優(yōu)化,兩階段方法的例子是:1)Faster R-CNN+SORT跟蹤器[81];2) Faster R-CNN[82],[83];3) 基于無人機(jī)視頻的Faster R-CNN[84],[85]。

當(dāng)前克服挑戰(zhàn)的方法:[86]中提出了ITS邊緣的DL方法,該方法在交通監(jiān)控視頻中執(zhí)行實(shí)時(shí)車輛檢測、跟蹤和計(jì)數(shù)。神經(jīng)網(wǎng)絡(luò)通過YOLOv3對象檢測方法捕獲外觀特征,在單幀級別檢測單個(gè)車輛,該方法部署在邊緣設(shè)備上,以最小化帶寬和功耗。[61]中討論了一種在惡劣天氣條件下實(shí)現(xiàn)各種交通環(huán)境中準(zhǔn)確度和檢測速度之間最佳權(quán)衡的車輛檢測和跟蹤方法。此外,還引入了一個(gè)名為DAWN的新數(shù)據(jù)集,用于在大霧、雨、雪和沙塵暴等惡劣天氣條件下進(jìn)行車輛檢測和跟蹤,以減少訓(xùn)練偏差。

2)交通擁堵檢測

模型和算法:基于計(jì)算機(jī)視覺的交通擁堵檢測方法也可分為單階段方法和多步驟方法。單階段方法從視頻圖像中識別車輛并直接執(zhí)行交通擁堵檢測。

當(dāng)前克服挑戰(zhàn)的方法:使用基于多個(gè)傳感器的解決方案(包括雷達(dá)、激光和傳感器融合)可以提高擁塞檢測性能,因?yàn)樵诂F(xiàn)實(shí)場景中使用單個(gè)傳感器很難實(shí)現(xiàn)理想的性能和精度。決策算法廣泛用于處理從多個(gè)傳感器獲取的融合數(shù)據(jù)[93]。利用惡劣天氣條件數(shù)據(jù)集訓(xùn)練的基于CNN的模型可以提高檢測性能[94],同時(shí)也應(yīng)用了基于生成對抗網(wǎng)絡(luò)(GAN)的風(fēng)格轉(zhuǎn)移方法[95]。這些方法有助于最大限度地減少與可推廣性相關(guān)的模型挑戰(zhàn),從而提高真實(shí)世界的性能。

3)自動(dòng)駕駛感知:檢測

模型和算法:輔助AD的常見檢測任務(wù)分為交通標(biāo)志檢測、交通信號檢測、道路/車道檢測、行人檢測和車輛檢測。

當(dāng)前克服挑戰(zhàn)的方法:在交通標(biāo)志檢測中,現(xiàn)有的交通標(biāo)志數(shù)據(jù)集在挑戰(zhàn)條件的類型和嚴(yán)重程度方面受到限制。與這些條件相對應(yīng)的元數(shù)據(jù)是不可用的,由于許多條件同時(shí)發(fā)生變化,因此無法調(diào)查單個(gè)因素的影響。為了克服這一問題,[126]引入了CURE TSDReal數(shù)據(jù)集,該數(shù)據(jù)集基于與真實(shí)世界環(huán)境相對應(yīng)的模擬條件。[127]中提出了一種端到端交通標(biāo)志檢測框架特征聚合多路徑網(wǎng)絡(luò)(FAMN)。它由兩個(gè)主要結(jié)構(gòu)組成,即特征聚合和多路徑網(wǎng)絡(luò)結(jié)構(gòu),以解決交通標(biāo)志檢測中的小對象檢測和細(xì)粒度分類問題。[128]中提出了一種用于夜間車輛檢測的車輛亮點(diǎn)信息輔助神經(jīng)網(wǎng)絡(luò),其中包括兩項(xiàng)創(chuàng)新:基于車輛亮點(diǎn)建立車輛標(biāo)簽層次結(jié)構(gòu)和設(shè)計(jì)多層融合車輛亮點(diǎn)信息網(wǎng)絡(luò)。[129]中給出了夜間情況下的實(shí)時(shí)車輛檢測,其中圖像包括占據(jù)大圖像區(qū)域的閃光,并且車輛的實(shí)際形狀沒有很好地定義。通過使用全局圖像描述符和中央凹分類器網(wǎng)格,可以準(zhǔn)確有效地估計(jì)車輛位置。AugGAN[95]是用于車輛檢測領(lǐng)域自適應(yīng)的非配對圖像到圖像轉(zhuǎn)換網(wǎng)絡(luò)。由于更好的圖像對象保存,它在數(shù)量上超過了競爭方法,以實(shí)現(xiàn)更高的夜間車輛檢測精度。[130]中提出了一種逐步域自適應(yīng)(SDA)檢測方法,以通過最小化跨域目標(biāo)檢測任務(wù)中的差異來進(jìn)一步提高CycleGAN的性能。在第一步中,訓(xùn)練一個(gè)未配對的圖像到圖像翻譯器,通過將源圖像翻譯成目標(biāo)域中的相似圖像來構(gòu)造假目標(biāo)域。在第二步中,為了進(jìn)一步最小化跨域的差異,設(shè)計(jì)了一個(gè)自適應(yīng)的CenterNet,以對抗性學(xué)習(xí)的方式在特征級別對齊分布。

4)自動(dòng)駕駛感知:分割

模型和算法:圖像分割包含三個(gè)子任務(wù):語義分割、實(shí)例分割和全景分割。語義分割是一項(xiàng)精細(xì)的預(yù)測任務(wù),用相應(yīng)的對象類標(biāo)記圖像的每個(gè)像素,實(shí)例分割旨在識別和分割屬于每個(gè)對象實(shí)例的像素,而全景分割統(tǒng)一了語義分割和實(shí)例分割,從而為所有像素提供了類標(biāo)簽和實(shí)例ID。

當(dāng)前克服挑戰(zhàn)的方法:最近的分割方向包括弱監(jiān)督語義分割[139]、[140]、領(lǐng)域自適應(yīng)[141]、[142]、多模態(tài)數(shù)據(jù)融合[143]、[144]和實(shí)時(shí)語義分割[145]、[146]、[147]。TS Yolo[148]是一個(gè)基于CNN的模型,用于在惡劣天氣條件下使用數(shù)據(jù)增強(qiáng)的新樣本進(jìn)行準(zhǔn)確的交通檢測。使用復(fù)制粘貼策略進(jìn)行數(shù)據(jù)擴(kuò)充,并從現(xiàn)有交通標(biāo)志實(shí)例構(gòu)建了大量新樣本。基于YoloV5,MixConv還用于在單個(gè)卷積運(yùn)算中混合不同的內(nèi)核大小,從而可以捕獲具有不同分辨率的模式。從大的輸入圖像中檢測和分類現(xiàn)實(shí)生活中的小交通標(biāo)志是困難的,因?yàn)樗鼈兿鄬τ谳^大的目標(biāo)占用較少的像素。為了解決這一問題,Dense RefineDet[149]應(yīng)用了單鏡頭目標(biāo)檢測框架,以保持適當(dāng)?shù)木?速度權(quán)衡。[127]中提出了一種端到端交通標(biāo)志檢測框架特征聚合多徑網(wǎng)絡(luò),以解決交通標(biāo)志檢測中的小對象檢測和細(xì)粒度分類問題。

5)合作感知

模型和算法:在互聯(lián)自主車輛(CAV)中,根據(jù)數(shù)據(jù)類型,可以在三個(gè)級別上執(zhí)行協(xié)作感知:早期融合(原始數(shù)據(jù))、中間融合(預(yù)處理數(shù)據(jù))和后期融合(處理數(shù)據(jù)),其中提取和傳輸中間神經(jīng)特征,其中共享檢測輸出(3D邊界盒位置、置信分?jǐn)?shù)),合作感知研究如何利用相鄰連接車輛和基礎(chǔ)設(shè)施的視覺線索來提高整體感知性能[150]!

1) 早期融合:[151]使用原始數(shù)據(jù)級LiDAR 3D點(diǎn)云融合從連接車輛的不同位置和角度收集的傳感器數(shù)據(jù),并提出了一種基于點(diǎn)云的3D目標(biāo)檢測方法,以處理對齊點(diǎn)云的多樣性。DiscoNet利用知識蒸餾,通過將相應(yīng)的特征約束到網(wǎng)絡(luò)中用于早期融合的特征來增強(qiáng)訓(xùn)練。

2) 中間融合:F-Cooper為邊緣應(yīng)用提供了一個(gè)新的框架,為自動(dòng)駕駛車輛提供服務(wù),也為3D融合檢測提供了新的策略。[154]提出了一種用于感知和預(yù)測的車對車(V2V)方法,該方法傳輸P&P神經(jīng)網(wǎng)絡(luò)的壓縮中間表示。[155]提出了一種注意力中間融合pipelines,以更好地捕獲網(wǎng)絡(luò)內(nèi)連接的代理之間的交互,[150]中提出了一種使用新型vit的具有車輛對一切(V2X)通信的魯棒協(xié)作感知框架。

3) 后期融合:基于Car2X的感知被建模為虛擬傳感器,以便將其集成到高級傳感器數(shù)據(jù)融合架構(gòu)中。

當(dāng)前克服挑戰(zhàn)的方法:

為了減少通信負(fù)載和開銷,提出了一種用于集體感知中消息生成規(guī)則的改進(jìn)算法[157],該算法通過重組集體感知消息的傳輸和內(nèi)容來提高V2X通信的可靠性。[158]提出并評估了一個(gè)統(tǒng)一的合作感知框架,該框架包含分散的數(shù)據(jù)關(guān)聯(lián)和融合過程,該過程可根據(jù)參與方差進(jìn)行擴(kuò)展。通過采用現(xiàn)有模型以及單個(gè)車輛車載傳感器視野的簡化算法,評估考慮了自組織V2V網(wǎng)絡(luò)中的通信損失和交通中的隨機(jī)車輛運(yùn)動(dòng)的影響。AICP在[159]中提出,這是第一個(gè)解決方案,其重點(diǎn)是通過在網(wǎng)絡(luò)和應(yīng)用層進(jìn)行有效過濾來優(yōu)化普適合作感知系統(tǒng)的信息性。為了促進(jìn)系統(tǒng)聯(lián)網(wǎng),他們還使用了一個(gè)網(wǎng)絡(luò)協(xié)議棧,該協(xié)議棧包括專用數(shù)據(jù)結(jié)構(gòu)和專門用于信息密集型應(yīng)用的輕量級路由協(xié)議!

6)道路使用者行為預(yù)測

模型和算法:來自視頻的軌跡預(yù)測對于自動(dòng)駕駛、交通預(yù)測和擁堵管理非常有用。該領(lǐng)域中較老的工作集中于同質(zhì)代理,例如高速公路上的汽車或人群中的行人,而異構(gòu)代理僅在稀疏場景中考慮,具有某些假設(shè),如基于車道的駕駛。

當(dāng)前克服挑戰(zhàn)的方法:[172]中的切換線性動(dòng)態(tài)系統(tǒng)(SLDS)描述了易受傷害道路使用者的動(dòng)態(tài),并使用從車載立體攝像機(jī)提取的特征中提取的上下文擴(kuò)展了動(dòng)態(tài)貝葉斯網(wǎng)絡(luò),重點(diǎn)關(guān)注靜態(tài)和動(dòng)態(tài)線索。該方法可以實(shí)時(shí)工作,提供道路用戶軌跡的準(zhǔn)確預(yù)測,它可以通過增加交通燈和人行橫道等環(huán)境來改善。[173]中探討了機(jī)載相機(jī)和激光雷達(dá)以及V2V通信的使用,以使用隨機(jī)森林和LSTM架構(gòu)預(yù)測軌跡。YOLO用于檢測汽車并提供邊界框,而LiDAR提供位置的細(xì)微變化,V2V通信傳輸轉(zhuǎn)向角等原始值,以減少預(yù)測的不確定性和延遲。在[174]中,TRAF數(shù)據(jù)集用于靜態(tài)或移動(dòng)相機(jī)的魯棒端到端實(shí)時(shí)軌跡預(yù)測。多車輛跟蹤采用Mask R-CNN和互速障礙物算法。如[74]所示,最后3秒的跟蹤用于預(yù)測接下來5秒的軌跡,具有端到端可訓(xùn)練的額外優(yōu)勢,不需要注釋的軌跡數(shù)據(jù)。本文還提供了TrackNPred,這是一個(gè)基于python的庫,包含不同軌跡預(yù)測方法的實(shí)現(xiàn)。它是許多軌跡預(yù)測方法的通用接口,可用于在真實(shí)世界密集和異構(gòu)交通數(shù)據(jù)集上使用標(biāo)準(zhǔn)誤差測量度量進(jìn)行性能比較。大多數(shù)用于軌跡預(yù)測的DL方法都沒有揭示潛在的獎(jiǎng)勵(lì)函數(shù),相反,它們只依賴于以前看到的示例,這阻礙了可推廣性并限制了其范圍。在[175]中,反向強(qiáng)化學(xué)習(xí)被用于找到獎(jiǎng)勵(lì)函數(shù),從而可以說該模型有一個(gè)具體的目標(biāo),允許其部署在任何環(huán)境中。[176]中執(zhí)行基于變換器的運(yùn)動(dòng)預(yù)測,以在Agroverse數(shù)據(jù)集中實(shí)現(xiàn)最先進(jìn)的多模態(tài)軌跡預(yù)測。該網(wǎng)絡(luò)對道路幾何形狀和車輛之間的相互作用進(jìn)行建模。[177]中,通過時(shí)空圖上的圖卷積網(wǎng)絡(luò)預(yù)測復(fù)雜城市場景中的行人意圖,該方法考慮了等待穿越的行人與車輛運(yùn)動(dòng)之間的關(guān)系。雖然在多個(gè)數(shù)據(jù)集上實(shí)現(xiàn)了80%的準(zhǔn)確率,但它可以提前一秒預(yù)測跨越的意圖。另一方面,將行人建模為機(jī)器人,結(jié)合SVM而不需要姿勢信息,導(dǎo)致更長的預(yù)測,但缺乏對上下文信息的考慮[178]。

7)交通異常檢測

模型和算法:交通監(jiān)控?cái)z像頭可用于自動(dòng)檢測交通異常,如停車和排隊(duì)。[68]已使用車輛拐角等低級別圖像特征的檢測來演示隊(duì)列檢測和隊(duì)列長度估計(jì),而無需在不同照明條件下進(jìn)行對象跟蹤或背景去除。基于光流的跟蹤方法不僅可以提供隊(duì)列長度,還可以提供速度、車輛數(shù)量、等待時(shí)間和車頭時(shí)距。

當(dāng)前克服挑戰(zhàn)的方法:異常檢測依賴于監(jiān)控?cái)z像頭,通常可以提供道路遠(yuǎn)處的視野,但遠(yuǎn)處的車輛僅占用幾個(gè)像素,這使得檢測變得困難。因此,[182]除了多粒度的box級跟蹤之外,還使用像素級跟蹤。關(guān)鍵思想是基于幀差的掩模提取和基于高斯混合模型的車輛軌跡跟蹤,以消除移動(dòng)車輛,并結(jié)合基于幀變化的分割來消除停車區(qū)。異常融合使用具有回溯優(yōu)化的box和像素級跟蹤特征來細(xì)化預(yù)測。監(jiān)控?cái)z像機(jī)容易在風(fēng)中抖動(dòng),因此在使用Faster R-CNN和級聯(lián)R-CNN形式的兩階段車輛檢測之前,進(jìn)行了視頻穩(wěn)定預(yù)處理[183]。從監(jiān)控視頻中進(jìn)行異常檢測的有效實(shí)時(shí)方法將外觀和運(yùn)動(dòng)學(xué)習(xí)分離為兩部分[184]。首先,自動(dòng)編碼器學(xué)習(xí)外觀特征,然后3D卷積層可以使用來自多個(gè)過去幀的潛在代碼來預(yù)測未來幀的特征。預(yù)測特征和實(shí)際特征之間的顯著差異表明異常,該模型可以部署在交通攝像頭附近的邊緣節(jié)點(diǎn)上,與像素方法相比,潛在特征似乎對照明和天氣變化具有魯棒性。為了擺脫對異常注釋數(shù)據(jù)的依賴,[185]中的無監(jiān)督單類方法應(yīng)用時(shí)空卷積自動(dòng)編碼器來獲取潛在特征,將它們堆疊在一起,序列到序列LSTM學(xué)習(xí)時(shí)間模式。該方法在多個(gè)真實(shí)世界監(jiān)控錄像數(shù)據(jù)集上表現(xiàn)良好,但并不比監(jiān)督訓(xùn)練方法更好。其優(yōu)點(diǎn)是,它可以在正常交通數(shù)據(jù)上無限期地訓(xùn)練,而沒有任何標(biāo)記的異常。

8)邊緣計(jì)算

模型和算法:ITS中的計(jì)算機(jī)視覺需要高效的基礎(chǔ)架構(gòu)來實(shí)時(shí)分析數(shù)據(jù)。如果將所有獲取的視頻流發(fā)送到單個(gè)服務(wù)器,則所需的帶寬和計(jì)算將無法提供可用的服務(wù)。例如,[193]中探討了使用視頻有用性度量進(jìn)行實(shí)時(shí)自動(dòng)故障檢測的邊緣計(jì)算架構(gòu)。只有被認(rèn)為有用的視頻才被傳輸?shù)椒?wù)器,而監(jiān)控?cái)z像機(jī)的故障或視線受阻會(huì)被自動(dòng)報(bào)告。基于邊緣云的計(jì)算可以實(shí)現(xiàn)DL模型,不僅用于計(jì)算機(jī)視覺任務(wù),還用于資源分配和效率[194]。被動(dòng)監(jiān)控現(xiàn)在已經(jīng)被文獻(xiàn)中越來越多的配備傳感器的車輛所取代,這些車輛可以協(xié)同執(zhí)行感知和建圖[56]。車輛上的車載計(jì)算資源通常不夠強(qiáng)大,無法實(shí)時(shí)處理所有傳感器數(shù)據(jù),而定位和地圖等應(yīng)用程序可能需要大量計(jì)算。

當(dāng)前克服挑戰(zhàn)的方法:大規(guī)模DL的一個(gè)問題是產(chǎn)生的大量數(shù)據(jù)無法發(fā)送到云計(jì)算機(jī)進(jìn)行訓(xùn)練。聯(lián)合學(xué)習(xí)[199]已經(jīng)成為解決這個(gè)問題的一種方法,特別是考慮到異構(gòu)數(shù)據(jù)源、帶寬和隱私問題。訓(xùn)練可以在邊緣節(jié)點(diǎn)或邊緣服務(wù)器上執(zhí)行,結(jié)果被發(fā)送到云以在共享深度學(xué)習(xí)模型中聚合[56]。聯(lián)合學(xué)習(xí)對單個(gè)邊緣節(jié)點(diǎn)的故障也具有魯棒性[191],[200]中通過以增量和無監(jiān)督學(xué)習(xí)的形式,僅將邊緣節(jié)點(diǎn)的推斷數(shù)據(jù)傳輸?shù)皆疲鉀Q了帶寬、數(shù)據(jù)隱私和功率需求的問題。通常,在邊緣處理數(shù)據(jù)以減少帶寬具有匿名傳輸數(shù)據(jù)的令人愉快的副作用[201],另一種降低帶寬需求的方法是對交通流預(yù)測所需的時(shí)空特征進(jìn)行頻譜聚類壓縮[192]。深度學(xué)習(xí)模型不能直接導(dǎo)出到移動(dòng)邊緣節(jié)點(diǎn),因?yàn)樗鼈兺ǔ_^于計(jì)算密集。[202]中引入了存儲(chǔ)和計(jì)算方面的神經(jīng)網(wǎng)絡(luò)修剪,而[203]中討論了在硬件上實(shí)現(xiàn)生成的稀疏網(wǎng)絡(luò),實(shí)現(xiàn)了效率的多個(gè)數(shù)量級提高。[204]中為移動(dòng)邊緣單元開發(fā)了一個(gè)通用的輕量級CNN模型,該模型與AlexNet和VGG-16相匹配或優(yōu)于它們,但只占尺寸和計(jì)算成本的一小部分。[86]部署了使用深度學(xué)習(xí)的基于邊緣計(jì)算的交通流檢測,YOLOv3與DeepSORT一起進(jìn)行了訓(xùn)練和修剪,以部署在邊緣設(shè)備上實(shí)現(xiàn)實(shí)時(shí)性能。[205]中對在低功耗邊緣計(jì)算機(jī)上部署用于物聯(lián)網(wǎng)應(yīng)用的緊湊型DNN進(jìn)行了全面審查。他們注意到,DNN應(yīng)用的多樣性和數(shù)量需要一種超越傳統(tǒng)修剪技術(shù)的自動(dòng)模型壓縮方法。

未來方向

1)數(shù)據(jù)挑戰(zhàn)問題解決

雖然大量數(shù)據(jù)對于訓(xùn)練深度學(xué)習(xí)模型至關(guān)重要,但質(zhì)量往往是訓(xùn)練性能的限制因素。數(shù)據(jù)管理是一個(gè)必要的過程,以包括邊緣案例,并根據(jù)來自真實(shí)世界的代表性數(shù)據(jù)訓(xùn)練模型。標(biāo)記視覺數(shù)據(jù),特別是在復(fù)雜的城市環(huán)境中,是一項(xiàng)由人類完成的勞動(dòng)密集型任務(wù)。可以通過首先使用現(xiàn)有的基于相關(guān)任務(wù)的對象檢測或分割算法來自動(dòng)標(biāo)記數(shù)據(jù)來加快速度。然后可以進(jìn)一步檢查這一點(diǎn),以消除機(jī)器的錯(cuò)誤,從而創(chuàng)建一個(gè)有用的標(biāo)記數(shù)據(jù)集。還需要包括來自不同視圖的多個(gè)傳感器的數(shù)據(jù)集來訓(xùn)練協(xié)作感知算法。由于硬件要求和同步問題,收集此類數(shù)據(jù)必然具有挑戰(zhàn)性,但可以使用與將部署的配置類似的連接車輛和儀表交叉口。像[207]這樣的數(shù)據(jù)驅(qū)動(dòng)模擬器使用高保真數(shù)據(jù)集來模擬相機(jī)和激光雷達(dá),這可以用來訓(xùn)練具有在現(xiàn)實(shí)世界中難以捕獲的數(shù)據(jù)的DL模型[208]。這種方法在自動(dòng)駕駛車輛控制的端到端強(qiáng)化學(xué)習(xí)中顯示了希望[209]。預(yù)計(jì)領(lǐng)域適應(yīng)技術(shù)將進(jìn)一步擴(kuò)展,以利用合成數(shù)據(jù)和方便收集的數(shù)據(jù)。

轉(zhuǎn)移學(xué)習(xí)的子領(lǐng)域,特別是few-shot學(xué)習(xí)和zero-shot學(xué)習(xí),將廣泛應(yīng)用專家知識,以解決缺乏數(shù)據(jù)的挑戰(zhàn),如ITS和AD中的角案例識別。同樣,新的無監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)模型有望在現(xiàn)實(shí)世界計(jì)算機(jī)視覺的一般領(lǐng)域中應(yīng)用。未來在視覺transformer可解釋性方面的工作將允許基于多個(gè)樣本的聚合度量獲得更全面的見解[41]。可解釋性研究也有望評估基于模型和無模型強(qiáng)化學(xué)習(xí)方法之間的差異[42]。數(shù)據(jù)分散是ITS中公認(rèn)的趨勢,為了解決數(shù)據(jù)隱私、大規(guī)模數(shù)據(jù)處理和效率等問題,基于視覺任務(wù)的眾感知[210]和聯(lián)合學(xué)習(xí)[211]是ITS和AD中不可避免的未來方向。此外,與為單個(gè)任務(wù)訓(xùn)練單個(gè)模型的傳統(tǒng)方式不同,使用通用基礎(chǔ)模型(例如Florence[212])學(xué)習(xí)多個(gè)下游任務(wù)是處理各種數(shù)據(jù)挑戰(zhàn)的一種有前途的趨勢。另一種機(jī)制是ITS中的數(shù)據(jù)處理并行性,與邊緣計(jì)算相結(jié)合,用于多任務(wù)(例如,交通監(jiān)控和道路監(jiān)控)學(xué)習(xí)[213]。

2)模型挑戰(zhàn)問題解決

深度學(xué)習(xí)模型經(jīng)過訓(xùn)練,直到達(dá)到良好的準(zhǔn)確性,但真實(shí)世界的測試往往揭示出邊緣情況和復(fù)雜環(huán)境條件下的弱點(diǎn)。需要在線學(xué)習(xí),以使此類模型繼續(xù)改進(jìn)并適應(yīng)現(xiàn)實(shí)場景,否則無法實(shí)際使用。如果由于缺乏對預(yù)測正確性的實(shí)時(shí)反饋而無法進(jìn)行在線訓(xùn)練,則必須使用人工存儲(chǔ)和標(biāo)記的真實(shí)數(shù)據(jù)定期分析性能。這可以作為一種迭代反饋循環(huán),其中模型不需要顯著改變,只需要根據(jù)其發(fā)現(xiàn)的最具挑戰(zhàn)性的輸入進(jìn)行增量重新訓(xùn)練。部分自動(dòng)化這一點(diǎn)的一種可能方式是使用相同的輸入數(shù)據(jù)進(jìn)行多個(gè)不同的冗余體系結(jié)構(gòu)的預(yù)測以及置信度得分。如果輸出不一致,或者如果某個(gè)輸出的置信度分?jǐn)?shù)較低,則可以手動(dòng)標(biāo)記該數(shù)據(jù)點(diǎn)并將其添加到下一次訓(xùn)練迭代的訓(xùn)練集中。

部署到邊緣設(shè)備的復(fù)雜深度學(xué)習(xí)模型需要通過諸如修剪之類的方法來提高效率。簡單的修剪方法可以將CNN性能提高30%以上,根據(jù)具體的架構(gòu),模型還可以被劃分為部署在獨(dú)立邊緣單元上的不同功能塊,以最小化帶寬和計(jì)算時(shí)間[215]。邊緣人工智能的一個(gè)可預(yù)見的未來階段是“邊緣的模型訓(xùn)練和推理”,沒有云數(shù)據(jù)中心的參與!

近年來,人們對可解釋的人工智能進(jìn)行了大量研究,尤其是在計(jì)算機(jī)視覺方面。已經(jīng)使用三種可解釋的方法來處理神經(jīng)網(wǎng)絡(luò):基于梯度的顯著性圖、類激活映射和激發(fā)反向傳播[216]。[217]中將這些方法擴(kuò)展到圖卷積網(wǎng)絡(luò),指出輸入中與分類相對應(yīng)的模式。[218]中給出了自我注意和共同注意transfomer網(wǎng)絡(luò)的可解釋性通用解決方案。雖然將這些方法應(yīng)用于交通應(yīng)用并不簡單,但已經(jīng)做出了一些努力來理解深度時(shí)空神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)處理視頻目標(biāo)分割和動(dòng)作識別,量化網(wǎng)絡(luò)中的靜態(tài)和動(dòng)態(tài)信息,并深入了解模型,突出從數(shù)據(jù)集學(xué)習(xí)到的偏差[219]。為了減輕遮擋、噪聲和傳感器故障的影響,合作傳感模型開發(fā)是未來更好地感知3D的必要方向。V2X網(wǎng)絡(luò)和視覺transformer已用于魯棒協(xié)作感知,可支持連接的自動(dòng)駕駛車輛平臺中的感知[155]。聯(lián)網(wǎng)的自動(dòng)駕駛汽車還將托管其他深度學(xué)習(xí)模型,這些模型可以以分布式方式從新數(shù)據(jù)中學(xué)習(xí)。共識驅(qū)動(dòng)的分布式感知有望利用6G V2X等未來網(wǎng)絡(luò)技術(shù),從而實(shí)現(xiàn)低延遲模型訓(xùn)練,從而實(shí)現(xiàn)真正的L5級自動(dòng)駕駛汽車。

3)用于解決復(fù)雜的交通環(huán)境挑戰(zhàn)

多模態(tài)感知和合作感知是未來實(shí)用研究的必要途徑。視頻、激光雷達(dá)和音頻等不同的模式可以組合使用,以提高純粹基于視覺的方法的性能。音頻尤其適用于早期檢測行人中的異常情況,如打架或騷亂,以及擁擠十字路口的車輛,因?yàn)橐曈X混亂可能不會(huì)立即顯示機(jī)械故障或輕微事故等問題。協(xié)作感知將允許來自不同車輛的同一環(huán)境的多個(gè)傳感器視圖構(gòu)建包含比任何單個(gè)代理都能感知到的信息更多的公共圖片,從而解決遮擋和照明問題。使用遷移學(xué)習(xí)來提高現(xiàn)實(shí)任務(wù)中的模型性能的趨勢越來越大。最初,基于合成數(shù)據(jù)對模型進(jìn)行訓(xùn)練,并使用任務(wù)特定數(shù)據(jù)進(jìn)行微調(diào),從而降低了復(fù)雜的一次性深度學(xué)習(xí)模型的可靠性,并通過對具有挑戰(zhàn)性的城市場景進(jìn)行再訓(xùn)練來提高真實(shí)世界的性能。如前所述,領(lǐng)域適應(yīng)、zero-shot學(xué)習(xí)、few-shot學(xué)習(xí)和基礎(chǔ)模型是預(yù)期的轉(zhuǎn)移學(xué)習(xí)領(lǐng)域,可用于此目的。在嵌入式硬件上部署后,通過在擁擠且具有挑戰(zhàn)性的場景中進(jìn)行在線學(xué)習(xí),可以進(jìn)一步改善[185]中所述的無監(jiān)督方法的結(jié)果,因?yàn)榇嬖跓o限量的未標(biāo)記數(shù)據(jù)。在[221]中,作為異常檢測的深度學(xué)習(xí)方法的一個(gè)重要方面,討論了在復(fù)雜環(huán)境中缺乏關(guān)于誤報(bào)率上限的理論性能分析,建議未來的研究也包括這一分析。很難想象完全依賴監(jiān)控?cái)z像頭來進(jìn)行強(qiáng)大、廣泛和經(jīng)濟(jì)的交通異常檢測。[222]中的方法包括交通、網(wǎng)絡(luò)、人口統(tǒng)計(jì)、土地利用和天氣數(shù)據(jù)源,以檢測交通。這種想法可以與計(jì)算機(jī)視覺應(yīng)用結(jié)合使用,以獲得更好的整體性能。

ITS中邊緣計(jì)算應(yīng)用的未來方向?qū)⒖紤]多源數(shù)據(jù)融合和在線學(xué)習(xí)。許多因素,如看不見的車輛形狀、新的周圍環(huán)境、可變的交通密度和罕見的事件,對DL模型來說都太具有挑戰(zhàn)性,該新數(shù)據(jù)可用于系統(tǒng)的在線訓(xùn)練。傳統(tǒng)應(yīng)用程序可以使用邊緣計(jì)算和IoV/IoT框架進(jìn)行擴(kuò)展,從視頻中重新識別車輛正在成為遮擋的最穩(wěn)健解決方案。然而,包含更多用于學(xué)習(xí)的時(shí)空信息會(huì)導(dǎo)致更大的內(nèi)存和計(jì)算使用。使用已知特征,可以在不同時(shí)間點(diǎn)將一個(gè)相機(jī)視圖中的軌跡與其它視圖進(jìn)行匹配。代替使用固定窗口,基于相似性和質(zhì)量的自適應(yīng)特征聚合可以推廣到許多多目標(biāo)跟蹤任務(wù)[225]。transformer在學(xué)習(xí)異構(gòu)體之間的動(dòng)態(tài)交互方面特別有用,這在擁擠的城市環(huán)境中對于檢測和軌跡預(yù)測特別有用。它們還可用于檢測異常和預(yù)測潛在危險(xiǎn)情況,如多用戶異構(gòu)場景中的碰撞!

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:最新綜述 | 復(fù)雜環(huán)境中的計(jì)算機(jī)視覺問題介紹及解決!

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    計(jì)算機(jī)視覺有哪些優(yōu)缺點(diǎn)

    計(jì)算機(jī)視覺作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動(dòng)了多個(gè)行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時(shí)也伴隨著一些挑戰(zhàn)和局限性。以下是對
    的頭像 發(fā)表于 08-14 09:49 ?1098次閱讀

    機(jī)器視覺計(jì)算機(jī)視覺有什么區(qū)別

    機(jī)器視覺計(jì)算機(jī)視覺是兩個(gè)密切相關(guān)但又有所區(qū)別的概念。 一、定義 機(jī)器視覺 機(jī)器視覺,又稱為計(jì)算機(jī)
    的頭像 發(fā)表于 07-16 10:23 ?594次閱讀

    計(jì)算機(jī)視覺的五大技術(shù)

    計(jì)算機(jī)視覺作為深度學(xué)習(xí)領(lǐng)域最熱門的研究方向之一,其技術(shù)涵蓋了多個(gè)方面,為人工智能的發(fā)展開拓了廣闊的道路。以下是對計(jì)算機(jī)視覺五大技術(shù)的詳細(xì)解析,包括圖像分類、對象檢測、目標(biāo)跟蹤、語義分割
    的頭像 發(fā)表于 07-10 18:26 ?1516次閱讀

    計(jì)算機(jī)視覺的工作原理和應(yīng)用

    計(jì)算機(jī)視覺(Computer Vision,簡稱CV)是一門跨學(xué)科的研究領(lǐng)域,它利用計(jì)算機(jī)和數(shù)學(xué)算法來模擬人類視覺系統(tǒng)對圖像和視頻進(jìn)行識別、
    的頭像 發(fā)表于 07-10 18:24 ?2232次閱讀

    機(jī)器人視覺計(jì)算機(jī)視覺的區(qū)別與聯(lián)系

    機(jī)器人視覺計(jì)算機(jī)視覺是兩個(gè)密切相關(guān)但又有所區(qū)別的領(lǐng)域。 1. 引言 在當(dāng)今科技迅猛發(fā)展的時(shí)代,機(jī)器人和計(jì)算機(jī)視覺技術(shù)在各個(gè)領(lǐng)域發(fā)揮著越來越
    的頭像 發(fā)表于 07-09 09:27 ?723次閱讀

    計(jì)算機(jī)視覺與人工智能的關(guān)系是什么

    引言 計(jì)算機(jī)視覺是一門研究如何使計(jì)算機(jī)能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識別、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域的知識。人工智能則是研究如何使計(jì)算
    的頭像 發(fā)表于 07-09 09:25 ?723次閱讀

    計(jì)算機(jī)視覺與智能感知是干嘛的

    引言 計(jì)算機(jī)視覺(Computer Vision)是一門研究如何使計(jì)算機(jī)能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識別、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域,是人工智能的重要組成部分。智能
    的頭像 發(fā)表于 07-09 09:23 ?1027次閱讀

    計(jì)算機(jī)視覺和機(jī)器視覺區(qū)別在哪

    計(jì)算機(jī)視覺和機(jī)器視覺是兩個(gè)密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 一、定義 計(jì)算機(jī)視覺 計(jì)算機(jī)
    的頭像 發(fā)表于 07-09 09:22 ?506次閱讀

    計(jì)算機(jī)視覺和圖像處理的區(qū)別和聯(lián)系

    數(shù)據(jù)的過程。計(jì)算機(jī)視覺的目標(biāo)是使計(jì)算機(jī)能夠像人類一樣“看到”和理解圖像或視頻內(nèi)容。 1.2 圖像處理 圖像處理,也稱為數(shù)字圖像處理,是應(yīng)用數(shù)學(xué)和計(jì)算機(jī)算法對圖像
    的頭像 發(fā)表于 07-09 09:16 ?1411次閱讀

    計(jì)算機(jī)視覺屬于人工智能嗎

    和解釋視覺信息,從而實(shí)現(xiàn)對圖像和視頻的自動(dòng)分析和處理。 計(jì)算機(jī)視覺的基本概念 2.1 計(jì)算機(jī)視覺的定義
    的頭像 發(fā)表于 07-09 09:11 ?1381次閱讀

    深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用

    深度學(xué)習(xí)技術(shù)的引入,極大地推動(dòng)了計(jì)算機(jī)視覺領(lǐng)域的發(fā)展,使其能夠處理更加復(fù)雜和多樣化的視覺任務(wù)。本文將詳細(xì)介紹深度學(xué)習(xí)在計(jì)算機(jī)
    的頭像 發(fā)表于 07-01 11:38 ?907次閱讀

    機(jī)器視覺計(jì)算機(jī)視覺的區(qū)別

    很多方面有著相似之處,如基礎(chǔ)理論、技術(shù)框架等,但它們在學(xué)科分類、應(yīng)用領(lǐng)域、側(cè)重點(diǎn)等方面存在明顯的區(qū)別。本文將對機(jī)器視覺計(jì)算機(jī)視覺進(jìn)行詳細(xì)的對比分析,以便讀者更好地理解兩者的差異。
    的頭像 發(fā)表于 06-06 17:24 ?1395次閱讀

    計(jì)算機(jī)視覺的主要研究方向

    計(jì)算機(jī)視覺(Computer Vision, CV)作為人工智能領(lǐng)域的一個(gè)重要分支,致力于使計(jì)算機(jī)能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學(xué)習(xí)、大數(shù)據(jù)等技術(shù)的快速發(fā)展,計(jì)算機(jī)
    的頭像 發(fā)表于 06-06 17:17 ?1084次閱讀

    工業(yè)計(jì)算機(jī)是什么?如何在不同行業(yè)中使用?

    工業(yè)電腦是專為在工業(yè)環(huán)境中使用而設(shè)計(jì)的計(jì)算機(jī)。它們可用于各個(gè)行業(yè),包括制造、運(yùn) 輸和能源。它們通常比普通計(jì)算機(jī)更強(qiáng)大,并且能夠在大多數(shù)計(jì)算機(jī)無法運(yùn)行的
    的頭像 發(fā)表于 04-01 15:45 ?872次閱讀
    工業(yè)<b class='flag-5'>計(jì)算機(jī)</b>是什么?如<b class='flag-5'>何在</b>不同行業(yè)中使用?

    計(jì)算機(jī)視覺的十大算法

    隨著科技的不斷發(fā)展,計(jì)算機(jī)視覺領(lǐng)域也取得了長足的進(jìn)步。本文將介紹計(jì)算機(jī)視覺領(lǐng)域的十大算法,包括它們的基本原理、應(yīng)用場景和優(yōu)缺點(diǎn)。這些算法在圖像處理、目標(biāo)檢測、人臉識別等領(lǐng)域有著廣泛的應(yīng)
    的頭像 發(fā)表于 02-19 13:26 ?1309次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>的十大算法
    主站蜘蛛池模板: 日本a级片免费 | 久久99热精品免费观看k影院 | 午夜亚洲福利 | 国产人成午夜免费噼啪视频 | 性生i活一级一片 | 国产精品久久久久国产精品三级 | 中文字幕卡二和卡三的视频 | 美女教师一级毛片 | 中国女人a毛片免费全部播放 | 久草婷婷 | 亚洲aaaa级特黄毛片 | 玖玖在线| 公妇乱淫日本免费观看 | 一级做a爰片久久毛片人呢 一级做a爰片久久毛片图片 | 如色网 | 成人国内精品久久久久影院 | avhd101天天看新片 | 香蕉视频色版在线观看 | 成人的天堂视频一区二区三区 | 免费的毛片 | 两性毛片| 精品久久久久久久免费加勒比 | 国产精品欧美激情第一页 | 久久精品视频国产 | 四虎中文 | 欧美一二三区在线 | 精品手机在线视频 | 亚洲成年网站 | 中文字幕在线看视频一区二区三区 | 女人张开腿让男人桶视频免费大全 | 真人一级一级特黄高清毛片 | 四虎国产精品免费视 | 最刺激黄a大片免费观看 | 四虎影视最新地址 | 久久夜色精品国产飘飘 | 日韩亚洲欧美日本精品va | 国产小视频在线播放 | 最黄色的视频 | 色黄视频| 国产一区二区三区影院 | 亚洲最新在线 |