隨著自動駕駛邁入量產時代,「數據驅動」成為一個熱門話題——無論是汽車廠商還是科技公司,在介紹新技術和新產品時,都常常將累計行駛里程和運行時間作為優勢亮點。大家時常會聽到類似「行駛里程突破千萬公里、系統學習突破數十萬小時,相當于人類駕齡數萬年」的表述。
回歸現實,乘用車自動駕駛能力依然處于輔助駕駛的階段,經歷著從高速、泊車到最復雜的城區場景逐步覆蓋的進程。理論上已經「學車數萬年」的AI,仍然無法完全代替人類駕駛員。
自動駕駛是數據驅動的技術,環境感知、精準定位、路徑規劃等模塊能力都構筑在堅實的數據基礎之上。而累計海量數據僅僅是最基礎的一步,更復雜也更困難的地方在于如何高效利用回傳數據,促進系統技術架構迭代升級。
與此同時,量產落地后海量并發的數據風暴,對創新公司的技術研發能力也帶來了諸多挑戰:
海量數據,算力壓力大:無論是研發測試車輛還是搭載自動駕駛系統的量產車,每天產生的數據量都能達到TB級別。同時,隨著傳感器數量和圖像分辨率增加,算法模型日趨復雜,對數據處理的算力壓力也水漲船高。
數據龐雜,處理難度大:自動駕駛研發數據來源多樣,有車輛數據、位置數據、環境感知數據、應用數據、個人數據等等,如何對數據進行精準化的篩選、提煉、統計和分析成為難點。此外,數據類型涉及結構化數據和非結構化數據,數據服務類型又涵蓋文件、對象等等,導致不同業務對存儲接口、協議訪問的需求多樣化,因此統一標準、提升不同研發任務的協同效率也是困難重重。
數據安全難度大:數據安全是伴隨著我國自動駕駛技術創新同步出現的全新課題。自動駕駛汽車涉及的用戶隱私數據、國家地理信息等等敏感信息如何安全管控和保護已經成為了全行業共同探索的問題。
總之,如何高效利用和安全處理量產回傳數據對技術研發提出了更高的要求。在大數據的基礎上,形成完整的數據閉環,才能夠對數據進行快速有效挖掘,促進AI算法迭代升級。
禾多科技自動駕駛系統從去年開始在廣汽等知名汽車廠商車型上量產搭載。對此,禾多科技基于完全自研工具鏈,形成從數據采集、數據仿真到場景庫搭建、系統測試的完整閉環,打通了基于數據驅動的自動駕駛系統升級閉環鏈路。
在這背后,禾多研發小伙伴們做了大量的工作,涉及數據采集/回傳、數據存儲、數據預處理、數據挖掘、數據標注、測試驗證等等一系列不同模塊,內容紛繁復雜。本期「有禾不可」就選擇其中四個亮點維度,見微知著,為大家介紹禾多科技如何通過數據閉環讓數據得到更高效的處理和更安全的使用。
數據回傳搭積木式靈活配置量產數據回傳功能
為了從海量、復雜的數據中提取真正有用的數據,解決自動駕駛長尾問題,數據場景化是必不可少的一步。場景是數據需求的基本單位,場景化是數據打通的中樞環節,能否有足夠強的場景提取的能力,將是一家自動駕駛公司的重要技術壁壘。
在實際量產項目中,禾多科技負責車端數據回傳技術的開發。為了滿足不同主機廠客戶實際需求,禾多科技提供了「積木式」配置方式:將場景識別的條件抽象成可配置的內容,一方面可以滿足算法在不同時期對于數據挖掘的動態變化的需求,另一方面也方便程序的升級迭代。
此外,為了充分利用數據,禾多科技在算法端不斷優化迭代,靈活選擇最優數據進行計算,對場景進行更精準定義和挖掘。同時,通過充分利用多信息融合方式,基于明確的系統異常表現和信息之間的明顯差異,利用算法自動挖掘極端場景和異常場景。
通過這種「搭積木」的場景庫配置方式,禾多科技的數據挖掘在量的基礎上實現了質的突破。
數據生產統一標簽體系
自動駕駛作為一項新興技術,其研發過程一直面臨著「缺乏統一標準」的困擾。
一方面,除了感知模塊作為典型的數據驅動技術為大家熟知以外,包括決策、規劃、控制、定位、地圖等模塊也都廣泛依賴數據的補給。不同的模塊需要一套共同語言能夠保證前后互通。
另一方面,完整的研發生命涵蓋需求定義、算法實現、測試用例、bug提交、數據采集、結果評測等階段,每個階段之間也需要一套共同語言能夠保證上下流轉。
這套語言就是我們常說的標簽。標簽體系不統一,就會導致不同模塊之間、不同階段之間的輸入輸出重疊或不一致,產生「重復造輪子」的問題。
禾多科技自身定位為自動駕駛解決方案公司,需要為主機廠客戶提供多模塊、全流程的研發服務。在這個過程中,禾多科技基于OpenX標準和量產項目中總結的經驗,創造性地構造了統一的標簽體系——在廣度上統一了不同模塊對于數據的挖掘需求,從深度上統一了不同階段對于數據的分級需求,保證各個模塊和流程之間實現標簽對齊以及場景一致,顯著提高了溝通效率、減少了數據生產過程中的浪費。
仿真測試貫穿研發測試生命周期
自動駕駛汽車需要經歷大量的道路測試才能量產上市。僅僅依靠路測來優化自動駕駛算法耗費的時間和成本太高,且面臨著法規限制多、極端交通條件難以創造、場景復現困難和安全風險高等問題。因此,基于場景庫的仿真測試是系統驗證中的重要環節。
結合實際量產項目開發和測試環節的需求,禾多科技完全自主研發了集「可視化、場景、仿真、評測」功能于一體的綜合性驗證平臺HoloX,支持在高精地圖基礎上搭建貼近真實道路的仿真場景。更重要的是,HoloX的仿真能力不僅用到傳統的SIL、PIL和HIL測試中,還直接在車端應用,實現了高效的車輛在環(VIL)測試,極大提高了系統集成的效率、安全性和極端場景的測試覆蓋度。
除此之外,HoloX可以為感知訓練提供有效的視覺數據且自動完成標注,既可以對實車數據采集提供有力補充,減少實車數據采集所需的人力和物力,還可以在虛擬場景下還原真實世界中難以遇到的場景,提高場景覆蓋度。
停車場環視相機數據仿真
行車場景環視相機感知仿真
泊車場景后視相機障礙物感知仿真
作為隨著研發需求而誕生工具,HoloX還伴隨著禾多科技量產項目的進展而不斷升級迭代,提供更完善的仿真測試能力。
量產數據應用云端全管理
除了研發端通常關注的數據處理效率問題,如何保障隱私和敏感數據的安全也是科技創新公司如今需要考慮的問題。
對此,禾多科技將此前應用于本地的數據閉環推到云端,打造完整了云端工具鏈。通過這種方式,將各種數據進行分類上傳、分類管理,在云端完成數據全生命周期處理,通過統一的接口權限,保障數據安全,規避數據泄露風險。
數據越多,算法越強的道理看似簡單,但僅僅只靠「堆數據」是遠遠不夠的。如何更加高效地篩選真正有用的數據來反哺算法才是更加關鍵的一步。與此同時,海量的數據如何安全合規地運用,也是研發過程中不能忽視的問題。
在技術落地層面,禾多科技正與多家中國頭部大型汽車集團攜手,推動自動駕駛系統規?;慨a:于2021年與廣汽集團達成「產融聯合」合作關系后,禾多科技與廣汽研究院攜手,為廣汽乘用車型平臺提供自動駕駛開發服務。目前已通過搭載3顆第二代激光雷達的AION LX Plus車型實現了NDA智能輔助駕駛的落地,并為去年上市的廣汽傳祺影酷車型提供了高階自動泊車技術。在2023年,還會有多款不同廠商的新產品搭載禾多自動駕駛系統量產上市。
面對量產之后海量并發的數據風暴,禾多科技已經做好了準備,以上內容僅僅是禾多數據閉環亮點的冰山一角。隨著今年系統量產工作的穩步推進,禾多數據閉環能力也將在逐步升級,后續的「有禾不可」將進行更詳細的介紹。
在邁向完全無人駕駛的終極目標的道路上,禾多科技數據閉環正加速向前!
審核編輯 :李倩
-
算法
+關注
關注
23文章
4625瀏覽量
93127 -
激光雷達
+關注
關注
968文章
4003瀏覽量
190155 -
自動駕駛
+關注
關注
784文章
13904瀏覽量
166730
原文標題:有禾不可|高效運用,安全處理,禾多科技如何利用數據加速自動駕駛算法迭代
文章出處:【微信號:gh_2ef7005733ab,微信公眾號:禾多科技HoloMatic】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論