靠8個攝像頭,特斯拉憑什么搞自動駕駛?
馬斯克炮轟的激光雷達到底什么角色?
有這樣的疑問是出于最近的一條新聞:“特斯拉宣布從10月開始歐洲、北美、中東地區交付的Model 3、Model Y,將取消超聲波雷達,隨后將推及到全球范圍,Model S和Model X也將在2023年一并取消超聲波雷達。”
要知道特斯拉的自動駕駛方案在最初還使用著1顆攝像頭+1顆毫米波雷達+12顆超聲波雷達的組合,隨著特斯拉AI算法和自研的FSD芯片不斷精進后。..。..
馬斯克覺得他行了。
他炮轟激光雷達,用“闌尾”形容激光雷達在車上的作用,用“foolish”形容那些使用激光雷達的人們,包括與小鵬汽車創始人何小鵬在推特上互嗆。他對雷達家族的深惡痛絕,仿佛有種“錯的不是我,而是這個世界”的感覺。
之所以有這樣的感覺,是因為特斯拉這幾年的動作完全“不合群”。別的車企,特別是那些造車新勢力瘋狂“上價值”,恨不得車上塞滿傳感器。而特斯拉在給汽車“減負”,去年5月特斯拉宣布砍掉毫米波雷達,現在又把超聲波雷達砍了,至于激光雷達,如果從量產車層面上看,它沒出現過,而在測試車輛上,它也就曇花一現。
在自動駕駛方案上,從此有了向左向右的問題,特斯拉一路向北,離開了有雷達的季節。..。..
此時壓力來到了那8顆攝像頭上。..。..
別人眼里的激光雷達
首先了解下激光雷達的工作原理,它本質是向目標發射激光束,然后激光束碰到目標物后會反彈或是散射,返回的光波會進入激光雷達的接收器中,因為光脈沖是以光速傳播,所以速度是已知的,繼而可以將光波發射的一個來回的時間換算成距離。
這只是測距。當然一個激光束是沒有用的,就像我們在漆黑一片的環境中行走,肯定會需要一個手電筒吧,太小不頂用,太大拿不動。
激光雷達也是這樣,激光束發射的頻率可以從每秒幾個脈沖到每秒幾萬個脈沖,不斷地掃描物體,就可以得到物體上所有目標點的數據,經過數據處理后,就可以得到精準的3D圖像。
那么問題來了,開車上路,上下前后左右都會有突發狀況或是障礙物,激光束只會朝一個方向射出,怎么一下子識別四周呢?
跟你拿手電筒左右來回照一個做法,那就是讓激光雷達轉圈圈~ 你可以想象成一個渾身插滿燈泡的陀螺。
就像這樣。..。..
這就是機械式激光雷達,靠電機帶動旋轉使激光束可以360度全方位掃描。目前市面上的雷達類型多按掃描方式進行區分,按照掃描方式有無機械轉動部件可分為機械旋轉、混合固態、純固態三種。整體發展趨勢從機械式向純固態演變。
但是如果只靠單線束激光,再怎么旋轉也只能掃一個平面,不能測量物體的高度,所以并不適用開車這么復雜的應用場景。因此除了掃描方式外,線束的多少也決定了成像的精細度。所謂單線雷達就是只有一個激光發射器和接收器,多線雷達就是在垂直方向上有多套收發裝置,目前市面上多見的多線雷達有32線、64線、96線、128線等。
這樣一堆光波打在不同物體的表面后所形成的畫面如下:
是不是有一種看素描畫的感覺?雖然成像不太好看,但是給自動駕駛提供了一個立體的世界,可以幫助算法更好地識別周遭的環境。
沒有對比就沒有傷害,要清楚認識到激光雷達的重要性,還要對比下毫米波和超聲波雷達。
毫米波雷達的探測距離短,受到頻段損耗的影響,也無法感知行人,而且對障礙物無法精準建模,特別是高處物體和小型物體,但勝在穿透性和抗干擾能力強,因此主要用于防撞。
超聲波雷達相當于毫米波雷達再減配,探測距離很短,方向性差,還受制于聲波傳輸速度,優點可能就是便宜,所以你看那些車企一用就是十幾顆,它主要應用在低速泊車等短距離場景。
由此看來,完整的一套多傳感器融合的自動駕駛感知方案,就是激光雷達構建3D世界,然后攝像頭豐富色彩、輪廓、紋理等細節信息,其余那兩顆雷達幫忙打下手,所以激光雷達是必不可少的C位角色。
特斯拉眼里的激光雷達
特斯拉所恪守的信條,其中之一肯定有成本,從特斯拉的供應鏈策略里就能看出端倪。
簡單來說,特斯拉的供應鏈策略就是一手抓(一體化)和就地取材(本土化)。以電池供應為例,特斯拉在上游原材料領域持續發光發熱,與各地企業簽署了供應協議。又以特斯拉上海工廠為例,在特斯拉上海廠運營一段時間后,寧德時代成為特斯拉上海的獨家供應商,其他諸如結構件、座椅支架、連接件等已經國產化。
特斯拉上海廠支撐了很大一部分產能,同時也為特斯拉降低了一大筆成本。上海廠生產Model 3車型的單位成本較美國工廠下降65%。
特斯拉這樣做都是為了降低運輸成本,提高生產效率。除了供應鏈策略外,特斯拉還采用新技術來降低成本。例如,特斯拉在2020年推出的4680電池,在電池組層面每千瓦時成本降低14%。2021年,特斯拉展示了一體式底盤電池包,這種一體化壓鑄車身,減重10%,減少370個車身零部件。
在毫米波雷達和超聲波雷達由于性能上的薄弱,已經開始拖后腿時,特斯拉自然可以以成本為由,把它們給炒了。根據 Munro Live 在油管上的一則視頻分析,特斯拉通過移除超聲波傳感器,估計每輛車可節省成本114美元(約817元人民幣)。
而激光雷達早期多用于軍事、工業領域,轉用民用領域,首先面臨的問題就是成本。現在,一顆高性能的激光雷達的價格可至上萬元,而Velodyne的64線激光雷達售價高達數萬美元,但一顆高清攝像頭的價格就幾百元。
這么高昂的成本是摳摳搜搜的特斯拉所不能接受的,但成本也僅能作為一個通用理由。
將雷達家族除名,是特斯拉所遵循的“第一性原理”在自動駕駛方案上的寫照。第一性原理指的是回歸事物最基本的條件將其拆分成各要素,進行結構分析,從而找到實現目標最優路徑的方法。
在自動駕駛方面,馬斯克認為人可以靠視覺來駕駛汽車,那么車僅依靠攝像頭也可以。唯一需要做的,就是找到如何提取攝像頭所獲取的信息,并利用這部分信息來訓練算法模型。
馬斯克這個耿直boy認為可以,它就一定是可以。就像當年馬斯克堅持走自動化生產工廠,差點讓Model 3難產至死,從“生產地獄”爬出來后,馬斯克選擇了妥協。
而這一次,馬斯克不需要妥協,因為特斯拉的算法和軟件功力。
特斯拉的底氣是硬件嗎?
很顯然是。因為8顆攝像頭背后是特斯拉自研的FSD自動駕駛芯片和DOJO超算。
2019年,特斯拉推出了自研的自動駕駛芯片FSD,在此之前特斯拉使用過MobileEye和英偉達的計算平臺。相較于上一代自動駕駛平臺,FSD芯片將算力提升至144TOPS,可以每秒處理10億像素的圖像信息。
2021年,特斯拉再度推出自研的AI芯片D1,用來訓練超算DOJO。DOJO可以利用特斯拉海量的視頻數據,來做無人標注和訓練,能夠自動學習和識別標記道路上的一切要素。今年AI Day上,特斯拉宣布,由D1芯片組成的高達1.1E算力的超算系統EXA POD將于明年一季度正式量產,屆時DOJO相比英偉達A100,可以達到最高4.4倍的單芯片訓練速度,而訓練延遲相比同等規模的GPU,最低可至1/50。
簡單來說,特斯拉給AI提供了學習課本還不說,連自習室都準備好了,而且這學習資料和自習室的規模和裝修程度愈發豪華,剩下的就交給AI自己了。
但特斯拉的底氣也不只是硬件。有了硬件的支撐,特斯拉擁有的海量數據和AI算法、模型,才是與其他車企拉開身位的地方。
特斯拉從2016年10月開始推出FSD(Full-Self Driving)自動駕駛套件,其選裝價格已經一路上漲至1萬美元。今年AI Day上,特斯拉宣布過去一年,有2000輛車參與了FSD Beta的測試,而目前這個數量已來到16萬。特斯拉介紹,得益于DOJO超算,特斯拉去年訓練了7.5萬個神經網絡模型,相當于8分鐘訓練一個,推送了35個更新,現階段,FSD Beta已經可以在一定程度上實現完全自動駕駛。
每天在路上飛馳的特斯拉,已經提供了超14.4億幀的視頻數據,視頻緩存達30PB,需要超過10萬個GPU訓練小時。
有了海量的數據,問題來到了算法和模型。
特斯拉在今年CVPR上發布了全新的算法,名為Occupancy Networks,用來改進AI模型HydraNets。
這個算法也是為了彌補缺少激光雷達所帶來的問題。
我們知道計算機視覺提供的是2D圖像,而現實世界是3D的,這就造就了很多識別上的問題。比如如何看到被遮擋的物體?計算機視覺中的模型都是以規整矩形來輸出,但很多物體形狀不規則,碰上那些奇形怪狀的物體該如何識別?沒有在數據庫中出現的物體突然出現在眼前又該如何識別?
以上這些問題,引入激光雷達是正解,因為它能構建3D傳感,來彌補2D感知上的失效,至少這是行業大部分企業所認同的。
那Occupancy Networks是如何解決的呢?
它把檢測識別這個概念變成了“占用”,簡單來說這個算法把世界切成了無數個小方格。
就像“我的世界”這款游戲一樣,如下圖:
它判斷這些小方格里面有沒有東西,有就代表占用,沒有就是空白,這樣先解決了那些不規則輪廓的識別問題。
這些小方格共同構建了一個3D體積,也形成了一張3D的鳥瞰圖。
然后特斯拉將這些3D體積通過訓練出來的3D重建場景進行比對,最終還原了攝像頭所看到的現實世界,如下圖:
看著是不是和激光雷達掃出來的世界差不多?
當然特斯拉的絕活還不止這些,什么自動標注工具,車道線網絡等等都是為了讓純視覺自動駕駛成真而努力。
毫米波和超聲波雷達本身的作用是測距和測速,現在特斯拉的算法和模型已經直指激光雷達的作用了,雷達家族被砍也就不足為奇了。
向左向右?
激光雷達的先鋒,LBEO申請破產,推崇固態激光雷達的Ouster股價跌破一美元,馬斯克對激光雷達的評論說對了?
那也未必,特斯拉與其他車企最大的區別還是其AI算法和軟件研發能力。對于特斯拉而言,如果軟件buff足夠強大,數據足夠多,那么硬件上就可以做到足夠的cost down,何樂而不為呢?
而其他算法能力還沒那么強的公司,現階段除了激光雷達外沒有其他選擇。多傳感器融合是能極大提升感知的精確性,也就提升了安全性。車是與生命安全強相關的產品,而安全是要做加法的,在安全面前,解決哪怕0.1個百分點的錯誤也比討論價值更有意義。
無論是多傳感器融合還是單兵作戰,作為環境感知,傳感器的功能無外乎相當于人的視覺。但人類在駕駛途中,依靠的可不僅僅是視覺,或者說視覺只是基礎。
隨著傳感器的技術發展,它們可以從識別一個靜態物體到一個紅綠燈,也可以從一個動態物體到一個行人甚至是背著包或者扛著物品行走的人。
但是遇到一輛高速行駛的車突然變道,原本在路邊等待的行人突然沖向你車前,而你旁邊正好也有一輛車,這時是該選擇緊急剎車與后車相撞,還是緊急變道與旁邊的車相撞以此避免撞到行人?這兩種緊急避險的辦法哪種損失又更小?
等等這些突發狀況都是在讀秒間,傳感器只能告訴你發生了什么,但無法告訴你該怎么做,而真正要做到自動駕駛,最關鍵的問題,最要解決的問題,往往是決策層面。
連人都會慌了神,失了措,那擺在一堆數據面前的路還很長。從這一點看,提升軟件能力,AI算法能力是所有自動駕駛企業最終的目標。
向左還是向右,向北還是向南,殊途同歸罷了。
審核編輯 :李倩
-
傳感器
+關注
關注
2552文章
51383瀏覽量
756042 -
雷達
+關注
關注
50文章
2965瀏覽量
117907 -
激光雷達
+關注
關注
968文章
4024瀏覽量
190299
原文標題:馬斯克不相信雷達,為什么?
文章出處:【微信號:芯世相新能源,微信公眾號:芯世相新能源】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論