12月30日,位于上海的特斯拉工廠(chǎng)將開(kāi)始交付Model 3。意味著,這家工廠(chǎng)將在開(kāi)工357天后開(kāi)始向客戶(hù)交付汽車(chē),這將創(chuàng)下全球汽車(chē)制造商在華的新紀(jì)錄。
上海工廠(chǎng)是特斯拉全球計(jì)劃的一部分,目的是增強(qiáng)其在世界最大汽車(chē)市場(chǎng)的影響力,更重要的是本地化的工程研發(fā)團(tuán)隊(duì)也即將落地,目的之一就是適應(yīng)中國(guó)路況的自動(dòng)駕駛功能優(yōu)化。
?
目前,特斯拉在國(guó)內(nèi)的Autopilot版本更新一直落后于美國(guó)市場(chǎng)。而在今年9月,交通運(yùn)輸部部長(zhǎng)***會(huì)見(jiàn)特斯拉CEO馬斯克時(shí),雙方就自動(dòng)駕駛技術(shù)發(fā)展交換了意見(jiàn)。顯然,特斯拉在過(guò)去一年時(shí)間,已經(jīng)頻繁與中國(guó)的相關(guān)主管部門(mén)進(jìn)行各種溝通,這在過(guò)去是不常見(jiàn)的。
彼時(shí),交通運(yùn)輸部特別強(qiáng)調(diào)了歡迎包括特斯拉在內(nèi)的各國(guó)新能源汽車(chē)制造商、自動(dòng)駕駛研發(fā)機(jī)構(gòu)和企業(yè)與中國(guó)科研單位、企業(yè)加強(qiáng)技術(shù)交流和研發(fā)合作,不斷拓展合作范圍,共同推動(dòng)自動(dòng)駕駛技術(shù)落地。
而馬斯克表示,特斯拉愿與中方一道努力,持續(xù)加強(qiáng)在自動(dòng)駕駛技術(shù)研發(fā)、標(biāo)準(zhǔn)制定等方面的交流與合作,期待得到中國(guó)交通運(yùn)輸部的更多支持。
與此同時(shí),最快于明年部署全自動(dòng)駕駛系統(tǒng)的特斯拉,正在陸續(xù)披露一系列和自動(dòng)駕駛功能相關(guān)的技術(shù)細(xì)節(jié)。
一、全自動(dòng)駕駛底層技術(shù)陸續(xù)曝光
這其中,近日披露的一個(gè)專(zhuān)利對(duì)于其全球化部署意味深重。這個(gè)名為數(shù)據(jù)管道(data pipeline)和深度學(xué)習(xí)系統(tǒng)的專(zhuān)利,優(yōu)化了用于深度學(xué)習(xí)的圖像處理過(guò)程,除了車(chē)端深度學(xué)習(xí)的流程優(yōu)化之外,還特別提到了未來(lái)如何在全球市場(chǎng)共享數(shù)據(jù)。
按照專(zhuān)利的描述,從單一車(chē)輛上提取的圖像數(shù)據(jù)信息將與其他特斯拉用戶(hù)在全球范圍內(nèi)收集的數(shù)據(jù)進(jìn)行比較,一方面緩解駕駛員在自動(dòng)駕駛時(shí)系統(tǒng)可能執(zhí)行錯(cuò)誤過(guò)程的擔(dān)憂(yōu),同時(shí)在特斯拉自動(dòng)駕駛軟件穩(wěn)定版本的性能基礎(chǔ)上加以改進(jìn),而且改進(jìn)的過(guò)程比以前更有效率。
“通過(guò)這個(gè)過(guò)程,特斯拉能夠從車(chē)輛的攝像頭和傳感器捕捉的圖像中保持盡可能高的分辨率。這樣,神經(jīng)網(wǎng)絡(luò)就可以更有效地從它所接收的數(shù)據(jù)包中學(xué)習(xí)。這使得神經(jīng)網(wǎng)絡(luò)能夠以更有效的方式處理更好的圖像,從而為更快地改進(jìn)自動(dòng)駕駛技術(shù)打開(kāi)了大門(mén)。”
而特斯拉的新數(shù)據(jù)管道和深度學(xué)習(xí)專(zhuān)利為更快的自動(dòng)駕駛改進(jìn)鋪平了道路。這項(xiàng)新專(zhuān)利,意味著特斯拉的數(shù)據(jù)傳輸管道可能是業(yè)內(nèi)最大的之一,因?yàn)樗鼜臄?shù)十萬(wàn)輛配備了大量傳感器的汽車(chē)中提取數(shù)據(jù)。
在應(yīng)用中,特斯拉解釋了其系統(tǒng)正在解決的問(wèn)題:
用于實(shí)現(xiàn)自動(dòng)駕駛的深度學(xué)習(xí)系統(tǒng)通常依靠捕獲的傳感器數(shù)據(jù)作為輸入。在傳統(tǒng)的學(xué)習(xí)系統(tǒng)中,通過(guò)將捕獲的傳感器數(shù)據(jù)從傳感器格式轉(zhuǎn)換為與學(xué)習(xí)系統(tǒng)的初始輸入層兼容的格式,使捕獲的傳感器數(shù)據(jù)與深度學(xué)習(xí)系統(tǒng)兼容。
這種轉(zhuǎn)換可能包括壓縮和下采樣,從而降低原始傳感器數(shù)據(jù)的信號(hào)保真度。此外,更換傳感器可能需要一個(gè)新的轉(zhuǎn)換過(guò)程。因此,需要一種定制的數(shù)據(jù)管道,可以最大限度地從捕獲的傳感器數(shù)據(jù)中獲取信號(hào)信息,為深度學(xué)習(xí)網(wǎng)絡(luò)提供更高層次的信號(hào)信息,進(jìn)行深度學(xué)習(xí)分析。
特斯拉在專(zhuān)利申請(qǐng)中描述了它的解決方案:
本發(fā)明公開(kāi)了一種數(shù)據(jù)管道,該數(shù)據(jù)管道將傳感器數(shù)據(jù)作為獨(dú)立組件提取并提供給用于自動(dòng)駕駛的深度學(xué)習(xí)網(wǎng)絡(luò)。在一些實(shí)施例中,使用深度學(xué)習(xí)網(wǎng)絡(luò)和從傳感器接收的輸入數(shù)據(jù)實(shí)現(xiàn)自動(dòng)駕駛。
例如,安裝在車(chē)輛上的傳感器將車(chē)輛周?chē)h(huán)境的實(shí)時(shí)傳感器數(shù)據(jù)(如視覺(jué)、雷達(dá)和超聲波數(shù)據(jù))提供給神經(jīng)網(wǎng)絡(luò),用于確定車(chē)輛控制響應(yīng)。
在一些實(shí)施例中,網(wǎng)絡(luò)使用多層實(shí)現(xiàn)。根據(jù)傳感器數(shù)據(jù)的信號(hào)信息,將傳感器數(shù)據(jù)提取為兩個(gè)或多個(gè)不同的數(shù)據(jù)組件。例如,特征或邊緣數(shù)據(jù)可以從全局?jǐn)?shù)據(jù)中分離出來(lái),提取到不同的數(shù)據(jù)組件中。
而不同的數(shù)據(jù)組件保留了目標(biāo)相關(guān)的數(shù)據(jù),例如,數(shù)據(jù)最終會(huì)被深度學(xué)習(xí)網(wǎng)絡(luò)用來(lái)識(shí)別邊緣和其他特征。在一些實(shí)施例中,不同的數(shù)據(jù)組件作為存儲(chǔ)與識(shí)別特定目標(biāo)功能高度相關(guān)的數(shù)據(jù)的容器,但它們本身并不識(shí)別或檢測(cè)功能。
不同的數(shù)據(jù)組件提取數(shù)據(jù),以確保在機(jī)器學(xué)習(xí)網(wǎng)絡(luò)的適當(dāng)階段進(jìn)行準(zhǔn)確的特征檢測(cè)。在某些實(shí)施例中,可以對(duì)不同的數(shù)據(jù)組件進(jìn)行預(yù)處理,以增強(qiáng)其包含的特定信號(hào)信息。可以對(duì)數(shù)據(jù)組件進(jìn)行壓縮或下采樣,以提高資源和計(jì)算效率。然后在系統(tǒng)的不同層將不同的數(shù)據(jù)組件提供給深度學(xué)習(xí)系統(tǒng)。
深度學(xué)習(xí)網(wǎng)絡(luò)能夠利用提取過(guò)程中保留的信號(hào)信息作為輸入,準(zhǔn)確地識(shí)別和檢測(cè)與數(shù)據(jù)組件的目標(biāo)數(shù)據(jù)(如邊緣、對(duì)象等)相關(guān)的特征。
例如,將特征和邊緣數(shù)據(jù)提供給網(wǎng)絡(luò)的第一層,將全局光照數(shù)據(jù)提供給網(wǎng)絡(luò)的后一層。通過(guò)提取不同的數(shù)據(jù)組件,每個(gè)組件保留各自的目標(biāo)信號(hào)信息,網(wǎng)絡(luò)可以更有效地處理傳感器數(shù)據(jù)。
同時(shí),不再接收傳感器數(shù)據(jù)作為網(wǎng)絡(luò)的初始輸入,而是在網(wǎng)絡(luò)的最適當(dāng)層向網(wǎng)絡(luò)提供最有用的信息。在一些實(shí)施例中,由于不同的數(shù)據(jù)組件可以充分利用其各自組件的圖像分辨率來(lái)實(shí)現(xiàn)其預(yù)期目的,因此網(wǎng)絡(luò)將分析捕獲的傳感器數(shù)據(jù)的更完整版本。
例如,特征和邊緣的輸入可以利用特征和邊緣數(shù)據(jù)的整個(gè)分辨率、位范圍和位深度,而全局光照的輸入可以利用全局光照數(shù)據(jù)的整個(gè)分辨率、位范圍和位深度。
有趣的是,專(zhuān)利中列出的三位工程師中的兩位已經(jīng)不在特斯拉工作了。至于剩下這位工程師是否還在特斯拉尚不清楚。這至少說(shuō)明此項(xiàng)專(zhuān)利已經(jīng)在內(nèi)部應(yīng)用較長(zhǎng)時(shí)間。
二、實(shí)際行駛數(shù)據(jù)+深度學(xué)習(xí)+OTA
一直以來(lái),特斯拉的神經(jīng)網(wǎng)絡(luò)接受大量真實(shí)數(shù)據(jù)的訓(xùn)練,這些數(shù)據(jù)是從用戶(hù)實(shí)際行駛收集來(lái)的。目前,所有的特斯拉車(chē)型都配備了某種版本的Autopilot,累計(jì)總共行駛了大約20億英里。
當(dāng)特斯拉為Autopilot添加一個(gè)新功能時(shí),它首先會(huì)向一小群“early access”用戶(hù)進(jìn)行部署。從他們的車(chē)中記錄的數(shù)據(jù)然后被用來(lái)完善功能,隨后用戶(hù)群被擴(kuò)大,然后更多的完善。一開(kāi)始看起來(lái)粗糙和不可靠的新功能可以在幾周內(nèi)改變。
更讓人驚訝的是,在今年彭博社的一次用戶(hù)調(diào)查中,特斯拉車(chē)主在很大程度上支持馬斯克的做法,即使自動(dòng)駕駛偶爾會(huì)出問(wèn)題。
以最新發(fā)布的智能召喚(也可以理解為L(zhǎng)4的自主泊車(chē))為例,盡管網(wǎng)絡(luò)上不少功能出故障的視頻,但調(diào)查結(jié)果顯示,高達(dá)70%的車(chē)主認(rèn)可該功能。不過(guò),一些安全倡導(dǎo)者批評(píng)特斯拉把客戶(hù)當(dāng)作實(shí)驗(yàn)品。
馬斯克表示,現(xiàn)實(shí)世界的訓(xùn)練(提升自動(dòng)駕駛功能)是減少車(chē)禍的最快途徑,也可能是唯一途徑。至少對(duì)于智能召喚來(lái)說(shuō),錯(cuò)誤發(fā)生在停車(chē)場(chǎng)(低速),并且不太可能造成嚴(yán)重的傷害。
智能召喚是特斯拉實(shí)現(xiàn)自動(dòng)駕駛的高頻場(chǎng)景之一,停車(chē)場(chǎng)對(duì)自動(dòng)駕駛來(lái)說(shuō)是出了名的難。一方面,不在道路法規(guī)管轄范圍內(nèi);另一方面,不同停車(chē)場(chǎng)的標(biāo)記線(xiàn)、行駛路線(xiàn)不規(guī)則以及車(chē)流、人流混雜。
智能召喚需要對(duì)人類(lèi)行為有深刻的理解。在智能召喚發(fā)布后的第一個(gè)月里,特斯拉車(chē)主們使用了100多萬(wàn)次。馬斯克表示,這將有助于“讓我們能夠檢查這些角落里的情況,并從中進(jìn)行快速學(xué)習(xí)”。
看看用戶(hù)的真實(shí)評(píng)論,或許你更能明白其中的道理。
“雖然這款軟件目前還處于測(cè)試階段,但在駕駛員的監(jiān)督下使用已經(jīng)足夠了。這是完全自動(dòng)駕駛的先驅(qū),隨著時(shí)間的推移,它會(huì)變得更加可靠,就像Autopilot一樣。”盡管我們經(jīng)常會(huì)在網(wǎng)絡(luò)上看到一些車(chē)主對(duì)功能的濫用,但實(shí)際上大多是特斯拉車(chē)主仍然非常謹(jǐn)慎使用,并且期待功能的不斷完善。
作為軟件定義汽車(chē)最典型的代表,自動(dòng)駕駛的真正商業(yè)化,應(yīng)該是在車(chē)企、用戶(hù)及系統(tǒng)之間形成一個(gè)真正的閉環(huán),從而基于真正有效的數(shù)據(jù)來(lái)反哺系統(tǒng)的不斷自我學(xué)習(xí)。
這或許也能解釋?zhuān)瑸槭裁唇衲晏厮估召?gòu)了計(jì)算機(jī)視覺(jué)初創(chuàng)公司DeepScale。后者有一項(xiàng)名為SqueezeNet的解決方案,可以實(shí)現(xiàn)深度神經(jīng)網(wǎng)絡(luò)在更小的設(shè)備上工作,并且允許以超高效的方式處理大量數(shù)據(jù)。
這在全自動(dòng)駕駛時(shí)代尤其重要,因?yàn)橄到y(tǒng)從車(chē)輛的多傳感器中收集了大量數(shù)據(jù)。特斯拉基于自主研發(fā)的FSD芯片,基于DeepScale的技術(shù)幫助更好地優(yōu)化硬件、數(shù)據(jù)處理和深度學(xué)習(xí),而無(wú)線(xiàn)更新(OTA)則是一個(gè)高效的解決方案為系統(tǒng)不斷迭代提供助力。
然而,今天典型的CNN/DNN模型的空中更新需要大量的數(shù)據(jù)傳輸。DeepScale的另一項(xiàng)核心技術(shù)就是保證更小的模型需要更少的通信,使得頻繁的更新更加可行。
這包括較小的卷積神經(jīng)網(wǎng)絡(luò)(CNNs)在分布式訓(xùn)練中需要較少的服務(wù)器間通信;更小的CNNs需要更少的帶寬將新模型從云端導(dǎo)出到自動(dòng)駕駛汽車(chē)上;較小的CNNs更適合部署在內(nèi)存有限的FPGAs和其他硬件上。
使用SqueezeNet,可以實(shí)現(xiàn)與AlexNet相比模型尺寸減少50倍,同時(shí)達(dá)到或超過(guò)了AlexNet的top 1和top 5的精度。模型的縮減量遠(yuǎn)高于SVD、網(wǎng)絡(luò)裁剪和深度壓縮。
同時(shí),應(yīng)用8位量化的深度壓縮,SqueezeNet得到一個(gè)0.66MB的模型(比32位的AlexNet小363×),與AlexNet的精度相當(dāng)。此外,在SqueezeNet上采用6位量化和33%稀疏的深度壓縮,可以得到一個(gè)0.47MB的模型(比32位AlexNet小510×),并且具有同等的精度。
有趣的是,DeepScale的第一款產(chǎn)品是一款名為Carver21的感知軟件,專(zhuān)門(mén)用來(lái)優(yōu)化自動(dòng)駕駛汽車(chē)前置攝像頭的數(shù)據(jù)處理。這與一直堅(jiān)持視覺(jué)優(yōu)先的特斯拉非常匹配,同時(shí)其也擁有道路上最大的聯(lián)網(wǎng)車(chē)隊(duì),大量的真實(shí)數(shù)據(jù)對(duì)于DeepScale也是最佳的實(shí)踐。
這就是DeepScale的SqueezeNet發(fā)揮作用的地方。由于其精確度與最先進(jìn)的神經(jīng)網(wǎng)絡(luò)相匹配,因此能夠?qū)ι窠?jīng)網(wǎng)絡(luò)進(jìn)行有效的訓(xùn)練,并保證神經(jīng)網(wǎng)絡(luò)模型的最小化,并且保證硬件上的可用資源進(jìn)行速度-精度的權(quán)衡。
DeepScale的全棧深度學(xué)習(xí)方法使人工智能軟件與各種處理器和傳感器緊密集成,實(shí)現(xiàn)可定制的自動(dòng)駕駛功能。模塊負(fù)責(zé)從訓(xùn)練、開(kāi)發(fā)、部署,甚至數(shù)據(jù)收集/管理的每一個(gè)方面。
實(shí)時(shí)決策對(duì)任何無(wú)人駕駛汽車(chē)都至關(guān)重要。能夠在集中式的高計(jì)算環(huán)境中部署更多具有更高精度的深度學(xué)習(xí)功能是任何自動(dòng)駕駛汽車(chē)制造商所希望的。而且,在這么小的計(jì)算空間里部署多個(gè)DNN正是DeepScale的解決方案非常適合特斯拉的原因。
而隨著特斯拉的車(chē)隊(duì)(搭載Autopilot)增加到100萬(wàn)輛,它的月行駛里程將達(dá)到10億英里左右(相當(dāng)于之前一年的數(shù)據(jù)),比Waymo的月行駛里程約100萬(wàn)英里高出1000倍。這意味著特斯拉具有從0.001%的里程中收集大量邊緣訓(xùn)練樣本的機(jī)會(huì)。
評(píng)論
查看更多