首頁 > 新能源汽車

特斯拉自動(dòng)駕駛強(qiáng)于Waymo三大理由

來源:新能源汽車網(wǎng)
時(shí)間:2019-06-19 11:01:23
熱度:

特斯拉自動(dòng)駕駛強(qiáng)于Waymo三大理由商業(yè)分析人士、記者和普通大眾的多數(shù)觀點(diǎn)似乎是,Waymo在自動(dòng)駕駛方面遙遙領(lǐng)先,特斯拉則遠(yuǎn)遠(yuǎn)落后。然而當(dāng)你研究神經(jīng)網(wǎng)絡(luò)的基本原理時(shí),就會(huì)發(fā)現(xiàn),上

商業(yè)分析人士、記者和普通大眾的多數(shù)觀點(diǎn)似乎是,Waymo在自動(dòng)駕駛方面遙遙領(lǐng)先,特斯拉則遠(yuǎn)遠(yuǎn)落后。然而當(dāng)你研究神經(jīng)網(wǎng)絡(luò)的基本原理時(shí),就會(huì)發(fā)現(xiàn),上述觀點(diǎn)是沒有意義的。

決定深度神經(jīng)網(wǎng)絡(luò)性能好壞有三個(gè)因素:訓(xùn)練數(shù)據(jù)、網(wǎng)絡(luò)架構(gòu)、優(yōu)化算法。眾所周知,深度學(xué)習(xí)需要大量的數(shù)據(jù),而大多數(shù)AI領(lǐng)域的工程師,也將大多數(shù)時(shí)間花在了訓(xùn)練數(shù)據(jù)上,可見,訓(xùn)練數(shù)據(jù)是深度學(xué)習(xí)問題中最核心的一環(huán)。一般來說,數(shù)據(jù)越多,AI越智能,表現(xiàn)越良好。這也是為什么一部分業(yè)內(nèi)人士認(rèn)為特斯拉優(yōu)于Waymo的根本原因。

擁有約50萬輛汽車的特斯拉車隊(duì),配備了特斯拉聲稱的全自動(dòng)駕駛硬件,特斯拉車隊(duì)每天行駛的里程約為1500萬英里,相當(dāng)于Waymo車隊(duì)成立以來行駛的總里程。根據(jù)每天1500萬英里的行駛里程,可以推算出特斯拉每年可以行駛54億英里,比Waymo公司預(yù)計(jì)的全年行駛里程高出200倍。值得注意的是,特斯拉的車隊(duì)也在以每周約5000輛的驚人速度不斷增長(zhǎng)。

這些數(shù)據(jù)主要在以下三個(gè)關(guān)鍵領(lǐng)域發(fā)揮重要作用:

計(jì)算機(jī)視覺

預(yù)測(cè)

路徑規(guī)劃/駕駛策略

計(jì)算機(jī)視覺

目標(biāo)檢測(cè)是計(jì)算機(jī)視覺的一項(xiàng)重要任務(wù)。有些物體,比如馬,很少出現(xiàn)在路上。每當(dāng)特斯拉的汽車遇到神經(jīng)網(wǎng)絡(luò)認(rèn)為可能是馬的東西(或者可能只是一個(gè)無法識(shí)別的物體擋住了路),攝像頭就會(huì)拍下照片,隨后通過WiFi上傳。可見,特斯拉讓車輛每年行駛數(shù)十億英里是有幫助的,因?yàn)檫@樣可以找到更多罕見物體的例子。據(jù)此,可以推斷,隨著時(shí)間的推移,特斯拉將比Waymo更善于識(shí)別路上的罕見物品。

預(yù)測(cè)

預(yù)測(cè)是指提前幾秒鐘預(yù)測(cè)汽車、行人或騎行者等交通參與者的運(yùn)動(dòng)或動(dòng)作的能力。多年來一直效力Waymo頂尖工程師之一——安東尼萊萬多夫斯基(AnthonyLevandowski)最近稱:如今的軟件不足以預(yù)測(cè)未來。Anthony Levandowski稱,根據(jù)數(shù)據(jù)顯示,目前自動(dòng)駕駛汽車的故障主要是因?yàn)殄e(cuò)誤地預(yù)測(cè)了周圍的車輛和行人的行為。

目前,特斯拉擁有約50萬輛汽車,這是一個(gè)非常優(yōu)越的資源。特斯拉可以利用這50萬輛汽車,實(shí)現(xiàn)對(duì)“錯(cuò)誤預(yù)測(cè)情況”的采集,將采集到的快照上傳并添加到特斯拉的訓(xùn)練集中。特斯拉還可以上傳一個(gè)由其計(jì)算機(jī)視覺神經(jīng)網(wǎng)絡(luò)生成抽象的場(chǎng)景,而不是上傳一段視頻。這種方式也將從根本上減少上傳該數(shù)據(jù)的帶寬和內(nèi)存需求。

雖然用于訓(xùn)練目標(biāo)檢測(cè)的圖像需要人類標(biāo)記,但預(yù)測(cè)神經(jīng)網(wǎng)絡(luò)可以僅從事件的時(shí)間序列中學(xué)習(xí)過去和未來之間的相關(guān)性。

由于不需要人為數(shù)據(jù)貼上標(biāo)簽,特斯拉可以將其神經(jīng)網(wǎng)絡(luò)訓(xùn)練成盡可能多的有用數(shù)據(jù)。這意味著其訓(xùn)練數(shù)據(jù)集的大小將與其總里程相關(guān)。與對(duì)象檢測(cè)一樣,與Waymo相比,它的優(yōu)勢(shì)不僅在于提供更多的數(shù)據(jù)來預(yù)測(cè)常見行為,還在于能夠收集在罕見情況下出現(xiàn)的罕見行為的數(shù)據(jù),從而預(yù)測(cè)這些行為。

路徑規(guī)劃/駕駛策略

路徑規(guī)劃和駕駛政策是指汽車在限速時(shí)保持在車道中心、變道、超車、綠燈左轉(zhuǎn)、繞過停著的車、停車讓行人過馬路等等行為決策。要制定一套涵蓋汽車在任何情況下可能需要采取的行動(dòng)的規(guī)則,本身極其困難,這也是國(guó)內(nèi)外自動(dòng)駕駛領(lǐng)域?qū)I(yè)人士一直在探討的問題。解決這一問題的一種方法是利用神經(jīng)網(wǎng)絡(luò)復(fù)制人類的行為。這就是所謂的模仿學(xué)習(xí)(也稱為學(xué)徒學(xué)習(xí),或從示范學(xué)習(xí))。

訓(xùn)練過程類似于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)如何通過繪制過去和未來之間的關(guān)聯(lián)來預(yù)測(cè)其他交通參與者的行為。在模仿學(xué)習(xí)中,神經(jīng)網(wǎng)絡(luò)通過繪制它所看到的(通過計(jì)算機(jī)視覺神經(jīng)網(wǎng)絡(luò))和人類駕駛員所采取的動(dòng)作之間的關(guān)聯(lián)來預(yù)測(cè)人類駕駛員會(huì)做什么。

最近,在模仿學(xué)習(xí)領(lǐng)域炙手可熱的明星,不得不提及DeepMind出品的AlphaStar。DeepMind使用了數(shù)百萬人類參與的《星際爭(zhēng)霸》游戲數(shù)據(jù)庫中的例子,來訓(xùn)練神經(jīng)網(wǎng)絡(luò)像人類一樣打游戲。網(wǎng)絡(luò)學(xué)會(huì)了游戲狀態(tài)和人類玩家行為之間的關(guān)聯(lián),從而學(xué)會(huì)了預(yù)測(cè)人類在面對(duì)不同游戲狀態(tài)時(shí)采取的不同動(dòng)作。僅通過這種訓(xùn)練,AlphaStar便達(dá)到了DeepMind估計(jì)的水平,使其大致處于《星際爭(zhēng)霸》競(jìng)爭(zhēng)力排行榜的中間位置。后來,AlphaStar通過強(qiáng)化學(xué)習(xí)提升到職業(yè)水平的能力。

同理,特斯拉正在將模仿學(xué)習(xí)應(yīng)用到駕駛?cè)蝿?wù)中,比如,如何處理高速公路上常見的立體交叉路況,或者如何在十字路口左轉(zhuǎn)。據(jù)外媒報(bào)道稱,特斯拉會(huì)將模仿學(xué)習(xí)擴(kuò)展到更多的任務(wù)中,比如如何以及何時(shí)在高速公路上換車道。特斯拉人工智能總監(jiān)安德烈·卡帕西(Andrej Karpathy)曾經(jīng)描述了特斯拉如何使用模仿學(xué)習(xí)。

與預(yù)測(cè)結(jié)果一樣,上傳汽車周圍場(chǎng)景的抽象表示,而不是上傳視頻,這表示,神經(jīng)網(wǎng)絡(luò)只需要更低的帶寬和內(nèi)存需求就足以供神經(jīng)網(wǎng)絡(luò)模仿學(xué)習(xí)。同樣,一旦數(shù)據(jù)上傳,就不需要人為標(biāo)記。由于神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)人類駕駛員在給定環(huán)境狀態(tài)下會(huì)做什么,所以它只需要“給定的環(huán)境狀態(tài)”和“駕駛員動(dòng)作”即可。模仿學(xué)習(xí)本質(zhì)上是預(yù)測(cè)特斯拉司機(jī)的行為,而不是預(yù)測(cè)特斯拉周圍其他交通參與者的行為。與AlphaStar一樣,所有需要的信息都包含在回放中。

根據(jù)卡帕西關(guān)于預(yù)測(cè)切入(predictingcut-ins)的評(píng)論,特斯拉在未能正確預(yù)測(cè)前方車輛是否會(huì)進(jìn)入特斯拉車道時(shí)觸發(fā)保存回放。類似地,當(dāng)涉及路徑規(guī)劃或駕駛策略的神經(jīng)網(wǎng)絡(luò)無法正確預(yù)測(cè)特斯拉駕駛員的行為時(shí),特斯拉可能會(huì)捕獲回放數(shù)據(jù)。埃隆·馬斯克(Elon Musk)過去曾提到過這種功能,不過這種功能的使用情況,尚未得到證實(shí)。

其他捕捉回放的情況包括:突然剎車或急轉(zhuǎn)彎、自動(dòng)緊急剎車、碰撞或碰撞警告,以及更為復(fù)雜的機(jī)器學(xué)習(xí)技術(shù),即異常檢測(cè)和新奇檢測(cè)。如果特斯拉已經(jīng)知道它想要捕捉什么,比如十字路口的左轉(zhuǎn),它就可以設(shè)置一個(gè)觸發(fā)器,每當(dāng)視覺神經(jīng)網(wǎng)絡(luò)看到交通燈,左轉(zhuǎn)彎信號(hào)被激活,或者方向盤向左轉(zhuǎn)彎時(shí),它就會(huì)捕捉回放。

結(jié)論

特斯拉擁有約50萬輛汽車,在以下三個(gè)關(guān)鍵領(lǐng)域相對(duì)于Waymo(和其他競(jìng)爭(zhēng)對(duì)手)具有優(yōu)勢(shì):

1.計(jì)算機(jī)視覺

2.預(yù)測(cè)

3.路徑規(guī)劃/駕駛策略

商業(yè)分析人士、記者和普通大眾的多數(shù)觀點(diǎn)似乎是,Waymo在自動(dòng)駕駛方面遙遙領(lǐng)先,特斯拉則遠(yuǎn)遠(yuǎn)落后。當(dāng)你研究神經(jīng)網(wǎng)絡(luò)的基本原理時(shí),就會(huì)發(fā)現(xiàn),上述觀點(diǎn)是沒有意義的。

更重要的是,AlphaStar證明了大規(guī)模模仿學(xué)習(xí)對(duì)于復(fù)雜任務(wù)的概念。有學(xué)者認(rèn)為,如果對(duì)特斯拉采用方法的正確性存疑,或者認(rèn)為路徑規(guī)劃/駕駛策略是一個(gè)簡(jiǎn)單問題的話,那么可以思考一下,為什么模仿學(xué)習(xí)在《星際爭(zhēng)霸》中行得通,在自動(dòng)駕駛中卻行不通。

基于以上分析,有學(xué)者旗幟鮮明地表示:除非Waymo在未來1-3年內(nèi)擴(kuò)大其車隊(duì)規(guī)模,否則,“Waymo遙遙領(lǐng)先、特斯拉遠(yuǎn)遠(yuǎn)落后的觀點(diǎn)”將被證實(shí)是錯(cuò)誤的。人們把太多的注意力放在演示上,可惜這些演示沒有表明系統(tǒng)的魯棒性。人們對(duì)訓(xùn)練數(shù)據(jù)的關(guān)注太少,尤其對(duì)那些Waymo沒有足夠的數(shù)據(jù)來做好基于機(jī)器學(xué)習(xí)的罕見的物體和行為關(guān)注更少。

仿真并不是Waymo的優(yōu)勢(shì),因?yàn)榘厮估趦?nèi)的所有的自動(dòng)駕駛汽車公司都在使用仿真。更為重要的是,仿真無法預(yù)測(cè)或不知道如何準(zhǔn)確地對(duì)罕見對(duì)象和罕見行為建模。

還有一項(xiàng)對(duì)科技工作者的調(diào)查表明,特斯拉是舊金山灣區(qū)第二大最受歡迎的公司,僅次于谷歌。調(diào)查還發(fā)現(xiàn),特斯拉在全球最受歡迎的公司中排名第四,比排名第二的谷歌落后兩名。(Shopify在全球排名第三,SpaceX排名第一。)同樣值得注意的是,機(jī)器學(xué)習(xí)領(lǐng)域的最新科研成果活方法經(jīng)常被學(xué)術(shù)界、OpenAI以及谷歌、Facebook和DeepMind的企業(yè)實(shí)驗(yàn)室公開分享。特斯拉能做什么和Waymo能做什么之間的區(qū)別可能不是那么大。

這兩家公司最大的不同在于數(shù)據(jù)。隨著特斯拉汽車數(shù)量增長(zhǎng)到100萬輛,其月行駛里程將達(dá)到約10億英里,是Waymo約100萬英里的1000倍。對(duì)于特斯拉來說,1000倍的差異意味著優(yōu)越的稀有物體檢測(cè),優(yōu)越的稀有行為預(yù)測(cè),以及優(yōu)越的路徑規(guī)劃/駕駛策略。自動(dòng)駕駛的挑戰(zhàn)更多的是處理可能只有0.01%的罕見的邊緣情況,而不是99.99%的通用場(chǎng)景。