谷歌一直稱(chēng)自己用實(shí)際路測(cè)和虛擬測(cè)試相結(jié)合的方式來(lái)訓(xùn)練自動(dòng)駕駛系統(tǒng)。到底兩者如何融合?在其中又遇到了哪些困難?應(yīng)該如何解決?
前幾日,繼Uber之后,Waymo的無(wú)人駕駛測(cè)試車(chē)也撞了。幸運(yùn)的是,只受輕傷。5月4日,在亞利桑那州錢(qián)德勒市,有人駕駛車(chē)輛由于某種原因跨過(guò)中間線(xiàn)撞向?qū)ο蛐旭偟腤aymo測(cè)試車(chē),導(dǎo)致雙方車(chē)輛受損,無(wú)人駕駛安全員受輕傷。警方認(rèn)為,Waymo車(chē)輛和安全員無(wú)須承擔(dān)責(zé)任。
看上去,該市警方已經(jīng)適應(yīng)了無(wú)人駕駛車(chē)輛是責(zé)任主體之一的現(xiàn)狀。盡管無(wú)責(zé),也讓公眾認(rèn)識(shí)到,在某些情形下,無(wú)人駕駛車(chē)輛對(duì)其他車(chē)輛不可預(yù)測(cè)行為的反應(yīng),并不比人類(lèi)做得更好。在近乎對(duì)撞的過(guò)程中,Waymo沒(méi)有采取令人驚嘆的規(guī)避動(dòng)作(也許保持車(chē)道更明智),但毫無(wú)反應(yīng)就有點(diǎn)令人失望,無(wú)人駕駛測(cè)試車(chē)甚至沒(méi)有采取剎車(chē)等慣常措施。
Waymo將在內(nèi)部徹查無(wú)人系統(tǒng)的訓(xùn)練日志,但他們不會(huì)蠢到試圖搞懂車(chē)輛在“想”什么。他們只會(huì)從結(jié)果逆推,發(fā)現(xiàn)訓(xùn)練系統(tǒng)中尚未完善、甚至尚未涉足的部分。
如何訓(xùn)練一個(gè)“黑盒子”
這導(dǎo)致了谷歌“城堡”計(jì)劃曝光。谷歌一直宣稱(chēng)自己用實(shí)際路測(cè)和虛擬測(cè)試相結(jié)合的方式來(lái)訓(xùn)練自動(dòng)駕駛系統(tǒng)。兩者如何融合,谷歌一直秘而不宣。
新的事故表明,谷歌仍然領(lǐng)先,但不再獨(dú)一無(wú)二。
無(wú)人系統(tǒng)制造出來(lái),就像剛出生的嬰兒一樣,擁有用于感知外界環(huán)境的“感官”(攝像頭、毫米波雷達(dá)、激光雷達(dá)),也擁有高速大腦(計(jì)算單元、圖像處理單元),但“大腦”功能尚在分化中,需要教它識(shí)別環(huán)境中一切可能出現(xiàn)的人和物體。也可以教它一些基本的對(duì)策,但實(shí)際中它如何決策,研究人員并不知曉。對(duì)于人類(lèi)來(lái)說(shuō),AI決策機(jī)制是一個(gè)“黑盒子”。這是很多人對(duì)此憂(yōu)心忡忡的原因。
教無(wú)人系統(tǒng)分辨道路和其他可能遇到的一切,是訓(xùn)練的第一步。就像教嬰兒看圖識(shí)物一樣。因?yàn)閳D像的信息太豐富,難以建模,深度學(xué)習(xí)似乎能發(fā)揮特殊優(yōu)勢(shì)。人類(lèi)基于數(shù)百萬(wàn)年的進(jìn)化,往往只須直覺(jué)就可以在復(fù)雜局面中找到解決路徑,AI正在學(xué)習(xí)這一點(diǎn),只不過(guò)遵循另一套規(guī)則。
深度學(xué)習(xí)既可以用于感知,也可以用于決策。比如的AlphaGo的走子網(wǎng)絡(luò),就是一套DNN訓(xùn)練系統(tǒng)。用最簡(jiǎn)單的話(huà)說(shuō),就是根據(jù)當(dāng)前狀態(tài)做出決策。它的設(shè)計(jì)者和訓(xùn)練師不是要教它決策(事實(shí)上人類(lèi)不知道系統(tǒng)將如何決策),而是教它一些基本知識(shí)。
在這個(gè)階段,識(shí)別環(huán)境是核心任務(wù)。物體、什么地方可以行駛(不能開(kāi)上路肩和花壇)、合法行駛路徑等。
首先,在一大批車(chē)的圖像中提取基本特征,比如車(chē)的正面和側(cè)面大致的幾何形狀,令系統(tǒng)分辨出車(chē)的左側(cè)和右側(cè)(用不同特征標(biāo)記)。
有了連續(xù)多幀的圖像,根據(jù)其間的連續(xù)變化,可以分辨車(chē)的行駛方向。并可以辨識(shí)出遠(yuǎn)處視野中很小的車(chē)輛,比任何人類(lèi)都看得遠(yuǎn)、看得清楚。如何評(píng)估它們對(duì)自身的影響,將放在后面訓(xùn)練。
其次,傳統(tǒng)圖像中,路肩和馬路本身顏色難以區(qū)分、立體視覺(jué)也很難辨別(畢竟高程差太?。H祟?lèi)是如何輕易識(shí)別的?靠陰影。區(qū)區(qū)10厘米的路肩,將形成一條連續(xù)暗色的窄帶區(qū)域。系統(tǒng)你學(xué)會(huì)了嗎?
用連續(xù)窄帶陰影(斷開(kāi)的個(gè)別路段,正好可以做高危提醒信號(hào)),結(jié)合道線(xiàn)識(shí)別,勾勒出可行駛區(qū)域。
看上去很完美,可是有時(shí)候沒(méi)有道線(xiàn)、或者由于天氣道線(xiàn)難以識(shí)別。這種情況下,人類(lèi)是如何駕駛的?斷續(xù)的樹(shù)木、街邊的排水明渠、兩側(cè)走動(dòng)的行人,都可以成為判斷依據(jù)。而系統(tǒng)需要從大量的視頻中(實(shí)際上是多幀圖像)提取出人類(lèi)策略,并加以?xún)?yōu)化。
Waymo期待自己的AI系統(tǒng)和明智的人類(lèi)駕駛員一樣,采取幾乎相同的步驟,但比任何人類(lèi)反應(yīng)更迅捷、處置更果斷。但在5月4日的車(chē)禍中,這一點(diǎn)沒(méi)有得到體現(xiàn),究竟是哪里出了問(wèn)題?
訓(xùn)練系統(tǒng)的局限
這表明,大量的虛擬環(huán)境訓(xùn)練,至少有一部分沒(méi)有被用于實(shí)際場(chǎng)景中。也就是說(shuō),融合出了問(wèn)題。
當(dāng)無(wú)人系統(tǒng)具備的了辨識(shí)能力之后,它需要面對(duì)兩類(lèi)場(chǎng)景:一類(lèi)是真實(shí)世界,另一類(lèi)是數(shù)字世界。從前者取得“實(shí)操”經(jīng)驗(yàn)后,在后者里面變換各種條件(比如將障礙物移動(dòng)位置、讓行人的行為更加不可預(yù)測(cè)),不斷磨練應(yīng)對(duì)策略,直到最優(yōu)。
谷歌的專(zhuān)家承認(rèn),模擬不靠譜的人類(lèi)行為極為困難。即便簡(jiǎn)單的十字路口,無(wú)人系統(tǒng)也對(duì)不遵循信號(hào)的行人和摩托車(chē)感到困惑。經(jīng)歷了一連串的剎車(chē)之后,無(wú)數(shù)車(chē)輛試圖從旁邊擠入,導(dǎo)致局面更混亂。
在數(shù)字化訓(xùn)練系統(tǒng)中,Waymo再次簡(jiǎn)化了路況。譬如兩條同向高速車(chē)道、只涉及兩輛車(chē)。A車(chē)搭載無(wú)人系統(tǒng),B車(chē)將作為阻礙出現(xiàn)。
當(dāng)A車(chē)以90公里的速度在內(nèi)側(cè)道路直行,右側(cè)B車(chē)猛然超車(chē)并到A車(chē)前方,并且緊接著剎車(chē)。A車(chē)能否迅速、平穩(wěn)地剎車(chē),同時(shí)還要給后面車(chē)輛留出足夠的剎車(chē)時(shí)間?
B以各種方式、從不同角度阻擋A車(chē),對(duì)于A(yíng)車(chē)剎車(chē)過(guò)程的測(cè)試重復(fù)上百次。訓(xùn)練系統(tǒng)記錄下來(lái)無(wú)人系統(tǒng)的表現(xiàn),并對(duì)其中失敗的情形進(jìn)行分析,優(yōu)化后者的處置動(dòng)作。
然后局面被設(shè)置得更復(fù)雜:城市多條車(chē)道,遇到在車(chē)道上后退車(chē)輛、路上突然出現(xiàn)滾動(dòng)的籃球或者從隔離帶上突然躥出行人,考查無(wú)人系統(tǒng)將如何應(yīng)對(duì)。
當(dāng)然,程序中無(wú)法窮盡所有輸入條件。程序員們希望無(wú)人系統(tǒng)在數(shù)萬(wàn)種情景中提煉出方法,以便在其他情景中也能做出理智決策。
5月4日的車(chē)禍,對(duì)于當(dāng)前的Waymo測(cè)試車(chē)來(lái)說(shuō),可能屬于“超綱”情形。面對(duì)對(duì)向車(chē)輛猛沖過(guò)來(lái),人類(lèi)的問(wèn)題在于沒(méi)有足夠的觀(guān)察、決策時(shí)間,以至于慌了手腳。
但無(wú)人系統(tǒng)不是這樣,在毫秒級(jí)的傳感器數(shù)據(jù)解算下,CPU準(zhǔn)確地獲知了周?chē)熊?chē)輛的即時(shí)位置,斜沖過(guò)來(lái)的車(chē)輛瞬時(shí)速度和加速度,預(yù)測(cè)了此后數(shù)秒內(nèi)對(duì)方的連續(xù)位置。并算出如果不采取緊急制動(dòng)+變換方向,1.5秒后將發(fā)生危及車(chē)內(nèi)人員的劇烈碰撞。
是什么促使Waymo車(chē)輛做出不予理會(huì)的決定呢?是右側(cè)車(chē)道沒(méi)有機(jī)動(dòng)空間,還是預(yù)測(cè)變換方向后無(wú)法保持車(chē)輛的穩(wěn)定,抑或是急劇剎車(chē)也無(wú)法改變碰撞的結(jié)果,反而會(huì)因路面摩擦的不平衡使車(chē)輛側(cè)翻、從而導(dǎo)致更嚴(yán)重的后果?我們無(wú)法獲知決策過(guò)程,Waymo工程師們讀取數(shù)據(jù)可能解決一部分困惑。如果他們的結(jié)論和無(wú)人車(chē)當(dāng)時(shí)的決策一樣——什么都不做更有利,那么就毫無(wú)問(wèn)題。
問(wèn)題在于,這樣的結(jié)論超出了人類(lèi)的認(rèn)知。面對(duì)危機(jī)我們總要做點(diǎn)什么,我們迅速提高腎上腺素水平、瞳孔放大、肌肉繃緊,血壓上升,以迎接挑戰(zhàn)。
將AI決策與人類(lèi)比較,可能是不合適的。這反過(guò)來(lái)促使人們思考基于人類(lèi)經(jīng)驗(yàn)的訓(xùn)練系統(tǒng)有效性。
虛擬世界可能設(shè)置得太簡(jiǎn)單了
Waymo的專(zhuān)家們吹噓他們是唯一一個(gè)采用“加速訓(xùn)練系統(tǒng)”的公司,實(shí)際上,福特、優(yōu)步和通用也都在硅谷建立了類(lèi)似的訓(xùn)練系統(tǒng)。Waymo只不過(guò)是開(kāi)始得最早的一個(gè)。當(dāng)然,他們?nèi)〉玫臄?shù)據(jù)也是最多的。
虛擬世界的訓(xùn)練,在24小時(shí)內(nèi)可能跑出上千萬(wàn)公里。每一分鐘都能模擬出10年前兩周的工作量。有專(zhuān)家提出模擬和真實(shí)公路測(cè)試的比例應(yīng)該是100:1。同時(shí),模擬部分應(yīng)該把無(wú)聊的地方切斷,專(zhuān)注于有趣的部分(盡可能的復(fù)雜場(chǎng)景),達(dá)到加速訓(xùn)練的目的。
有人認(rèn)為,一旦無(wú)人系統(tǒng)在虛擬城市中的數(shù)量達(dá)到數(shù)百萬(wàn)個(gè),其群體行為模式,已經(jīng)非常接近真實(shí)的超級(jí)城市日常。而在其背后,必須部署足夠的實(shí)際車(chē)輛和傳感器,建立公路數(shù)據(jù)庫(kù)。完全依靠虛擬場(chǎng)景訓(xùn)練出來(lái)的無(wú)人系統(tǒng),可能面對(duì)真實(shí)路況時(shí)表現(xiàn)“不大一樣”。
這提示了人們,虛擬城市的模型過(guò)于簡(jiǎn)單,會(huì)不會(huì)導(dǎo)致無(wú)人車(chē)無(wú)法駕馭大城市的復(fù)雜局面。
不過(guò),錢(qián)德勒市是旅游勝地,實(shí)際上人口只有幾十萬(wàn)。而且通常陽(yáng)光充足、對(duì)傳感器正常工作有正面作用。環(huán)境影響似乎可以排除。
讓我們回到開(kāi)始。訓(xùn)練雖然開(kāi)始時(shí)借鑒了人類(lèi)司機(jī)應(yīng)對(duì)的場(chǎng)景,但最終人工智能可能會(huì)采取不同的策略。隨著無(wú)人系統(tǒng)對(duì)人類(lèi)行為理解的深入,促使它形成自己的駕駛風(fēng)格。令人吃驚的是,無(wú)人系統(tǒng)面對(duì)另一個(gè)無(wú)人系統(tǒng)時(shí)采取的策略,與它面對(duì)人類(lèi)駕駛車(chē)輛時(shí)不一樣。而我們還沒(méi)有想過(guò)城市里完全充斥著無(wú)人駕駛車(chē)輛的情形。
這意味著,無(wú)人系統(tǒng)統(tǒng)治整個(gè)城市的時(shí)候,可能自發(fā)形成全新的交通準(zhǔn)則。更高效、更默契。人類(lèi)在汽車(chē)時(shí)代所積累并奉為圭臬的準(zhǔn)則,很可能被替代。車(chē)禍揭示了有人和無(wú)人車(chē)輛混行可能造成的混亂,但也讓我們更期待全新的無(wú)人駕駛交通。到那時(shí),無(wú)人系統(tǒng)的工作可能更簡(jiǎn)單。
-
谷歌
+關(guān)注
關(guān)注
27文章
6254瀏覽量
111559 -
無(wú)人駕駛
+關(guān)注
關(guān)注
100文章
4301瀏覽量
126911 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
794文章
14910瀏覽量
180262
原文標(biāo)題:如何訓(xùn)練無(wú)人駕駛系統(tǒng)?
文章出處:【微信號(hào):IV_Technology,微信公眾號(hào):智車(chē)科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
實(shí)際路測(cè)和虛擬測(cè)試相結(jié)合的方式來(lái)訓(xùn)練自動(dòng)駕駛系統(tǒng),到底兩者如何融合?
評(píng)論