特斯拉最近又出大新聞了。才內(nèi)部郵件宣布達成L2級自動駕駛,這次徹底“純視覺”了。
這次是美國時間7月10日,特斯拉 FSD Beta V9.0終于在美國向用戶推送。相比起上一個版本,V9.0做了FSD有史以來最大的一次更新。徹底拋棄了雷達的使用。而且,特斯拉征召了2000名車主內(nèi)測,報名踴躍。不過,BUG很快就出來了。
這不,一位叫Giacaglia的網(wǎng)友看了一下特斯拉車主們發(fā)的視頻,馬上就收集了FSD 9.0 beta的11個失誤瞬間。從各個動圖來看,很明顯現(xiàn)在的系統(tǒng)還是只能算是駕駛輔助,如果脫手或者離開人的監(jiān)控,還是會出事情。這次可以看到的BUG有:
場景一:自動轉(zhuǎn)彎之后徑直向道路中央的綠化帶撞了過去。
場景二:無法識別路中單軌道路。
場景三:闖公交車專用道。
場景四:在單行車道上逆行。
場景五:一直轉(zhuǎn)換車道。路口右轉(zhuǎn)時,無法判斷使用哪個車道。
場景六:汽車壓實線并線;急需換道時,因為后方車輛逼近,錯過時機,只能下個路口見了。
場景七:自動并線超車之后發(fā)現(xiàn)道路劃線,還要強行壓線并道。
場景八:左轉(zhuǎn)時提前換道。
場景九:左轉(zhuǎn)時,差點進入對向路邊停車位。
場景十:汽車穿過幾條車道后才能左轉(zhuǎn)。?
場景十一:在一個只有停車標(biāo)志的地方,看到兩個停車標(biāo)志。
“作為一個做Deep Learning方向的人表示,用神經(jīng)網(wǎng)絡(luò)的車我是肯定不敢坐的……”“是的,做ML(Machine Learning)的看現(xiàn)在的自動駕駛,堪比醫(yī)生遇到掛科的同學(xué)給自己做手術(shù)。”“強行讓機器來學(xué)人(純靠視覺)本就是錯誤的發(fā)展方向,機器有自己的優(yōu)勢(可以自由加裝雷達等設(shè)備進行輔助)而不利用,就是典型的教條主義、本本主義。”……
這都是很專業(yè)的質(zhì)疑,那么,特斯拉是不是點錯科技樹?這個問題雖然見仁見智,但是從主流的CV(Computer Vision)+雷達路線來說,特斯拉有點像“西毒”歐陽鋒了,為了降低成本,純視覺一條道走到黑,“雖百死而不悔”的精神雖然有了,但是,那都是消費者的命啊……
為什么純視覺?
如果特斯拉很老實地講自己是駕駛輔助也就罷了,壞就壞在從一開始馬斯克喜歡“吹”自動駕駛,直到吹破了以后在內(nèi)部郵件中承認(rèn)是L2級駕駛輔助。但是,現(xiàn)在馬斯克給吹得成為一種神話,這種造神運動讓馬斯克騎上虎背下不來了。
而且,國內(nèi)外有太多“特吹”,包括大眾集團CEO赫伯特·迪斯博士。當(dāng)然,迪斯博士吹特斯拉,是為了麻痹敵人,那是另外一回事。
且不說特斯拉多年排名墊底的自動駕駛功力,已經(jīng)讓多少人命喪黃泉,單說特斯拉靠“純視覺”方案,說能達到全自動駕駛L4~L5級別,這就讓人匪夷所思了。
蘇黎世聯(lián)邦理工學(xué)院(ETH Zurich)教授Marc Pollefeys則認(rèn)為特斯拉不太可能放棄完全自動駕駛近在咫尺的說法,“很多人已經(jīng)為此買單(特斯拉的FSD套餐),所以他們必須保持希望,”他說,“他們被困在那個故事里。”故事已經(jīng)成為一種神話。
那么,為什么特斯拉取消雷達使用純視覺?特斯拉多次強調(diào)過,攝像頭數(shù)據(jù)和雷達數(shù)據(jù)在做融合的時候比較困難,當(dāng)攝像頭數(shù)據(jù)與雷達數(shù)據(jù)有沖突時,系統(tǒng)反而會更加難以抉擇。
所以,馬斯克也表示過,與其讓二者互相扯后腿,不如只選一個并把它做到極致。而且,在他看來,特斯拉的深度學(xué)習(xí)系統(tǒng)已經(jīng)比毫米波雷達強100倍,現(xiàn)在的毫米波雷達已經(jīng)開始拖后腿了。
而在今年的 CVPR(計算視覺與模式識別大會)上,特斯拉首席AI科學(xué)家安喬·卡帕西(Andrej Karpathy)還講了特斯拉如此“執(zhí)拗”的原因。不過,對于走上歧路的特斯拉,我們還是奉勸要保持冷靜。
為什么呢?道理其實很簡單,人在開車,雖然是以視覺為主,但是其他的感官都是一體作用的,并非無用。比如聽覺,身體的觸覺,甚至是意識的直覺等。“事實上,人類開車的時候,是一種近乎無意識的感知,他就能夠預(yù)測下一步應(yīng)該怎么辦,從而規(guī)避事故。”這是奇瑞科技有限公司總經(jīng)理李中兵在世界人工智能大會的一場論壇上所講的。而在這點,特斯拉有點過于執(zhí)著在視覺上了。
通用視覺系統(tǒng)和神經(jīng)網(wǎng)絡(luò)
那么,這次的CVPR上,特斯拉的安喬·卡帕西(Andrej Karpathy)詳細(xì)介紹的基于深度學(xué)習(xí)開發(fā)的自動駕駛系統(tǒng),也就是全視覺的好處是什么?
特斯拉的底氣,是采用了“通用視覺系統(tǒng)”和“神經(jīng)網(wǎng)絡(luò)”兩種黑科技。當(dāng)然,Karpathy 強調(diào),基于視覺的自動駕駛,在技術(shù)角度更難實現(xiàn),因為它要求神經(jīng)網(wǎng)絡(luò)僅僅基于視頻輸入就能達到超強性能的輸出。“不過,一旦取得了突破,就能獲得通用視覺系統(tǒng),方便部署在地球的任何地方。”
“我們拋棄了毫米波雷達,車輛只靠視覺來行駛。”Karpathy認(rèn)為,有了通用視覺系統(tǒng),車輛就不再需要什么補充信息了。特斯拉始終認(rèn)為,收集環(huán)境信息是一回事,利用環(huán)境信息又是另一回事。而且,傳感器的種類和數(shù)量越多,互相之間的協(xié)調(diào)與整合就越難做,最終效果恐怕只是1+1<2,得不償失。
這次特斯拉發(fā)布的FSD Beta V9.0,從技術(shù)上來說,新算法調(diào)用所有用于自動駕駛的8個攝像頭,修復(fù)跨鏡頭畸變、時域差,拼接成環(huán)視視覺,再對周圍環(huán)境進行實時的3D建模。也就是特斯拉所謂的“鳥瞰圖視覺”。
具體來說,就是特斯拉將2D視圖轉(zhuǎn)化為模擬激光雷達數(shù)據(jù),然后再用(激光雷達)算法處理這些數(shù)據(jù),得到比之前好非常多的視覺測距精度。你不覺得奇怪么,既然還是得用激光雷達算法,為什么不用激光雷達呢?
按照特斯拉的說法,其自動駕駛系統(tǒng)是基于神經(jīng)網(wǎng)絡(luò)的特征識別、預(yù)判和規(guī)控,對于道路環(huán)境項目進行學(xué)習(xí),比如交通路牌的含義到底是什么,需要通過很多場景素材訓(xùn)練系統(tǒng),訓(xùn)練得越多系統(tǒng)能處理的場景越多。通過幾百萬車主積累的大數(shù)據(jù),表現(xiàn)出來的能力就是,特斯拉可以輕松做到目前城市道路的自主駕駛。
實際上,馬斯克一直都希望將特斯拉的制造成本壓到最低。從成本上來說,目前特斯拉Model 3的自動駕駛攝像頭成本只需要65美元。而激光雷達的成本,還基本上在1000美元以上級別。要知道,2018年的時候,Velodyne的64線激光雷達HDL-64售價可是高達7.5萬美元的。
支撐特斯拉車價一降再降的當(dāng)然是成本的控制。但是,馬斯克和特斯拉還是過于迷信軟件和AI的力量了。對于自動駕駛的“長尾問題”,特斯拉認(rèn)為靠AI和超級計算機能解決,這都是有問題的。就算完成了99%,最后的1%依然是不可跨越的鴻溝。
此外,已經(jīng)有外媒認(rèn)為,美國本土的傳統(tǒng)車企通用汽車將在2021年超越特斯拉,原因就在于特斯拉在自動駕駛方面已經(jīng)落后,特別是又在“純視覺”的路線上一條道走到黑。
傳感器融合才是未來
就純視覺的局限來說,有業(yè)內(nèi)人士認(rèn)為,在一些極端的場景中是無法滿足對于感知探測能力的KPI指標(biāo)的。比如一些復(fù)雜的天氣情況,如大雨、大霧、沙塵、強光、夜晚,這對于視覺和激光雷達都是非常惡劣的場景,難以用一種傳感器應(yīng)對。主要體現(xiàn)在幾個大的方面:
1)天氣環(huán)境因素造成的視覺傳感器致盲(如逆光炫目、沙塵暴遮擋等);
2)小目標(biāo)物體在中低分辨率視覺感知系統(tǒng)中,可能造成目標(biāo)晚識別(如減速帶、小動物、錐桶等);
3)異形目標(biāo)由于未經(jīng)訓(xùn)練可能造成無法匹配,被漏識別(道路落石、前車掉落輪胎等);
4)視覺傳感器本身的識別要理要求,對于視覺識別的高算力需求等。
就算一些自動駕駛測試或比較成熟廠商,在智能駕駛中也多次發(fā)生撞車事故,為傳感器系統(tǒng)的失效付出慘痛代價。所以,傳感器融合是構(gòu)建穩(wěn)定感知系統(tǒng)的必要條件。畢竟,視覺感知能力有局限,必須結(jié)合毫米波雷達或激光雷達做優(yōu)勢互補才能實現(xiàn)。
回頭來說,這次特斯拉的內(nèi)測BUG里面,但凡有一個場景沒有人類駕駛員眼明手快接手的話,就會演變成為交通事故。這能讓人放心嗎?特斯拉的車主們也忒心大了。
此外,我們知道,攝像頭如何感知深度只是自動駕駛問題的一部分。特斯拉依靠的最先進的機器學(xué)習(xí)只是識別模式,這意味著它會在新情況下掙扎。一掙扎,就會產(chǎn)生誤判。
與人類司機不同的是,如果系統(tǒng)沒有遇到場景,它就無法推理該做什么。“任何AI系統(tǒng)都不了解實際發(fā)生的事情,”研究自動駕駛汽車計算機視覺的康奈爾大學(xué)副教授克里安·溫伯格(Kilian Weinberger)如此表示。
還有一點是,雖說,F(xiàn)SD 9.0給智能輔助駕駛系統(tǒng)是創(chuàng)造了更廣闊的應(yīng)用場景,但是,在L2級別的駕駛輔助系統(tǒng)(而不是自動駕駛系統(tǒng))這個前提下,這些功能多少仍顯得有些雞肋,因為駕駛過程中根本無法脫手。而且,人類駕駛員不僅需要手握方向盤,還需要在城市道路上與車載電腦系統(tǒng)較勁,增加了額外負(fù)擔(dān)和心理壓力。
FSD BETA V9.0的這些內(nèi)測BUG會在實際道路上反復(fù)出現(xiàn),毫無疑問這為城市交通也制造了更多的隱患。不過,這套系統(tǒng)能不能用在更加復(fù)雜的中國的開放道路上?公社的小伙伴中還是有對特斯拉超有信心的,“大家都沒開過,怎么知道行不行呢?”是啊,是騾子是馬,特斯拉總會拉出來遛遛。
來源:汽車公社
作者:王小西
本文地址:http://m.155ck.com/news/qiye/153425
以上內(nèi)容轉(zhuǎn)載自汽車公社,目的在于傳播更多信息,如有侵僅請聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動網(wǎng)(m.155ck.com)立場。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。