智能汽車時代的數據革命。
2021 年,Robotaxi 無人車的規模化與自動駕駛技術的前裝量產,已經成為汽車科技發展的兩個重要主題。
百度在去年底公布其 L4 自動駕駛車隊規模達到 500 臺。
今年 4 月,百度又對外披露,將在年內再增加 500 臺 Robotaxi。
同月,百度的 L4 自動駕駛路測里程突破 1000 萬公里。
小馬智行目前擁有超過 200 輛車的自動駕駛車隊,其自動駕駛測試里程超過 500 萬公里。
搭載了大量傳感器的自動駕駛汽車,每小時將產生 TB 級甚至到 10 TB 級別的數據。
如果是一支百臺車的自動駕駛車隊,每天產生的數據就是 PB 級的。
車隊規模和測試里程的快速增長,意味著頭部公司將迎來數據量的大爆發。
同樣的現象,也正在消費級汽車上發生。
比如今年底,預裝了華為高階智能駕駛解決方案的極狐阿爾法 S HI 版車型就將向消費者交付,HI 版車型將搭載 3 顆激光雷達、6 個毫米波雷達和 13 個攝像頭。
以及,小鵬汽車不久前推出緊湊型轎車 P5。
P5 會在第四季度搭載兩顆激光雷達交付。
2007 DARPA Grand Challenge 參賽車
十幾年前,當硅谷的 DARPA 無人車挑戰賽舉辦時,人們一度以為自動駕駛還要半個多世紀才能到來。
但現在看,自動駕駛量產車和自動駕駛出行服務似乎就在眼前了。
對行業內來說,跨入千萬公里級的自動駕駛測試里程,以及實現以萬臺級為單位的自動駕駛汽車前裝量產,將帶領整個汽車科技行業進入大數據的「無人區」。
1、大海淘金,千萬公里級數據如何傳輸、存儲和挖掘?
目前在全球范圍內,L4 自動駕駛測試里程積累最多的公司是 Waymo。
Waymo 的前身是 Google X 下的無人車項目。
Waymo 用了將近 8 年時間完成了第一個 1000 萬英里里程的積累,而第二個 1000 萬英里積累用時僅 1 年零 3 個月。
這說明,隨著車隊規模增長和大范圍測試開展,自動駕駛里程的增速將越來越快。
雖然目前全球完成千萬公里級里程積累的自動駕駛公司只有 Waymo 和百度兩家,但相信在今年和明年,會有越來越多的公司加入這一行列。
毫無疑問,數據是自動駕駛發展的金礦。
而面對如此大規模的數據,如何傳輸、存儲和挖掘已經成為業內面對的新興問題。
以往在自動駕駛算法訓練的過程中,針對大容量車載數據的離線遷移,目前業界沒有特別成熟的解決方案。
常見的做法是將車載計算平臺中的固態硬盤取出來,再通過快遞或人工手段,從訓練場帶到數據中心。」希捷科技中國區業務拓展經理董志南向我們分享。
「這樣的做法可能傳輸效率比較低,運輸過程容易損傷盤體造成數據丟失,不利于自動駕駛系統的快速開發迭代。」
為此,希捷在過去幾年開發了一個 Lyve 系列的產品,這是一套「套娃式」的模塊化存儲硬件,從車載端覆蓋到服務器端,來實現龐大數據量的轉移和傳輸。
目前,豐田的自動駕駛子公司 TRI-AD 和捷豹路虎在愛爾蘭的研發中心都在使用 Lyve DRIVE 進行自動駕駛系統的快速轉移和存儲。
解決了轉移和存儲問題,下一步是如何從海量數據中挖掘出最有價值的數據。
「如果行駛場景是空無一人的大街,其實對算法訓練沒什么幫助。」希捷科技的董志南分享,「真正有價值的是一些非常少見的交通狀況,比如紅綠燈突然壞掉了,于是路口變成了由一個交警來進行指揮的場景。」
百度 Apollo 自動駕駛技術部總經理王云鵬將海量數據的數據挖掘工作總結為人工標注 - 離線挖掘- 在線挖掘三個階段:
第一個階段,通過車上的測試人員來記錄問題,從而標記下那些出現問題的場景數據;
第二個階段是離線挖掘,也就是數據回傳到數據中心后,通過動態場景語義理解,給數據打上自動化的標簽,在導入仿真場景庫中進行大量的訓練;
第三個階段是在線挖掘,車端的系統通過動態條件出發,來主動采集和回傳高價值的場景數據,從而減少大量數據存儲和轉移的工作。
通過這樣的過程,車隊開展規模化的路測,路測數據被快速傳回數據中心,有價值的數據被挖掘出來,加速自動駕駛系統的高效迭代。
2、自動駕駛前裝量產,智能汽車時代更加需要「黑匣子」
一方面 L4 級的自動駕駛技術快速發展,最激進的公司可能希望在 5 年之內推動 Robotaxi 民用化。
另一方面,L2+的技術開始大規模上車。
特斯拉具有高速公路上下匝道、自動變道功能的 NOA 自動導航輔助駕駛就是典型的 L2+系統,蔚來汽車在 2020 年也推出類似的 NOP 功能,小鵬在 2021 年初推出 NGP。
在此基礎上,華為更進一步,華為聯合北汽極狐將在今年底交付的車型上,實現城市道路自動駕駛的高階智能駕駛方案 ADS。
小鵬在 P5 上推出的 Xpilot 3.5 城市 NGP 功能也是類似方案。
華為聯合北汽極狐的量產車阿爾法 S HI 版,搭載 3 顆激光雷達
這些自動駕駛系統的推出,改變了車輛上的傳感器、計算平臺部署以及電子電氣架構設計,也大幅改變了汽車的軟硬件成本結構。
同時,因為機器參與了車輛的駕駛過程,針對這些車輛的駕駛責任界定也正在發生變化。
過去,車輛交通事故的駕駛定責只需要行車記錄儀就可以,而現在每輛智能汽車上都需要一個「黑匣子」。
比如,在近兩年中,關注度極高的各類特斯拉的事故,就是通過黑匣子來還原眾多的車輛數據,包括事故當時 Autopilot 是否開啟、駕駛員是否手握方向盤、駕駛位的安全帶是否系緊、事故發生前剎車/電門的狀態等等。
針對高級別自動駕駛的車輛,黑匣子記錄的數據更為復雜。
比如,在 AutoX 的黑匣中,監控范圍包含車輛底盤、計算單元及復雜的系統層面信號、傳感器及全部感知到的周圍環境路況、到自動駕駛全棧軟件所有模塊信息。
雖然當前各大車企對于車載黑匣子的具體規格還未達成一致,但董志南告訴我們,「自動駕駛系統上路的所有數據,包括激光雷達、攝像頭、毫米波雷達數據都將被記錄下來。」
「在未來的量產車上,車規級、大容量、高性能的存儲硬件也將是標配。」
一方面,這些存儲硬件可以還原車輛駕駛時的一些關鍵狀態。
另一方面,它們記錄下車輛在路上經歷的復雜場景,這些場景數據可以用于加速自動駕駛系統的迭代。
隨著這些自動駕駛車輛大規模量產上路,不僅車端的軟硬件系統發生變化,同時車企與技術公司也將為車隊在各地建立起大規模的數據中心。
IDC 的報告顯示,全球的數據,每 3 年就會暴增一倍。
2019 年,全球的數據總量是 40ZB。
預計到 2022 年,這一規模將增至 80ZB。
而到 2025 年這個數字將是175ZB。
汽車的智能化,將大幅加快大數據爆炸性增長。
誰能最有效地利用數據,誰就能挖掘到智能時代最大的金礦。
來源:第一電動網
作者:汽車之心
本文地址:http://m.155ck.com/kol/147720
文中圖片源自互聯網,如有侵權請聯系admin#d1ev.com(#替換成@)刪除。