關注并標星電動星球News
每天打卡閱讀
更深刻理解汽車產業(yè)變革
————————
出品:電動星球 News
作者:毓肥
9 月 28 日,毫末智行舉辦了第三期品牌開放日。
和前兩次相比,這次品牌開放日的毫末智行,「亮劍」的氣氛明顯更濃。簡單點說,就是干貨更多、數(shù)據(jù)更多、需要多想一會兒的技術思考更多了。
而另一個事實,是雖然毫末的品牌日已經舉辦到了第三期,但卻是以每季度一次的高頻率呈現(xiàn)。即使是技術立身的自動駕駛公司,如此高密度宣發(fā),也是對技術積累的考驗。
毫末智行 CEO 顧維灝在發(fā)布會上,將他們的智能駕駛哲學,凝練為「數(shù)據(jù)處理慢功夫」,一個很容易讓友商放松警惕的概念——因為「慢」,聽上去與智能駕駛的滾滾洪流,似乎并不對稱。
但實際上,毫末智行昨天在開放日呈現(xiàn)的信息,或者表態(tài),不像字面意義上的「慢」,甚至更像「快」。
比如國內首發(fā)高通 8540+9000 的智能駕駛方案——單芯片360T四芯片 1440TOPS 的高算力;
再比如引入 Swin-Transformer 模型,相比常規(guī)方式最多提高80%深度學習速度;
還比如使用無監(jiān)督聚類,自動化挖掘每天數(shù)千萬幀數(shù)據(jù)的價值、開發(fā)自動轉化工具提高仿真測試速度,從每天仿真 30 個場景提升到 14400 個,等等。
無人駕駛進入深水區(qū),需要解決的核心問題有兩個:如何提高數(shù)據(jù)利用率?如何降低數(shù)據(jù)利用成本?
至于如何解決這些問題,毫末智行用品牌開放日給出了自己的答案。干貨很多,術語很多,下面馬上開始。
前言:車企孵化的自動駕駛技術公司?
成立于 2019 年的毫末智行,前身是長城汽車智能駕駛前瞻部,由長城汽車孵化而出,成為獨立的自動駕駛人工智能技術公司。
也就是說,長城汽車既是毫末智行的大股東,也是毫末智行的大客戶。
這樣的路線,類似福特之于 Argo UI,通用之于 Cruise。也就是成熟車企獨立孵化的自動駕駛技術公司。
這種模式的特點,是技術公司不僅保留了輕裝上陣的獨立性,距離量產車場景也還比純粹的技術公司更近。
截止到技術日,毫末智行小魔盒累積的路測數(shù)據(jù)已經達到了 100 萬公里,輔助駕駛打開率為 30%,未來三年的目標則是登上 100 萬輛長城乘用車。
另外,張凱表示到 2025 年,長城汽車旗下所有新車型都會搭載 L2 技術,75% 車型搭載 L2+ 技術,其中 40% 車型搭載 L3 及以上技術。
這次技術日雖然有很多術語和干貨,但毫末智行希望傳遞的核心信息,其實就是這兩個 100 萬,以及「2025 小目標」背后的意義:量產智能駕駛會遇到什么挑戰(zhàn)?如何克服這些挑戰(zhàn),讓更多汽車實現(xiàn)智能駕駛?
一、怎么把每一公里數(shù)據(jù)利用到極致?
100 萬公里路測數(shù)據(jù),是智能駕駛征程中的一個節(jié)點。
在毫末智行 CEO 顧維灝的演講中,百萬級的數(shù)據(jù)積累在他看來,更像是一塊敲門磚。「我們發(fā)現(xiàn)了大量的,量產前想不到的情況。發(fā)現(xiàn)現(xiàn)實世界遠遠比我們想的復雜。」
他用「浩如煙海」來形容現(xiàn)實世界對智能駕駛的考驗。
事實上,這樣的考驗并不來源于「里程」,而是來自每一幀視頻畫面。
擁有自主思考能力的人類司機,經過教育和實踐之后,可以識別、分析并適應道路狀況。比如你知道路邊停著的共享單車不會自動沖出路面,也知道對向車道來車突然撞過來的幾率很小。
但對于人工智能來說,光是讓它「認清」這個世界,就已經難倒了無數(shù)工程師。
毫末智行將這種困難,總結為「如何找到對當前能力最有價值的數(shù)據(jù)」。顧維灝則用了一個詞語:「診斷」。
這是毫末智行尋找有價值場景的具體方法,看懂這張圖的門檻不低。
簡單總結一下,就是毫末用了兩套模型——云端的 fundamental model 全任務感知模型+車端的 domain model 部分感知模型,用類似于「找茬兒」的方式,實現(xiàn)了更高比例的自主診斷。
是的,找茬兒,找車端感知過程中的茬兒。
比如這張 PPT,很生動地展示了車端感知的三個常見「漏檢」:道路遠處已經變得很小的前車、被障礙物擋住的前車,以及只有部分被攝像頭拍到的側前車。
對于人類司機相當于 5.76 億像素的視覺和極其精妙的大腦而言,這三個「漏洞」除非危險駕駛,否則基本不會出現(xiàn)。但對于人工智能,想要認清這樣的 Corner cases,就必須依賴訓練。
而如果同樣的數(shù)據(jù)量,能夠找到更多 Corner cases,那就是「尋找有價值場景」的效率更高。
這也是顧維灝提出「數(shù)據(jù)處理的慢功夫」背后的邏輯:慢,指的是深度挖掘同一組數(shù)據(jù)的利用率;慢的目的,則是為了少出錯。
二、自動化+Transformer,數(shù)據(jù)效率方法論
但顧維灝提出的「慢功夫」,也為毫末智行帶來了新的挑戰(zhàn):數(shù)據(jù)量。
在自動駕駛業(yè)內,路測里程數(shù)是一個相對通俗易懂的維度。但如果要準確描述深度學習的負擔,用「幀」是更對工程師口味的。
毫末智行的工程師告訴我們,目前他們的路測車,每天可以產生數(shù)千萬幀的視頻數(shù)據(jù)。
隨著 100 萬長城乘用車裝配智能駕駛「小目標」的臨近,這樣的數(shù)據(jù)量只會繼續(xù)幾何級增長——更何況,毫末智行才剛提出了不斷挖掘場景的「慢功夫」。
那么,毫末智行會如何進入數(shù)據(jù)爆炸的智能駕駛時代?顧維灝給出的答案是「快」,或者說,「提高訓練數(shù)據(jù)的效率」。
1.提高效率,首先要提高深度學習訓練速度。
Swin-Transformer,這是 PPT 上面非常重要的一張。
Swin Transformer是一種新型深度學習視覺模型,由微軟首先提出,屬于 Transformer 模型的一類——Transformer 和 CNN(卷積神經網絡),屬于目前比較主流的深度學習模型。
更具體的原理分析,本文就不展開了。簡單總結一下 Swin-Transformer 的優(yōu)點,就是相比起 CNN,它對數(shù)據(jù)量大的模型更友好,效率更高。
毫末智行表示,如果使用標準的數(shù)據(jù)并行訓練,同樣是 100 萬幀的視頻數(shù)據(jù),4 臺各配置 4 張英偉達 V100 深度學習卡的服務器,需要 64.3 小時。
但 100 萬幀數(shù)據(jù)根本不算多——上文剛說了,現(xiàn)階段毫末智行每天的數(shù)據(jù)量就達到了數(shù)千萬幀,使用原始方法訓練速度明顯不夠快。
顧維灝表示他們使用了數(shù)據(jù)和模型同時并行的混合方案,比如把模型、不同層的網絡數(shù)據(jù)橫向和縱向各自拆分,動態(tài)分配到計算卡顯存里面。
結果如這個表格所示,優(yōu)化后的迭代速度(橙色),可以提高50%-80%。
2.提高效率,還需要降低人力參與度。
毫末智行每天產生的數(shù)千萬幀視頻數(shù)據(jù),根據(jù)我們了解到的消息,如果光靠人力「看」,速度只有每個人每天 1000 幀,效率極低。
所以除了必要的人工標注之外,毫末智行一直希望提高數(shù)據(jù)處理的自動化程度。
總結下來,毫末智行的自動處理,主要有「無監(jiān)督聚類」、「CSS 自動轉換+云端仿真」兩個主要特點。
上面提到過,毫末智行使用了雙模型對比的方式尋找錯漏。而無監(jiān)督聚類的作用,則是自動找到更多工程師想要的場景。
舉個例子,比如工程師需要「被樹木擋住的車」,首先需要進行一次表征學習,把圖片變成特殊的矩陣,基于這個特殊矩陣做自動化積累——最后所有「被樹木擋住的車」相關圖片都會自動分類。
毫末智行方面表示,無監(jiān)督聚類過程不需要人工打標簽,這個過程極大提高了數(shù)據(jù)利用的速度。
CSS 自動轉換+云端仿真,則是毫末智行在傳統(tǒng)方式基礎上,加快驗證速度的工具。
顧維灝表示,常規(guī)方法一套流程走下來,每個人每天只能驗證30個場景,「而且人工設置的也很隨意,經常會設置很多無效的場景,浪費時間。」
使用云端并行和自動轉換工具之后,他表示目前每天可以自動生成一萬多個仿真測試用例,PPT 上的數(shù)據(jù)則是 14400 個/天。
二、毫末智行+高通,最高 1440TOPS 算力?
自動駕駛深水區(qū),一定是數(shù)據(jù)量和計算能力互相超越的「軍備競賽」。
數(shù)據(jù)量不僅來源于量產車數(shù)量,還來源于精度不斷提高的感知硬件。
從明年開始,200 萬像素,甚至 800 萬像素就將成為智能汽車的標配。和如今主流的 100/130 萬像素相比,對芯片的要求上了好幾層樓——這也為「算力競賽」推波助瀾。
那么毫末智行,會為長城汽車提供怎樣的算力?
2020 年 12 月 30 日,長城汽車與高通技術公司宣布雙方在自動駕駛領域達成合作。長城汽車將是國內首批采用高通 Snapdragon Ride 平臺的整車廠商。
也是在毫末智行的技術開放日上,我們第一次得知了高通智能駕駛芯片的代號——8540+9000。
其中 8540 是類 CPU+GPU 的 SOC 芯片,9000 則是專業(yè)負責深度學習的異構芯片,它們都將基于車規(guī)級 5 納米工藝打造,單片 8540+9000 的功耗大概是 75W。
在 5 納米工藝高通芯片加持下,毫末智行帶來了新的「小魔盒 3.0」平臺,單板可以達到 360TOPS 的算力,并支持升級到 1440TOPS,也就是 4 板聯(lián)合的算力。
顧維灝則表示,75W 的 8540+9000 每秒可以計算 2 萬幀數(shù)據(jù)。
目前,高通驍龍 Ride 平臺已經在毫末智行上車測試。發(fā)布會上分享的數(shù)據(jù),則是該平臺已經幫助毫末智行的算法擴展了從感知到認知的各項任務,號稱「端到端延遲低于30毫秒」。
最后:「又干又硬」,智能駕駛的必修課
前兩天,毫末智行公布了他們的高速公路領航輔助功能 NOH(Navigation on HIpilot)。到了品牌開放日上,官方表示目前已經適配 31 萬公里的高速公路和城市快速路。
進入 2021 之后,毫末智行在加速。這是長城汽車進入智能駕駛時代的主客觀要求,但加速的前提,是技術夠硬、夠干。
這是作為一家自動駕駛公司必須做到的,也是毫末智行一直希望證明的。
NOH 高速領航輔助、新的深度學習模型、高自動化數(shù)據(jù)處理,這些是發(fā)布會打在 PPT 上的成果。
此外,毫末智行的人員規(guī)模,還是另一個低調的發(fā)力點——毫末智行團隊目前超過 500 人,預計在今年底超過 700 人,明年達到 1000 人,其中碩博比為 50%。
除了名詞、術語、數(shù)據(jù),成為國內首批跟高通合作并量產智能駕駛平臺的自動駕駛公司,還能看出毫末智行希望成為頭部玩家,也就是他們的「野心」。
顧維灝在開放日開場的時候這樣說:「誰能用最低的成本,得到最多的數(shù)據(jù),用最快的速度進行產品迭代,誰就將獲得未來競爭的勝利。」
從發(fā)布會上看,毫末智行在往這樣的方向走,至于能不能贏,那就要看 2022 年落地的表現(xiàn)如何了。
(完)
來源:第一電動網
作者:電動星球News蟹老板
本文地址:http://m.155ck.com/kol/157625
文中圖片源自互聯(lián)網,如有侵權請聯(lián)系admin#d1ev.com(#替換成@)刪除。