從創(chuàng)業(yè)之時起,毫末智行就是行業(yè)里“卷速度”的典型,不僅產(chǎn)品和技術(shù)創(chuàng)新迭代快,就連科技發(fā)布會的頻次,也是業(yè)內(nèi)最高的那個梯隊。
大模型技術(shù)井噴式爆發(fā)的今年,毫末更是把骨子里的“快”基因激活到極致。就在昨日,這家科技公司帶著千元級別的無圖NOA產(chǎn)品、DriveGPT雪湖·海若的進化成果以及大模型時代的最新思考和部署,高調(diào)舉辦了第九屆毫末AI DAY。
從這場長達三小時的技術(shù)發(fā)布會來看,毫末現(xiàn)階段拼刺刀的已不只是快速創(chuàng)新,還有產(chǎn)品端的性價比優(yōu)勢。要想在智能化下半場競賽里不下牌桌活下去,“卷速度”只是的創(chuàng)業(yè)公司一個優(yōu)勢,新的階段,提高性價比、拿下更多的市場份額才能比對手活得更好。
打出價格牌,是大勢所趨。
一是,智能化產(chǎn)品上車,已成為車企競爭的關(guān)鍵。根據(jù)工信部公布的數(shù)據(jù),2023年上半年,具備高階輔助駕駛功能的乘用車新車銷量占比達到了42.4%,預(yù)計2025年乘用車高階輔助駕駛的滲透率將會達到70%。
二是,智駕產(chǎn)品滲透率不斷加速提升,從2023年開始,乘用車城市NOA迎來量產(chǎn)新高潮。毫末估計,城市NOA已經(jīng)占到高階輔助駕駛市場份額的17%,2024年占比會達到40%,2025年或高達70%,高階智駕產(chǎn)品市場在未來兩年將迎來全面爆發(fā)。
當下的毫末,拼速度,拼性價比,借著AI DAY發(fā)布會的熱度,推出了更具性價比的行泊一體高階智能駕駛方案。毫末也用這場AI盛宴告訴外界,他們是如何思考城市NOA落地的新解法,以及面世200天之后的DriveGPT,究竟又有什么新的進化。
01
性價比,還是性價比!
發(fā)布會現(xiàn)場,毫末智行正式發(fā)布了全新第二代HPilot智能駕駛產(chǎn)品,三款新品分別是HP170、HP370和HP570,陸續(xù)會在今年和明年先后量產(chǎn)上車,主打性價比優(yōu)勢,可滿足高、中、低價位車型的量產(chǎn)需求。
- HP170
毫末HP170是行業(yè)首個能夠?qū)崿F(xiàn)高速、城市快速路上的無圖NOH,被定位為3000元級的行泊一體智駕解決方案,是毫末的入門級平民化輔助駕駛產(chǎn)品。
在傳感器方面,毫末HP170標配了1個前視相機、4個魚眼相機、2個后角毫米波雷達、12個超聲波雷達,可自由選裝1個前視毫米波雷達和2個前角毫米波雷達。
- HP370
更高級別的毫末HP370,被定位為5000元級的城市記憶行車和記憶泊車一體化的智駕產(chǎn)品。目前,毫末HP370已經(jīng)完成了全部功能的開發(fā),將于明年量產(chǎn)上車。
在毫末看來,記憶行車可看作是毫末城市NOH的最小集,是毫末城市NOH的強有力補充,僅需一次學(xué)習(xí),就可完成用戶日常路線的記憶,且不依賴于車機的導(dǎo)航路線。
在傳感器方面,HP370標配了1個前視+2個側(cè)視+1后視+4魚眼共8個相機,以及1個前毫米波雷達、2個后角毫米波雷達、12個超聲波雷達,可選裝一個小角度前視相機和2個前角毫米波雷達。此外,HP370采用多源感知的BEV技術(shù),可實現(xiàn)360度的無死角感知。
作為毫末的中算力平臺的智駕解決方案,HP370可實現(xiàn)城市記憶行車和記憶泊車的一體化。
毫末張凱在發(fā)布會上表示,記憶行車、記憶泊車本就同源,可以做到相互借鑒,相互促進。
在記憶泊車方面,毫末首創(chuàng)了業(yè)內(nèi)首個免教學(xué)記憶泊車功能,可以做到靜默學(xué)習(xí)記憶路線,實現(xiàn)可見即可用。未來,公司還計劃從功能上打通記憶行車、記憶泊車的記憶路線,從用戶使用的視角,實現(xiàn)記憶行車、記憶泊車功能上的協(xié)同。
- HP570
作為毫末的旗艦產(chǎn)品,HP570被定位為8000元級的城市全場景無圖NOH智駕解決方案。在毫末管理層的規(guī)劃里,HP570平臺的歷史使命,是打造行業(yè)內(nèi)最具性價比的高階城市智駕產(chǎn)品。
在此前毫末HP550平臺的基礎(chǔ)上,HP570成本可下降三分之二,在性能不打折的前提下可實現(xiàn)全場景無圖城市NOH,僅通過導(dǎo)航地圖來實現(xiàn)城市全場景覆蓋。同時支持全場景泊車、激光雷達的選配,也能讓傳感器成本更優(yōu)化。
在傳感器方面,HP570標配了2個前視+4個側(cè)視+1后視+4魚眼共11個相機,以及1個前毫米波雷達、12個超聲波雷達,還支持可選配1-2顆激光雷達。
據(jù)悉,HP570采用毫末深度優(yōu)化的多源感知BEV和占用網(wǎng)絡(luò)技術(shù),可實現(xiàn) 360度規(guī)則世界和非規(guī)則世界的無死角感知。目前,HP570已完成整體架構(gòu)設(shè)計開發(fā),各技術(shù)模塊還處于功能驗證階段。
“性價比”和“省錢”——
這是張凱主題發(fā)言時提及最多的兩個詞,在他看來,毫末智行非常清楚智駕產(chǎn)品在高速場景下,高精地圖使用的時機和技巧。在此基礎(chǔ)上,依據(jù)使用場景,毫末也對系統(tǒng)進行了深度優(yōu)化和技術(shù)升級,對硬件的能力進行極致的挖掘和壓榨,擺脫對高精地圖的依賴,從而為客戶節(jié)省了一大筆成本。
同時,毫末的HP170也是目前業(yè)內(nèi)唯一一個有能力將高速無圖NOH系統(tǒng)壓縮到一顆MCU上的智駕系統(tǒng)。
“這次,要把極致性價比打出來!”
三款智駕產(chǎn)品,價格分別打到3000元級、5000元級、8000元級的低位,一邊是把價格打下來,另一邊是把性能打了上去。未來一年,毫末將圍繞這條主線,和競爭對手分食智駕賽道的誘人蛋糕。
02
200天
DriveGPT再進化
過去一年,公司CEO顧維灝頻繁提及數(shù)據(jù)驅(qū)動的自動駕駛3.0時代,大模型將重塑汽車智能化的技術(shù)路線。最大的幾個特征,是中大模型與海量數(shù)據(jù)相結(jié)合,數(shù)據(jù)開啟自訓(xùn)練模式,自動駕駛里程由硬件驅(qū)動、軟件驅(qū)動時代的百萬乃至千萬公里,飆升到1億公里。
上海車展前夕,毫末推出全球首個自動駕駛生成式大模型DriveGPT雪湖·海若,讓業(yè)界看到大模型落地應(yīng)用在車端的另一種可能,AI領(lǐng)域炙手可熱的GPT,終于可以用在自動駕駛領(lǐng)域了。
半年已過。
這家公司依舊憑借著超凡速度,讓DriveGPT持續(xù)進化,在昨日的AI DAY現(xiàn)場,顧維灝也對外公布了圍繞這一技術(shù)領(lǐng)域的最新進展。
- 截止到2023月10月,毫末數(shù)據(jù)智能體系MANA的學(xué)習(xí)時長超過103萬小時。乘用車用戶輔助駕駛行駛里程已經(jīng)接近9000萬公里,正在向1億公里邁進,搭載毫末高階智駕的車型已經(jīng)落地歐盟。
- 隨著毫末產(chǎn)品落地規(guī)模的不斷增長,毫末智駕數(shù)據(jù)迎來爆發(fā)式增長,將預(yù)計在2023年正式邁入自動駕駛3.0時代所標定的1億公里的智駕里程規(guī)模。這也意味著,毫末的數(shù)據(jù)閉環(huán)能力與產(chǎn)品迭代能力形成正向加速閉環(huán)。
顧維灝再次提及自動駕駛3.0。
在他看來,大模型、大數(shù)據(jù)、大算力,成為自動駕駛公司邁入3.0時代的關(guān)鍵標志。從一開始,毫末團隊就在為自動駕駛3.0時代作準備,在感知、認知、智算中心的建設(shè)上,毫末都是按照數(shù)據(jù)驅(qū)動的方式建設(shè)的,目前在數(shù)據(jù)積累上,即將實現(xiàn)一億公里智能駕駛行駛里程的目標,同時MANA OASIS已經(jīng)具備處理更大規(guī)模數(shù)據(jù)的能力——
目前已然準備就緒。
據(jù)悉,DriveGPT在MANA OASIS雪湖·綠洲智算中心已經(jīng)訓(xùn)練了超過100億幀互聯(lián)網(wǎng)圖片數(shù)據(jù)集,480萬包含人駕行為的自動駕駛4D Clips,以及8700萬公里的訓(xùn)練里程。
DriveGPT,究竟如何發(fā)力?
兩個方向,感知大模型和認知大模型。
在感知大模型方向,毫末通過對實現(xiàn)真實物理世界的學(xué)習(xí),將真實世界建模到三維空間再加上時序的4D向量空間中。在構(gòu)建對真實物理世界的4D感知基礎(chǔ)上,毫末也進一步引入圖文多模態(tài)大模型,來完成4D向量空間到語義空間的對齊,實現(xiàn)跟人類一樣的萬物識別能力,公司稱之為自動駕駛語義感知大模型。
而在認知階段,基于語義感知大模型的萬物識別能力,通過構(gòu)建駕駛語言來描述駕駛環(huán)境和駕駛意圖,再結(jié)合導(dǎo)航引導(dǎo)信息、以及自車歷史動作,借助大語言模型的海量知識來輔助給出駕駛決策。
最終,毫末把感知大模型與認知大模型對接,進行端到端訓(xùn)練,構(gòu)建了毫末自動駕駛大模型DriveGPT。
顧維灝介紹了DriveGPT下的七大實踐:
即駕駛場景理解、駕駛場景標注、駕駛場景生成、駕駛場景遷移、駕駛行為解釋、駕駛環(huán)境預(yù)測與車端模型開發(fā),正是這些實踐,讓毫末對自動駕駛的開發(fā),徹底進入了一個和之前完全不同的模式里。
例如,如何更高效的篩選數(shù)據(jù)。
解決一個自動駕駛的Corner Case,必須準備一批跟這個Corner Case相關(guān)數(shù)據(jù)。傳統(tǒng)的方式,是采用標簽加人工的方式,從高達百億的數(shù)據(jù)中篩選出幾萬個有效數(shù)據(jù),成本非常高、效率非常低。
毫末則在通用感知大模型的加持下,利用圖文多模態(tài)模型的視覺編碼器,對收集到的海量駕駛數(shù)據(jù)進行目標級別和全圖級別的特征提取,變成圖片表征向量,并對這些海量的向量數(shù)據(jù)建立向量數(shù)據(jù)庫,實現(xiàn)秒級搜索。
開發(fā)工程師只需要用自然語言的方式,表達自己對場景圖片的需求,毫末利用圖文多模態(tài)模型的文本編碼器,對于輸入的任意搜索文本提取特征變成文本向量,再通過向量搜索去搜索剛才建立的向量數(shù)據(jù)庫,即可從百億級別的向量數(shù)據(jù)庫中找到該文本對應(yīng)的駕駛場景數(shù)據(jù)。
再如,怎樣更高效的標注數(shù)據(jù)。
篩選出一批數(shù)據(jù)之后,傳統(tǒng)的開發(fā)模式,是將這批數(shù)據(jù)送給標注公司,進行人工標注,效率低、成本高、周期長。
毫末的做法,是將閉集自動標注升級為開集(Open-set)場景中進行Zero-Shot的自動標注,這是一個標注能力上的飛躍,因為通過這樣的方式,任意物體都可以被標注了。
借助大語言模型的能力,毫末實現(xiàn)了在開集場景中Zero-Shot的快速精準的自動標注。
整個過程,可分為多模態(tài)模型蒸餾、大語言模型輔助、視覺語言特征交互三個部分。多模態(tài)模型蒸餾用于增強自動標注模型對語義、時空、顏色等的基礎(chǔ)感知能力,大語言模型輔助用于提供開放詞句的表征能力,視覺語言特征交互進行跨模態(tài)特征增強和感知,最終完成Zero-Shot的自動標注。
03
“四大戰(zhàn)役”
即將收官
快——
這是業(yè)界對毫末智行的普遍評價。要知道,即使是特斯拉這樣的頭部公司,往往也是一年才“卷”一次科技日或品牌日,毫末團隊不一樣,他們把科技發(fā)布會的頻次提升到每季度一次,且似乎每次都能講出用高密度信息,吊足業(yè)界胃口。
顧維灝也特意回顧了毫末過去歷次AI DAY上的技術(shù)觀點和重大發(fā)布,既展現(xiàn)了毫末一以貫之的技術(shù)思考,也通過這樣的方式,在傳播上再次亮劍,凸顯團隊自我迭代的速度之快。
就拿今年來說——
1月的第七屆AI DAY,毫末建成了自動駕駛智算中心MANA OASIS雪湖·綠洲,并同時發(fā)布了五大自動駕駛感知和認知領(lǐng)域的大模型,首次將GPT技術(shù)思路引入到自動駕駛認知決策領(lǐng)域。
4月的第八屆AI DAY,正式推出行業(yè)首個自動駕駛生成式大模型DriveGPT雪湖·海若,首先實現(xiàn)對自動駕駛認知決策模型的持續(xù)優(yōu)化,同時也在將多個感知大模型的訓(xùn)練納入到DriveGPT統(tǒng)一的架構(gòu)中,目標是實現(xiàn)端到端自動駕駛。
昨日的第九屆AI DAY,剛好是DriveGPT發(fā)布的第200天,我們看到,這家科技公司更加堅定自己的技術(shù)路線了,即通過統(tǒng)一的DriveGPT大模型架構(gòu)來整合通用感知和通用認知能力,讓自動駕駛實現(xiàn)一次技術(shù)范式的躍遷。
“命運的齒輪開始轉(zhuǎn)動?!?/p>
用顧維灝的話說,公司里的這群人,依舊固執(zhí)地相信技術(shù),他們想親手創(chuàng)造自動駕駛的未來。
有意思的是,這一屆AI DAy恰逢2023年進入第四季度的收官階段,年初立下的四大戰(zhàn)役,作為公司CEO的顧維灝也忍不住在現(xiàn)場“曬出”最新的成績單。
第一場,智能駕駛裝機量的王者之戰(zhàn)。
據(jù)悉,毫末智能駕駛用戶行駛的總里程已經(jīng)突破8700萬公里,搭載毫末HPilot智駕產(chǎn)品的車型也已經(jīng)達到20款以上,其中,山海炮HEV、新摩卡是最新搭載了毫末HPilot產(chǎn)品的車型。
第二場,MANA大模型的巔峰之戰(zhàn)。
今年4月,毫末率先發(fā)布了行業(yè)內(nèi)首個自動駕駛生成式大模型DriveGPT雪湖·海若。在過去200天左右的時間里,DriveGPT依托8700萬公里輔助駕駛量產(chǎn)數(shù)據(jù),累積480萬段Clips高質(zhì)量標注數(shù)據(jù),僅是在自動化標注方面,DriveGPT能幫助生態(tài)伙伴提效90%以上。
第三場,城市NOH的百城大戰(zhàn)。
目前,搭載城市NOH導(dǎo)航輔助駕駛功能的毫末HP550平臺,首款量產(chǎn)車型將落地在魏牌藍山上,將會在明年一季度正式量產(chǎn)上市
第四場,末端物流自動配送的商業(yè)化之戰(zhàn)。
在末端物流自動配送的商業(yè)場景方面,毫末的小魔駝產(chǎn)品已經(jīng)在商超履約、快遞接駁、校園配送、智慧社區(qū)等9大場景開啟了常態(tài)運營。
其中,在商超履約和快遞接駁上,毫末聯(lián)手物美多點、達達快送等合作伙伴,已經(jīng)實現(xiàn)可持續(xù)的正向盈利模式,這也是目前全球首個L4自動駕駛產(chǎn)品單店經(jīng)營實現(xiàn)盈利的商業(yè)化案例,從而打通了末端物流自動配送的最終商業(yè)閉環(huán)。
2023年慢慢走向尾聲,毫末的四場戰(zhàn)役也看到勝利的曙光。不過,按照毫末自己的估算,城市NOA將在2024年占比會達到40%,2025年或?qū)⒏哌_70%,高階智駕產(chǎn)品市場在未來兩年將迎來全面爆發(fā),新的更艱難的戰(zhàn)役,恐怕還在后面。
來源:第一電動網(wǎng)
作者:NE時代
本文地址:http://m.155ck.com/kol/211393
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。