一個觀察,智駕走不走 VLA 路線業(yè)界還沒有共識,但對世界模型這種訓練方式,頭部玩家達成了一致。
今年上半年,華為乾崑、小鵬、理想等玩家都采用了世界模型作為云端訓練方式。所謂世界模型,就相當于在智駕系統(tǒng)的云端大腦里搭建了「虛擬沙盤」,能動態(tài)模擬周圍車、人、路以及周邊環(huán)境的狀態(tài)。
一個能給智駕「開副本」的世界模型,被看作 L2+躍入 L3 的關鍵跳板。
但能不能把世界模型的功能發(fā)揮到極致,得看根基。華為乾崑進入到了智能汽車的「雙百萬」階段:搭載華為乾崑智駕的車輛超過 100 萬輛、華為乾崑的激光雷達發(fā)貨量超過 100 萬部。
話說明白點,融合了世界模型的華為乾崑智駕 ADS 4,殺傷范圍更大。
8 月底,汽車之心搶先體驗了 ADS 4 的更新。在超過 2 個小時的上海核心城區(qū)的深度智駕體驗中,我們發(fā)現(xiàn)了 ADS 4 最大的提升——徹底區(qū)分了「接管率」和「智駕完結(jié)率」。
媒體測評角度的「接管率」,和用戶真實使用智駕的場景截然不同。
媒體測評雖然專業(yè)細致,但往往會留給智駕更多時間,等待它決策。用戶視角才是試金石,一旦智駕稍微不滿足預期,就會接管,過一會打開再用。這也導致大量用戶的城區(qū)智駕體驗都是「不連續(xù)的」。
這不是用戶的問題,而是智駕不好用的問題。華為乾崑智駕 ADS 4 最大的進步就是,復雜城區(qū)內(nèi)用戶的智駕完結(jié)率趨近于 100%。
這背后是 ADS 4 大版本更新采用了 WEWA 的技術架構(gòu)。WE 即云端的世界引擎,讓 AI 訓練 AI,WA 即車端的世界行為模型,相當于在車端生成多能專家,給人更安心的駕駛體驗。
如果沒有意外,WEWA 將會成為華為乾崑沖擊 L4,甚至 L5 的技術架構(gòu)。
華為乾崑智駕 ADS 4 采用 WEWA 架構(gòu),也打響了一場無比殘酷的資源賽,為行業(yè)明確了三個賽點:
其一,仿真數(shù)據(jù)會成為主流。背后的仿真能力涉及到 AI 資源,甚至是推理卡的數(shù)量競爭。
其二,智駕競爭中后期,模型數(shù)據(jù)越積累越多,沉沒成本越來越大,越發(fā)考驗技術堅定性。
其三,用戶視角的「智駕完結(jié)率」,將會代替媒體視角的「接管率」。
以上三個賽點說的其實是一件事:一家公司必須找到不隨意改變、能支撐其走到終局的技術價值觀。
01、世界模型,為端到端「解渴」
智駕領域曾經(jīng)出現(xiàn)過三個進化階段。
第一個階段就是規(guī)則時代,類似于人類進化歷史中的「猿人」階段。
規(guī)則時代純粹是手敲代碼,寫出車輛通行的規(guī)則和邏輯。
最典型的就是 if 路口紅燈、then 車輛停,if 路口綠燈、then 車輛前進。路上的障礙物,更是千奇百怪。即便工程師已經(jīng)將各種大型車輛輸入白名單,但如果路上出現(xiàn)一個環(huán)衛(wèi)工人推著四個輪子的垃圾桶。
一個移動垃圾桶,閣下又該如何應對?
在規(guī)則時代,工程師們在寫一本永遠寫不完的交通法典,就像猿人在森林中艱難生存,處處碰壁之后才能清楚生存法則。
直到第二個階段,進入端到端時代。
這就像智人時代,人類開始廣泛學會使用工具。在端到端階段,智駕玩家開始琢磨用統(tǒng)一的 AI 模型將傳感器數(shù)據(jù)映射為車輛的控制指令。
一層提升在于重塑智駕系統(tǒng)的底層架構(gòu),減少了模塊之間的數(shù)據(jù)損失和傳輸時延。另一層在于體驗提升,一段式端到端可以讓系統(tǒng)模仿人類學習開車提升體驗。
但模仿人是有局限性的。過去一年,頭部智駕公司都在抱怨同一件事兒:智駕數(shù)據(jù)的質(zhì)量太差了。
有的公司要么花大價錢請來優(yōu)質(zhì)司機組建一支幾百人車隊,為系統(tǒng)收集數(shù)據(jù)。要么在海量用戶數(shù)據(jù)里研發(fā)一套系統(tǒng)精挑細選高質(zhì)量數(shù)據(jù),費時費力。
兩個方法都殊途同歸,費時、費力、費錢,效果一般。就像智人已經(jīng)學會了使用各種工具提高生存效率,可以適應環(huán)境,但遠遠無法改變環(huán)境,其中欠缺的就是對于環(huán)境和未來的想象力。
第三個階段到了世界模型,核心在于理解力和想象力。
所謂想象力,就是 AI 給系統(tǒng)打造了一個接近于真實的平行世界。
理解能力就是讓系統(tǒng)學一套百科全書:石頭是硬的、泡沫是軟的、雨天駕駛要注意防滑等等。
世界模型可以基于理解能力在推演「如果... 會...」的問題。如果右側(cè)車道的車靠得太近,車輛靠左行駛,會不會更安全一點?如果車輛加速通過遠離右側(cè)車,這樣的決策是不是更好?
世界模型就相當于云端訓練場,為智駕帶來了三個能力的提升:
第一重能力在于生成仿真數(shù)據(jù),解決了過去智駕數(shù)據(jù)稀缺的問題。
如果智駕只用真實駕駛數(shù)據(jù)訓練,千奇百怪的高難度場景,一年到頭都碰不到幾次。而世界模型一箭雙雕,不僅可以降本,而且能生成現(xiàn)實世界里很難收集到的場景數(shù)據(jù)。比如極端場景下的近距離加塞、施工前車急剎、鬼探頭等等。
第二重能力在于世界模型具備一定可解釋性與泛化性。
世界模型的決策過程不是依靠直覺,而是通過因果關系推理得出的。
世界模型融合了世界運轉(zhuǎn)的基本規(guī)律,依賴的是物理世界「第一性原理」,因此世界模型中系統(tǒng)的決策可以追溯和還原。這種可解釋性為智駕帶來更好的可控性。
第三重在仿真世界中訓練智駕,可以達到 AI 訓練 AI 的效果。
世界模型所構(gòu)建的沙盤,也是復雜的智駕試驗場。
智駕系統(tǒng)可以在同一個場景里反復測試不同參數(shù)下的智駕效果,在網(wǎng)絡環(huán)境中對車輛做獎懲制度,從而來提升模型性能。比如在復雜路口博弈場景中,人類司機無法一次性在現(xiàn)實場景中就作出最優(yōu)策略,但在世界模型里系統(tǒng)可以「無限重開」,直到得出最優(yōu)策略。
所以世界模型具備了兩個與人類認知機制一致的特征:理解、想象,但卻比人多了「重開」的能力——在數(shù)次反復訓練中,用最短時間找到最優(yōu)解策略。
這也是世界模型能從類人到超人的根本邏輯。
02、老師傅配合大專家,訓出 AI 老司機
盡管世界模型成為自動駕駛未來發(fā)展的「最大公約數(shù)」,但不是所有玩家都能走好這條路。
橫亙在世界模型面前的,還有兩道工程化難題:
其一,平行時空帶來的不真實性。現(xiàn)實交通并不是簡單的幾何建模,而是一場復雜的物理實驗,任何偏差如果未被世界模型捕捉到,都會被放大成系統(tǒng)誤判,最終在真實道路上穿幫。
其二,自由度過高帶來的不確定性。生成式 AI 一旦時長過長,AI 的幻覺詬病就會使得系統(tǒng)放飛自我,車輛如果在失真場景中訓練,就容易輸出脫離實際路況的危險控制指令。
華為乾崑沒有回避這兩個問題,而是通過一種精密的架構(gòu)設計給出答案。
在 WEWA 架構(gòu)上,云端與車端形成明確分工:
云端的 WE(World Engine,世界引擎)是 AI 訓練的基本盤,負責在虛擬世界里不斷淬煉駕駛智慧;
車端的 WA(World Action Model,世界行為模型)則是專為智能駕駛打造的一段式端到端架構(gòu),把云端學到的能力高效落地到真實道路。
WE 要完成兩件事:一是真實,二是可控。
關于真實,華為乾崑依托云端充沛的算力與自研仿真工具鏈,打造出平行時空的「微觀級」復刻,確保 AI 在虛擬世界學到的每一個制動動作,都能在現(xiàn)實中精準復現(xiàn)。
而在可控層面,WE 給 AI 安排了一套「地獄級通關副本」。借助擴散生成模型,系統(tǒng)能夠?qū)⒁粋€極端場景無限擴散成高質(zhì)量、高密度的難例場景數(shù)據(jù),包括鬼探頭、前車急剎、紅綠燈路口的混亂局面等,甚至可以把難例密度提高 1000 倍。
然后,讓 AI 通過「題海戰(zhàn)術」反復刷這些極端難題,把危險情境練到肌肉記憶。
在 ADS 4 體驗中,我們也實測了一把地獄場景,把車開進了上海逼仄的小巷,在違規(guī)臨停車占據(jù)部分單行道情況下,對向還遇到逆行電動車,放在日常,只有經(jīng)驗豐富的老司機才能從容應對,但 ADS 4 系統(tǒng)沒有任何猶豫,直接做到了絲滑避障。
而 WE 的另一層優(yōu)勢在于打通 L3。當很多車企還卡在 L3 路測關口時,華為乾崑已經(jīng)在世界模型里先行點亮了綠燈。
截至 2025 年 4 月,華為乾崑在世界引擎中完成了超過 6 億公里的高速 L3 仿真驗證。
也可以理解為,WE 相當于是一個 AI 老師傅,給 AI 不斷進行高強度訓練。此外,老師傅還在通過嚴厲的獎懲機制對違背物理規(guī)律的決策實時糾錯,始終教導 AI 安全優(yōu)先。這就相當于,AI 刷完題還得考試,知道丟分點在哪,才能不斷往滿分的標準靠攏。
而 WA 的使命很簡單:牢記師傅教的本領,在真實道路上完美執(zhí)行。
和行業(yè)里常見的「改造版」不同,很多輔助駕駛系統(tǒng)都是拿通用大模型改一改再上車,結(jié)果模型笨重,時延高,車端運行吃力。而 WA 是從零開始為智能駕駛打造的「原生基模型」,一出生就是為開車而生。
它能同時處理視覺、聽覺、觸覺等多種傳感器信息,把這些復雜的感知數(shù)據(jù)「翻譯」成統(tǒng)一的語言,再交給模型去理解和決策。
在架構(gòu)上,WA 采用了 MoE(多專家模型)。不同場景交給不同「專家」處理。比如遇到復雜路口,就由路口專家出手;在高速上突遇障礙,就交給避險專家來應對。
這樣的機制讓車輛既能精準下達控車指令,又能提前幾步預判其他車輛的動作。比如,當前方來車時,系統(tǒng)預判,按照當前速度會遇到博弈情況,于是選擇向左變道,保證行駛的效率與舒適性。
云端的「老師傅」和車端的「多能專家」形成合力,讓系統(tǒng)逐漸成長為懂得人類價值觀的老司機。數(shù)據(jù)層面,相比 ADS 3,在 ADS 4 加持下,系統(tǒng)端到端時延縮短了 50%,車輛反應更快、變道更順滑;無效變道明顯減少,整體通行效率提升 20%;具備了「預見式駕駛」能力,緊急重剎率下降 30%。
而這樣的智駕能力,才能跳出媒體視角下「接管率」的單一評價體系,直接接受用戶視角中「智駕完結(jié)率」的實際檢驗。
相當于,ADS 4 并非在媒體的反復測試中勉強達成任務,而是能讓用戶真正產(chǎn)生信任并愿意高頻使用,而這才是智駕產(chǎn)品的核心價值所在。
03、流水的技術浪潮,鐵打的華為乾崑 ADS
如果說過去十年的智能駕駛賽道是一場馬拉松,那么華為乾崑幾乎是唯一一個既能在技術上不斷「加速」,又能在安全性上始終「剎得住」的選手。
回顧華為乾崑 ADS 的進化脈絡,可以看到 ADS 走得極其穩(wěn)健,并且每一步都踩在用戶真實需求的鼓點上。
ADS 1 :城區(qū) NCA 功能率先商用,將智能駕駛從高速限定區(qū)域推向城市街道;
ADS 2 :實現(xiàn)「無圖+全國都能開」,并首發(fā)全向主動安全功能,徹底解決了「地圖畫不到的地方就開不了」的尷尬;
ADS 3 :不再滿足于「全國都能開」,而是「全國都好開」,并推出「車位到車位」,補上最后一公里的體驗短板;
ADS 4 :推開 L3 大門,帶來 WEWA 世界模型這套「技術內(nèi)功」,更用 CAS 4.0 全維防碰撞系統(tǒng),把安全防護網(wǎng)織得更密。
這條路徑始終貫穿著華為乾崑的攻守之道。
攻的一面,華為乾崑智駕 ADS 沒有過分糾纏在算力、芯片、傳感器的參數(shù)軍備競賽里,而是把技術力轉(zhuǎn)化為實實在在的場景拓展。
華為車 BU CEO 靳玉志最近在采 訪中表示,今年 ADS 4 將具備高速 L3 的試點商用能力及城區(qū) L4 測試能力,希望在法規(guī)允許的情況下,明年具備高速 L3 能力以及城區(qū) L4 試點能力。
守的一面,華為乾崑智駕,已累計避免可碰撞次數(shù)超過了 271 萬次。
現(xiàn)在,全向安全跨越到全維安全層面,相當于進一步給系統(tǒng)增加安全保險杠。
比如在全天候場景中,將防護范疇拓展至霧塵天、雪天等復雜氣象條件,并著重考量不同路面材質(zhì)的附著力差異;在全場景覆蓋層面,除常規(guī)的巡航、泊車場景外,進一步納入爆胎、駕駛員失能等極端突發(fā)情形,這相當于把潛在的風險漏洞都填補上。
一攻一守之間,華為乾崑智駕 ADS 充當了智能駕駛「指南針」的角色。
尤其當整個賽道被各種熱詞包圍:大模型、端到端、純視覺、千 TOPS 算力。華為乾崑智駕 ADS 沒有盲目跟從,而是始終保持著一種濃重的華為色彩,即高效、可靠、適用的技術價值觀。
正如在 VLA(視覺語言動作大模型)火爆之時,華為乾崑并未急于上車。
VLA 倚重語言模型作為「翻譯層」,強調(diào)文本推理和可解釋性,但在空間感知與物理推理上仍存在短板,這需要 VLA 玩家在語義解釋與強化學習上下更大功夫。
華為乾崑選擇 WEWA 這條路,是把空間感知與推理深度嵌進系統(tǒng)底層。車輛是在真實物理世界中行駛,它需要的是厘米級環(huán)境建模、實時推演與軌跡預測,這種對空間的系統(tǒng)級理解,讓 WEWA 在復雜場景中更從容、更可靠。
本質(zhì)上,華為乾崑走的是一條更務實、更回歸駕駛本質(zhì)的路。
現(xiàn)在,華為乾崑智駕搭載量正式突破 100 萬大關,覆蓋 28 款爆款車型,基于全新 WEWA 架構(gòu)的 ADS 4 也將在 9 月陸續(xù)推送。
華為乾崑很清楚,智能駕駛的價值,不在于跑分,而在于落地。用戶對酷炫的技術名詞并不感冒,只關心實在的安全感與落地體驗。
所以說,華為乾崑智駕 ADS 的技術演進史,本質(zhì)上是一部「智能駕駛價值覺醒史」。
那么 ADS 4 所帶來的,不僅是技術性能的升維,還在于為行業(yè)立下「技術要落地生根」的標桿。
來源:第一電動網(wǎng)
作者:汽車之心
本文地址:http://m.155ck.com/kol/274311
文中圖片源自互聯(lián)網(wǎng),如有侵權請聯(lián)系admin#d1ev.com(#替換成@)刪除。