讓元戎CEO周光感到非常興奮的是,在市場如此艱難的情況下,元戎拿到了一筆巨大的融資,并且這是一筆非政府的資金,而是來自產業鏈。這證明了元戎的技術實力得到了行業認可。
按照周光的說法,自動駕駛技術發展至今,經過了3個比較大的階段,前融合,“無圖”城市NOA,端到端,而這些,元戎都是最早在國內提出來并且付諸行動的。
元戎能夠拿到頭部主機廠的輸血,很大程度上得益于其在技術路線上的激進策略。今天的智駕技術正在逐步趨于收斂。元戎的判斷是否正確?與整個行業對比,元戎的技術又處于怎樣的水平?
目前整個行業提得最多的就是端到端架構,主流方式有3種:一種是分段式,這是大部分車企采取的思路;另一種是交集式,智駕系統包含3個網絡,感知、規控和安全規則,但彼此之間相互有交集,代表車企是小鵬、華為;另一個是一段式網絡,代表車企是元戎和Momenta。(至少在公開宣傳資料里,只有這兩家的傳播口徑是一段式端到端)
按照元戎的說法,它的一段式端到端架構已經上車,目前正在預研VLA模型,即Vision Language Action Model,視覺語言動作模型,屬于端到端2.0版本,是周光于2024年9月30日汽車百人會GIV上正式提出。元戎啟行的VLA系統可以連接視覺、語言、動作,能識別和描述道路環境、交通標志、道路參與者等,理解交通場景中復雜的交互事件、隱藏的語義信息和邏輯推理,即便碰到罕見路標跟邊緣場景,系統也能輕松應對。
元戎的VLA有三個優勢。
1、VLA采用多模態訓練,除了視頻數據訓練,元戎還引入了語言模態訓練、行為模態訓練。VLA模型可以通過預訓練的方式,從大量的未批注數據中進行訓練,學習語料的通用特征,擁有更多常識。
2、VLA還具有場景理解能力,能通過語音、文字(Language)形式對自己的駕駛行為和推理進行描述。技術人員可以了解系統的決策邏輯,就可以更快地訓練它們。決策過程透明了,也更容易建立大家對智駕的信心和信任。
3、另一個就是泛化能力。因為加入了視覺、語言和動作的多模態模型,VLA模型可提高模型的泛化能力和判斷推理能力。不僅限于汽車,未來,VLA還能移植到機器人等更多載體上。
基于這一套技術,元戎構建了“一體兩翼”的商業邏輯,具體解釋為,一個AI系統,兩條商業化落地路徑。其實就是輔助駕駛和Robotaxi用同一套技術,然后通過數據積累的方式不斷迭代系統能力。
行文到此,接下來有意思的部分就來了。下面有3個爆點:
首先是技術的先進性。元戎認為目前VLA是最先進的技術架構。
VLA這個名字很熟悉有沒有?
沒錯,和理想今年一直在提的VLM很像,但二者并不是一回事。周光舉了一個例子,“VLM+端到端”其實是兩個人在車里,新手學員和教練。端到端就是學員,而教練就是所謂的VLM帶著新手學員開車,告訴你怎么走,實際的駕駛員還是新手學員。而VLA的邏輯是直接拿掉學員,讓教練自己開。
周光認為,VLM是一個落后的架構,完全比不上VLA。因為純視覺的端到端(VLM)缺乏可解釋性,無法解釋駕駛決策邏輯。碰到潮汐車道、限行時段等罕見路標/邊緣場景難以用常識理解讀懂,這種情況下很難推理出好的駕駛決策。這是元戎做VLA的原因。
有意思的是,理想自己也認可這個說法。根據《36氪汽車》報道,理想人士表示:“可以把VLA看成是端到端+VLM的合體。”而且據說包括理想在內的很多車企也在秘密研發VLA架構。
第二,元戎在技術策略和商業理念上與特斯拉完全相同。繼侯曉迪,樓天城等技術大咖質疑特斯拉Robotaxi之后,元戎是首個也是目前唯一一個在技術理念上公開站隊特斯拉的企業。
首先,馬斯克一直在強調通過數據來提升自動駕駛能力;其次,特斯拉希望用一套技術來實現輔助駕駛和Robotaxi,把輔助駕駛的FSD放在Robotaxi上。
這和元戎提到的“數據驅動,Robotaxi同源”的理念一致。
重點來了,侯曉迪,樓天城等人的觀點剛好相反。樓天城認為Robotaxi并不是無腦堆數據,數據達到了一定上限對系統反而是累贅;而且樓天城也不認為用輔助駕駛思路做得了Robotaxi。他認為自動駕駛的唯一解是世界模型。
來看看周光是如何反駁的,他認為必須要用AI的方式去做Robotaxi,而不是這種基于模塊化的、基于地圖劃個區域去做。2018年,全世界首個Robotaxi運營,到今天為止,Robotaxi全球的運營面積可能就是千平方公里,周光認為這種運營沒有價值,元戎的運營模式沒有區域限制。
大佬爭論,看客吃瓜,有點意思。
第三,承接上文,今年初周光在中國電動汽車百人會上diss L4,引發了不少關注,被外界稱之為耿直boy。
在最近的溝通會上,周光再次對這個問題進行了解釋。周光認為,元戎目前在進行的Robotaxi并不是L4,完全是兩回事。L4更多的是一種技術路徑的探索,而Robotaxi是一種商業模式的探索,二者并不是一回事。
由于Waymo等企業的引導,大家都把Robotaxi等同于L4。事實上,Waymo確實在以L4的方式做Robotaxi,但Robotaxi卻不止L4一種方式,也可以通過元戎所謂的AI方式來做。
周光說明年元戎會把最新的VLA的技術帶上車,也就是基于Thor的DeepRoute IO(也有消息說Thor并沒有準備就緒)。按照周光的說法,這套系統上來以后城區智駕才能真正達到好用的狀態,現在大家都是嘴炮。預計2024年底,至少會有三款搭載元戎啟行智能駕駛系統的車輛進入消費者市場。同時,元戎啟行也在積極推進與多家主流車企的十余款智能汽車的量產合作。智能駕駛大潮將至,元戎打出了創業5年來的蓄力一擊。