上周的 WAIC 2025,最大的體驗就是無序的科技狂歡,卻帶著「萬物皆可 Agent、到處都是機(jī)器人」的秩序感。
尤其是智能座艙領(lǐng)域的 Agent,其激烈程度與隔壁宇樹的機(jī)器人擂臺賽不相上下。
智能座艙作為 AI 的落地超級場景,已經(jīng)火過兩輪。
第一輪是由于國產(chǎn)游戲出圈,各家車企紛紛上車《黑神話》,當(dāng)時智駕座艙考驗的是 CPU 算力、存儲和散熱。
第二輪是由于 Deepseek 爆火,各大車企又紛紛接入了 DS、豆包等國內(nèi)主流的語言大模型。
前兩輪都是外界技術(shù)和內(nèi)容引發(fā)的被動式智能座艙的變化,但一山更有一山高。
在 WAIC 還是能看到新鮮玩意的,第三輪主動式的智能座艙變革,就發(fā)生在這里。
在 WAIC 上,千里科技展出了新奇的「蛋艙」,形狀酷似鵝蛋,搭載著千里科技和吉利汽車、階躍星辰共同打造的下一代智能座艙 Agent OS(預(yù)覽版)。
Agent OS 的「主動性」在于它是圍繞 Agent(可采取行動的系統(tǒng))展開的。如果說 AGI 發(fā)展分五個階段,那么 Agent OS 就是智艙界的 L3,它代表著你的座艙里將會有一個擁有可以像人一樣采取行動的智能體。
這就是千里科技首個公開的座艙產(chǎn)品。
這家公司以硬核的資源所為人關(guān)注,由曠視科技創(chuàng)始人印奇、前華為車 BU 總裁王軍領(lǐng)銜,而背后吉利集團(tuán)更其提供了強(qiáng)大資源優(yōu)勢。
用很硬的資源做智艙這樣「很軟」的產(chǎn)品,需要巧勁兒。當(dāng)我進(jìn)入蛋艙,仔細(xì)研究了一遍之后,我才真正理解為何 Agent OS 決定了未來 5 年內(nèi)的智艙浪潮。
在里面我看到了千里科技的思路:超級模型+超級場景=下一代智能座艙。
01、智能座艙發(fā)展四大階段,情緒價值才是終點
千里科技智艙產(chǎn)品設(shè)計負(fù)責(zé)人賈秀江是千里科技座艙業(yè)務(wù)的悍將,曾經(jīng)操刀多家車企的座艙及整車產(chǎn)品設(shè)計,作為一名老兵,他對整個汽車座艙的發(fā)展歷史了然于掌。
2010—2015 年第一階段:智能中控時代,硬件驅(qū)動座艙升級。
這個階段的核心思維是把車內(nèi)的按鈕轉(zhuǎn)變成屏幕,衡量車智能化程度的標(biāo)準(zhǔn)就是屏幕大小和屏幕數(shù)量。
一方面是把分鍵替換成屏幕。
最典型的就是當(dāng)時的奔馳 S 級,為了凸顯豪華旗艦定位,其高配車型就采用了兩塊 12.3 英寸的高分辨率顯示屏,主打「屏幕化」。
另一方面就是汽車開始在二排提供屏幕,2015 款的奔馳 S 級就提供了二排選裝屏幕。
這一階段的屏幕不是為了智能,而是一種設(shè)計語言。當(dāng)時整個汽車座艙還沒有誕生出中控屏的概念,即便是奔馳 S 級的座艙屏幕也是主駕屏幕的延伸,屏幕此時只是為了更方便為主駕清楚地展示信息。
2015—2020 年第二階段:屏幕+語音,帶來基本的情感鏈接。
新能源汽車崛起,汽車大電池足以支持大量屏幕能耗,車企也從屏幕展示信息的思路轉(zhuǎn)換到了屏幕連接用戶,此時,座艙屏幕加上了語音助手。
這股風(fēng)最早是新勢力帶來的,比如蔚來 NOMI,就是語音+IP 形象的具象化,語音既方便操作,同時也讓人和車有了情感鏈接。
當(dāng)時行業(yè)還有一種更加顛覆式的思路,即汽車電子電氣架構(gòu) SOA 化。
傳統(tǒng)電子電氣架構(gòu)網(wǎng)絡(luò)信號和物理層綁定,功能開發(fā)耗時長,座艙 OTA 難度大,而且由于硬件接口、通信矩陣都不統(tǒng)一所以和功能開發(fā)限制多,無法規(guī)模化開發(fā)。而 SOA 就可以顯示軟硬解耦,提升開發(fā)效率。
基于通信行業(yè)摸爬滾打的敏銳度,華為是當(dāng)時少數(shù)比較早開始 SOA 化的玩家,這也使得其智艙和智駕產(chǎn)品 OTA 節(jié)奏可以達(dá)到周更、月更水準(zhǔn)。
2020 年—2025 年第三階段:智能座艙的功能性時代。
隨著智能輔助駕駛的規(guī)模和成熟度上升,逐步解放用戶雙手之后,就需要逐步解決用戶注意力。
很大程度上智駕和智艙是共生關(guān)系。
在 L2 階段,車輛「人機(jī)共駕」,座艙功能核心是「配合駕駛」,要搞定的是導(dǎo)航地圖渲染、定位等。
在這個階段語音可以實現(xiàn)對車輛的基本控制,講究的是座艙要具備基本的控制及娛樂功能。
痛點在于,控制功能需要用戶輸出非常具體、精確的操作指令,娛樂生態(tài)也非常有限。以導(dǎo)航為例,每一次都需要念出具體的位置才能實現(xiàn)導(dǎo)航。
2025 年之后第四階段:「人車合一」智艙成為第三生活空間。
輔助駕駛變成智能智駕之后,下一代智艙也隨之而變,其內(nèi)核在于「人車合一」,即人的思維與車的思維合為一體。
但在此之前行業(yè)需要解決此前智能座艙缺乏情感和記憶的問題。
由于座艙缺失對用戶的長期記憶,用戶的重復(fù)性動作很多。以及由于缺乏感情和個性,座艙很難真正理解用戶需求。
L3 級智駕呼喚下一代智能座艙。
當(dāng)智駕即將進(jìn)入 L3 階段,就需要座艙玩家提前思考一個問題——用戶的注意力和精力被極大解放之后,座艙需要什么能力?
答案就是提供實用價值+情緒價值,將座艙打造成第三空間。
02、大模型不是下一代座艙的通行證
千里科技 Agent OS,完整展示了下一代座艙的兩個重要變化,
其一,大模型并非下一代座艙的通行證,而是多模態(tài)。
前者強(qiáng)調(diào)的是模型的規(guī)模和數(shù)據(jù)量,后者重點在于處理融合不同形式的信息,將文本、圖像、音視頻以及傳感器的數(shù)據(jù)融合一起,為智能體采取行動打基礎(chǔ)。
座艙就是多模態(tài)模型最大的用武之地,千里科技 Agent OS 車端采用的是階躍星辰 40 億參數(shù)的多模態(tài)大模型,云端則是國內(nèi)首個千億參數(shù)端到端語音大模型 Step-Audio 底層模型。
其二,座艙從功能轉(zhuǎn)向了技能。
功能是單一、獨立的功能操作,但技能在于多個功能互相協(xié)同,座艙能操作更復(fù)雜的任務(wù)。
千里科技 Agent OS 完整地展示了下一代智能座艙具備的技能點。
第一個技能點是車內(nèi)/外的理解能力。
Agent OS 可以將車內(nèi)外的一切場景通過視覺輸入,再用自然語言輸出,可以識別并理解車內(nèi)用戶所有的動作,這也意味著 Agent OS 可以通過用戶動作來預(yù)估用戶需求,不再受限于被動聽命令,而是根據(jù)用戶行為來主動做決策和動作。
第二個技能點是全融合地圖的人機(jī)共駕,Agent OS 具備 2D 及 3D 車道級導(dǎo)航融合。
在車機(jī)進(jìn)入目的地導(dǎo)航頁面后,導(dǎo)航會自動從 2D 切換成 3D 效果,現(xiàn)實世界里的紅綠燈、大樓、車輛等都會立體呈現(xiàn)在畫面中,效果有種玩極品飛車的賽車感,提升了用戶的駕駛感受。
第三個技能點是具備融合記憶能力。
Agent OS 擁有一整套全場景化、自我訓(xùn)練成長的記憶系統(tǒng)。
以導(dǎo)航為例,用戶可以告訴語音助手「導(dǎo)航上次吃過的餐廳」,系統(tǒng)就能自動調(diào)取到上一次用戶去過的餐廳,這極大減少了用戶的重復(fù)動作。
第四個技能點是提供完整的應(yīng)用生態(tài)。
上一代座艙系統(tǒng)要添加 APP,就必須與應(yīng)用方打通底層服務(wù)。比如,理想最新版本座艙系統(tǒng)理想同學(xué)可以點星巴克、喜茶,但是如果換成其他品牌就需要由車企再和對應(yīng)企業(yè)去對接,這背后是大量的時間等待和資源消耗。
Agent OS 首先能實現(xiàn)「應(yīng)用數(shù)量自由」。Agent OS 的底層邏輯是人能操作的 APP,車機(jī)都能操作可以搭載所有公版軟件,與平時手機(jī) APP 無異。
其次實現(xiàn)了「應(yīng)用操作自由」,用語音就能操作抖音上下滑視頻、搜索視頻等等。區(qū)別是,傳統(tǒng)座艙是用底層協(xié)議打通軟件,但 Agent OS 用模擬物理行為來控制 APP 操作。
未來,智艙的終極形態(tài)可能就是不需要再安裝任何 APP,而是以隱藏的模式進(jìn)行操作,整個過程都會隱藏,直到需要確認(rèn)才顯示給用戶看。
第五個技能點是有情感的智能體,智能體相比于普通的語音助手,具備情商和性格特征,能夠根據(jù)用戶的偏好和習(xí)慣,自主代替用戶完成各項操作。
Agent OS 針對女性、家庭、孩童等創(chuàng)建了 5 個智能體,比如大米是女性議題和娛樂八卦的好手,哪吒主要是用來陪小孩,還有外教 David,不僅能練習(xí)英語,甚至可以幫助孩子定制英語課程。
現(xiàn)在,座艙領(lǐng)域已經(jīng)不流行比較「誰的模型參數(shù)最大」,大家更關(guān)心模型能不能幫自己干點正經(jīng)事、提供情緒價值。
這些智能體更像是第三空間里的個人生活助手,他們像人一樣有偏好和個性,提供實用功能及情緒價值。
說白了,情緒價值才是座艙比拼的終點。
過去的語音助手是「造出來的」,但是 Agent OS 作為下一代座艙給我們的啟發(fā)是,真正的 Agent 是結(jié)合用戶的偏好和習(xí)慣「長出來的」,Agent OS 可以結(jié)合用戶習(xí)慣和需求創(chuàng)造自己的智能體。
賈秀江告訴汽車之心,目前汽車同質(zhì)化的程度很高,在動力、尺寸、外觀都有趨同跡象,但座艙的情緒價值會是差異化競爭的出口。
座艙是否具備記憶能力和情緒價值,這將是新舊座艙時代的分水嶺。
03、成立半年,何以定義下一代座艙
作為千里科技這樣一家進(jìn)軍科技業(yè)務(wù)板塊尚不足一年的公司,在短時間內(nèi)就發(fā)布了下一代智能座艙,且還在迅速推進(jìn)落地。這確實給業(yè)界帶來了一些小小的震撼。
定義下一代座艙需要是基建能力,其中兩個難點就是端云一體和協(xié)作問題。
端云一體涉及了多模態(tài)數(shù)據(jù)的融合和同步、端云算力與資源動態(tài)分配以及如何確保低時延和高可靠通信的難題。
功能協(xié)作也是一大挑戰(zhàn),賈秀江舉了個例子,用戶簡單一句「幫我點一份上周吃過的湖南菜,價格 40 元左右,要我到家的時候送到門口。」
這句話需要調(diào)用的能力就包括預(yù)估用戶開車時長、預(yù)估外賣送達(dá)時間、提供價格方案和支付能力、導(dǎo)航記憶能力,至少 5 種以上的功能協(xié)同。
千里科技能夠率先落地 Agent AI 是因為,這并不是一家單純的創(chuàng)業(yè)公司,而是「老炮新灶」。
不僅是因為有印奇、王軍這種領(lǐng)軍人物坐鎮(zhèn)。在座艙領(lǐng)域,千里科技同樣有非常成熟的老炮團(tuán)隊。
目前千里科技的座艙團(tuán)隊核心成員都交付過新勢力完整的座艙項目,這支團(tuán)隊的工程化經(jīng)驗豐富,產(chǎn)品設(shè)計邏輯更加成熟。
其二,進(jìn)軍科技業(yè)務(wù)的千里科技,身上也有創(chuàng)業(yè)公司起新灶的特質(zhì),沒有太多的歷史負(fù)擔(dān)。
反而由于聚集了行業(yè)老炮能打開身手,解開座艙底層的條條框框。Agent OS 的實現(xiàn)靠的是在應(yīng)用之下做重構(gòu),「歸零」讓千里科技有了從地基開始建設(shè)的契機(jī),反而能讓樓建得更高。
其三,在于千里科技與階躍星辰的深度合作關(guān)系。
外界可能低估千里與階躍的合作關(guān)系。其實千里科技成立之初就釋放過信號,今年 2 月,吉利汽車集團(tuán)、千里科技、階躍星辰聯(lián)合宣布,三方將深化技術(shù)合作伙伴關(guān)系,共同推動「AI+車」的深度融合。
借用印奇對于超自然人機(jī)交互的誕生」的闡述,要實現(xiàn)這個目標(biāo)就要以階躍星辰多模態(tài)大模型為基礎(chǔ),千里自研的 AI Agent 技術(shù)棧為手段,最終把汽車變成 AI 時代「移動終端」。
而千里座艙業(yè)務(wù)合作的階躍星辰,是目前大模型公司中多模態(tài)能力最強(qiáng)的一家。
成立兩年,階躍共發(fā)布了 22 款自研基座模型,其中有 16 款是多模態(tài)模型,占比超 7 成,階躍也因此在行業(yè)內(nèi)被稱為「多模態(tài)卷王」。
在 WAIC,階躍也發(fā)布了 Step 3,把推理效率卷到 DeepSeek 的 3 倍,其模型甚至在高反光環(huán)境下仍能讀取菜單上的菜名和價格。
這也意味著千里的智能座艙的底層模型能力,也會隨著階躍的模型成長而成倍增長。
一個智艙老炮玩家+多模態(tài)卷王的組合,千里科技可能是今后智艙領(lǐng)域一位不容低估的對手。
來源:第一電動網(wǎng)
作者:汽車之心
本文地址:http://m.155ck.com/kol/272048
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。