自去年ChatGPT發布之后,大模型的熱度居高不下。國內企業迅速跟進,前有百度文心一言、阿里通義千問,后有訊飛星火,加上商湯、騰訊等多家企業,共同開啟“百模大戰”。
一場場的發布會向公眾展示大模型在各個領域的應用前景,開啟了一場人工智能的狂歡。而對于汽車領域,眾廠商發揮巧思,在智能座艙、自動駕駛等方向似乎都有大模型應用的廣闊天地。
“AI研發的一個終極目標是我們希望設計一個算法,并使它能像人一樣去思考。ChatGPT向人們證明,這并不是不切實際的想象,AI大模型也許會在未來融入到社會的各個行業場景,驅動產業的變革,經濟的增長,將會帶來新的一場工業革命。”在由蓋世汽車主辦的“人工智能——大模型時代下的智能汽車技術研討會”上,NVIDIA工程和解決方案技術總監路川如是說到。
NVIDIA工程和解決方案技術總監路川;圖片來源:蓋世汽車
大模型的火熱,無疑也給予汽車產業玩家極大的想象空間,但是每一種新興事物的出現,總是伴隨著擁躉與爭議,大模型同樣如此。但也有一批批先行者前赴后繼,想要在這團還不太明朗的迷霧中,探索一條通往終局的大道。
大模型重塑智能汽車體驗
就汽車行業和大模型的關系,大模型可以在自動駕駛、座艙智能化、人車傳感器互聯、工廠數字化等層面產生價值。從功能層面來看,目前AI大模型在汽車上主要有兩種落地形式。
其中一類與智能駕駛有關,自動駕駛的進程,因為大模型又生波瀾。ChatGPT的出現帶給自動駕駛行業很大啟示,這種通過對海量多模態數據的大規模自監督學習,加之預訓練+微調的方式,讓AI得以完成各種復雜自然語言任務。自動駕駛,被認為是下一個可能實現突破的領域。
對此,汽車產業界迅速反應。今年4月,毫末智行發布了自動駕駛生成式大模型DriveGPT,通過引入駕駛數據建立RLHF技術,對自動駕駛認知決策模型進行持續優化,終極目標是實現端到端自動駕駛。
6月20日,理想汽車也公布了其智能駕駛最新進展,稱理想AD Max 3.0進入大模型時代,當月內將向北京和上海的內測用戶交付不依賴高精地圖的城市NOA功能,下半年將向用戶開放通勤NOA功能。該功能核心是采用了BEV大模型。
AI大模型或賦予自動駕駛更快速、準確地解決認知和決策問題的能力,或在標注、仿真、視頻信息處理等多方面存在應用空間。如通過大模型優化數據標注,可以降低人工標注比例和成本,以及提升虛擬訓練環境的真實性,優化虛擬訓練數據等。
對于大模型上車,還有一類是用于人工智能對話交流,大多數應用在智能座艙。比如此前發布的百度的文心一言,已有東風日產、紅旗、長城以及吉利銀河等近十家車企宣布接入;阿里巴巴也宣布AliOS智能汽車操作系統已接入通義千問大模型進行測試等。
在研討會上,商湯絕影智能車艙產品創新高級總監邵昌旭分享到,未來的智能座艙將成為有溫度,能夠更加懂你出行的管家,能夠全方位的感知和理解乘客的需求。
商湯絕影智能車艙產品創新高級總監邵昌旭;圖片來源:蓋世汽車
通過大模型賦能,智能汽車更具“情感”,以真正向第三生活空間轉變,滿足乘客更深層次的生理和心理需求。值得注意的是,現在如百度的文心大模型,再或者吉利AI大模型,其在智能座艙領域最核心的應用均是在語音等交互場景,短期內可能會出現同質化的隱憂。
當然,在大模型時代,智能座艙可進化的空間遠不止于此。
今天的智能座艙,本質上在功能層面并不是一個AI問題,而是用產品經理去定義座艙中的各個場景。“大模型時代的一個典型特征就是好像每一個問題都可以變成AI問題。”長城汽車智能化研發總監楊繼峰說到。
長城汽車智能化研發總監楊繼峰;圖片來源:蓋世汽車
AI問題的核心是如何讓機器模擬人類的智能思維和行為。大模型時代,有機會把座艙變成一個AI問題。如自動駕駛一般,其本質是車如人一樣駕駛,對于智能座艙,則是駕乘空間如何更加的“擬人”。智能座艙需要從如今的形態走向智能空間形態。
基于這種思考,若將用戶歷史使用習慣和車內外的當前環境狀態等信息,輸入給座艙的認知大模型,再利用各種生態應用或交互方式等方式來表現,以實現智能座艙的體驗躍升。
現在智能空間會成為一個跟自動駕駛體量差不多的AI問題。Coding、閱讀、知識搜索和推送……所有的業務重構會變成一個一個的AI問題。這帶來了一個全新的挑戰,“我們沒有準備好。”楊繼峰說到。
大模型這筆賬,該怎么算
楊繼峰認為大模型突然爆發的本質原因是LLM提供了一個能力和泛化能力足夠強的模型基座,和一系列可以SFT、可以對齊、plug-in,以及可以重訓、可以輕量化的工程范式。
落到具體的實現層面,如大模型在智能座艙方面的應用,挑戰伴隨著變化出現。如可能面臨需要去挖掘各個不同的維度上所有的感知數據;在座艙里需要建立從來沒有建立過的針對于算法的數據閉環體系等。
高合汽車前期智能產品與技術規劃負責人黃駿認為,大語言模型、多模態檢測模型和神經輻射場建模NeRF是比較可能落地的座艙大模型。其中,多模態檢測模型的重要性愈發突出,能大幅削減檢測模型標注成本。而利用擴散網絡生成的SR場景能大幅降低座艙計算負載。
高合汽車前期智能產品與技術規劃負責人黃駿;圖片來源:蓋世汽車
但從大模型開發的視角來看,今天還處在技術競爭的前期階段,模型如何做到足夠大能力足夠強,形成強的競爭力是本質問題。站在企業角度,如何讓大模型盡快進入產品工程賽道和降成本周期,以快速進行大規模應用,才是本質要求。
這是一個持續深化的過程。
一方面,大模型的成熟是一個循序漸進的過程。火山引擎汽車行業總經理楊立偉表示,大模型的成熟應該是厚積薄發的,新技術滿足舊需求,舊技術滿足新需求,而非用新技術做新場景。信息數據是制約大模型持續訓練的主要因素。
火山引擎汽車行業總經理楊立偉;圖片來源:蓋世汽車
他認為,在ChatGPT4.0出現之前,最大的大模型就是人的大腦,應將外部大模型和內部大模型結合起來,找尋可落地的場景。當人或機器某一方犯錯時,能通過人和機器共同決策,以最終結果來做出靠譜的決策。
在廣泛的應用場景里,大模型遠不如人類思考能力,需要通過Transformer模型、多模態的數據、規劃訓練端平臺對大模型進行打磨訓練,讓其得以處理更復雜的事情。
路川認為,要做好大模型,需要滿足以下幾個點:
第一點是基于Transformer的模型結構;第二點是需要用到更多的數據,或者是用一些多模態的數據,去訓練大模型的業務,以滿足一些復雜業務場景的需求;第三是計算平臺層面的支撐,大模型的訓練需要強大的算力資源,傳統的計算模式已經很難滿足,在訓練端用集群的方式去構建一個分布式的系統,對于大模型來說是必須的,這樣才能有一個比較好的訓練速度,快速迭代,讓大模型應用在真實的業務場景中成為可能。
從成本的方面考量,大模型帶來的訓練、推理、數據等方面的成本飆升是不得不考慮的問題,以及對算法、芯片算力等方面的要求持續高漲。
楊繼峰指出,從算力形態角度大規模分布式推理平臺的形態和能力也還需要一些時間,同時下一代的專用芯片、GPU、通信問題也都在路上。
針對這些問題,業界持續思考解決方案。黃駿表示,座艙智能化帶來的算力缺乏問題要求跨域融合或大算力芯片。考慮到汽車行業的計算業務規模相對較小,嵌入式NPU集成于設備中,可分擔GPU的部分工作,提供更高計算性能的同時降低功耗。嵌入式NPU的AI開發利用NPU加速AI應用,能大幅降低硬件成本,將成為OEM在AI業務投資和單車收效中關鍵的一環。
此外,使用大模型還小模型這筆賬該怎么算?大模型的企業嘗試著用更大參數量的模型解決更多的問題。而主機廠傾向于用更小的模型去解決特定的問題,并且以更低的工程成本去實現應用。
路川提到,如智能駕駛是一個非常復雜的場景,把一些業務通過一個通用的模型進行融合,讓大模型成為車載大腦提供完善的智能服務,是未來探索的一個方向,也是未來大模型一個可能應用的領域。
中科創達物聯網事業群副總裁楊新輝預測,下一個時代可能將圍繞于汽車產業和機器人產業的融合,而汽車正處于機器人和汽車機器人之間的過渡階段。未來的大模型可能在混合方面發生變化,一是在云端和邊端組合的層面,二是在大模型和小模型混合的層面。
中科創達物聯網事業群副總裁楊新輝;圖片來源:蓋世汽車
真正的挑戰是深入到汽車產業各個層面的。
“我們在同時面臨著的模型層面的爆發、工程層面的爆發、應用層面的爆發、生態層面的爆發、產業層面的爆發,而我們在研發結構調整和組織能力調整上好像還有很長的路要走。”楊繼峰感嘆。
大模型深入賦能汽車產業并非可以一蹴而就,這需要相關企業持續創新、與時俱進,也需要整體的汽車產業鏈做好迎接變革的準備。
激進與謹慎,蓄勢待發的產業鏈
大模型時代,新的商業模式正在出現。
無論是自動駕駛還是智能座艙,現在大模型上車更多的是比較淺層的應用,離真正的給汽車帶來翻天覆地的變化,或許還有一段距離。更直觀的感受是,整個汽車產業鏈正在做好迎接大模型的準備。
站在車企的角度,楊繼峰指出,傳統的汽車產業鏈結構已發生改變,跨領域鏈接和合作已是常態。車企需要在全新的時代找尋自己的定位,而不是基于所有業務進行AI轉型。
不止車企,大模型帶來生態的廣泛鏈接,基于不同的分工,每一個企業都將會是大模型的共建者。
商湯絕影基于“駕、艙、云”三位一體的發展戰略,通過大模型向自動駕駛和智能座艙提供賦能,實現駕艙一體和人機共駕等駕乘體驗。邵昌旭介紹,商湯提出在大模型時代的解決方案,打造了全新智能座艙架構:車端和云端為底層支撐,智能車艙大腦為核心,不同風格的定制化數字人交互呈現各類智能應用,實現座艙如人一般的智能。
面對大模型時代對于整車操作系統的新要求,中科創達打造了“滴水OS”整車操作系統,賦能大模型上車。楊新輝說到,大模型可能會成為操作系統中不可或缺的組成部分,并在很大程度上改變操作系統的形態。
據悉,該操作系統能夠滿足智能駕駛在功能安全方面的需求,以及具備動態自發、異構融合等優勢,并集成創達魔方基礎大模型,可實現多模態交互與反饋、全局智能決策支持等功能,以此提升智能駕駛和座艙體驗。
而對于核心的算力和平臺支撐,路川透露,從數據集構建、分布式集群訓練平臺搭建到客戶端應用優化和部署,NVIDIA能為基礎薄弱的公司提供大模型快速構建整合方案。NVIDIA有一整套完善的工具鏈,可以高效地幫助客戶快速構建數據集。針對分布式訓練平臺,NVIDIA擁有NeMo Megatron框架, SuperPOD參考架構,可以更好地支撐客戶針對大模型的分布式訓練任務的需求等。
“NVIDIA在很久之前就開始認識到AI對算力的需求是飛速增長的,并開始構建GPU集群用于內部的研發,應用測試,從中不斷地積累相關經驗,并輸出給行業客戶,大模型時代的到來,更多的客戶可以依托NVIDIA技術積累,快速構建自己的分布式訓練平臺,可以應用NVIDIA提供的端到端的技術方案,快速具備大模型的能力。”路川說到。
實際上能夠完整構建基礎大模型的一定是少數企業,居高不下的成本和技術壁壘是難以翻越的一座高山。在此之上,更多行業前沿玩家,基于對行業的理解和掌握的行業數據,構建更貼合實際場景的行業大模型。除此之外,還有在基礎大模型和行業大模型之上,開發AI應用的企業。
楊立偉表示,由于每個大模型都有自己的側重點,重要的是如何建設好大模型平臺,滿足不同客戶的需求。
6月28日,火山引擎發布大模型服務平臺“火山方舟”,面向企業提供模型精調、評測、推理等全方位的平臺服務(MaaS,即Model-as-a-Service)。楊立偉提到,MaaS平臺具備的低成本、費用低、能以一定的測試標準針對不同場景輸入結果,在短期內是最有價值的平臺。火山引擎憑借在工具和數據兩個層面的優勢,能幫助車企進行數據治理。
以上只是產業鏈的一角縮影。
模型時代是一個模型研究、工程研究 、計算研究、數據研究、產品形態、商業形態、產業生態、法規倫理同時爆發的時代。這給各個參與方帶來思考,如何建立大模型時代的組織架構、研發體系、基礎設施等。
楊繼峰坦言,大語言模型并不是無所不能,不是所有知識的表達形式都是語言,同樣也不是把所有的業務問題用LLM的范式解決都是最優解。“但不管怎么樣,當我們開始用大模型的范式思考業務轉型,用AI思維對待流程、對待數據、對待評價、甚至是對待生產力和生產關系的時候,就真正來到了一個大模型世界。”
或許接下來,產業內將面臨一場空前激烈的競爭,大模型的上車之路也將在這個過程中,持續進化,行至終點,而今天,才只是開始。
來源:蓋世汽車
作者:青檸
本文地址:http://m.155ck.com/news/shichang/208379
以上內容轉載自蓋世汽車,目的在于傳播更多信息,如有侵僅請聯系admin#d1ev.com(#替換成@)刪除,轉載內容并不代表第一電動網(m.155ck.com)立場。
文中圖片源自互聯網,如有侵權請聯系admin#d1ev.com(#替換成@)刪除。