7月22日,馬斯克在推特上宣布,x.AI由10萬張H100組成AI訓練集群上線,這是全世界目前最強的AI訓練集群。
光是這10萬張卡本身,就需要40億美元的資本投入,再加上驚人的電耗、散熱管理以及卡間通信的成本。
到2024年,AI公司進入第一梯隊的門票可能進一步提升到10萬張卡這個量級。
AI公司的突圍成本,正變得越發巨高無比。
在智能駕駛領域,特斯拉的純視覺智駕獨樹一幟,國內也只有極越等少數汽車品牌能夠跟進,超高的算力、數據、算法門檻決定了純視覺只能是「少數玩家的游戲」。
激光雷達的核心原理是運用回波時間測量法,繪制出周邊物體的點云,激光點云包含的信息精度高,但信息的維度有限。
純視覺則類似于人眼,其獲取的信息十分豐富,并且車端的成本更低。但采用純攝像頭作為數據輸入,距離識別,尤其是縱向距離的精度提高非常困難。同時,攝像頭的輸入也容易受到光照等環境影響,在逆光、大雪遮擋的情況下會造成辨識困難。
就連特斯拉的前AI高級總監Andrej Karpathy早些時候也在演講時表示:「純視覺能夠精準感知深度、速度、加速度信息,實現純視覺是一件困難的事情,需要大量的數據?!?/p>
好在,隨著AI技術的發展,基于人工智能框架和大模型,純視覺方法對三維環境的識別能力已有大幅提升。
不過,相應的代價,是這套流程需要強大的算力。
前文提到,建立一個10萬卡的AI訓練集群,光買下這10萬卡的集群,就需要40億美元的投入。
而從能耗角度,10萬張H100的功耗是150MW(兆瓦)。作為對比,目前最大的國家超級計算機El Capitan只需要30MW的功率。
更何況,這些AI集群之間通過光通信連接,距離越遠,光通信的成本也越高。
這也是為什么,特斯拉不僅部署了超級算力中心,還于去年正式投產了特斯拉的Dojo,后者是特斯拉自研的超級計算機。
據公開數據,特斯拉每個Dojo都集成了120個訓練模塊,內置3000個D1芯片,擁有超過100萬個訓練節點,算力達到1.1EFLOP(每秒千萬億次浮點運算)。
特斯拉基于自研芯片的算力集群,一個ExaPod 1.1 EFLOPS
此外,特斯拉預計,2024年10月特斯拉的算力總規模將達到100 Exa Flops ,相當于30萬塊英偉達A100顯卡的算力總和。
今年3月,特斯拉推出FSD V12更新,整個系統中端到端的算法幾乎全部采用神經網絡構建,靈活度非常高、應變能力強,并能以高度擬人化的狀態駕駛。
但光有算力就夠了嗎?顯然不是。純視覺技術路線的主要「成本」,除了算力之外,還包括算法和數據。
視覺算法需要海量的數據進行訓練。算力可以砸錢堆砌,但算法和數據,卻很難坐等「拿來主義」。因此,純視覺方案,對于追趕者具有極高的門檻。
而在國內造車新勢力中,背靠百度的能力,由集度主導智能化研發的極越01在純視覺智能駕駛的路線中走在市場前列。
在談到為什么要押注純視覺方案時,集度(極越)汽車CEO夏一平曾表示:因為這是最為類似人類駕駛的方案,人眼看到的圖像和視頻包含了大量的場景信息,機器也可以從圖像中獲得最為豐富的信息,通過這些信息,機器只要能夠識別圖像中的相關語義,就可以做出準確的判斷,并且覆蓋范圍更廣。
而更深層次的原因,其實也包括純視覺方案相對激光雷達方案對硬件要求低,對AI能力要求高,因此,只要AI算法一直升級,它的智駕能力就能一直升級,智駕系統就能越來越像人類老司機,能自主理性決策,更人性化,所以它的上限更高。
這也是為什么夏一平會喊出「五年內不過時」的內在邏輯。
「這樣的技術路線選擇,其實是為了將來能夠讓智駕能夠更加快速普及,做的一個非常大的決定?!?/p>
極越其采用的純視覺方案,以自動駕駛視覺大模型VTA(Vision Takes All)為底座,大幅升級包括動靜態檢測、時序跟蹤、實時建圖、場景理解等能力。
硬件上,由集度主導智能化研發的極越01全系則配置了大算力智駕芯片,搭載2顆OrinX,除此之外,還有百度為其智駕訓練提供的2.2 EFlops的云端算力。事實上,基于百度Apollo純視覺高階智駕能力和安全體系賦能,極越完成了OCC占用網絡升級。
去年10月,極越在國內第一個用了BEV+Transformer的純視覺方案,而后在今年1月又是國內第一個應用了OCC占用網絡技術,形成了“BEV+OCC+Transformer”純視覺方案的“完全體”。
其中,OCC占用網絡這個技術的原理是感知攝像頭將周邊環境的物體3D化,將物體識別為網絡中的一個個“體素”,感知系統只要對網絡體素是否被占用進行識別,這樣就能對3D物理空間的可通行區域進行高保真度還原。
依托這套比激光雷達點云分辨率更高的三維結構信息,OCC占用網絡還能減少漏檢、誤檢并彌補視覺所不具備的空間高度信息,突破能力上限和提升安全保障的同時,完全替代了激光雷達,大幅提升了泛化能力。
由此,在搭載了OCC占用網絡技術后,極越能夠實現障礙物精細刻畫,3D精度可以做到厘米級,輕松比肩激光雷達精度。
過去一段時間,坊間習慣性將純視覺路線視為車企的降本之舉。誠然,對比激光雷達的硬件成本,純視覺方案的確要「 省錢」不少,但其實,藏在純視覺方案背后的軟件成本,卻要大幅高于激光雷達方案。
對車企而言,只要愿意掏錢,激光雷達方案可以輕松上車。但純視覺方案卻不行。
而極越的優勢,來自于百度的技術賦能。在純視覺智能駕駛相關的技術指標上,百度在算力、算法、數據這三個關鍵領域都有著深厚積累。
首先是算力,百度已為智能駕駛在建立了超過2.2 EFLOPS高算力訓練集群。
其次是算法,百度Apollo擁有10多年的L4級自動駕駛技術研發積累。
而國內其他車企的應用方案目前都是L2級,雖然都在發力L3級乃至更高級別的自動駕駛的研發工作,但相比已搭建起L4級別自動駕駛大模型、并成熟落地應用的百度而言,技術差距是顯而易見的。
最后是數據方面,百度Apollo的自動駕駛里程已經超過1億公里,未發生過重大傷亡事故,這些都是高質量的L4級別自動駕駛數據積累。同時,通過蘿卜快跑、極越汽車等品牌,百度還在持續迭代數據規模。
目前,百度不僅擁有海量L4級別高質量實際行駛數據,還形成數據資產管理、自動化數據產線等一系列的體系化能力。目前國內其他車企也還做不到這樣的數據能力。
而這些百度所獨有的技術優勢,無疑將毫無保留地在極越品牌身上得到體現。
作為全球領先的AI大模型公司,也是自動駕駛技術領軍企業,百度擁有10余年L4級自動駕駛技術研發和創新應用經驗。同時,百度Apollo已形成海量的數據資產管理,建立了百億參數的視覺大模型、高標準的自動化標注產線、超過2.2 EFLOPS高算力訓練集群,為AI算法升級提供持續動力,同時賦能極越和蘿卜快跑的智駕能力高速迭代。
正是在百度智駕能力的加持下,極越汽車的智駕表現才站在了第一梯隊,比肩特斯拉,成為中國純視覺智駕方案的領跑者。
值得一提的是,國內不少車企都從今年開始跟進布局純視覺智駕的路線,包括小鵬汽車今年的新車,以及蔚來子品牌樂道在內。
隨著極越以及特斯拉這兩家領航者的持續推動,未來不排除越來越多的車企會加碼純視覺的陣營
來源:第一電動網
作者:HiEV
本文地址:http://m.155ck.com/kol/239554
文中圖片源自互聯網,如有侵權請聯系admin#d1ev.com(#替換成@)刪除。