《流浪地球2》里出現的智能量子計算機550W,是“MOSS”,某種意義上說也算BOSS。
如果切換到當時當下的智能電動車市場,車機語音助手是否也能成為類似存在,對答如流又充滿思考性,尚有懸念。但或許,這并不妨礙行業為之持續探索。
2月6日,魅族“FlymeAuto主理人計劃”發布第四期議題——更聰明的語音手應該怎樣?有評論直接建議“做一個手機版MOSS”。
從2022年11月18日起,“FlymeAuto主理人計劃”徐徐展開,從智能座艙和手機的N種連接方式,手機和智能座艙如何協同才能稱之為最佳拍檔,下車后的便捷操控,到今天這個語音助手相關話題,無一不透露出魅族對車載OS的思考。
FlymeAuto是魅族手機操作系統Flyme在智能座艙上的延續,根據魅族規劃,FlymeAuto將建立人與人、人與物、物與物之間的互聯互通,最終實現多終端、全場景、沉浸式融合體驗。
不過截至目前,FlymeAuto還沒有公開任何實質性進展。
結合魅族做過手機的經歷,語音助手可能要比之前幾期議題更具討論性。比如,更新到9.3版本的Aicy(前身小溪)可能即將迎來新的OTA升級。至于包含了語音、識屏、縱覽、影像和建議的Aicy在車端會有怎樣的變化,仍是個未知數。
蓋世汽車研究院的數據顯示,2022年前8個月里,語音交互功能在座艙的滲透率已經達到73.3%,僅次于中控屏的89.1%。同時近三年里,語音交互功能滲透率不斷提升,現已成為汽車標配之一。
但從大約十年前車機語音助手面世以來,其受到的爭議就沒有間斷過。如今已是成熟年紀,卻基本都還是小孩子。
語音助手最初目的是解放駕駛員和乘客的雙手,利用語音喚醒開啟或者關閉各種功能。事實上,市面上大多數語音助手產品還處于“發育不成熟”階段。“不配合”的情況也時有發生。
比如去年上市的理想L9首度在后排娛樂屏上應用了3D ToF手勢交互,而非語音助手,但由于技術欠佳,一度受到詬病。不過在之后的L7、L8新車型上,理想依然堅持選用了車內手勢控制。
相較早期的觸控方式,語音和手勢交互一定程度上有助于駕駛員集中注意力,降低事故發生風險。和手勢相比,語音交互的學習成本要更低一些。只是某些場景或者對于聽力不佳的駕駛員來說,手勢也的確有其優勢所在。
而語音和手勢若想徹底取代機械和觸控交互,前提條件一定是,機器反應足夠迅速且失誤率低。至于全自動駕駛目標的實現,容錯率則是零。
以車機語音交互為例,ASR(包含信號輸入、降噪以及音素選取等流程)、NLP(包含NLU與NLG,涉及詞性標注與文本信息處理)、TTS(包含語音的后端拼接合成,同時也是語音擬人化核心環節)等構構成三個關鍵環節,同時也是當前行業發展仍需重點突破的技術模塊。
另外,擺在“魅族們”面前的,始終還有一個問題:如何讓語音助手更智能,擁有更擬人且連貫的溝通能力。有觀點認為,語音助手也可以從ChatGPT的走紅中借鑒經驗。
行業有毫末智行借鑒其中的人類反饋強化學習RLHF的訓練方式,得到人駕自監督認知大模型。大概思路是,先從模型入手得到一個獎勵模型(reward model),讓其知道什么是好的開法,什么是不好的,以及哪些行為需要改進,從而訓練出更高質量的算法模型。
“萬物皆可ChatGPT”。從這個角度看,AI語音助手的算法模型或許也能從中受益,創造更接近真人的互動對話。
圖片來源:魅族社區
再者,在差異化、定制化被著重強調的時代背景下,語音助手不僅要變聰明,還要有辨識度,以打造不可替代的產品標簽。
在已有的車機語音助手基礎上,支持自定義喚醒詞、開發更有吸引力的虛擬形象、人聲,升級離線語音包等等。顯然,“魅族們”可以做的事實在太多。最新消息是,魅族在申請注冊“無界汽車”商標后,又將目光投到了“無界手機”上,國際分類是科學儀器。
魅族要做的事似乎很多,但最好別丟了西瓜撿芝麻。
來源:蓋世汽車
作者:徐珊珊
本文地址:http://m.155ck.com/news/qiye/195317
以上內容轉載自蓋世汽車,目的在于傳播更多信息,如有侵僅請聯系admin#d1ev.com(#替換成@)刪除,轉載內容并不代表第一電動網(m.155ck.com)立場。
文中圖片源自互聯網,如有侵權請聯系admin#d1ev.com(#替換成@)刪除。