2021年4月13日,由蓋世汽車、慕尼黑上海電子展聯合主辦的“2021中國汽車人機交互HMI創新大會”隆重召開。本次大會旨在聚集汽車HMI領域的杰出人才、UX/UI設計師以及前瞻規劃研究人員分享全方位汽車人機交互領域的創新理念、技術趨勢、行業焦點、現實挑戰及應用解決方案。會議期間,摩斯智聯產品與運營高級總監周陽霖發表了“智能時代下場景化HMI交互設計思考”的主題演講。
以下為演講實錄:
感謝主辦方的盛情邀請,我是摩斯智聯的周陽霖,今天我給大家帶來的分享題目是《智能時代下場景化HMI交互設計思考》。
在主題演講開始之前,我簡要為大家介紹一下摩斯智聯。
摩斯智聯科技有限公司是一汽-大眾與大眾中國合資成立、由一汽-大眾控股的、從事智能網聯產品研發的科技公司。公司自2019年4月落戶成都天府新區以來,目前正在承擔一汽-大眾多個智能網聯產品的研發工作。接下來,我們進入到演講的第一部分內容:智能時代的新挑戰。
今天人類社會已經邁入人工智能時代,在這個無比精彩的時代,我們面臨著怎樣的挑戰呢?
在回答這個問題之前,我們先簡要回顧一下人工智能的發展歷史。自1956年第一次提出“人工智能”概念以來,人工智能一共經歷了三次浪潮。當前,我們正處在開始于2007年的第三次人工智能浪潮中。那么回溯2007年,那一年發生了哪些事情,又給我們帶來了什么呢?
2007年1月9日蘋果公司發布了第一代iphone、2007年11月5日谷歌正式向外界展示安卓操作系統,同樣是2007年,比特幣開始研究數字貨幣和支付系統。學術界與產業界把2007年定義為移動互聯網和第三次人工智能浪潮的元年,這一年,人類正式跨入全球數字經濟。新經濟模式帶來了新的挑戰,讓我們一同看看這個新挑戰是什么?
三度普利策獎得主,托馬斯.弗里德曼用右邊這張圖為我們描繪了人類適應性與科技發展的關系,我們看到,數萬年以來人類的適應性一直在平穩地進化,但是自從2007年第三次人工智能浪潮興起,科技的發展呈現加速狀態,人類適應性與科技之間形成了越來越大的逆差,兩者的背離趨勢帶來了難以熨平的數字鴻溝,這就是智能時代下人類面臨的最大挑戰。面對新挑戰,我們怎么辦?
為什么是交互設計來回答智能時代的新挑戰呢?我們先來看看交互設計的發展歷史。
整個交互設計的發展分為四個階段:
1、前交互是交互設計的史前時代,此時沒有交互設計的概念。人們通常使用工業設計與人機工程去解決相關的問題,如按鍵、旋鈕。
2、伴隨著計算機技術的發展,人們完成了最初的交互設計定義。通過提供簡單易懂的圖形界面使計算機等數字產品能夠與人類交互。
3、實體交互,通過物理實體和物理環境,與數字信息進行交流互動的界面,這里的介質主要是物理層面的交流互動,如鼠標、觸屏。
4、智能交互,運用智能傳感設備與算法,通過語音、手勢、表情等自然交互方式,突破硬件界限,實現人與機器之間的交流與溝通。
通過回顧看到,交互設計發展是伴隨著科技發展衍生的介質改變而演進。
(動效切換)
因此,設計哲學家理查德.布坎南將交互設計定義為:通過產品的媒介(實體的、虛擬的、服務、甚至是系統)來策劃和支持人的行為。
通過交互設計的定義,我們會發現交互設計由傳統的對實物的設計轉換為對用戶行為的非物質設計;與此同時人與設備溝通的主題也從功能邏輯轉換為行為邏輯。
那功能邏輯與行為邏輯有什么不同之處呢?
那么功能邏輯與行為邏輯有何區別?交互設計之父阿蘭庫珀提到過一個比喻:想象有一架客機,客機有兩個艙門,左邊是飛行員的駕駛艙,右邊是乘客艙。
機組需要了解復雜狀況下的所有功能,應對各種突發局面;而乘客只想簡單渡過幾小時后安全舒適抵達目的地,雖然機組和乘客的目的地是相同的,但是涉及不同的是決策復雜度及復雜度背后的心智模型。機組與乘客可以喻指功能邏輯與行為邏輯,功能邏輯復雜強大,強調面面俱到;行為邏輯則在意降低認知成本,關注用戶易用愛用。
認知心理學將人類決策過程歸納為自主心智、算法心智和反省心智三種。對心智模型的充分了解可以幫助我們理解如何降低認知成本。
第一個問題,用戶的決策幾乎是無意識的,不需要消耗注意力,憑直覺做出反應;
第二個問題,用戶根據經驗,有意識的去分析解決,并且一次只能專注一個任務;
第三個問題,用戶無法直接做出決策,需要研究一定的規則、知識,尋求外界手段輔助決策過程。
這三類問題對應了自主心智、算法心智和反省心智
大腦最喜歡自主心智,它有最好的人類適應性
交互設計是通過對行為的設計,以更低認知資源消耗達成用戶目標的設計方法。
面對智能時代,交互設計著重關注人類適應性、讓人們以更輕松的心智模型應對復雜的科技變化,熨平巨大的數字鴻溝,從而回答了這個時代的挑戰。
接下來我們進入場景化HMI交互設計探索
一般而言交互設計一定是在具體場景下進行的,為何格外強調場景化,這就需要從交互設計五要素談起。
左圖是辛向陽博士提出的交互設計五要素。
為了便于理解,我們將交互五要素整合為右圖。
這里的主線是用戶采取什么樣的行為、利用什么樣的媒介與工具,在什么樣的場景下達成目的。
我們看到,用戶與用戶目的是相對固定,而行為因場景、媒介的改變而有所不同。
在智能座艙領域,因密閉性、復雜性與多樣性,場景因素顯得尤為突出。
實事求是的講,因人類活動的復雜性與多樣性,場景化分類遠不止以上幾種。
在智能座艙的交互設計探索過程中,我們發現需要特別關注這三個場景——駕駛場景、路況場景與乘員場景。前兩者關乎注意力,后者關乎用戶隱私。
為什么智能交互的時代需要特別關注注意力與隱私呢?這源于智能交互的特征?
多模態、主被動響應、擬人化與個性化是智能交互的3個重要特征。稍加思索就能發現,在不同的場景下,注意力與隱私對這幾個特征影響深遠。
比如說沒有人希望在商務出行的場景下暴露過多個人隱私。
接下來,我們談一下對這些特征的具體探索。
多模態交互設計的目的是幫助駕駛者降低認知載荷,改善人車交互體驗。
多模態設計實踐的核心在于注意力帶寬的最大節約與重新分配。
因此,與注意力密切相關的駕駛場景和路況場景就顯得格外重要。
尤其是在座艙內屏幕顯示權重日益增長的今天,顯示什么信息、如何顯示信息,成為無法回避的重點問題。
接下來,我們先從與顯示密切相關的視覺說起。
與互聯網、移動互聯網等領域已經存在較為統一、成熟的設計標準相比,車內屏幕的顯示規范仍在探索發展之中。
但是,共性的理論原則依然可以遵循。
接下來,我們看兩個視覺設計實踐。
PPI在150以上的液晶儀表與中控屏幕可以帶給用戶精致感,雙屏布局在124°雙眼視角之內可以讓用戶感到一目了然;這些都屬于視覺感知原則的實現;
再向細節深挖,我們發現這兩塊顯示屏上的視覺流動也有所不同。
(翻頁動畫)
左邊是液晶儀表遵循的古騰堡圖表模式;人類視覺流動從左上至右下,液晶儀表的設計中將重要信息按照這條動線排布,會讓用戶更快速的獲取信息。
右邊是中控屏遵循的是F模式和Z路徑,中控屏幕的設計把菜單集中在左側以提升視覺聚焦速度。
以上努力可以有效降低用戶認知成本,但駕駛者視線仍難免脫離路面。面對這種情況,讓我們進入AR-HUD探索。
AR-HUD的出現是為了幫助駕駛者減輕認知負荷,提高態勢感知能力。它秉持“少即是多”的設計原則,簡化信息層級,減輕視覺重量。
1、在信息布局上,根據米勒組塊理論與??硕?,AR-HUD所呈現的主要設計元素應保持在3個以內
2、在導航信息上,應用格式塔連續性法則,使用視覺重量較輕的藍色虛線,具備較好的用戶體驗。
3、在限速與速度信息方面,依據最小努力原則,限速信息使用圖標,速度使用文本數字。
接下來我們談談聽覺這個模態
這里和大家分享一下,聽覺交互設計中需要重視的兩個方面:語音技能設計和聲音情感化設計
在語音技能設計時,需要重視這三點:
1、關注語音的參數設置細節,比如語音終止超時一般是1.5秒,而當用戶開始念“手機號碼”時,可以將語音終止超時設置的長一些,甚至可以根據不同年齡段的用戶設置不同的語音終止超時。
2、常用表達提供的越多,意圖理解越準確,我們在設計探索中發現,意圖的常用表達下限是30條,上限當然越多越好。
3、有了豐富的技能,還要教會用戶怎么說,說什么,關于這點,不僅取決于產品設計,也是一項運營工作。
在聲音情感化方面,我們有如下探索發現:
1、在語調方面,30歲左右的女性,柔和、親切、干練的聲音,聽感最佳。
2、在語速方面,238-248的字數為舒適區間
3、在語句間停頓方面,0.3-0.4秒讓用戶感覺最為舒適的。
在我們把視覺和聽覺的單一模態做了詳盡分析以后,接下來探討基于不同模態組合的多模態交互設計。
我們將多模態交互分為兩大類——融合型多模態交互和遞進型多模態交互。
融合型多模態交互指的是多種模態同步協同工作,如聽覺+視覺方式。該形式通過對語音和唇語的融合分析,可以降低誤喚醒率。同時因視覺識別的引入,人們可以用手指、眼動進行更好的指代,如人們經常說的“這邊的空調風小一點,關上那邊的窗戶”
遞進型多模態交互指的是某一模態在前,另一模態在后。比如先監控到駕駛人疲勞,再釋放清新香氛。
進行多模態交互設計,必須要了解人類器官的五感能力
左圖是來自美國哈佛大學的研究,人的大腦通過五感接受外部信息的比例是不同的,我們看到視覺占比最高。右圖顯示的是人類對五感的大腦反應速度也是不等的,語音反應最快
多模交互需要多感官協同,這必然導致設計復雜化,那么如何管理這種復雜呢?
第一種方法是感官任務能力分析,我們將感官設計的任務類型分為五類。
在不同任務類型下,感官能力有不同的精度,利用這個框架找到最適合任務的模態通道或模態通道組合。但是,這種方法僅是一個定性的框架,對設計者經驗要求較高。下面我們介紹另外一種基于定量的方法。
第二種方法多模態平衡設計,通過VACP模型進行評估計算.
VACP模型是基于人們的視覺、聽覺、認知與運動構建的一個數據模型。每一個字母代表不同的通道,V代表是視覺、A代表聽覺、C代表認知、P代表運動,每一個通道中有0-7分,分數越高代表占用通道越高。
以分析開車場景為例,駕駛員需要通過視覺來判斷目前的方位,通過聽覺判斷后方是否有鳴笛,在通過認知分析前方交通標記,通過動作進行行車操作。根據這個分析可以充分利用占用級別低的通道進行方案設計。
通過這兩個方法可以幫助我們良好的管理客觀世界中的復雜場景。
簡單小節一下,多模態的交互是基于場景,基于人類生理適應性邊界的交互。
接下來我們進行主動響應式交互探索。
先來看看幾個主動響應交互的例子。
左圖,人們走向車輛,汽車以語音、燈光、全息影像、車外屏等形式來給我們來打招呼,這是迎賓場景
中圖,當檢測到我們情緒低落時,主動播放有趣的內容;這是心情場景
右圖,當監控到我們疲勞時,會發出蜂鳴,利用聽覺提醒刺激;這是安全場景
這些場景下的交互存在一個共性——即關懷;體現關懷的主動響應本質上是感知智能,基本對隱私脫敏,也是從業者比較易于發揮的方向。
然而,人工智能更大的舞臺是認知智能——即預測,精準的預測推薦需要用戶的個性化數據,而這類數據恰恰與隱私高度重合,完善個性化數據才是主動響應交互的深水區。
接下來我們看看如何完善個性化數據。
這是一個關于加油推薦的理想預測模型,梳理一下可以得知,在這個完美案例中,除了油量預警閥值,系統還要知道用戶品牌偏好、優惠偏好和時間靈活度。但實事求是的講,在初始訓練樣本有限、個性化數據積累困難的實際條件下,這樣的主動響應交互很難實現。
為此同濟大學的孫效華教授優化了預測模型,將矛盾聚焦在 “用戶使用習慣與行為偏好” 、“上下文語境”、“預測正誤反饋” 這三類信息獲取上。
(過場動效)
其主要思路為:通過多模態交互與擬人化交互,在保證低打擾性的前提下,避免用戶一次經歷過多交互流程,逐次引導積累用戶的偏好輸入。把每一次交互,當做人工智能學習的一次起點。
最后我們看一下擬人化與個性化探索
沒有人格的語音界面是不存在的,但是在考慮如何設計人格之前,首先要回答三個問題
1、你會讓用戶問系統自身相關的問題嗎 ?(例如:“你最喜歡的是什么顏色”)
2、你如何處理粗魯和粗俗的行為?
3、你介意打破用戶把VUI看作人類的幻想嗎?
認真對待這三個問題,一方面它支撐著人格設定的一些原則,更為重要的是,其背后不但有產品和公司目標,也存在道德和社會目標。
人物模型設計是擬人化交互的關鍵所在,一般說來分為助手型與伴侶型。助手型的特征是提供便捷高效的服務,伴侶型的特征是提供更多知心關懷。設計中選取哪個類型的擬人化隱喻,需要結合品牌調性、企業形象、產品定位來選擇,需要注意的是不同類型的人物模型,在對話腳本、語氣、語調、語速、停頓等方面都有明顯差異
VUI提供何種可視化反饋,是在設計探索中經常遇到的問題對于一個成功的語音交互而言,虛擬形象并不是一個必選項,亞馬遜、谷歌都使用了比較簡單抽象的圖形表達,抽象圖形同樣可以產生移情,提供視覺動效反饋。當然,也不是說虛擬角色一無是處,虛擬角色的引入會增強用戶的參與度,但凡事有兩面性,可視化形象的個性越鮮明,用戶反應也會越極端。此外虛擬角色的設計和開發需要投入大量精力,還得謹防掉進恐怖谷陷阱,因此要慎重。
個性化設計是我們本次探索的最后方向。個性化交互不再是所有人學習使用同一系統,而是系統學習不同用戶的需求。在智能汽車時代,用戶身份識別已成為基礎能力。因此,座艙環境、界面展示、交互邏輯、甚至語音語調都將展示出用戶的個性化特征。
回顧汽車誕生的一百多年來,個性化一直都是用戶需求,并引領設計趨勢。在智能時代隨著燈語、全息影像、車外屏、智能表面等技術的逐漸普及,越來越個性化的展示也正在實現。右側這兩個概念車,個性化所展示的是車輛與環境交互。人類正在進入自動駕駛的XMI設計時代。
XMI設計是HMI與EMI設計融合。對于下一代自動駕駛汽車,需要將駕駛狀態信息傳遞給環境,從而確保其他車輛和周圍的行人也可以對其作出恰當反應,此時整個交互過程就包含了XMI設計。XMI設計對整個交互系統提出了更廣泛的要求,如何應對這種要求并將設計體驗推向新的高度,這是智能時代留給我們的一個至關重要的思考。
最后總結一下,交互設計是系統設計的頂層,在技術飛速發展的今天,它越來越融入生理學、心理學、AI算法、軟件邏輯等各個專業的知識,今天在這里拋磚引玉,期望和大家共同研討,一起努力把產品做的更好,滿足客戶對我們的期望,不負這個變革的時代。
我的演講到此結束,謝謝大家!
來源:蓋世汽車
作者:忻文
本文地址:http://m.155ck.com/news/qiye/144428
以上內容轉載自蓋世汽車,目的在于傳播更多信息,如有侵僅請聯系admin#d1ev.com(#替換成@)刪除,轉載內容并不代表第一電動網(m.155ck.com)立場。
文中圖片源自互聯網,如有侵權請聯系admin#d1ev.com(#替換成@)刪除。