蓋世汽車訊 據外媒報道,哥倫比亞大學工程學院的研究人員推出一種計算機視覺技術,通過利用人、動物和物體之間的高層次關聯,讓機器對接下來會發(fā)生的事情有更直觀的感知。
哥倫比亞大學計算機科學助理教授Carl Vondrick表示:“我們的算法使機器能夠對人類行為做出更好的預測,從而更好地協調機器與我們的行為。此項研究結果為人機協作、自動駕駛汽車和輔助技術開辟了更多可能性?!?/p>
研究人員稱,該算法是迄今為止,對視頻內未來幾分鐘的動作事件預測的最準確的方法。在分析了數千小時的電影、體育比賽和“辦公室(The Office)”等節(jié)目后,該系統(tǒng)學會了預測上百種活動,從握手到碰拳。而當系統(tǒng)無法預測具體的動作時,就會找到將動作聯系起來的更高級別的概念,即“問候(greeting)”。
(圖片來源:哥倫比亞大學)
過去在預測機器學習方面的嘗試,包括團隊嘗試,都是一次只預測一個動作。算法決定是否將動作歸類為擁抱、擊掌、握手,甚至是“忽略”等非動作。但當不確定性很高時,大多數機器學習模型都無法找到可能選項間的共性。
哥倫比亞大學工程學院博士學生Didac Suris和Ruoshi Liu決定從不同的角度來看待更長期的預測問題。Suris稱:“未來的一切并非都是可以預測的。當一個人無法準確預見會發(fā)生什么時,他們會謹慎行事并在更高的抽象層次上進行預測。我們的算法是第一個學習抽象推理未來事件能力的算法?!?/p>
因此,Suris和Liu重新研究古希臘數學問題。在高中,學生會學習熟悉且直觀的幾何原則:直線是筆直的,平行線永遠不會交叉。而大多數機器學習系統(tǒng)也遵守這些原則。但是,其他幾何圖形具有奇異的、違反直覺的特性,如直線彎曲和三角形凸出。Suris和Liu使用這些不尋常的幾何結構來構建AI模型,從而組織高級概念并預測未來的人類行為。
麻省理工學院(MIT)高級研究科學家、MIT -IBM沃森人工智能實驗室(Watson AI Lab)聯合主任Aude Oliva表示:“預測是人類智能的基礎。人類永遠不會犯的錯誤,機器會犯,因為它們缺乏我們抽象推理的能力。而這項工作是彌合這一技術差距的關鍵一步?!?/p>
研究人員開發(fā)的數學框架可以使機器能夠根據事件在未來的可預測性組織事件。 例如,我們知道游泳和跑步都是鍛煉的形式。而該新技術可學習如何自行對這些活動進行分類。系統(tǒng)可以識別不確定性,在確定時提供更具體的操作,并在不確定時提供更通用的預測。
研究人員說,這項技術可以讓計算機更接近于評估環(huán)境并做出細微決定,而非預先編程的動作。該論文的共同主要作者Liu稱:“這是在人與計算機之間建立信任的關鍵一步。信任來自機器人真正了解人的感覺,如果機器能夠理解和預測我們的行為,計算機將能夠無縫地協助人們進行日?;顒??!?/p>
Vondrick說:“與之前相比,雖然新算法對基準任務的預測更準確,但接下來的步驟將驗證該算法在實驗室外是否有效?!毖芯咳藛T說:“如果該系統(tǒng)可以在不同的環(huán)境中工作,那么就很有可能部署機器和機器人,從而改善我們的安全、健康和保障?!痹撔〗M計劃繼續(xù)使用更大的數據集和計算機以及其他形式的幾何來提高算法的性能。Vondrick評論道:“人類的行為常常出乎意料。而我們的算法可以使機器能夠更好地預測他們接下來要做什么。”
來源:蓋世汽車
作者:劉麗婷
本文地址:http://m.155ck.com/news/jishu/150318
以上內容轉載自蓋世汽車,目的在于傳播更多信息,如有侵僅請聯系admin#d1ev.com(#替換成@)刪除,轉載內容并不代表第一電動網(m.155ck.com)立場。
文中圖片源自互聯網,如有侵權請聯系admin#d1ev.com(#替換成@)刪除。