來源:第一電動網(wǎng) 特約作者:騎大
“標題要吸引人,其實我們更想探討的是,百度Apollo平臺到底想做什么”。
百度的開發(fā)者大會無疑是最近自動駕駛界最矚目的事情,甚至沒有之一。
Apollo開放路線圖
谷歌在今年的I/O大會上提出了“AI First”,之前可能是“送外賣”去了的百度,好像終于和谷歌有了那么幾分神似。
整場發(fā)布會陸奇強調(diào)了無數(shù)遍人工智能時代,數(shù)據(jù)是多么多么重要。無論是對于自動駕駛或是更廣泛意義上的人工智能,Data is King 或者更準確的說 He who has data is King.
所以Apollo計劃的內(nèi)在核心,是數(shù)據(jù)。
我們知道百度從2013年就開始了自動駕駛項目,百度進行了不少路測,只是我們好像從來沒有在什么渠道上看到或是聽到百度積累了多少公里的路測。作為國內(nèi)非常早開始做自動駕駛的大公司,我們似乎很難找到理由如果自己有不錯的數(shù)據(jù)積累的情況下,作為自動駕駛水平的重要依據(jù),不去提這個數(shù)字。
在百度謎一樣的路測/數(shù)據(jù)背后,一個原因可能是由于國內(nèi)相關(guān)法律法規(guī)的缺失。法律法規(guī)的缺失導致路測在沒有合法身份的情況下,并沒有辦法大規(guī)模的或是高效的開展。同時,在法律法規(guī)出臺前公開數(shù)據(jù),就像在高調(diào)宣布自己違法一樣,畢竟樹大招風,這次Robin上五環(huán)可不是分分鐘就被盯上了。
數(shù)據(jù)為王,數(shù)據(jù)不夠,怎么辦?
有一個聲音說:開放平臺。
Apollo開放平臺孕育而生。
百度并不是第一個在自動駕駛領(lǐng)域開源的公司,早在2016年11月底,天才黑客George Hotz就宣布他創(chuàng)辦的Comma.ai的軟硬件全部開源。開源的目的也很簡單就是收集收據(jù)。Comma.ai還提供手機APP來收集數(shù)據(jù),僅僅是通過1900多名APP用戶,在今年3月份時就已經(jīng)收集了2.2萬小時行駛數(shù)據(jù),84.5萬英里行駛里程。而他的自動駕駛和機器人開源平臺已經(jīng)聚集了超過5000名開發(fā)者。對Comma.ai來說,無疑是一個不錯的成績單。
既然Comma.ai開源的最主要任務(wù)是收集收據(jù)以及匯聚開發(fā)者,那么同樣作為開放平臺的Appllo也不例外。
我們先說說匯聚開發(fā)者,筆者作為一名曾經(jīng)的十八線程序猿,決定以開發(fā)者的視角來接觸Apollo開放平臺。
毫不猶豫的點了Github
進入開發(fā)者頁面,可以看到目前可以使用的組件只有智能決策與控制,數(shù)據(jù)開放平臺。未來還有感知、仿真、DuerOS等模塊可使用。
智能決策與控制會把你帶到Github的頁面,提供了非常標準的說明文檔,對于有簡單開發(fā)基礎(chǔ)的人來說,配置環(huán)境、運行Apollo都不是難事。Apollo提供了一個非常有好的HMI界面。
紅色框中的Dreamview 是一個針對當前自動駕駛功能的可視化輸出模塊
Dreamview預覽,目前Apollo 1.0僅包含循跡自動駕駛功能
我們常說自動駕駛包含三大模塊,感知、決策、執(zhí)行。通過Apollo我們可以看到實際開發(fā)中,自動駕駛會包含以下更細致的模塊,包括感知、定位、預測、規(guī)劃、決策、控制、HMI、監(jiān)測以及CANBUS模塊。
作為一個開源項目,Apollo 1.0上線一周以來,目前有16位貢獻者對代碼做出了68處改動,涉及156個文件,新增3832行代碼,刪去了3703行代碼,還有65處改動有待審閱。不過仔細看了下可能絕大部分貢獻來自百度Apollo團隊自身。
根據(jù)Apollo路線圖,今年年底就要上線簡單城市路況自動駕駛,到了明年年底,就可以有城市道路自動駕駛和特定區(qū)域高速駕駛功能。
看起來,作為開發(fā)者,我離自動駕駛,可能就差一輛車了。
Apollo成功降低了自動駕駛的參與門檻,讓一些對自動駕駛有興趣的開發(fā)者,有了參與其中可能,只是
只是開發(fā)者發(fā)現(xiàn)了Apollo網(wǎng)頁底部的免責聲明。
“汽車自動駕駛本身存在其內(nèi)在風險,參與人員可能遭受潛在財產(chǎn)損失、損害或人身傷害。本平臺和百度均不會對平臺代碼的輸出和使用結(jié)果的正確性、準確性或可靠性作出任何保證,也不會就任何已知或未知的錯誤或缺陷承擔任何進行改正、修改、發(fā)布升級補丁或做出通知的法律責任。若您在道路測試或其他行動中依賴平臺代碼,您將自行承擔使用平臺代碼的風險和相應(yīng)責任。”
是的,畢竟自動駕駛太特殊了,它具有危險性,百度雖然開發(fā)了并且開放了這個功能,但是,要是出事兒了,請務(wù)必注意這和百度沒一點關(guān)系,請自行負責。
畢竟自動駕駛還在一個比較早期的階段,無論算法、測試環(huán)境等各方面都不成熟,百度這么做實在情有可原。但是對于開發(fā)者,無論是個人還是機構(gòu)/企業(yè)又是否愿意去承擔呢。對于個人開發(fā)者,承擔不起這樣的后果,作為企業(yè),尤其是缺乏研發(fā)能力的企業(yè)/機構(gòu),相比于承擔這樣的風險,倒不如等百度開發(fā)成熟了拿來用。那對于有一定研發(fā)能力的企業(yè)/機構(gòu),與其拿著百度的算法去承擔風險,是不是參考百度算法取長補短最后用自己的算法去承擔風險更合理一些。這也讓人好奇百度和Apollo平臺上的50位合作伙伴是否也有這樣的免責條款。
所以對于Apollo平臺,推出仿真平臺就變得非常有必要甚至迫切了。有了仿真平臺,大家的后顧之憂看起來都解決了。其實在會上陸奇也強調(diào)仿真是Apollo平臺非常核心的一環(huán)。沒有這一環(huán),這個平臺對于開發(fā)者的吸引力可能就要大打折扣。
2個月后,仿真模擬器就會上線。
Apollo平臺隨著仿真模擬器的加入以及升級,匯集開發(fā)者的任務(wù)看起來可以實現(xiàn)。那接下來的核心就是數(shù)據(jù)了。Apollo平臺提供了一個數(shù)據(jù)開放平臺。向開發(fā)者開放數(shù)據(jù)以及計算能力。
開放數(shù)據(jù)提供了一些標注的數(shù)據(jù),目前開放的包括三類,激光點云障礙物檢測分類樣本、紅綠燈檢測樣本以及Road Hacker的小部分數(shù)據(jù)集。你滿懷著希冀的下載了激光點云樣本和紅綠燈檢測樣本,打開發(fā)現(xiàn)里面有100個標記樣本,是的,只有100個。我們都知道深度學習的效果優(yōu)劣與樣本數(shù)據(jù)量息息相關(guān),所以你看百度是非常清楚數(shù)據(jù)的價值的。另外,如果想要更多的數(shù)據(jù),那就拜托各位開發(fā)者或是合作伙伴多多貢獻了。
開放能力主要包括計算能力和標注服務(wù),主要依托于百度云。可以在云端完成樣本訓練(與NVIDIA DIGITS類似),但Apollo平臺在這里給開發(fā)者設(shè)置了門檻,當前僅針對科研機構(gòu),企業(yè)單位開放云端計算能力,允許他們通過API訪問開放數(shù)據(jù)。當然對于個人開發(fā)者,這并不是太大的問題,選擇還是比較多的。
Apollo開放的計算能力,降低了開發(fā)者或是合作伙伴樣本訓練的成本,但僅僅是降低訓練成本是否真的構(gòu)成去開放數(shù)據(jù)的吸引力呢。首先數(shù)據(jù)訓練的選擇還是比較多的,其次,也是更重要的一點,開發(fā)者和合作伙伴肯定明白,數(shù)據(jù)為王,那么他們,真的有意愿去共享自己的數(shù)據(jù)嗎。
在Apollo網(wǎng)頁底部,可以看到一個數(shù)據(jù)開放與分享倡議,以下摘錄部分核心內(nèi)容:
“……
二、數(shù)據(jù)共享
公平數(shù)據(jù)原則
在數(shù)據(jù)開放規(guī)模方面,以“貢獻越多收獲越大為原則”。
合作伙伴貢獻以數(shù)據(jù)里程(公里)為單位進行核算。
收獲指合作伙伴在阿波羅數(shù)據(jù)開放平臺(以下簡稱“平臺”)可以獲取的數(shù)據(jù)、服務(wù)和算法模型等。
初始數(shù)據(jù)與后續(xù)數(shù)據(jù)
百度作為平臺的發(fā)起者,為平臺提供初始數(shù)據(jù)。這部分數(shù)據(jù)將對平臺的所有合作伙伴開放。
初始數(shù)據(jù)之后,平臺將依靠平臺全體合作伙伴的貢獻逐步成長。每位合作伙伴都應(yīng)遵循公平數(shù)據(jù)原則。
數(shù)據(jù)加工
平臺有權(quán)對合作伙伴上傳并標記為公開的數(shù)據(jù)進行加工處理,處理后的數(shù)據(jù)將作為本平臺的公開數(shù)據(jù)。
數(shù)據(jù)隱私
任何合作伙伴可以查看自己的數(shù)據(jù),并設(shè)定數(shù)據(jù)的隱私屬性為:私有或公開。
私有:表示該數(shù)據(jù)只能由合作伙伴自己查看和使用。
公開:表示將該數(shù)據(jù)授權(quán)給本平臺,本平臺將根據(jù)平臺的數(shù)據(jù)共享原則公開衍生的數(shù)據(jù)和資源。
合作伙伴上傳的數(shù)據(jù)默認為該合作伙伴私有;平臺在合作伙伴上傳且標記為公開的數(shù)據(jù)基礎(chǔ)上經(jīng)過二次加工的數(shù)據(jù)(如:標注或場景提取)需要作為平臺公開數(shù)據(jù)。
黑名單:如果合作伙伴不希望自己的數(shù)據(jù)被某個敏感合作伙伴訪問,則可以進行設(shè)定。
特殊數(shù)據(jù):默認為合作伙伴私有數(shù)據(jù)。該數(shù)據(jù)的擁有者可以指定將其開放給平臺的特定合作伙伴。
三、數(shù)據(jù)范圍與開放方法
1、數(shù)據(jù)內(nèi)容
原始數(shù)據(jù)、標注數(shù)據(jù)、無人駕駛場景(供仿真模擬器使用)、特殊數(shù)據(jù)
……”
在這份倡議中(具有法律約束力),我們看到百度試圖營造一個正向激勵的循環(huán),并且告訴開發(fā)者你的數(shù)據(jù)隱私可以得到很好的保護。所以在這樣的前提下,資源是否有機會真正共享起來呢,筆者做了諸多假設(shè),發(fā)現(xiàn)很多情況下都無法滿足最核心的兩點,第一是百度要收集數(shù)據(jù)這個目的,第二是數(shù)據(jù)對于合作伙伴或是開發(fā)者是非常有價值的,他們主觀上不會有共享的意愿。如果要滿足這兩點訴求,目前看來最理想的方案是,每個合作伙伴與百度單獨共享數(shù)據(jù),正向激勵循環(huán)也可以在百度和每個合作伙伴間流暢運作,百度因此也可以收集到大量數(shù)據(jù),唯一會造成的現(xiàn)象就是,這個數(shù)據(jù)開放平臺上,真正標記為“公共“的數(shù)據(jù)非常少,大部分都是“私有及僅向百度開放“的狀態(tài)。當然這種看起來是雙贏的合作,其實真正的大贏家,只有百度。
以仿真匯聚開發(fā)者,以數(shù)據(jù)成就百度在國內(nèi)自動駕駛的領(lǐng)先地位,這是我們目前看到的Apollo平臺。然匯聚開發(fā)者易,開放數(shù)據(jù)難,檢驗Apollo的最好辦法,就是用數(shù)據(jù)說話。
或許我們幾個月之后就可以看出一些端倪。
歡迎大家指正、交流,作者微信號:kamizhq
來源:第一電動網(wǎng)
作者:楊曉紅
本文地址:http://m.155ck.com/news/jishu/53282
本文由第一電動網(wǎng)大牛說作者撰寫,他們?yōu)楸疚牡恼鎸嵭院椭辛⑿载撠煟^點僅代表個人,不代表第一電動網(wǎng)。本文版權(quán)歸原創(chuàng)作者和第一電動網(wǎng)(m.155ck.com)所有,如需轉(zhuǎn)載需得到雙方授權(quán),同時務(wù)必注明來源和作者。
歡迎加入第一電動網(wǎng)大牛說作者,注冊會員登錄后即可在線投稿,請在會員資料留下QQ、手機、郵箱等聯(lián)系方式,便于我們在第一時間與您溝通稿件,如有問題請發(fā)送郵件至 content@d1ev.com。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。