無人車其實是個勞動密集型產業,整站優化分享這資訊讓你萬萬沒想到吧
病友們都在看雜志、刷Instagram的時候,Shari Forrest打開了手機上的一個app,開始訓練一個將要用在無人車上的人工智能。
54歲的Forrest并非工程師或程序員,她靠撰寫教材來謀生。盡管如此,在平時有空時,Forrest依然會在Mighty AI上登錄,然后把自己的時間花在給行人、垃圾桶,以及任何其他你不希望無人車撞上的東西做標記上。
Mighty AI是一家人工智能眾包服務平臺。在這里,Forrest的“同事”們在全球范圍內還有20萬人。這家公司提供的主要服務包括計算機視覺、自動駕駛、自然語言處理等。今年1月,公司剛剛宣布完成1400萬美元B輪融資。
“如果能趁著排隊的工夫賺幾塊錢的話,何樂而不為呢。“Forrest說。
對于無人車產業而言,在自動駕駛時代真正到來之前,類似Forrest所做的這種數據標注工作都是不可或缺的。要對自動駕駛賴以實現的AI進行訓練,所需的數據量往往超出了想象。
谷歌和通用這種公司很少去提這件事情,但正是像Forrest一樣的人們組成的勞動力大軍,構成了那些嗡嗡作響的數據中心背后的基石。
多數開發自動駕駛技術的公司會聘用成百上千名員工,然后把這種教會無人車識別行人、騎行者和其他障礙物的工作外包到印度或中國。這些工人需要對長達數千小時的視頻逐幀進行標記。
“機器學習是個神話,就像《綠野仙蹤》一樣。”硅谷硬件孵化器公司Lemnos Labs的投資人Jeremy Conrad說,“標記團隊對每家公司都至關重要,我們一段時間內仍然需要他們,因為戶外環境十分多變。”
人工智能、傳感器質量和計算能力的巨大進步,給無人車的革命打下了技術基礎。然而,盡管出現了這些創新,但在未來很多年內,人類仍然需要在幕后默默奉獻,才能讓這些系統保持最好的狀態。
“在我看來,人工智能從業人員整體都很自大,認為電腦可以解決一切。”Mighty AI創始人兼CEO Matt Bencke說。人工智能系統也都存在同樣的問題:電腦需要通過人工添加標簽的龐大數據進行“學習”,然后利用這種‘模型’在今后看到類似的物體和形態時將其識別出來。
訓練無人車面臨的挑戰比其他人工智能應用更大,因為汽車所要面臨的場景和環境是開放性的。即便是針對不同時間的燈光和天氣環境進行調整后,城市環境仍會因為建筑、活動或事故而在一夜之間發生變化。
“標注過程通常都是一項非常隱秘的成本,很少被人提及。”自動駕駛創業公司Drive.ai首席執行官Sameep Tandon說,“這非常痛苦,也非常麻煩。”
無人車所需的精度也高于其他人工智能系統。汽車之所以能夠自動駕駛,是通過將它們借助攝像頭和傳感器看到的周圍環境,與車載3D地圖進行比對來實現的。安全是頭等大事:如果Google Photos的面部識別無法正確認出一張照片中的人,那也沒什么大不了;但如果Waymo的無人車無法識別行人,就會引發致命事故。
在爭相開發無人車的過程中,企業的衡量標準都是他們的累計行駛里程。Waymo今年5月表示,他們的汽車已經在公共道路上試駕了300萬英里,而特斯拉去年表示,他們已經借助Autopilot系統,通過現有的車主收集了1000多萬英里的駕駛數據。
然而,里程越多,就意味著這些公司的后臺數據處理人員需要手工從事更多工作。短短幾英里的駕駛里程就會產生數十GB的數據,這些數據很快就會變得過于龐大,以至于無法通過車載無線網絡進行傳輸。相反,必須首先保存在硬盤之中,然后再傳輸到到外包中心。
這樣一個擁有尖端技術的行業,卻采用如此陳舊的模式,的確令人感到意外。
硅谷自動駕駛系統開發公司PlusAI首席執行官David Liu表示,每駕駛一個小時,就需要花費數百個小時才能將其轉化成有用的數據。
他說,“我們需要幾十萬,甚至幾百萬小時的數據”才能讓無人車隨處行駛,并且需要“數十萬人來實現這一目標”。
但大型科技公司通常不肯披露無人車所涉及的人工程序。Waymo、Uber和特斯拉均拒絕對此置評。
“很難聽到有人談論此事。”華盛頓大學計算機科學與工程教授Dan Weld說,“他們都喜歡說,機器學習很神奇。”
曾經擔任Waymo和Uber工程師的Anthony Levandowski曾于2013年在加州大學伯克利分校的公開演講中,將谷歌的印度團隊稱作一個由“人類機器人”組成的團隊,他們負責標記街景服務采集的各種圖像。
這種勞動密集型工作的成本并不低。業內人士估計,要創建和維護每座美國城市的地圖,一年的花費約為數十億美元。
有的創業公司從中看到了機會,PlusAI、Deepmap和Drive.ai都聲稱可以使用“深度學習”來降低人工成本(關于Drive.ai完全用深度學習來做無人車的方案,戳這里),但仍然可以維持安全駕駛所需的精度。但其他業內人士仍然懷疑,深度學習難以徹底擺脫對人類的依賴。
Mighty AI的 Bencke指出,Facebook、YouTube和Twitter面臨的挑戰,是如何在他們的社交平臺上應對欺凌和恐怖主義等各種負面內容。“如果深度學習具備這種能力,你不認為它現在就應該已經解決這個問題了嗎?”他說,“這個問題沒有無人車那么復雜,而且市場很大。”
當下,AI的智慧在更大程度上仍然取決于它所用來訓練的數據的質量。Bencke稱自家的平臺會用自己的機器學習技術,來判定每個人最為擅長的領域,并以此來分配工作。沒人因此變得富裕,但對于Mighty AI來講,這無關緊要。
Forrest說,自己去年在這項工作上掙了300美元,大部分都用來網購了。她從沒見過無人車,更別提乘坐一次。但她知道自己正讓它們變得更為聰明,也對這項技術的未來充滿信心。
來源:量子位