圖片來源:若水國際

專訪台灣智駕Turing Drive技術長:了解情境需求並掌握「對的數據」,AI技術才能落地商轉

文/若水 Flow AI Blog 編輯團隊

如何讓自駕車不只是一種想像,而是真的能落地商轉,行駛在台北街頭?
台灣智駕(Turing Drive)的自動駕駛服務,已成功運行在台北信義區、台中麗寶樂園等著名地點,累積超過 7 萬人次搭乘,準備進軍東南亞等國際舞台。

若水 AI Blog 編輯團隊專訪 Turing 的技術長李昇達(阿達),分享 AI 創業路上,如何將神經網絡技術落地。在高中同學眼裡,阿達是個非主流的「異數」,專注於自己喜歡的事情上,一旦認定了目標,便會全力以赴地搞懂為止。大學開始,阿達對如何讓車子變得更聰明這件事產生濃厚興趣,即使遇到語言及技術難題,也無法擋住他探索的熱情,網搜各式各樣的國外研究論文,還直接寫信給作者求教。

Turing 團隊平均年齡不到 30 歲,能走到應用商轉,靠的不是滿腔熱血,而是直面使用者需求,每天在空地裡、在道路旁或在車子裡認真「蹲點」,解決問題所累積的實戰經驗。


問 : 創業故事通常有個起點,像若水當初成立AI事業部,是基於「Tech for good」的理念,看準AI起飛會有數據處理需求,便能為不出門的身障者創造就業機會。Turing呢?

答:其實是一連串美麗的誤會。我們一開始沒有想做自駕車,純粹是為了桃園農業博覽會的標案,才把一群彼此不認識的人聚在一起。

團隊裡面有機械跟控制背景的人,而我個人的專業領域是電動車,當時標案要找美國的軟體公司和台灣電動車廠合作,但美國公司的軟體平台無法相容,我們只好硬著頭皮把案子扛下來做完。

做的過程中其實很痛苦,也有點收穫。覺得既然有能力挑戰讓大家趨之若鶩的議題,那就試試看,於是有了現在的台灣智駕(Turing Drive)。

為了如期交付,我們每天睜開眼,都在想怎麼解決 AI 落地的問題,這種想法跟思維跟很多人的創業歷程不一樣。團隊從 Day 1 就知道:

AI或任何新技術的目的,是要解決某個問題,不是為了炫耀技術而做技術。

所以我們發展出的核心技術,都圍繞著「最終要解決某個問題」的核心精神,如果技術沒辦法進入場域,表現得再好沒有用。而且其實大家都在不同工作領域被虐待過(笑),知道如果純做技術,一定不會落地。

自駕公車在信義區上路後,許多台北市民來試乘,我們都會默默記錄使用者的反應。我們原本以為他們會聊天討論這台車是怎麼動起來的,結果呢?乘客關心的是冷氣冷不冷丶座位太硬不好坐。這讓我明白,技術再怎麼高深,最重要的還是客戶體驗。


問:能不能分享從技術到落地,你們做了什麼?怎麼長出自駕服務的關鍵核心技術?

答:自駕車首先要讓車子可以動,光這件事在硬體本身就有三個環節:轉向、煞車、油門。

要重新改成可以用電子訊號控制,再來是軟體要能夠滿足使用者需求。因為自駕車不能只在電腦上 demo,要能在真實場域行駛,同時需要軟體跟實務結合。

所以我們並不是純粹做軟體,而是把軟體安裝到硬體上,提供自動駕駛服務。例如信義路專案的公車營運情境,最終目標是要讓自駕公車行駛在公車專用道上。第一件事,就是去理解這個場域有什麼需求,什麼問題需要被解決,我覺得這個認知是很重要的。

從技術到落地,是一段重複試錯的血淚史。一開始模型在電腦上 demo 的成果很好,實測卻跑不動。好不容易訓練好模型安裝到硬體上,結果車子還是不會動。

後來一陣摸索,才發現問題出在數據。

以前我們車用鏡頭裝的位置不對,抓不到需要的數據,於是工程師只好自己下海,拿著梯子到處找適合的空地收集數據、模擬需要的場景,包括到底要在車頭、車尾、車頂裝幾顆鏡頭,要用什麼樣的鏡頭、鏡頭角度怎麼喬,晴天、雨天又要怎麼調整、判讀,才能收集到完整收據。

創業前兩年,我們都在研究車輛控制,包括煞車、轉向等,才進入 POC 階段,大量測試一路累積的成果。所以在具體的 AI 產品服務出現之前,其實大家都在努力「蹲點」。最後發展出 3 個關鍵核心技術:電腦影像和現實地圖的虛實整合,動態車體控制以及邊緣運算控制。

(圖片來源:若水國際)

網路上有很多的免費 dataset 或神經網路的論文可以下載,很容易做出厲害的人流監控 AI在電腦 demo,模型安裝起來好像很厲害,也真的能偵測到人進出。

因為模型只能偵測出門口有人,卻無法告訴你相機跟門口距離多遠,門口在相機的哪裡,這些都不是神經網路可以幫你解決的,而是基礎工。

很多工程師跌進神經網路的世界裡面,卻忘了基礎工,也沒有意識到神經網路的能力,其實是來自於數據,最後什麼都解決不了。所以你們(若水)在做的數據處理工作,其實很重要。


問:一開始沒有數據該怎麼辦?收集到的數據,如果跟你們要的真實狀況不一致的時候,你們是怎麼調校的?

答:我們的自駕車控制是用遷移式學習(Transfer learning),為了賦予模型我所想像的功能,需要用大量數據驅動。因此,如何透過感知器,取得相同規格的結構化數據很重要。

在做控制的過程中,要去了解我要解決什麼問題,收集哪種數據,數據的特性是什麼,工程師才能去累積這些結構化的數據做機器學習。

舉例來說,信義自駕公車和電腦視覺相關,所以要收集的是影像數據,且需要有足夠的特徵(feature)。而且這些特徵,人類的肉眼要能夠判斷得出來,才有辦法做標註。

我們嘗試過各種收集數據的方法,因為要用相同的品質去收集影像,其實很不容易。第二個是嘗試找出適合的標註方法。我們先決定好要用檢測網路還是語意分析網路,再根據 solution,選擇用物件偵測(detection)和語意切割(segmentation)進行標註。

第一次標註完,把數據餵進模型之後,通常結果會很糟。但至少要先用少量數據來訓練模型,做到 Overfitting,確保模型真的有學到我需要的東西,後面再來調校。

(👉延伸閱讀:什麼是Overfitting?當AI模型表現不好,先從這裡找問題

其實,要做到這點並不簡單。因為在自駕公車情境要收數據,除了車子會移動,還要加上晴天雨天等天氣、光影變化影響,導致數據品質參差不齊。因此,相機鏡頭無法固定拍攝單一方向,需要更換不同拍照像素的相機,從各種不同的角度來收集數據。

你可能會好奇,為什麼不用免費的 open dataset?

一般 open dataset 都是從車上安裝的鏡頭角度拍攝,但公車的鏡頭角度比較高,會產生俯角。所以我們得去補足這類數據,經過數據標註,再餵進模型訓練。

NVIDIA 曾提出 DRIVE PI(perception infrastructure) 一詞,包含著 Data Factory 及MagLev 兩大模組,強調神經網路透過訓練變強的循環流程,首先須要數據收集和數據標註,不斷反覆訓練及測試,神經網路最終必然會達到我們要的結果,數據處理可以說是 DRIVE PI 很重要的部分。

我在十幾年前得知 DRIVE PI 的概念,但真正在公司做好前期基礎工,把這個循環跑起來是 2019 年的事了,當我們神經網路用得越多,未來這類的循環就會越長越多,有更多數據處理需求。

拿 open dataset 訓練模型很快就可以有成效,但是,

收集、標註數據的基本功,才是真正重要的工作。沒有數據怎麼會有神經網路?


問:要讓自駕車在真實世界行駛,你們還做了哪些事情?

答:AI模型透過大量的影像數據,學習辨識現實世界的道路路面。但真實世界其實用的不是AI在虛擬環境中學會的像素座標,而是世界座標。

當虛擬世界和真實世界的語言不一致,怎麼辦?

光是讓影像裡面的座標訊息,可以和真實世界的座標訊息相對應,就花了三個月。

要在一般道路上行駛,自駕車需要把場景資訊預先建在地圖裡面,實際行駛時藉由場景去參照地圖,彈性判斷自駕車該做什麼反應,而不是讓自駕車像死背書的書呆子,靠著記憶座標點,來決定哪邊要停車,轉彎。所以前面做了很多基礎工,後來就倒吃甘蔗,開始回收成果了。

這些事其實和神經網路的技術無關,但這是必經之路。

在還沒有使用影像之前,我們用 GPS 作為主要的定位機制,只是會遇到一些環節卡關,GPS 訊號無法涵蓋的地方車子就過不去,所以一定要有另一套輔助機制。原本我們只打算把影像當輔助,大約佔場域 5%的路線,但是跟若水合作之後,現在 95%都可以用影像來處理。

雖然是必然的結果,只是沒想到會這麼快。短短三個月,影像功能的發展進步到超過想像。

(圖片來源:若水國際)

問:怎麼看自己未來的發展?

答:其實只要是創業,每天都如履薄冰。如果我們兩年前沒有決定要先做出一台車,來證明我們有能力做系統服務,現在你們大概也不會看到我們。

創業比較困難的是,我要花兩年時間繞遠路,現在才能開始做真正想做的事情。

自駕車在台灣的市場大嗎?

其實相對較少,但是越來越多人轉向這個方向。而且越來越多新創公司意識到一樣的問題,就是 Level 5 的自駕車在真正開放道路,其實沒那麼浪漫,要落地有一定的難度。選這個議題勢必要打國際賽,不可能只做台灣市場。

現在認真來講,Turing 不是在做自駕車,而是在特殊場域做自動駕駛服務。這是我們認為自駕車可以落地的型態,也是在目前資源有限的創業階段,最有機會落實的一種形式。

所以我們要做的,就是去徹底理解每個應用場域有哪些需求,或是問題沒有被解決。過去兩年,我們碰到很多產業人來問,有些工作是老闆願意花大錢,都還請不到人來做,比方開垃圾車、巡園車,隨著人口老化,這類人力缺口的問題會愈來愈多。

在這條路上,我們倒是沒有過度放大自己,因為不管我們想出多厲害的點子,全世界一定有超過 100 個人同時想過這件事情,然後大概有 10 個人以上,是已經在做這件事了。

也許世界上最厲害的公司或最厲害的人,是像賈伯斯一樣站在金字塔頂端,自己創造出一樣產品,創造出一個 Apple system。

我們捫心自問,覺得自己還沒到那個等級。但至少,我們要當第二層的人。就是我們明確知道問題在哪裡,然後我們有能力、也沉得住氣去解決問題。

💡 延伸閱讀:
AI專案一直卡關,為什麼?(感謝科技報橘轉載)
專訪Beseye執行長:AI落地專案的成功與挑戰,來自於人們經常忽略的「小數據」

【3分鐘看AI大事】2021全球十大突破性科技/誰買假帳號衝人氣/2年內麥當勞買了又賣AI公司為啥

【3分鐘看AI大事】華府AI大戰略/Stanford AI報告出爐/AI落地商轉兩個前提