文/若水 Flow AI Blog 編輯團隊
AI 要成功應用落地,數據永遠是關鍵的第一步。
近年來,不只台灣企業對 AI 數據處理品質的要求愈來愈高,對於以「職人文化」聞名世界的日本企業來說,是否具備數據處理的專業素養,更是日企選擇數據外包商的首要條件。
日本新創公司 Skydisc 成立於 2013 年,為企業提供超過上百件智慧製造相關的「IoT x AI 」解決方案,在業界有豐富的 POC ( Proof of Concept 概念性驗證 )到執行落地經驗,據點橫跨福岡、東京、大阪和名古屋等地。
然而,經驗豐富的 Skydisc 團隊一直有個煩惱。要進行核心業務的 AI 模型開發之前,必須先處理大量的機器學習數據。
智慧製造的 AI 數據需求之高,讓企業傷透腦筋
智慧製造業的 AI 數據有個特色,就是非常、非常的精細且複雜。為了品質的一致性,每件產品上面的元件間距,都需要用毫米,甚至是像素等級來放大標註,才能真正落實客戶對工廠品管檢測的要求,這讓原先請內部工讀生自行標註的 Skydisc 團隊,有說不出的苦。
「我自己也下去試標過,但馬上就想舉手投降了。不只很難標,事後檢查也很花時間。」說到這裡,Skydisc 的窗口之一、負責專案管理的滝內先生表情略顯無奈。
每張圖要分成 7 個遮罩標註,平均要花 1~2 小時才能標註完一張,還要加上 QC (品管)檢核和的時間和人力成本,讓團隊能量難以專注開發核心業務的 AI 模型。
於是,Skydisc 重新思考資源分配的策略,找尋可能合作的 AI 數據處理團隊。
秉持日本企業一貫的嚴謹精神,Skydisc 先試著洽詢日本國內和東南亞幾家 AI 數據處理或數據標註公司,拿少數幾張圖資請對方公司試標註,但最後結果都不盡理想。
不是數據的標註品質未達標準,就是對方太快誇下海口,說這個專案很簡單,很快就能做完,讓切身經歷並了解標註難度有多高的 Skydisc,覺得難以信任,兜兜轉轉花了不少時間。
「直到團隊最後經由業界的口碑推薦,我們找上了若水 AI 數據處理團隊,」
在 Skydisc 福岡總公司,擔任市場開發及行銷的西小野先生說。
用 AI 數據處理專業,讓日本客戶「一試成主顧」
第一次視訊會議時,針對 Skydisc 的提問,若水團隊並沒有像其他外包商一樣急著回答所有問題,而是針對可能有疑慮的部分,內部再行確認後才正式回覆。
滝內先生也提到,合作期間有一些關於特殊案例的原則討論,例如,該如何判斷一張圖上的異常狀況,是否需要用特別的方式標註,還是判定為工業製品本身的瑕疵等,雙方團隊也能在協作平台上即時彈性討論、對應,
讓他感受到若水的 PM 在 AI 數據處理方面,擁有豐富經驗。
其實,從正式合作前的試標專案,若水團隊就謹慎以待。不只是因為日本企業對高品質的要求,更是因為團隊成員們很清楚數據的重要性:有精準的數據,才能訓練出精準的 AI 模型。
在考慮是否正式合作前,Skydisc 曾提供一批電腦視覺 (Computer Vision) 類型的圖資,讓若水分成兩次嘗試標註。第一批標註順利通過後,客戶根據標註結果修正原則,請若水再以新原則標註剩餘圖資。
為了讓客戶手邊的圖資都是最精準的版本,團隊在客戶沒有要求的情況下,主動回頭優化的第一批已提交的試做成品,提供超越日方期待的服務,讓日本客戶覺得貼心。
但亞洲的數據處理團隊那麼多,為什麼 Skydisc 決定與若水合作?
滝內先生表示,「除了全程可以用日語溝通,對接順暢之外,數據標註也處理得很細緻。」
Skydisc 也因為這次的 AI 數據策略合作,敲開更多企業合作的大門。
「之前拿其他家標註出來的數據給 RD 工程師看,都被打槍品質不夠好。現在終於可以雪恥!」,Skydisc 的窗口分享,語氣中隱約透露出開心與得意。
透過 AI 數據策略合作,Skydisc 進一步擴大智慧製造市場規模
對於 Skydisc 來說,思考資源配置,決定採取數據處理外包策略的好處,不只是能夠穩定取得精準數據,同時,能夠進攻的市場區隔分群 ( Segmentation ) 也因此增加。
「以前曾經接獲一些企業的需求,可惜當時缺乏數據處理的機制,只能婉拒。」西小野先生說,但和若水合作之後,除了一條產線動輒數千萬日幣的日本知名大企業,
他們也開始得以進軍以百萬日幣為單位的中小企業智慧製造市場,進一步提供瑕疵檢測AI 系統開發服務。
如今,Skydisc 和若水合作的第一個 AI 數據處理專案已經成功結案,若水團隊正著手進行第二批數據,迎戰來自日本不同工廠的智慧製造應用,產生的大量、高品質數據處理需求。