文/ 陳潔如 Sabrina Chen, 若水 AI 數據處理服務團隊執行長
「這次完成左、右手臂的時間多長?」
「右手比左手久,平均多 0.6 秒。」
「怪了,左手通常會帶手錶,應該比較久。」
「好,我們開視訊遠端追蹤修正。」
「小狗正面看東西的時候有什麼特徵?」
「眼睛一個大、一個小算嗎?」
「等等,有白眼球的算嗎?」
如果不看場景,只聽對話,會讓人誤以為置身在某個醫療現場。每回有機會向企業界的朋友說起若水 AI 數據處理服務事業部在做的事,聽者無不瞪大眼好奇,「不過就是要照指令做事,把圖上的特徵標出來,需要討論那麼多嗎?」
這答案說來話長。
大概去年這個時候,我和若水市場開發部門的夥伴做研究、到處拜訪,準備跨入 AI 市場,而這是我在若水的第 33 個商業模式的驗證。在這之前的 5 年,我們失敗了 29 個,直到第 30 個才找到 BIM(建築資訊模型)的商機。
近兩次驗證商業模式的經驗,讓我隱隱約約察覺:拜 BIM、AI 這類新科技所賜,將有機會創造與之相應的科技服務業。在多數人擔憂 AI 會不會搶走未來的工作?
若水的經驗是,只要找對地方,懂得重新設計工作,掌握數據和系統的力量,科技創新反而能創造出附加價值更高的工作。也因為這樣的契機,讓若水想為身障者創造工作機會的初衷得以發揮。
而所謂的「找對地方」,往往就是使用者痛點。
在 AI 產業裡,AI 數據標註(Data Annotation)是最枝微末節卻又讓企業很痛的關卡。一來重覆性高、很吃人力,卻又不好找人標註或管理;二來沒有品質檢測過的數據,會拖慢模型開發速度,所以不少企業會選擇把標註這項工作外包 (Data Annotation Outsourcing)。
這也是為什麼現在 AI 數據標註外包產業,在印度、非洲、中國大陸特別活躍。很多人戲稱,這是人工智慧時代裡的「工人智慧」,在中國大陸叫「數據標註工廠」,因為多半從製造業工廠改建,只是換上一排排的電腦和大螢幕,人們沒日沒夜,也不太需要交談。這樣的工作誰做都好,做不好就淘汰,不愁沒有人力。
在若水 AI 部門不一樣。
用科技和系統,找到光譜兩端的交集
做為台灣第一家,也是目前唯一一家投入 AI 數據處理 & 標註服務 的企業,我們深知這是一份有技術含量的工作。對外,我們要有產能、有品質,才能幫助客戶的 AI 專案順利落地;對內,我們要守著創造身障者就業的初衷。
(延伸閱讀:看見數據裡的生命力)
所以,我們以 AI 數據匯流處理平台結合多元智慧標註工具箱,加上多元、尊重、重視溝通的管理文化,讓這光譜兩端的目標產生交集。
與許多客戶訪談後了解到,在台灣不少企業或把 AI 數據標註交給工讀生或找眾包平台。這麼做的確比從前省事多了,但卻要開始擔心標註品質的問題。我們讓數據標註成為不是一件「誰做都好」的事,從 AI 數據標註師招募、訓練考核、原則回饋、QC 良率提升到資安防護都有獨到作法。
比方,若水 AI 透過線上直接招募 AI 數據標註師,透過各種評量、訪談,確定其工作動機和意願。入選夥伴還要經過各種標註圖形、遠端協作訓練,通過測驗,取得認證者才能參與工作,正式參與專案前還要再考試,以確保對每一次的 AI 數據標註工作有正確認知。
AI 數據要標註精準,得靠著能即時回饋、調整的內控系統。團隊上上下下從這樣的共識,一年多來不斷優化組織架構,也跌跌撞撞了好幾次,才有目前的輪廓。
4 個部門市場開發、專案管理、居家就業和系統科技各有特色、各司其職。其中,PM 專案管理團隊主要負責定義標註特徵和品質檢測,就像幫浦居間串聯著客戶和身障夥伴,每一個關卡都有數據把關,若水也正準備把這些數據全數搬上系統,以便給 AI 數據標註師更及時的激勵和操作建議。
說來也許你會很驚訝,在若水的經驗裡,AI 數據標註品質和良率的重大突破往往來自身障標註師的親身回饋,而這些回饋也在無形之中,幫助企業的運算模型順利推展。
像若水內部有位 AI 數據標註師不管做什麼案子,良率都能一直在 95% 以上。QC 夥伴和 AI 數據標註師們平日幾乎隨時都在線上討論,一聊發現原來他很愛打電動,善用快捷鍵和電競滑鼠,取代重覆動作。我們就讓這位 AI 數據標註師在會議上分享訣竅,不僅提升了團隊表現,也讓他對標註工作更有成就。
在智慧零售當道的現在,我們常常接到標註褲子、鞋子的請託。這看似簡單的物件,卻超乎想像難標,若水夥伴們就會在標註前來回和客戶、標註師討論、確認定義。
褲子除了不同光源的色差外,還有長度、反摺程度、摺疊和展開和正反面如何判定等問題;鞋子像是立體模型,每一面都有不同的多邊形,同一隻鞋子可以被拆解成鞋頭、身、尾等部位,還有各種視覺的角度面向等。以上都還沒有討論到被其他東西遮擋的情境呢!
用 1 塊錢,為產業與社會創造最大的價值
再問一次,「不過就是要照指令做事,把圖上的特徵標出來,需要討論那麼多嗎?」
科技日新月異,將帶動 AI 發展的各種可能性,AI 數據的標註也將走向愈來深化,從單純的褲子、鞋子等任何你想到的物件,走向抽象複雜的情感、場域氛圍辦識,而這些都不是演算法所能取代的。我們也在與 AI 數據標註師伴協力討論、精進的過程中,了解不同族群對生活的需求與想像,這將為 AI 落地,帶來更多可能的加速與突破。
這一年來,若水在台灣培育了 200 個居家身障夥伴,一起完成 100 個 AI 數據標註專案。我想,在這些數字背後,對整個社會最大的價值在於:
這些可能從來沒被視為「勞動力」的弱勢族群,靠著系統與平台的力量,有機會跟平常人一樣進入 AI 產業貢獻心力,同時有一份自己的收入,降低對家庭的依賴。而企業與若水合作的每一塊錢,除了能更順暢推動 AI 專案落地,也在改變弱勢族群的未來。
(延伸閱讀:若水帶領全台百位居家身障者,跨足 AI 產業,提供 AI 數據顧問和標註服務)
歷史上每一次重大的科技創新,都會帶來體制和認知的進步。若水想做的,無非就是讓弱勢的人藉由科技創新引發出他們內在的優勢,並轉化成為符合市場需求的人力資產,也因如此,若水才能明白如何設計一個更符合新世代組織的文化和管理能力。
為了標好每一張圖,這一年多來我和夥伴們做了許多實驗,得到 3 個重要的結論,或許也能給同在 AI 時代的管理者一些參考:
1, 為每個管理工作找到數據,從數據中找到洞察
2, 組織的設計和流程是致勝關鍵,要能因應市場和組織的需求持續調整
3, 任何從數據或管理而來的智慧,要能結合 IT 系統運作
這些都是科技創新裡最有人味,也永遠沒法被機器取代的地方。
【延伸閱讀】
1, AI 要落地,怎麼做更容易成功?趨勢科技創辦人張明正先生,提出了兩個問題,幫助想發展 AI 的企業或創業者參考 ➡️➡️ 第一個問題:如果你有一條牛,打算怎麼用牠賺錢?
2, 為了預測消費趨勢、提高供應鏈和營運效率,全球零售巨人Walmart 張開數據網,即時監控2000億筆的內部交易數據、200 個外部數據 ➡️➡️ 為了活下去,全球最大的零售商沃爾瑪變身數據公司
圖片來源:Franck V. and Kamyab Lotfollahyan on Unsplash