文/ 蔣曜宇, 數位時代記者
近年來越來越多台灣企業開始採用 AI 技術,然而許多企業卻忽略基礎數據處理的重要性。若水FLOW 執行長陳潔如認為,AI 應該長出產業分工鏈,才能提升 AI 應用的效率。
AI 應用近年來在台灣逐步落地,許多產業也開始思考如何導入AI,進而降低生產成本、增加整體營收。專門提供數據處理與諮詢服務的若水強調,企業對AI的思維轉型,不應只著重於演算法,更要加強檢驗並優化數據的處理。
若水執行長陳潔如表示,大公司的 AI 團隊規劃,對AI的整體發展造成很大的問題。許多老闆認為,錢應該花在演算法上而不是在數據處理上。這使得高端 AI 工程師得花上很大的時間成本處理基本的數據。
「我曾聽過工程師分享,一天工作八小時,他們可能花上五個小時在處理基本數據,只剩三小時來寫演算法」若水國際執行長陳潔如道。
陳潔如強調,AI 產業才剛開始發展,所以它很需要長出產業分工鏈。企業高層的思維,應該透過不同階段 AI 工作的專業分工,與擁有專業 AI 數據標註團隊的公司合作,進而有效分配高級工程師的工作內容,把錢花在刀口上。
AI 模型總是跑出「垃圾數據」?最初的數據規則定義是關鍵
要啟動AI應用,首先必須搜集大量數據進行分析。但數據種類繁雜,有優劣之分,把未經處理的資料丟進AI,很容易就會「garbage in, garbage out」,最終也只是徒勞。因此,尋求專業的 AI 數據處理,為數據進行精準的規則設定,成了一大重點。
所謂的精準數據處理又包含哪些層面?若水事業發展協理簡季婕表示:
在一開始就問對問題,並準確定義數據,是創造成功 AI 模型的關鍵。
簡季婕說,進行應用時,她會先思考要如何設定篩選標準,才能在最後得到優質、有用的資料。她以若水與日本廠商共同分析橋樑安全度的專案為例,她說,這間廠商希望明確標記出橋樑生鏽的部分,但他們的 AI 卻把與鐵鏽相似的苔蘚、髒污以及陰影處都一併標記起來,降低數據的準確性。
藉由數據處理的專業分工,若水協助他們找到更準確的數據篩檢方式,定義出鐵鏽的形狀及顏色等特徵,進而得到更精準的成果。
「 好的處理方式會加值 AI 數據的養成 」簡季婕強調。
搜集的難易度、多元使用情境,數據處理比想像中更繁雜
對許多企業來說,將數據導入 AI 模型運算時有許多挑戰。其中,如何定義有效數據、並在出狀況時知道要去調整數據或是運算模型,都有一定難度。
簡季婕說,要使用數據訓練 AI 模型,事前必須經過全面性思考。數據搜集的難易度以及數據使用的多元情境,都需納入考量。以大量運用 AI 的自駕車產業來說,天氣好的時候路況較單純,標註周遭環境與物件是相對容易的事。然而在雨天,物件就可能變得模糊,AI需要特別進行訓練。
「AI 模型的培養是一個循序漸進的過程」簡季婕說。
數據就如同 AI 的土壤,土壤的成分、性質、濕度、含氧量,都需經過精確的設定、調配,才能開花結果。精準的數據標註就如同這個概念,這也是若水所強調的,AI 產業鏈分工的重要性所在。
【推薦閱讀】
➡️➡️ 【AI 時代的工作哲學】(1):看見數據裡的生命力
➡️➡️ 【AI 時代的工作哲學】(2) :原來數據標註是這麼一回事
➡️➡️ 【AI 時代的工作哲學】(3):用鷹眼管理,從巨量數據中提煉出黃金