當問題無法用既有或傳統的方法來解決,再來考慮用機器學習,開發AI模型應用。也正因為如此,每家的AI模型都很獨特,在餵養數據時更需要「因材施教」,用真正適合自家應用的AI數據來訓練,才能真正讓人工智慧落地。
然而,要產出適合訓練的精準數據,是一條不輕鬆的必經之路。
POC階段,在AI專案時程的壓力之下,要找人來快速產出大量、一致性高的標註數據;而當模型逐漸走向Production階段,需要辨識的場景越來越複雜(例如自駕車應用,可能需要辨識各縣市的道路),對於AI數據標註品質的要求也會更精細,讓QC品管更加棘手。
多數AI模型要學習的物件和情境非常多元,若水處理過最難標註數據的案型之一,就屬人的行為標註。因為人的動作千奇百怪(有些動作甚至看不出是人),當很多人一起標註數據的時候,要客觀且一致很難。一旦品質管理的難度增高,AI專案的管理成本也會隨之上升。這種情況下,若水如何有效的配置人力資源,確保AI數據的標註品質?