超市百貨、大馬路、道路監視器等應用情境,其跨境標註的需求正在逐漸增加。即使標註方法是基礎的拉框(bounding box)或下標籤(tagging),在時間與空間變數的加乘下,數據處理的難度也跟著乘上好幾倍。
例如,客戶曾經希望若水短時間內,在影片裡面找出1000名相同的人標上ID,每個人的移動軌跡都要拉至少10個框(bounding box)。這時候,如何有效且省時省力的達成任務,就是一件需要思考和設計的事情。
通常,若水團隊會請客戶提供該場域的攝影機配置圖,事前研究攝影機的角度、位置,和出入口的關係,掌握空間變數。接著,便搭配時間變數一起考量,像刑事辦案一樣,推算如果目標對象經過A處,接下來特定時間範圍內,還有可能出現在何處。
如此一來,不只可以快速預測目標對象的移動路徑,還可以清楚推測,該目標對象下一個五分鐘會出現的區域為何,確認是否有誤判。
克服了時間和空間的變數,還需要解決一件事:人的專注力和記憶力有限,沒辦法長時間記住所有資訊,同時拉框和下10幾種標籤。
面對動輒幾小時的影片數據,要請AI數據標註師從1000人中,辨認出特定人物並且持續追蹤,是一件很困難的事。剛開始或許還能分清楚A人物和B人物的差別,但越到後來記憶力和判斷力會越來越模糊,不小心把A和B認成同一個人。
這種時候,若水團隊會啟動「階段性標註」機制,讓AI數據標註師先專心做拉框的動作,等拉框階段結束之後,再回頭專心幫目標對象下標籤,維持數據精準度。
AI應用逐漸走向落地,企業對數據精準度的要求越來越高,數據處理團隊的專案執行經驗是否豐富,以及是否具備針對各產業的數據處理know how,也變得更加重要。