假如我有一個問題想用AI解,該如何判斷要花多少資源呢?這就要回頭來看問題的本質:是「會變」(variant),還是「不變」(invariant)?
所謂的「不變」(invariant),意思是AI模型不太需要隨著時間持續更新,例如手寫字跡辨識、語音辨識、圍棋等,只要訓練好一個AI模型,就可以用很久。面對不會變的問題,最重要的是收集大量且多元的數據。
而「會變」(Variant)」,則是像金融預測、病毒預測這類會隨著市場變動,每月甚至是每週都需要即時更新模型的命題。這類問題的考量點會比較複雜,包括數據處理、數據標註、如何retrain模型,到了Production階段去預測時,如何知道我的模型好不好等等。
大家可能會想,不變(invariant)的問題好像比較簡單又省錢,我從這類型開始入手好了?其實Google當初在做圍棋AI時,足足花了7億5千萬元來訓練AI模型,所以重點還是要回來思考「這個問題有多複雜」,再來決定須要投入多少資源。