建立數據文化,提升AI成功機率

【若水導讀】AI專案落地的重點思維:
1. 想做AI?先找到對的商業命題
2. AI不只模型訓練,請先建立數據流(Data Pipeline)
3. 設計管理階層,與數據科學家團隊協作

近幾年,許多企業紛紛開始思考AI數位轉型。但 AI 專案涉及的範圍很廣,團隊和技術,究竟誰該先行?企業又如何讓AI得以落地變現呢?

若水 AI 邀請全球排名前三的雲端資安公司,前趨勢科技資深技術經理張佳彥(Charles),藉趨勢科技成功的實戰案例,與我們分享要讓AI發揮商業價值,有哪三大要素。

我們知道 AI 是很熱門,也很強大的技術,然而它的執行成本很高,因此企業必須把它用在對的地方,並用正確的方式使用 AI

以核能為例,如果人們妥善使用它,就能用來發電;反之,如果使用不當,就會造成非常大的破壞力。套用在AI專案的執行,若沒有善用 AI 技術,那麼它不僅不會幫忙帶來營收,甚至還會增加企業開銷。

在這樣的前提下,想要成功執行 AI,第一步是找到 right place,也就是「對的命題」。

究竟什麼才叫「對的命題」?有兩點要思考:

1, 是否有足夠的數據量。(因為 AI 訓練需要餵大量的數據給機器學習 ( machine learning ) 模型,數據量不足,將影響 AI 的成敗)

2, 是否創造高利潤。(企業所能投注的資源有限,但 AI 背後的成本很高,所以需要找到高報酬的痛點著手)

要發展 AI,一定要有龐大的團隊嗎?

以微軟 (Microsoft) 亞州研究院和東方航運公司合作,所做的貨櫃調度AI專案為例,這個團隊其實不超過10個人,但它們找到適合用AI人工智慧來解決的問題,把利潤提升到7%,每年省下$1,000萬美金。所以找到對的命題,並創造利潤,才是更重要的因素。

找到「對的命題」後,大家要進一步思考的是,究竟是需要 AI 來幫我做決策,還是它只是拿來輔助的工具?在討論AI專案的執行方式時,「如何取捨」是關鍵。在思考這個問題時,有兩個需要判斷的決策點至關重要:

1, 如果 AI 犯錯,是否能被接受?

2, 不論可不可以接受,都需要有良好的 AI 監控機制跟安全網。

舉波音737 MAX的墜機事件為例,這起事件其實歸因於 AI 系統的判斷失誤。在飛行過程中,AI 系統和駕駛員的主觀判斷互相對抗,再加上系統沒有設計完善的安全維護機制,最後導致悲劇發生。所以在導入 AI 技術時,建立良好監控機制跟安全網非常重要。

需要AI來解決的問題情境,基本上可以分成兩大類:不會變動的、會變動的。例如單一場景的影像辨識,就屬於不會變動的類型;而金融和病毒防護模型,就屬於會隨著市場現況而變動的類型。

針對不同問題,企業會採取不同的方式去建立自家的數據流(Data Pipeline)。

對於「不會變動的」問題,只需要去蒐集足夠的AI數據,解套相對單純。反之,對於「會變動的」問題,團隊需要不斷地蒐集、更新數據,再針對蒐集來的數據屬性與對於數據的需求,建立一套自己的 Data Pipeline。

所以,在開始 AI 專案之前,首要問題是我們有沒有數據?是否已經準備好建立數據流?如果沒有這樣的能力,談AI人工智慧其實有點好高騖遠。

(資料來源:趨勢科技)

整個AI專案的數據流裡面,其實演算法只佔了小小一塊(上圖黑色區塊),你需要數據工程師、數據基礎架構工程師來打造其他環節。

想要高品質數據,除了建立好數據流(Data Pipeline)去蒐集數據,高品質的數據標註(data labeling)也很重要。以Amazon為例,旗下的M-Turk有ground truth服務,走眾包概念,可以自動產生一些簡單的基礎標註。而若水則是成立專業標註團隊,各有不同,端看階段需求和資源配置。

在執行 AI 專案時,企業常遇到兩個問題。

第一個常見問題是:產業領域專家(Domain Expert)跟數據科學家(Data scientist)的協作。

比方說遇到問題時,產業專家可能會覺得既有方式比較好,但是資料科學家卻覺得應該用AI數據去解決問題,不想了解該領域的知識。

然而AI專案的執行重點在於「如何Debug機器學習模型」,因此同時需要產業專家的專業知識,以及資料科學家解讀數據的能力,所以這兩個角色必須交流彼此的知識、互相配合,如此一來 AI 專案比較容易成功。

第二個常見問題是:管理階層跟資料科學家 (亦稱:數據科學家 Data Scientist)的協作。

打個比方來說,如果一名資料科學家執行某個專案18個月,管理層的人可能會納悶為何這麼久了成果還沒出來。管理層不知道該如何問對問題,找出原因,而數據科學家想解釋時,管理層可能根本聽不懂資料科學家所解釋的專業內容,也不清楚整個 AI 專案該往哪個方向執行、解決。

延續上述兩個問題,我想強調的是:AI 機器學習並非是拿來取代產業專家的專業知識,而是去輔助他們,讓能力可以充分發揮出來。重點在於「Actionable Intelligence(動態智慧)」,去判斷當專案卡關時,該靠專業知識前進,還是以數據洞察為依歸。

以「AlphaGo」為例,它之所以能成功,很重要的原因是Google DeepMind的團隊有黃士傑博士,他同時身兼電腦圍棋專家跟資料科學家的角色,兩個領域的專業交相配合,才能在這麼短的時間內促成AlphaGo的成功。

再來,機器學習 (Machine Learning) 並非萬靈丹,我們需要瞭解用在哪裡,才能發揮它的價值所在。因此,無論是管理階層、資料科學家還是產業專家,都要能夠建立一套共同的商業語言,以及大數據語言。同時,永遠要記得做取捨判斷,才能夠把獲利最大化。

(資料來源:趨勢科技)

總結一下,AI人工智慧要成功先是要找對命題,再來要組織一個好的團隊。這個團隊要有管理階層、產品經理、產業領域專家、數據基礎架構工程師、資料科學家,建立一個可持續生產的數據流,快速學習做數據洞察。

很多人會以為,首先要解決的是命題、數據收集還有技術問題,但我們發現最重要的是,先要讓團隊建立起「AI數據文化」,再來了解要用什麼樣的技術、什麼樣的數據來推動AI專案落地,這樣成功機率才會比較高。

所以最後,其實「人才」跟「企業文化」是最重要的。這裡的「人才」並不是指要找最優秀的人,是整個公司的人都需要有數據文化、數據經驗和知識,才能真正成功執行 AI 專案,創造最大收益。

Back to Top
Close