Beseye AI數據標註

專訪Beseye執行長:AI落地專案的成功與挑戰,來自於人們經常忽略的「小數據」

文/若水 Flow AI Blog 編輯團隊

AI落地的過程中,如何確保一路上技術的發展,同時得到顧客支持?獲選數位時代「2020年 台灣你最該關注的10家科技類新創」之一,新創公司Beseye(雲守護安控)的經驗非常值得參考。

全球安防監控市場以人臉辨識為大宗,Beseye卻跳脫主流,靠著獨門的「人體骨幹分析AI技術」吸引日本前三大鋼鐵工廠 JFE Steel等企業合作,不只兩大電信龍頭(中華、遠傳)是它們的客戶,連日本東急鐵道,也將危安示警的重責大任託付給這間台灣本土新創。

若水AI Blog編輯團隊專訪Beseye執行長涂正翰,分享團隊以AI創業的落地與驗證之路的深度對談。訪談過程中他不斷強調,要提高AI落地的成功機率,重點除了 AI 技術之外,更重要的是了解真實情境,才能進而解決商業問題。


問 : 每個事業的開始會有個原因,像若水是以「Tech for good」為主軸,當初成立AI事業部,正是看準各大產業會有AI數據處理痛點,同時可以藉此為身障者創造就業機會。很好奇Beseye創業之初,怎麼找到市場定位?

答:Beseye草創成員的強項都在AI影像分析(VA)領域,所以我們一開始就在考慮往這方面發展。畢竟我們幾個如果出去賣紅豆餅,也不會賣得比別人好(笑)。

創業初期,團隊技術只能做到一個人體擷取數十個人體骨幹特徵點,現在已經能擷取超過4,000個點,是台灣唯一一家把人體骨幹分析技術商用化的公司。從研究機構來看,相較於目前全世界頂尖的美國卡內基美隆大學(Carnegie Mellon University),Beseye的人體骨幹分析技術分析效率超過3倍之多,因此受到國際大廠的青睞。 

我們也沒有從day one就決定要做人體骨幹分析,早期曾想過要不要做臉部識別,但因為臉部辨識市場當時已經高度競爭,而且在許多應用領域,如果希望把人臉辨識的精準度做好,在數據收集( Data Collection )應用上會面臨兩個難題。

除了攝影機和人臉的距離不能太遠,對人臉辨識的角度也有很高的要求,只要不是正臉,機器就很容易誤判。

所以我們決定另闢戰場,從人體骨幹下手,訓練機器辨識人的肢體動作,藉以分析出其姿勢、行為,進而分析出人們需要協助的各項危險情況。也因為不採用臉部識別技術,因此在市場上,只要客戶是處理的需求包括安全性、機密性、隱私性等問題,就會選擇用骨幹分析的解決方案,這也是大多數客戶導入公眾場域的需求。

圖片來源 : Beseye Facebook

講到這裡,我有兩個深刻學習。

第一,很多團隊會過度強調我做的是AI技術,好像只要有好技術就能賣,但其實不然。今天不管你的技術有多好,但對大部分大型企業來說,除了要解決商業問題,他們更不想要碰公關問題,如果技術會帶來侵害隱私的疑慮,企業壓根不會想用,因為會讓企業有無法控制的潛在風險。

第二,當技術被採用時,除了AI分析的精準的程度要高之外,你在AI分析模型以外的架構,還包括整個資料安全的設計、對隱私權的考量、以及如何降低運算效能以節省成本,達到因地制宜的使用,都必須要有精密的設計。因為你賣的是企業,企業不會只對 「精準度」 一個單點有要求,而要能為企業解決商業問題。

(延伸閱讀:智慧安防產業應用場景多變,數據該如何處理?

Beseye將自己定義成可對應多元產業的「AI技術的軍火商平台」,服務過公眾交通系統(例如日本東急鐵道),智慧零售、智慧工廠、長照到金融等領域的企業客戶。

從目標來看,這些客戶在導入AI時,不只期待分析速度快、精準度高,系統穩定性夠,還很重視「數據安全性的架構」,但這點往往很容易被忽略。

如果心態上太工程或製造導向,會誤以為只要專注開發出強大的AI技術,產品就能賣得很好,但其實不然。最終還是要回到使用者的角度來思考,客戶最重視的是什麼?


問:若水AI整理過一篇Shazam的AI數據案例,分析這間被Apple收購的音樂辨識公司把數據當成一種「動態策略」,可否談談如何在提升模型表現的同時,兼顧商業機會?大概會分成幾個階段?

答:剛開始數據不多,我們就是跟著客戶一路慢慢增加精準程度,解決用戶重視的問題。

像上述提到的客戶都不是第一天就有,一開始訓練模型時,第一個選擇的是智慧零售的場域,因為這類企業主要在於了解消費者喜好,回頭調整商業策略,精準程度超過9成就足以解題。後來到鐵道公共的場域,客戶對精準程度的要求到98%或99%,因為分析錯了會有生命危險。

世界上沒有產品開發可以一步到位,採取快速疊代比較好的方法。所以我們會先做出一個AI模型,用少量的數據丟進去觀察,再逐步修正,一路從數十個人體骨幹特徵點,到現在擷取超過4,000多個,大約花了5~6年時間。

至於每個階段在人體上擷取特徵點( Feature Points )的數量上的選擇,其實是與整個時代發展的大背景息息相關。

例如,2000 年到 2014 年,GPU 計算速度的躍進讓演算法成長高達 450 倍,AI 模型的深度學習精準度提升、分析速度提升、及運算成本降低。這幾年,攝影機的影像解析度不斷提升,AI也跟著需要學會辨識更多的特徵點 ( Feature Points ) ,解決更難、更多元的商業問題。

對我們來說,當客戶橫跨不同的產業,要如何決定AI模型需要佈多少特徵點、才能夠取得最佳的商業與技術上的均衡點?

我們作法是:由人類提供不同數量的特徵點當作籌碼,由機器自己去學習、選擇把這些籌碼下在哪邊,找出更合適的骨幹特徵擷取點。一如AlphaGo之所以能打敗世界圍棋冠軍,正因為人類沒有給予機器太多的限制與規則,機器才有機會找出超越人類想像的答案。

如果今天機器下了4,000個點,表現很好,但改下8,000個點,反而沒有明顯差異,那就表示4,000個點已經是優化的極限。為了不浪費企業客戶的商業運算效能和成本,就會讓機器學習放在最佳的精準度,與客戶所必須付出成本的平衡點上。

思考這個問題還有另一個解法。有時候AI專案的挑戰,來自於人們常常過度看中大數據,而忽略了對「小數據」的觀察能力。

AI是從大數據中取出共同特徵,但最終目的還是為了解決客戶的商業問題。與其滿腦子想從大數據中得到答案,有時候真的坐下來,面對面了解你的使用者,得到的資訊反而更齊全。你不一定總是一開始就可以取得大數據,但是你一定能找到混搭 (hybrid) 的方案來解決。


問:這個想法很有意思!實際上怎麼運作?

答:開始合作前,我通常會建議客戶先做一件事:確認數據和商業命題之間,確實有相互關係。

為大家都會覺得數據丟進去,答案就會出來,但不是這樣。如果你是具有domain know-how的人,你一定要知道這個問題的答案,只是你沒有這麼多的時間驗證,而不是你自己都不知道答案,卻把AI當神。AI無法回答連人類都不知道的答案。假如要推測銷售成績和天氣變化有關,這時最好先請工讀生連續3個月紀錄天氣,比對銷售數據,看看是否真的有關聯。

如果真的有關,理論上用最簡單人力和少量數據,應該多少可以改善這個商業問題。換言之,如果這個商業問題真的這麼重要,那理論上就算沒有 AI,企業客戶也還是得老老實實地去解決它,真的先以最低的資源,確定有初步的效果、再導入AI來做快速的自動化解決,才不會浪費大量導入 AI 的時間和成本,卻無法預期花了一堆錢與時間後,到底可能的結果會是什麼。

另外,和客戶對接時,不只有PM,專案的內外部參考者也同時需要知道企業的高階管理者,對AI的使命和想像是什麼?唯有了解你的客戶,才能夠真正解決 「他的」商業問題。

假如客戶有一個大問題,可以被拆成五個小問題來解決,其中三個有大數據( Big Data ),我就會傾向用AI來解決。另外兩個無法取得大數據的,或許可以從產業know-how和對小數據的觀察力,了解這批數據的傾向。

這時候不需要執著於AI,比較輕巧的AI模型,甚至是推論統計( statistical inference )的方法,都會是可行的辦法。目標在於最有效率的解決客戶的問題,技術只是方法與手段。

回到商業需求面來思考,每個客戶對於AI產品的需求都不一樣,無法靠一招打天下。例如鐵道交通需要在1秒鐘內知道答案,但零售業7天出一次報告就好,即時性差很多,對辨識精準度的要求也不同。

又或者安防監控,客戶的攝影機雖然需要 24小時全時運作,但是卻不需要 24小時全速執行最複雜的分析,因為很浪費計算資源與客戶的運算成本。

圖片來源 : Beseye 官網

此時,就可以把AI引擎分成幾種分析的狀態,像滿足篩選器條件進而觸發的方式,幫客戶大幅節省導入初期的成本以及導入後的維運費用。比方,先分析場域內有沒有物體移動,如果沒有就休眠;偵測到移動物,再進一步分析是不是人類、這個人類有沒有我們想要捕捉的動作,一層一層,以此類推。


問:從您的經驗來看,影響演算法表現的原因有哪些?

答:AI產品化可以分成三個層次,底層是 AI 數據,再來是AI模型,最上層是AI系統。在這個架構之下,可以再細分成6個因素。

好的 AI 模型與系統設計是解決商業問題的關鍵。AI 模型影響最基礎的精準程度,但有些問題不一定會發生在 AI 模型層次,而是必須在 AI 系統層次解決。所以在wrapper之上,還有一層AI系統產品的架構,這個也會大幅影響最終分析的表現。 

有了好的 AI 模型與系統設計後,高品質的數據仍然是AI模型訓練的基石。同時,數據和商業問題的關聯度要夠高,才能夠真正解決問題。只要掌握了 AI的模型設計、系統設計以及數據,大概就能解決AI產品化80% 的問題。


問:怎麼確保數據的分類與品質?

答:舉個簡單的例子,今天我們想要訓練機器來看懂一個人的年齡,這是在智慧零售產業很常見的運用,如果只是標完就一張張照片丟進去,然後讓機器學習並分析,不管這數據模型設計成什麼樣子,它的結果可能都會糟。因為數據在丟進去之前,缺少對數據的專業分類。

每個人對於其他人的年齡判斷都不盡相同,有些人很會猜其他人的年齡、有些人卻猜得很糟糕,而且某些人看起來就是比較年輕、有些人看起來就是比較老,當整個世界的資訊都進到機器中、不同人判斷的數據都進來了,機器會很疑惑,為什麼同樣一個人,有時某些人覺得他年輕、某些人覺得他老?

到最後機器會不確定人類世界到底存不存在標準答案,因為數據被各種人不同的判斷中和掉而很難存在準則。

要解這個問題,從數據端就應該做各種分類,比方說男生的年齡與女生的年齡獨立分析,讓機器知道這是兩個極度不同的群體,硬要放一起只會讓機器搞不清楚到底人類的標準是什麼,這只是一個很小的例子,幾乎每一種商業問題都會有對應的數據分類標準在裡面。

這類問題即便你不是數據科學家,你也可以懂,因為更大程度來自對 domain數據的理解。

你不能預期任何要推動AI落地的企業,永遠都可以取得龐大的數據,很多數據問題只要從源頭把關、做好數據分類,後面 AI 訓練所需的數據量與問題就會少很多。

最後,大家都希望AI 成功落地,最好遍地開花。這裡通常有兩種模式。一種是要求商業世界為我改變。

但舉個例子,大家都喜歡與嚮往智慧家電,但你會因為科技大廠出了智慧冰箱,就馬上丟掉家中的舊冰箱嗎?可能不會。如果我們自己都不願意這樣做,怎麼能期待商業世界這件事會這樣發生呢?

在協助企業客戶導入 AI 案例,Beseye成功率一直都非常的高。原因除了有不錯的 AI 技術之外,同時,我們會盡量讓企業客戶盡可能以他們既有的硬體導入 AI 來解決問題、實現以最小的耗費資源、最小限度的成本投入,迎向 AI 帶來的智慧生活,不需要經歷一段痛苦的磨合期。

此外,我們最近也和Intel、世平興業三方合作開發「Beseye AI Edge Platform」,試圖解決客戶在跨領域系統整合上的困難,這個平台已被大量政府部門、工廠及國中小校園採用。

面對瞬息萬變的安防監控市場,我們想要讓這個世界用它最舒服的方式,讓AI落地。

醫療科技展 智慧醫療

【2分鐘看AI大事】2021九大科技趨勢/台灣AI醫療發展卡在這兩關

AI人工智慧

【2分鐘看AI大事】中國「AI四小龍」拼上市/再過幾年電動車能普及?/經濟部明年力推產業AI化