圖片來源:滴滴出行官網

【3分鐘看AI大事】中國AI四小龍少一尾/訓練數據太多怎解/微軟進軍醫療保健市場

AI 趨勢新聞精選
【2021/7/1〜2021/7/7】

➡️ ➡️ 我們將在電子報提供您更深入數據處理洞察,點擊連結訂閱:https://ai-blog.flow.tw/register

中國AI四小龍少一尾,獲利仍成最大挑戰

科技新報重點摘錄:

北京商報報導,中國依圖科技、商湯科技、曠視科技、雲從科技並稱中國「AI(人工智慧)四小龍」,先前依圖科技為 AI 四小龍中首家衝刺 A 股的企業,IPO 進程受市場關注。

依圖科技以人工智慧晶片技術和演算法技術為核心,研發及銷售包含人工智慧算力硬體和軟體在內的人工智慧解決方案,籌備近 8 個月之後卻主動撤單,科創板 IPO 告敗;曠視科技、雲從科技目前仍在競速 IPO。

誰能拿下 AI 第一股,仍是留給市場的懸念。不過對 AI 企業上市,一些業內人士認為有挑戰與難度,零壹研究院院長于百程認為,研發投入大,導致 AI 企業短期難以盈利,是目前面臨的挑戰,很多企業依賴高投入來實現高成長,但營運依然虧損,規模化盈利仍比較遠,商業模式並不成熟。


圖片來源:微軟官網

Google Health才喊撐不住,微軟進軍醫療保健市場

STPI重點摘錄:

醫療保健似乎是成為科技公司執行長的首要任務。首先,亞馬遜正在推出自己的醫療保健業務;其次,蘋果正在將 iPhone 轉變為病患參與和診斷工具;第三,Alphabet 則是透過投資部門、AI 和分析在醫療保健方面投入了大量資金。

COVID-19 大流行加劇了虛擬護理和親身面對面護理之間的脫節。微軟希望能夠將虛擬與面對面護理連結起來。微軟於 2020 年年底推出了其首款垂直雲端產品 Cloud for Healthcare。該軟體側重於為更習慣提供面對面護理的公司提供遠距醫療的功能。

醫療系統和數據來源之間的互通性,長期以來一直是一個問題。微軟支持快速醫療互通性資源(Fast Healthcare Interoperability Resources;FIHR)標準,讓醫療保健系統之間能夠安全的共享私人訊息。該標準旨在使系統為用戶透過 AI 分析與機器學習之後,在接收和處理健康數據上變得更容易。


剛風光赴美上市,滴滴出行疑洩露數據App被下架

BBC重點摘錄:

中國國家互聯網信息辦公室周日在「網信中國」官方微信公眾號發佈消息稱,「根據舉報,經檢測核實,『滴滴出行』App 存在嚴重違法違規收集使用個人信息問題」。

就在審查啟動前兩天,滴滴公司在紐約證券交易所上市交易。融資 44 億美元,上市首日,市值為 684.9 億美元。這是自阿里巴巴 2014 年在美國上市以來,中國企業在美上市規模最大的一次。也是最新一家利用繁榮的美國股市獲利的中國公司。

北京正逐步控制中國的科技巨頭,包括阿里巴巴和騰訊。據路透社報道,中國國家市場監督管理總局正在調查阿里巴巴,是否存在不公平地排擠規模較小的競爭對手的行為。


訓練數據太多,如何去蕪存菁?

若水 AI Blog重點摘錄:

2021 年疫情再度來臨,帶起台灣一波零接觸的自動化熱潮。例如辨識社交距離的 AI 模型,有些團隊使用目標人物之底部中心點的距離來判斷,有些則用頭部與頭部之間的距離來判斷,因而帶動不同視角下的人物、頭部數據收集與標註需求。

疫情帶動的服務深化、場景應用改變,回頭拉高對數據訓練的要求,面對這麼多數據,該如何用最輕省的方式處理,降低商業成本?

在收集數據時往往有個迷思,以為擁有愈多數據愈有利,但其實大量數據裡面可能包含了許多根本不能用,或是不適用的髒數據。只有回到最初的專案目的來思考,收集到真正符合模型訓練用的數據,才是好數據。

同時,無論哪種專案類型,模型訓練的再好,都要注意收集到的數據是否來自實際應用情境,才能確保 AI 專案落地時,不會發生無法適用於現場的窘境。


圖片來源:google blog

從語句中關鍵內容學判斷,Google「MUM」懂75種語言

udn重點摘錄:

今年在 Google I/O 2021 期間,Google 分別宣布兩種語言模型「LaMDA」 (Language Model for Dialogue Applications),以及「MUM」 (Multitask Unified Model),藉此詮釋未來在人機互動上的想像。

按照字面上解釋,「MUM」是由「Multitask Unified Models」三個字縮減為稱,主要會分析字句中的關鍵內容進行比對,而不是僅作全面比對,因此與現行應用在 Google Search的BERT、GPT-3 模型採不同運算模式。

不過,光是第一個步驟就會面臨極大挑戰,比方目前對應新型冠狀病毒的 17 款疫苗,至少就透過 50 種語言以超過 800 種名稱稱呼,其中輝瑞疫苗或莫德納疫苗均有不同稱呼方式,但是都是指相同疫苗,因此要在短時間理解判斷使用者所指內容細節,並且能讓使用者快速找到正確內容,勢必要改善現行 Google Search 背後使用語言模型。

訓練數據太多,如何去蕪存菁?以終為始的前期數據處理三步驟

【3分鐘看AI大事】疫情如何改變了各行各業/打開Netflix的AI工廠/王力宏的內容變現記