圖片來源:華為官網

【3分鐘看AI大事】該要大數據還是好數據/Spotify控訴蘋果壟斷裁決出爐/華為瞄準NLP推重磅AI產品

AI 趨勢新聞精選
【2021/4/29〜2021/5/5】

➡️ ➡️ 我們將在電子報提供您更深入數據處理洞察,點擊連結訂閱:https://ai-blog.flow.tw/register

能贏嗎?華為端出重磅AI產品

MdEditor重點摘錄:

熬過了被美國全面打壓無比痛苦 2020 年之後,華為在 2021 年上半年,又開始了連續的爆發,拿出了一款重磅 AI 產品:華為雲盤古大模型,瞄準的是 AI 的底層技術— NLP 自然語言處理與深度學習領域。

按照官方説法,有兩個第一誕生了:第一,業界首個千億級生成與理解中文 NLP 大模型。據介紹,其預訓練階段學習了 40TB 中文文本數據,是最接近人類中文理解能力的 AI 大模型。第二,業界最大的 CV 大模型。之所以稱為目前業界最大的視覺預訓練模型,因為包含了超過 30 億參數。

既然是數億級的參數,需要消耗海量的存儲、計算等資源。對計算架構集羣、存儲及數據庫、基礎軟硬件計算及協同等,都會提出極高的要求。這時候,雲端運算的價值就凸顯出來了。根據 Gartner 的最新報吿,2020 年,華為雲全球 IaaS 市場排名上升至中國廠商第二,僅次於阿里雲,在全球位列前五,成為全球五朵雲之一。


高盛最新研究,5年內量子運算可應用於金融市場

聯合報重點摘錄:

高盛(Goldman Sachs)與量子新創公司 QC Ware 共同進行的一項研究,預測量子運算(quantum computing)可在五年內,應用於金融市場上一些最複雜的計算。

例如,衍生性金融商品定價。這類定價是金融市場裡最需要電腦高度運算的工作,也是投資銀行非常耗費成本的作業。如果是用現在的電腦來算,有時需要好幾個小時。

高盛這份研究指出,程式員試圖放棄部分量子運算系統所能發揮的強大表現,讓電腦達到務實的成效就好。如此,「不盡完美」的量子電腦就可望提早問市。


Spotify控訴蘋果壟斷 歐盟裁決出爐

iThome重點摘錄:

歐盟 2019 年針對串流音樂平臺 Spotify 控訴蘋果壟斷行為展開調查,目前初步裁決出爐,調查重點包括蘋果強制 iOS App 業者使用程式內購買(IAP)機制並抽成 30%。

另一調查重點,是蘋果對 App 開發商施加種種限制,不允許他們告知 iPhone 或 iPad 用戶有其他更便宜的支付選項,即「限制引導條款」(Anti-steering provisions)。

蘋果發出聲明指出,Spotify 已是全球最大音樂訂閱服務商。Spotify 對 99% 的訂閱用戶交易都沒有付錢給蘋果,而剩下經由 App Store 服務的使用者,也只付了 15% 的佣金。因此,蘋果認為 Spotify 只是想占盡 App Store 所有好處,但卻不想付出任何代價。

🍎推薦閱讀:先前,蘋果花了約新台幣 120 億收購音樂辨識公司 Shazam Entertainment,這家公司如何靠導入 AI 和數據策略,達到每月 1.5 億活躍用戶?


中國進一步加強網路科技監管

中央社重點摘錄:

中國從去年下半年以來,持續加大對於網路巨頭的反壟斷監管措施,並於今年起陸續對被調查的企業祭出重罰,包含阿里巴巴、百度、唯品會等無一倖免,也正研議擴大反壟斷機構組織規模,強化相關業務。

據華爾街日報 3 日報導,中國國家市場監管總局正在研議擴大旗下負責反壟斷業務的反壟斷局規模,其中的措施之一是增設一名副局長。

華爾街日報引述消息人士說,中國強化反壟斷局規模的另一個目的,是要對於在境外避稅天堂註冊的中國網路科技公司「出手」。同時,反壟斷局將開始進行追溯性執法。知情人士表示,目前反壟斷局已經掌握了大約 1,700 個相關案件。


Landing AI 創辦人吳恩達(Andrew Ng)。(圖片來源:Synced Review

要大數據還是好數據?AI大神這麼說

知勢重點摘錄:

Landing AI 創辦人吳恩達(Andrew Ng)日前透過網路直播分享自己對於模型及資料的看法,並提出一個機器學習工程師應該將 80% 的工作放在資料準備上,以確保資料品質。

他認為:「機器學習工程師 80% 的工作應該在準備高品質的資料上。」但是,當他在arXiv上翻閱約 100 篇的 AI 相關論文後,卻發現有 99% 都在說明如何改善模型。如果 99% 的研究都在討論佔比 20% 的工作,那麼應該轉移些心力在另外 80% 的工作上。

比起大數據,品質良好的數據更為重要。但是什麼是好的數據呢?吳恩達提出以下需要注意的重點:

  1. 定義需一致,除了好的標註定義之外,標註的一致性也很重要。
  2. 資料必須要涵蓋重要案例,也就是必須要包含實際應用的場景與狀況。
  3. 產品上線後,資料需要回饋以更新資料分佈。此外,適當的資料集大小以及資料的隱私、偏差等問題,都是需要特別注意的地方。

🐶延伸推薦:對MLOps運作流程,以及後續如何在數據、模型間調校有興趣,千萬別錯過5/10即將開跑的「Tomofun 狗音辨識 AI 百萬挑戰賽」。

專訪英業達人工智慧中心首席科學家:AI落地不只技術,更需要活用武功、見招拆招

【3分鐘看AI大事】日本政府為什麼積極研發量子技術/瑕疵檢測還有7成延伸待開發/中國軟體業搶進電動車市場