並不古老的古跡：手機AI創生史

編者按：我們已經討論過很多有關手機AI的問題。半年過去，我們很高興看到越來越多的廠商和開發者加入這個大命題，越來越多的消費者開始關注AI。同時，移動AI的相關平台、解決方案和黑科技也在開枝散葉。

智能手機的歷史上曾經出現過很多令人激動的時刻，而AI的加入，顯然正在醞釀下一個。

要知道，手機AI的出現和發展，並不僅僅完成了手機某部分的進化。在芯片、算法、開發平台，以及硬體、軟體、傳感設備等要素的協同進化下，我們接下來很可能見證一場人與移動設備共存方式的長久改變。從攝影、遊戲、翻譯這樣的手機固有功能，到旅行、商務、家庭這些與每個人密不可分的生活方式，都可能被手機AI帶來的衝擊所改變。

然而，在對未來滿懷好奇的時候，手機AI的相關賽道也開始出現擁堵，甚至混亂。很多“AI擦邊球”開始出現。劣幣效應若隱若現，也不免讓心底泛起憂慮。

我們猜想，或許是時候開啟一場關於手機AI的知識旅行，做一次足夠全面的移動AI內容梳理。

假如說手機AI/移動AI的到來，是在我們面前打開了一幅長卷，或者用遊戲的說法：開了張新地圖。接下來我們將一個個景點，去窺探這個新世界的奧秘。

第一站，從AI與手機相遇的歷史遺跡說起。讓我們回到那久遠的過去——幾個月之前。

“史”前時代：手機開始嘗試人工智能，以及遇到的問題

雖然手機AI這件事大舉躍入公共視野，僅僅是幾個月之前的事。但恐怕我們想要搞明白這次相遇，還要再把時間倒回去一點，也不多,七十年吧…

自1951年會議確定了AI概念開始，學術界對人工智能運算的期許始終都可以總結成三件事：像人類一樣對話；用如同人類的眼鏡識別萬物；如人類一樣推理和思考。

為了這三個目標，電腦科學和數學界努力了幾十年，發明了從邏輯到專家系統，再到機器學習的各種解決方案。有意思的是，在智能手機徹底佔領人類生活方式之後，這三個”小目標“剛好能滿足手機下一步進化的需求：對話操作，可以抵消觸屏操作中的不便、機器視覺技術，可以讓手機的拍照、影片和影像處理更多元；而基於多元數據的機器學習，可以讓手機開始理解用戶的習慣和需求。

從這個邏輯上看，智能手機的下一步幾乎肯定是AI。但怎麽跨入AI的大門，對於手機產業來說卻並不是那麽容易解決的問題。

其實早在移動AI芯片出現之前，各種手機探索AI的方式已經陸續誕生。或許這個可以稱為手機AI的”史前時代“。

比如說，蘋果手機一度以語音助手Siri掀起了浪潮。而Siri的不斷進化基本是靠AI的語音互動和語義理解能力來實現的。最早的Siri是個問答模板，而AI的加入讓ta不斷變得”聰明“起來。

再比如蘋果手機很早開始探索的圖片識別和標簽分類，也是利用了AI的影像理解技術來實現。

在語音和影像之外，AI理解用戶這件事也被嘗試了出來。2016年，榮耀發布了榮耀magic，首次探索了利用AI技術主動理解用戶資訊，提供主動服務。

除此之外，AI還隱藏在手機的更多角落。比如很多雙攝解決方案中，都需要用AI的太空算法來優化拍照效果。

但以上這些探索，卻不約而同遇到了問題：AI的神經網絡和卷積運算模式，不同於傳統的運算和影像處理任務。用CPU+GPU的傳統移動運算模式來處理比較吃力，還要大量耗能。就像上文所說蘋果的影像分類，由於讓手機識別影像的運算非常緩慢，必須要依托雲計算來完成，所以蘋果選擇在夜晚進行分類處理。對於用戶來說，這種隔一天才能完成的運算當然體驗很差。

而榮耀magic的主動服務模式雖然得到了好評，但進行AI運算需要大量耗電這事無法得到解決。

AI很好，但運行AI很慢很耗電，在2017年之前差不多是手機產業的共識。那麽，解決方案是什麽呢？

萌芽紀元：從AI芯片，到兩強逐鹿

差不多所有技術發展史上，關鍵節點的技術突破，都會成為撬動整個行業的”勝負手“。燃油機之於輪船、汽車；交流電之於照明和電器設備，莫不如是。

對於手機AI來說，既然CPU、GPU來承擔複雜的AI計算任務不靠譜。那解決方案當然是單獨做一個基於深度學習和神經網絡的AI專項處理單元。其實類似的雲計算芯片解決方案已經很多，但在2017年年中的時候，外界還是普遍不看好這類技術可以在移動終端實現。

清楚記得去年7月，一位同行還跟我抬杠。他言之鑿鑿地告訴我，以他報導芯片十年的經驗，AI移動芯片五年內都不可能出現....

好吧，最後打臉的不是我。

去年9月2日，華為率先發布了世界首款搭載AI任務專項處理能力的移動芯片。麒麟970的最大特點，顯然在於它在CPU、GPU兩個通用處理單元之外，加入了AI處理單元NPU（Neural network Processing Unit，神經網絡單元）。

由於利用了深度學習處理技術，NPU可以比其他處理模式更快地處理卷積、遷移等深度學習任務，也就可以達成更快的AI任務處理能力。根據數據顯示，處理相同的AI任務，麒麟970的異構計算架構擁有約 50 倍能效和 25 倍性能的提升，影像識別速度可達到約2000張/分鐘。

當時媒體還有一種聲音，是說AI芯片這種玩法是華為自娛自樂，無法得到廣泛認同。結果打臉又分分鐘到來。9月13日，蘋果在發布iPhone X時發布了A11芯片。A11集成了一個專用於處理AI任務的運算單元“神經網絡引擎(Neural Engine)”，開啟了iPhone的AI之路。

隨後到了10月，華為發布了搭載麒麟970的旗艦機華為mate10，在攝影、圖片識別和用戶服務幾個層面展開了AI攻勢。而榮耀也緊隨其後，發布了搭載麒麟970的V10。剛剛發布的華為P20也以此為基礎，創造了DxO攝影頭評測的分數新高。

目前來看，華為、榮耀、蘋果的主流旗艦產品，在今年都會搭載AI專用芯片，並以此作為產品功能創新的基礎，應該已經沒什麽疑問。

短短幾個月間，手機AI這件事就經歷了從一片洪荒到萌芽初始的變化。而唯二坐擁專屬AI芯片開發能力的蘋果與華為，也被輿論認為將在接下來的手機AI市場裡上演“雙雄對決”。

此外，谷歌在pixel2中使用了在攝影頭區域安裝專用影像處處理單元ImageProcessing Unit （IPU）的解決方案，三星則希望以新的語音互動功能帶來AI體驗。整個移動AI賽道開始變得多元。但有一個共識似乎已經在這場比賽初期就達成了：專用的處理能力，是AI體驗的基礎。

創生期的共識：AI為什麽需要終端計算？

無論是華為、蘋果還是谷歌，似乎都在一開始就認定了，先有AI處理單元，而後有AI體驗。

這到底是什麽道理，直到現在很多手機評測和分析還是沒有搞清。

讓我們舉個例子，應該很多人都用過拍照識花功能。春天是個踏青的季節，這功能在今天可謂正當其時。但不妨回想一下，這個很有代表性的AI體驗，其實反應非常慢。各種識花軟體都要等上一會。假如網絡不好還要等更久。這就是因為影像識別消耗算力較大，還要到雲端進行數據庫匹配，最終導致體驗並不是瞬時的。

其實，用CPU和GPU也都能處理AI任務，就像單CPU也能處理影像任務一樣，問題是缺乏針對性算力會導致能耗過高和大量延遲。假如是識花倒也還好，畢竟這麽雅致的事值得等上一等，但假如是直播中進行AI優化與識別，高延遲加高耗電不就太過分了？

這就是通過AI處理單元，在終端完成AI任務處理的第一個原因：提高處理速度，達成實時化，低耗能，並能夠處理複雜的AI任務。

另一方面，最近Facebook的數據泄露事件鬧得沸沸揚揚，而此前谷歌、蘋果也都有關於數據庫泄露的問題出現。在AI時代，用戶把聲音、影像和影片上傳給系統，完成識別與優化已經成為必然。但上傳到雲端，把自己的數據交給一個遠在天邊的伺服器，似乎有些不妥。

拍個花花草草當然還好了，但如果是自己與家人的照片和影片，冒著隨時可能泄露的風險上傳到雲端進行AI處理，估計很多用戶都會選擇放棄。

這就是手機必須搭載AI處理單元的第二個原因：終端處理，保證安全。當然，雲端訓練機器，終端機器服務用戶的“雲端一體化”思路是更加合理的。但終端AI處理能力，是整個AI服務閉環中不可或缺，但也是最難攻克的一環。

除了上述兩點之外，近半年的手機AI創生史中，還有一件事是值得大家思考的。那就是我們到底期待什麽樣的AI體驗？

再舉個例子，在去年華為Mate10發布了場景化拍照模式之後，今天小米mix2S也發布了宣傳話術都近乎一樣的功能。相信不久的將來，還會看到更多場景識別拍照，最終這將成為今年主流機型的標配。

但AI真的只能如此雷同嗎？回想一下喬布斯帶給智能手機的創意，最大的突破在於引入了APP模式，讓各種各樣的功能和體驗進入到同一部手機裡。而AI原本應該是更多元化，更多想象力的技術邏輯，怎麽竟然變成了“天下是一家，抄我再抄他”？

開發一種AI算法很容易（模仿就更容易），讓各種各樣的AI功能百花齊放卻有點難。而這就是AI需要在終端完成計算的第三個原因：通過硬體提供通用AI加速能力，引進開發生態。

試想一下，假如手機AI算力支持，也不提供開放接口，只是自己搞了一些簡單AI功能。那一個開發者即使想出來特別牛的AI創意，基本也於事無補。

是拿少數幾個AI功能，賭消費者能否買账，還是拿千萬開發者的創意能力，去賭AI生態的開花結果，顯然並不是特別難的選擇題。

所以，整個手機AI的從無到有，從蠻荒生長到萌芽勃發，基本可以看做是一個問題和一個回答：我們到底如何AI？答案是，走最困難的路，搭建從芯片到平台，再到生態的邏輯閉環。

畢竟AI不是魔法，不能從空中結出果子。