搜狗AI，正在搶灘智能手機

乾明發自凹非寺

量子位報導 | 公眾號 QbitAI

搜狗AI最近打出一組攻擊波。

近期，先是在MegaFace百萬級人臉識別競賽中奪冠，接著又亮相了世界首個AI合成主播，在國內外引發大量關注。搜狗有AI，AI能力挺厲害，這些成果都是明證。

但也不乏好事者抬杠：有沒有人人可用、大家看得見摸得著的AI？有，還不少。

除了AI加持搜索、輸入法等自身主營業務，搜狗AI，還正在搶灘智能手機。這算是惠及人人的AI落地了。

搶灘智能手機

按照目前行業流行的說法，可以說這是AI+智能手機，也可以看作是AI深入產業，而且是蓬勃發展的手機產業。

搜狗在該領域的布局早已開始，他們在去年10月正式推出深智引擎平台，目前分三個板塊：機器翻譯、影像識別與OCR、智能問答與對話。

不完全統計，使用vivo、錘子、小米、華為等品牌智能手機或智能音箱等硬體產品的用戶，都多多多少少直接或者間接享受著搜狗提供的AI服務。

其中，vivo與搜狗的合作主要在機器翻譯與OCR方面，錘子、小米主要在影像識別方面，華為則是聚焦在智能問答與對話領域。

機器翻譯

比如，vivo最新旗艦機NEX的用戶，在進行AR實景翻譯和日韓小語種離線語音翻譯等個性化翻譯時，已感受到AI魅力。

這背後，便是搜狗的身影。

今年6月份，搜狗與vivo達成合作，為其提供AI支持的個性化翻譯服務。

此次合作是國內首次實現在安卓平台上的影片流實時翻譯。

經過深度優化，搜狗的AR實景翻譯技術不僅能夠自動適配各種性能的安卓手機硬體，影片流處理區域屏佔比也達到了60%以上。

為了保證移動端上有更好的體驗，搜狗還開發了一個移動端多目標跟蹤及運動軌跡預測算法。據搜狗介紹，在這個算法的加持下，加速多目標跟蹤的整體跟蹤速度達到了100fps，這有力地保證了AR實景翻譯的實時性。

搜狗在OCR組段分析、AR渲染、AR翻譯融合動態跟蹤等技術領域的進一步突破，也讓AR翻譯體驗更加流暢便捷。

在此次合作中，還有一個容易被忽視的方面——離線翻譯。

通常，機器翻譯都是在線的，能夠使用的資源、數據庫都是海量。但在離線情況下，因為資源和數據存儲在本地，相對受限，翻譯效果會大打折扣。

用一個比喻來說，在線與離線，就是“開卷考試”與“閉卷考試”。但是，搜狗翻譯的在線和離線翻譯結果的精度相差無幾，它是怎麽做到的？一共有三點：

第一，基於神經網絡壓縮技術，解決了在離線情況下常見的模型存儲與識別精度下降的問題。

第二，搜狗機器翻譯模型能力為離線的模型訓練提供了知識提純的基礎，避免了學習雜亂無效的資訊，增加額外負擔。

第三，搜狗設計了小型的神經網絡，針對不同的翻譯場景進行訓練，以確保離線翻譯的更快速度與更精準結果。

機器翻譯，一直都是搜狗的強項。借助自主研發的深度學習並行訓練平台，搜狗能夠高效利用海量的語料進行模型訓練，推動翻譯精準度達到國際領先水準。

最佳的例證，就是在去年的國際頂級機器翻譯賽事WMT，搜狗一舉斬獲中英和英中機器翻譯雙向第一。

而且，圍繞機器翻譯，搜狗已經有了不少直接提供給用戶使用的軟體與硬體產品。比如搜狗翻譯APP、搜狗旅行翻譯寶等，都在市場上得到了認可。

現在，凝練於這些產品中的搜狗AI技術，伴隨著搜狗深智引擎的不斷完善，正在注入到每一個智能手機等移動設備之中。

影像識別與OCR

該項技術的合作如錘子和小米。

2017年，搜狗就在影像識別方面與錘子合作，一同為用戶提供OneStep1.5“以圖搜圖”功能，只需要一步拖拽，就能夠使用搜狗圖片搜索快速查詢相關資訊。

前不久，搜狗又與小米合作，將其AI影像識別功能注入到了小米MIX 2S、6X、小米8三款手機中。

在小米的這些手機上，用戶打開相機功能，切換至“智能識物”模式，對準需識別的物體拍攝，就可以快速識別出圖片中的物體。點擊“搜圖”，就會跳轉到搜狗圖片的識圖搜索頁面，進行全網搜圖。

影像識別，是搜狗搜索業務的自然延伸。據悉，搜狗圖片搜索截至目前已積累了海量的影像訓練數據，為影像搜索效果的提升奠定了堅實的基礎。

而且，隨著技術的不斷完善，搜狗已經成功地將深度學習技術應用於影像識別整個系統中，並在特徵學習、特徵壓縮、海量高維數據索引、近鄰計算、細粒度分類環節進行了深度優化。

在進行整個影像搜索的過程中，搜狗也把技術覆蓋到了用戶搜索需求理解環節，智能化識別需求，以更好地提供用戶想要的答案。

今年3月底，搜狗AI刷新了影像識別國際頂級賽事Pascal VOC挑戰賽的最佳成績，創造了最新記錄，就是這些努力的一個佐證。

在OCR方面，據搜狗介紹，OCR深度學習檢測與識別模型的訓練，是基於大規模數據集訓練出來的。不僅避免了傳統算法步驟繁瑣、錯誤疊加的問題，還能夠將這項技術適用於多角度、多尺寸、多語種、多種風格的文字識別場景。

此外，針對移動端計算設備特點，搜狗不僅優化設計了適用於移動端的結構模型，還基於CPU&GPU底層計算單元進行了統籌開發，使其能力在移動端設備上更好地展現了出來，在檢測與識別模型上，實現了3倍加速。

智能問答與對話

在華為Mate 20 系列產品國內的發布會上，華為AI音箱首次登場，搜狗為其提供了智能問答服務。

和影像識別一樣，搜狗研發問答技術，有天然的優勢。

搜狗搜索，作為國內第二大搜索引擎，也是當前人們獲取資訊的重要手段。自2004年誕生以來，已經積累了百億級中文網頁索引量，有大規模高品質的問答數據可作技術研發支持。

但，數據只是基礎，重要的是怎麽充分利用這些數據。

如上圖所示，智能問答的整個過程，至少包含三個步驟：用戶意圖分析，結構化知識和精準呈現答案。

在用戶意圖分析上，用戶在使用搜狗搜索引擎時反覆輸入的資訊與反饋，被充分利用了起來。而且，近年來搜狗在翻譯APP及硬體上的探索，也豐富了人機互動技術的研究場景。

在結構化知識方面，挑戰在於把龐雜的內容建立起關聯網絡，這對於搜狗來說並不是難事。據悉，搜狗知識圖譜在國內最早提供大規模知識圖譜搜索服務。

在手機這類移動設備上，用戶對答案精確度的需求要遠遠高於在電腦設備上的需求。換句話說，用戶要的是一個答案，而不是一堆答案。

搜狗方面表示，基於搜狗的知識圖譜，搜狗的問答系統，已經能夠在分析類問題、觀點類問題、數字類問題等開放領域提供精確的答案了。

在搜狗搜索上，搜狗也推出了基於智能問答的服務“搜狗立知”。據悉，這個應用已經能夠滿足80%以上的用戶問答需求，已達到業內最高水準。

同時，搜狗在智能問答技術方面並不只是“閉門造車”，還聯合了業界及學術界主辦技術大賽，提供大規模真實用戶問答數據集，集“眾智”來推動AI在問答方面的發展。

需要注意的是，這三個方面的技術能力並非各自獨立，而是交叉融合。比如，在使用AI翻譯服務的時候，也會用到影像識別與OCR方面的技術、也會應用到智能問答與對話方面的服務。

“智能”手機新標準

搜狗AI搶灘智能手機，可能只是一個新時代的縮影。

因為，現在儼然已經到了一個發布新手機必談AI的時代。經歷了十年爆發式增長，智能手機市場已經飽和，增長乏力，亟待新技術新革命。

AI作為近年來的當紅炸子雞，成了各大手機廠商提高用戶體驗、實現差異化，以及提高競爭力的新法寶。在手機廠商的新品發布會上，AI所佔的“權重”越來越大，甚至成了主角。

有一些激進的觀點更是認為，沒有AI加持的手機，已不能稱得上是智能手機。

檢驗智能手機是否智能的核心標準，在於AI。

但是，手機廠商需致力於“專攻”硬體產品的工業設計等方面。這種情況下，再抽出精力，同時發展AI技術難免會心有余而力有不足。再加上，人工智能技術的研發需要龐大的數據做基礎支撐，這也成為手機廠商發展AI的一個不小阻力。於是，在賦予手機AI能力的時候，“合作”可謂水到渠成。

而如此一來，智能手機的供應鏈上，搜狗一樣的AI技術方案提供商，開始越來越重要。

隨著搜狗AI技術的開放，智能手機廠商無需“重新發明輪子”，可以直接快速獲取相關的優勢，將精力聚焦在硬體設計與用戶體驗提升上，從而推動智能手機行業更好的向前發展。

同樣，對AI的應用與落地來說，智能手機是一個非常好的終端，不僅使用頻繁，承載著大量的使用場景，而且還有針對性。從智能手機場景中反饋過來的數據，將會反哺搜狗，推動搜狗在AI技術上實現進一步的提升。

堪稱雙贏。

此外，更有意思的是，之前憑借智能手機發展壯大的搜狗，如今一朝“反哺”，又成為了智能手機的AI賦能者。

這樣的趨勢可能才剛剛開始，這樣的故事會越來越多。

你發現了嗎？

—完—

年度評選申請

加入社群

量子位AI社群開始招募啦，歡迎對AI感興趣的同學，在量子位公眾號（QbitAI）對話界面回復關鍵字“交流群”，獲取入群方式；

此外，量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募，面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號（QbitAI）對話界面回復關鍵字“專業群”，獲取入群方式。（專業群審核較嚴，敬請諒解）

誠摯招聘

量子位正在招募編輯/記者，工作地點在北京中關村。期待有才氣、有熱情的同學加入我們！相關細節，請在量子位公眾號(QbitAI)對話界面，回復“招聘”兩個字。