每日最新頭條.有趣資訊

搜狗AI,正在搶灘智能手機

乾明 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

搜狗AI最近打出一組攻擊波。

近期,先是在MegaFace百萬級人臉識別競賽中奪冠,接著又亮相了世界首個AI合成主播,在國內外引發大量關注。搜狗有AI,AI能力挺厲害,這些成果都是明證。

但也不乏好事者抬杠:有沒有人人可用、大家看得見摸得著的AI?有,還不少。

除了AI加持搜索、輸入法等自身主營業務,搜狗AI,還正在搶灘智能手機。這算是惠及人人的AI落地了。

搶灘智能手機

按照目前行業流行的說法,可以說這是AI+智能手機,也可以看作是AI深入產業,而且是蓬勃發展的手機產業。

搜狗在該領域的布局早已開始,他們在去年10月正式推出深智引擎平台,目前分三個板塊:機器翻譯影像識別與OCR智能問答與對話

不完全統計,使用vivo、錘子、小米、華為等品牌智能手機或智能音箱等硬體產品的用戶,都多多多少少直接或者間接享受著搜狗提供的AI服務。

其中,vivo與搜狗的合作主要在機器翻譯與OCR方面,錘子、小米主要在影像識別方面,華為則是聚焦在智能問答與對話領域。

機器翻譯

比如,vivo最新旗艦機NEX的用戶,在進行AR實景翻譯和日韓小語種離線語音翻譯等個性化翻譯時,已感受到AI魅力。

這背後,便是搜狗的身影。

今年6月份,搜狗與vivo達成合作,為其提供AI支持的個性化翻譯服務。

此次合作是國內首次實現在安卓平台上的影片流實時翻譯。

經過深度優化,搜狗的AR實景翻譯技術不僅能夠自動適配各種性能的安卓手機硬體,影片流處理區域屏佔比也達到了60%以上。

為了保證移動端上有更好的體驗,搜狗還開發了一個移動端多目標跟蹤及運動軌跡預測算法。據搜狗介紹,在這個算法的加持下,加速多目標跟蹤的整體跟蹤速度達到了100fps,這有力地保證了AR實景翻譯的實時性。

搜狗在OCR組段分析、AR渲染、AR翻譯融合動態跟蹤等技術領域的進一步突破,也讓AR翻譯體驗更加流暢便捷。

在此次合作中,還有一個容易被忽視的方面——離線翻譯

通常,機器翻譯都是在線的,能夠使用的資源、數據庫都是海量。但在離線情況下,因為資源和數據存儲在本地,相對受限,翻譯效果會大打折扣。

用一個比喻來說,在線與離線,就是“開卷考試”與“閉卷考試”。但是,搜狗翻譯的在線和離線翻譯結果的精度相差無幾,它是怎麽做到的?一共有三點:

第一,基於神經網絡壓縮技術,解決了在離線情況下常見的模型存儲與識別精度下降的問題。

第二,搜狗機器翻譯模型能力為離線的模型訓練提供了知識提純的基礎,避免了學習雜亂無效的資訊,增加額外負擔。

第三,搜狗設計了小型的神經網絡,針對不同的翻譯場景進行訓練,以確保離線翻譯的更快速度與更精準結果。

機器翻譯,一直都是搜狗的強項。借助自主研發的深度學習並行訓練平台,搜狗能夠高效利用海量的語料進行模型訓練,推動翻譯精準度達到國際領先水準。

最佳的例證,就是在去年的國際頂級機器翻譯賽事WMT,搜狗一舉斬獲中英和英中機器翻譯雙向第一。

而且,圍繞機器翻譯,搜狗已經有了不少直接提供給用戶使用的軟體與硬體產品。比如搜狗翻譯APP、搜狗旅行翻譯寶等,都在市場上得到了認可。

現在,凝練於這些產品中的搜狗AI技術,伴隨著搜狗深智引擎的不斷完善,正在注入到每一個智能手機等移動設備之中。

影像識別與OCR

該項技術的合作如錘子和小米。

2017年,搜狗就在影像識別方面與錘子合作,一同為用戶提供OneStep1.5“以圖搜圖”功能,只需要一步拖拽,就能夠使用搜狗圖片搜索快速查詢相關資訊。

前不久,搜狗又與小米合作,將其AI影像識別功能注入到了小米MIX 2S、6X、小米8三款手機中。

在小米的這些手機上,用戶打開相機功能,切換至“智能識物”模式,對準需識別的物體拍攝,就可以快速識別出圖片中的物體。點擊“搜圖”,就會跳轉到搜狗圖片的識圖搜索頁面,進行全網搜圖。

影像識別,是搜狗搜索業務的自然延伸。據悉,搜狗圖片搜索截至目前已積累了海量的影像訓練數據,為影像搜索效果的提升奠定了堅實的基礎。

而且,隨著技術的不斷完善,搜狗已經成功地將深度學習技術應用於影像識別整個系統中,並在特徵學習、特徵壓縮、海量高維數據索引、近鄰計算、細粒度分類環節進行了深度優化。

在進行整個影像搜索的過程中,搜狗也把技術覆蓋到了用戶搜索需求理解環節,智能化識別需求,以更好地提供用戶想要的答案。

今年3月底,搜狗AI刷新了影像識別國際頂級賽事Pascal VOC挑戰賽的最佳成績,創造了最新記錄,就是這些努力的一個佐證。

在OCR方面,據搜狗介紹,OCR深度學習檢測與識別模型的訓練,是基於大規模數據集訓練出來的。不僅避免了傳統算法步驟繁瑣、錯誤疊加的問題,還能夠將這項技術適用於多角度、多尺寸、多語種、多種風格的文字識別場景。

此外,針對移動端計算設備特點,搜狗不僅優化設計了適用於移動端的結構模型,還基於CPU&GPU底層計算單元進行了統籌開發,使其能力在移動端設備上更好地展現了出來,在檢測與識別模型上,實現了3倍加速。

智能問答與對話

在華為Mate 20 系列產品國內的發布會上,華為AI音箱首次登場,搜狗為其提供了智能問答服務。

和影像識別一樣,搜狗研發問答技術,有天然的優勢。

搜狗搜索,作為國內第二大搜索引擎,也是當前人們獲取資訊的重要手段。自2004年誕生以來,已經積累了百億級中文網頁索引量,有大規模高品質的問答數據可作技術研發支持。

但,數據只是基礎,重要的是怎麽充分利用這些數據。

如上圖所示,智能問答的整個過程,至少包含三個步驟:用戶意圖分析,結構化知識和精準呈現答案。

在用戶意圖分析上,用戶在使用搜狗搜索引擎時反覆輸入的資訊與反饋,被充分利用了起來。而且,近年來搜狗在翻譯APP及硬體上的探索,也豐富了人機互動技術的研究場景。

在結構化知識方面,挑戰在於把龐雜的內容建立起關聯網絡,這對於搜狗來說並不是難事。據悉,搜狗知識圖譜在國內最早提供大規模知識圖譜搜索服務。

在手機這類移動設備上,用戶對答案精確度的需求要遠遠高於在電腦設備上的需求。換句話說,用戶要的是一個答案,而不是一堆答案。

搜狗方面表示,基於搜狗的知識圖譜,搜狗的問答系統,已經能夠在分析類問題、觀點類問題、數字類問題等開放領域提供精確的答案了。

在搜狗搜索上,搜狗也推出了基於智能問答的服務“搜狗立知”。據悉,這個應用已經能夠滿足80%以上的用戶問答需求,已達到業內最高水準。

同時,搜狗在智能問答技術方面並不只是“閉門造車”,還聯合了業界及學術界主辦技術大賽,提供大規模真實用戶問答數據集,集“眾智”來推動AI在問答方面的發展。

需要注意的是,這三個方面的技術能力並非各自獨立,而是交叉融合。比如,在使用AI翻譯服務的時候,也會用到影像識別與OCR方面的技術、也會應用到智能問答與對話方面的服務。

“智能”手機新標準

搜狗AI搶灘智能手機,可能只是一個新時代的縮影。

因為,現在儼然已經到了一個發布新手機必談AI的時代。經歷了十年爆發式增長,智能手機市場已經飽和,增長乏力,亟待新技術新革命。

AI作為近年來的當紅炸子雞,成了各大手機廠商提高用戶體驗、實現差異化,以及提高競爭力的新法寶。在手機廠商的新品發布會上,AI所佔的“權重”越來越大,甚至成了主角。

有一些激進的觀點更是認為,沒有AI加持的手機,已不能稱得上是智能手機。

檢驗智能手機是否智能的核心標準,在於AI。

但是,手機廠商需致力於“專攻”硬體產品的工業設計等方面。這種情況下,再抽出精力,同時發展AI技術難免會心有余而力有不足。再加上,人工智能技術的研發需要龐大的數據做基礎支撐,這也成為手機廠商發展AI的一個不小阻力。於是,在賦予手機AI能力的時候,“合作”可謂水到渠成。

而如此一來,智能手機的供應鏈上,搜狗一樣的AI技術方案提供商,開始越來越重要。

隨著搜狗AI技術的開放,智能手機廠商無需“重新發明輪子”,可以直接快速獲取相關的優勢,將精力聚焦在硬體設計與用戶體驗提升上,從而推動智能手機行業更好的向前發展。

同樣,對AI的應用與落地來說,智能手機是一個非常好的終端,不僅使用頻繁,承載著大量的使用場景,而且還有針對性。從智能手機場景中反饋過來的數據,將會反哺搜狗,推動搜狗在AI技術上實現進一步的提升。

堪稱雙贏。

此外,更有意思的是,之前憑借智能手機發展壯大的搜狗,如今一朝“反哺”,又成為了智能手機的AI賦能者。

這樣的趨勢可能才剛剛開始,這樣的故事會越來越多。

你發現了嗎?

年度評選申請

加入社群

量子位AI社群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字“交流群”,獲取入群方式;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字“專業群”,獲取入群方式。(專業群審核較嚴,敬請諒解)

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復“招聘”兩個字。

獲得更多的PTT最新消息
按讚加入粉絲團