每日最新頭條.有趣資訊

三天發布100個新產品,谷歌能否走出增長瓶頸?

(圖為谷歌2019年開發者大會,當華盛頓開始聲討矽谷公司們的隱私問題時,科技公司的每一次發聲都小心翼翼。 攝影/《財經》記者 劉泓君 )

文 | 《財經》特派記者 劉泓君發自美國山景城編輯 | 宋瑋

今年5月的谷歌開發者大會,谷歌用三天的時間發布了100個創新產品。距離谷歌從“移動為先”轉型向“AI為先”的口號提出已經三年,可以說這場活動表現出人工智能的發展進入深水區,創新乏善可陳;也可以說它充滿了人文關懷,細節才是打動人心的力量。

2019年是多事之年,就在谷歌開發者大會的前一周,由於其母公司Alphabet收入增長不及預期,財報之後大跌8%。對用戶隱私的保護正在動搖用數據賺錢的廣告模式,此外,谷歌收到歐盟17億美元的天價罰單。此時,對矽谷科技巨頭的反壟斷與分拆討伐不斷,Facebook聯合創始人發文建議分拆Facebook。今年,最後一批矽谷獨角獸紛紛提交上市申請,互聯網高速增長的紅利期結束。

在中美關係緊張下,谷歌斷供華為手機,安卓系統成為中美衝突升級的棋子,甚至連美國用戶也對谷歌的“不作惡”提出質疑。

在整個大環境中,這場開發者大會的情緒與傳遞的信息都甚為微妙:過去五年,谷歌人工智能方面的重大技術突破,掀起沉寂許久的人工智能再次迎來高潮期,且誕生了一批獨角獸;放眼未來,越來越多的模型需要大規模的數據來訓練,當華盛頓開始聲討矽谷公司們的隱私問題時,這讓科技公司的每一次發聲都小心翼翼。

增長放緩、隱私憂慮,比起中國互聯網公司以強運營作為護城河,技術驅動的谷歌將如何走出自己的增長瓶頸?這次開發者大會可見一二。

搜索無處不在

在谷歌母公司Alphabet的收入結構中,有84%以上營收來自於廣告收入。然而,亞馬遜正在廣告市場蠶食谷歌的市場。

美國媒體CNBC曾經報導,在購物領域,廣告主正在把預算從谷歌轉移到亞馬遜,原因是在亞馬遜上投放的廣告的投入產出比更高,越來越多人在購物時第一時間想到使用亞馬遜來搜索。

根據市場調研公司eMarketer的預測,未來谷歌在廣告市場的市場份額將從38.2%下降到37.2%,這1個百分點將被亞馬遜取代,亞馬遜在整個廣告市場的份額將從2018年的6.8%上升到8.8%。預計2020年將達到10%。對未來谷歌在廣告市場的擔憂,以及一季度增長放緩,正是谷歌財報後下跌的主要原因。

長期來看,谷歌正在通過人工智能將搜索嵌入到更多場景中。《財經》記者在現場試用谷歌新發布的手機Pixel 3a時,拍攝一張照片,可以自動切換Google Lens(一款圖片識別App),立刻會出現人物服裝、家具等購買鏈接。這意味著,用戶拍照都可以成為購物廣告。記者現場試用結果顯示,目前谷歌出現的相關圖片購買鏈接,還無法精準到原物。

未來,依托谷歌的搜索技術,在加入圖片與語音的互動之後,搜索不再只是輸入文字。谷歌在開發者大會期間宣布了100項產品和算法上的新功能。這裡,選取一些打動人的產品創新:

基於圖片的搜索

美國絕大部分餐廳都沒有圖片,菜單是一張密密麻麻英文列表。當你去到一家餐廳不知道吃什麽的時候,不需要再通過其他App搜索,打開Google Lens的手機攝影頭對著菜單,螢幕會出現哪些菜最好吃,這些會有重點記號顯示;當你點擊一道菜的名字時,谷歌還會調取谷歌地圖上的圖片,直接出現這道菜的圖片。

吃完飯後,只需要圖片拍攝菜單,就可以自動計算AA製每個人應付的錢數。

此外,谷歌還與法國的一本美食雜誌合作。當雜誌上出現一道法式烤豬排時,只要用攝影頭對著豬排的圖片,就可以在攝影頭中出現動態的豬排的做法演示。

儘管這些簡單的小應用背後都需要強大的算法與技術支持,但這依然離不開谷歌過往收集的數據,比如菜單上的圖片就來自於用戶主動的拍照上傳分享。而動態的豬排做法,則需要專業的團隊去製作這樣的視頻。

基於圖片識別的另一個功能是Google Go,它可以幫助識別路牌。對於語言不通的人來說,或者殘障人士,只要將手機攝影頭對準路牌,就可以自動將信息念出來,或者將英文信息翻譯成中文,不再需要在文字搜索框內翻譯,過去幾年,谷歌在翻譯功能和視覺識別的精準度方面已經快速提升。

在搜索具體名詞時,谷歌還加入了3D圖像與AR圖像。在谷歌中搜索一雙新百倫的鞋子,可以看這雙鞋子的各個側面,包括鞋底的展示。目前,谷歌正在與NASA、新百倫、三星、沃爾沃汽車和美國超市Target、美國家具平台Wayfair合作,在搜索結果中呈現更多3D圖像。

如果搜索白灰鯊魚,會在手機上出現鯊魚的3D圖像,還可以使用點擊移動功能。現場展示者就將大鯊魚的AR圖像移動到了舞台上。轉動攝影頭,甚至可以通過手機看到大白鯨的牙齒。

Google Assistant 語音助手

去年,谷歌首次推出智能語音助手的一款更加智能的程序Duplex,它可以模仿人的語氣電話訂餐、並且在機器說話的時候加入停頓詞,可以連續發出多個請求,不需要每次都用“Hey Google”喚醒。谷歌資深科學家、技術大神Jeff Dean介紹稱:“僅這一個系統就涉及了多項技術,包括自然語言處理和對話理解、語音識別、文本到語音轉換、用戶理解和有效的 UI 設計。”

今年語音助手連續發出了8個指令,可支持多任務同時進行,甚至可以讓語音助手挑選出相冊中在黃石國家公園有動物的照片,甚至是有犛牛的照片。

谷歌還推出了基於網頁的Duplex版本,只要說出為我下一次旅行訂車,Duplex可以通過Gmail知道你喜歡的車型、訂車時間,自動幫你完成所有需要填寫的表單,全程不需要手動輸入,這項功能將在今年下半年上線。

當你告訴語音助手:“導航去媽媽的家”,其中“媽媽的家”可能是一家餐廳的名字,也可能真的是你母親的住所。谷歌可以識別這些個性化信息。

考慮到強大的“填表機器人”可能比用戶更清楚地記得自己的信用卡账戶、媽媽家的地址、班機和出行的詳細訂單,在隱私問題頻繁出現的矽谷,需要用戶自己在語音助手中設置個性化信息。

不過,這些新技術的展示就好比泡麵盒子上的展示圖片與真實圖片的差距。在去年的現場展示中,Duplex在幫助人類訂餐時,甚至可以模仿人的語氣詞,以至於餐廳老闆也無法確認,背後到底是一個人還是機器人。

但在真實的應用中,谷歌承認Duplex有25%的電話是人打出去的,而不是真正的語音助手,在機器打出去的電話中,15%會受到人的乾預。現場多數人在看完演示以後,會很簡單地以為這個機器人無所不能,真相是,它最擅長的功能就是“預訂餐廳”,因為谷歌一直在反覆訓練它,儘管如此,它有時候還做不到那麽好。

今年,語音助手還將加入到谷歌地圖中。只要說出“Let’s Drive”,就可以通過車內環境語音打開Youtube上的音樂、決定是否接電話。可以確定的是,通過語音直接調取應用程序越來越主流,語音正在成為下一個入口。

關愛特殊人群

谷歌的價值觀是:“讓所有人都可以享受技術的便利,而不是一部分人。”今年,谷歌也推出了很多使用科技幫助殘障人士的新功能。最終,這些幫助殘障人士溝通的新技術進展,也可以給普通人在特定場景下使用。

Steve Saling患漸凍症已經有13年,這種病在發病後肌肉僵硬、抽搐、說話或者吞咽困難,四肢開始逐漸無力,最終喪失自主運動的能力,著名物理學家霍金就患有此病。

谷歌通過識別Steve的面部表情,來訓練機器學習的模型。最終他只需要稍稍做出不同的面部表情,就可以操作谷歌智能家居設備Google Home。

這個項目名為Project Eupho年,由失聰設計師Elise Roy與哈佛教授Michael Brenner共同研發,但它需要盡可能多的聲音樣本。

谷歌語音研究員Dimitri Kanevsky就是一名聽力障礙者,失聰後才開始學習英文,因此在谷歌現場播放的大螢幕上,完全無法聽清楚他在說什麽——這段英語發音模糊,單詞輸出不清晰,無法與人溝通。於是,他錄入了1.5萬條自己的語音模型訓練,最終,機器可以準確識別他的聲音與講話方式。但這種個例並不具有普適性,谷歌正在尋找更多的樣本為殘障人士提供交流渠道。

谷歌還研發有一項Live Caption系統:你所說的話字幕會實時出現在手機螢幕上,這樣失聰的人就可以通過文字“聽”到語音電話了。除了給殘障人士使用,這項場景應用廣泛,比如在嘈雜的酒吧看球賽或者電視(美國電視都不帶字幕),或者不太方便收聽電話時均可使用,語音可以實時轉換成文字。

如今,這個功能已經在Youtube視頻網站上應用,對於沒有字幕的美劇,在螢幕下方點擊字幕,就可以出現谷歌根據語音出現的字幕。但事實上,字幕的實時識別並不是什麽新功能,美國的用戶很早就可以選擇在Youtube上添加字幕了。一位現場的開發者很明顯地感覺到:“谷歌的識別準確率提升很快。”

在互聯網時代,谷歌的第一次商業模式是通過搜索賣廣告賺錢;在移動時代,谷歌抓住了安卓的機會。如今,谷歌正在通過圖片與語音的識別技術,改變搜索的方式,並將人工智能悄無聲息地嵌入更多場景中。

硬體戰爭

語音與圖片技術的發展也在帶來用戶使用習慣的改變。拍照是搜索,說話是搜索,看菜單、訂車都可以是搜索。在矽谷,很多人使用智能手機的習慣已經改變:“Hey Google,明天早上8點開會。”“Siri,打開微信。”他們習慣對著安卓或者蘋果用語音打開手機應用程序,而不再是滑動螢幕找APP。

過去,智能語音助手在五大科技巨頭之間角力並不是什麽新鮮事:蘋果的Siri、亞馬遜的Alexa、微軟Cortana,以及Facebook的Massager M和Google的Assistant,這些各大公司研發的語音助手,都在尋找落地場景。在語音產品上,過去兩年競爭最激烈的新硬體領域就是智能音箱。

Google Assistant是軟體,Google Home是智能音箱硬體,Duplex又是Assistant軟體中的一個Google開發的語音應用程序;同時語音助手也可以調動很多其他應用程序,可以看成是語音小程序Actions。

在智能語音市場上,除了發布手機之外,家庭智能硬體的競爭越來越激烈,過去主要是谷歌與亞馬遜的較量。亞馬遜最先行動,從2014年開始開發智能音箱,儘管技術上不如谷歌,但一直牢牢佔據著過半的智能音箱市場。2016年之後,谷歌醒過來開發智能語音助手。過去三年的谷歌開發者大會,谷歌語音助手搶佔了主題演講最多的風頭。

一位同時使用過谷歌與亞馬遜智能音箱的開發者評價稱:“亞馬遜的智能音箱發行比較早,能夠控制的智能設備更多;但谷歌智能音箱的技術更好,在一些開放性問題的回答上,明顯智能很多。”一位房地產銷售人員稱:“在谷歌公司旁邊的新建案,已經在房子裡內置了亞馬遜Alexa,用來遙控家裡各種設備。”

2018年,是谷歌逆襲的關鍵一年。它用29.9美元低價的Google Home Mini智能音箱搶佔盡可能多的智能家居市場,谷歌很快將市場份額從23.8%提升至29.5%。Voicebot研究機構曾經預言,到2022年,預計谷歌智能硬體產品將超過亞馬遜,形成48%比37%的市場格局。

早期,谷歌語音助手內置於谷歌Pixel手機中,後來還出了iOS與安卓的App。接下來,谷歌將語音助手應用於開發的兩款智能音箱產品中:Google Home與Google Home mini。如今,谷歌的新算法可以幫助新一代的智能助理在設備上以高達10倍的速度來回答問題,延遲幾乎為零,新一代的智能語音助手將出現在今年晚些時候推出的Pixel 3手機上。

未來,谷歌還將與汽車廠商合作,在更多汽車上安裝語音助手。當你在駕駛時,谷歌語音助手可以開啟智能駕駛模式,新的儀表盤會在開車時自動啟動,通過語音控制導航、信息和電話、多媒體。除此之外,甚至還可以用它遠程控制汽車,比如調節車內的溫度、檢測燃油油位,或者在房間裡鎖車。

另一個趨勢是,在智能音箱布局完成以後,矽谷巨頭們紛紛醞釀以客廳和廚房為中心的帶顯示屏的智能設備。一位谷歌工程師告訴《財經》記者:“有很多場景無法通過語音來解決,語音在識別上還有一些誤區,螢幕的存在可以幫助糾正聲音指令,也會有更多的應用場景。”

今年的幾個開發者大會上,谷歌發布了帶有螢幕的Nest Hub,它可以給家人打電話、看美劇,尤其適合廚房與家庭硬體設備。Facebook也發布了適合廚房與客廳的硬體設備Portal,但在語音助手的合作上,普通的應用場景Facebook選擇了自己的語音助手,而購物場景則與亞馬遜Alexa合作。

谷歌從2016年開始研究語音助手,2017年推出了基於語音助手調動的小程序Actions。2017年4月,谷歌還僅僅只有175個Actions,到如今已經有4253個Actions。與之對比,亞馬遜有6萬多個Skills小程序。

在谷歌的園區,語音助手的體驗區會詳細教開發者如何來設計基於聲音的互動。經過近四年的發展,谷歌將語音助手如同第三方設備一樣,開放給很多第三方合作夥伴。目前,已經在超過10億台設備、在80多個國家以30多種語言開始使用。

谷歌CEO SundarPichai在活動一開始就展示了現場的AR地圖和導航功能,這讓這次開發者大會看起來像一個充滿未來感的樂園。

這樣的AR導航對找不到方向的人來說提供了很多便利。記者在現場打開AR地圖,除了經常掉線跳出,在不到兩分鐘的時間裡,手機電量從31%掉到了15%。儘管谷歌每年的開發者大會演示的新功能都很炫酷,應用到現實還有很多要解決的問題。

新技術應用困境也是谷歌商業探索的折射,很多新的商業模式起源於細分領域的技術突破,這是長期探索的過程,短期內還要克服很多難題,無人駕駛Waymo的誕生就是個典型的例子。

這正如獨立股票研究機構Valuentum Securities分析師CallumTurcan所說:“Alphabet的公允價值被下調,部分原因是該公司進入了收入增長放緩期;但我們非常樂觀地認為,Alphabet是一個長期投資機會。”

(本文首刊於2019年6月3日出版的《財經》雜誌)

獲得更多的PTT最新消息
按讚加入粉絲團