每日最新頭條.有趣資訊

谷歌副總裁:過度炒作正吞噬語音助手未來

【獵雲網(微信號:ilieyun)】8月27日報導 (編譯:孫家樂)

編者注:隨著人工智能的發展,語音助手服務成為了人們生活的重要部分。但是現今的語音助手服務仍然存在不足,不論是過度炒作、語音識別難度大還是出現問題的最終責任人等問題,都影響著語音助手服務的發展。想要在這方面取得進展,必須反對“一刀切”,要有創新,也要聯合所有相關人士的智慧,一同解決難題,推進語音助手服務的發展。

由Venture Beat在加利福尼亞州米爾谷舉辦的聚焦人工智能的活動中,負責Google Assistant工程團隊的谷歌副總裁Scott Huffman分享了一些有關如何通過語音助手創建持久體驗的見解。成為一個人日常生活的一部分有助於推動人們的接納人工智能服務,例如:Google Assistant“創建提醒”或“播放音樂”指令的使用次數可能會是谷歌搜索查詢的40倍。

Huffman很會從平台角度分享獨特見解,但這只是一個方面。另一方面是大量的開發人員、初創企業和服務提供商在進行自己的第三方體驗,這些體驗會給Google Assistant或Alexa的工作帶來幫助。

炒作會破壞價值

在過去的幾年裡,機器人和人工智能或許取得了比科技行業的其他任何部門都長足的進步,但同時也受到了過度行銷甚至是虛假宣稱的影響。一段時間後,想要從謠傳中分辨真相就成為了一種挑戰。

Voicera公司的首席執行官Omar Tawakol表示,這種誇大其詞的炒作會帶來一些不良後果。

他說:“我討厭炒作,因為炒作破壞了價值。因為從長遠來看,當你有一個很好的創新想法時,它通常會超出你之前的想法,但在短期內,它會被過度誇大,以至於你在兩個想法之間都會有不理性的行為。當你沒有足夠的耐心把自己的創新想法發展到最終階段時,你就會找一些辦法來炒作。這對投資者而言是有利的,但對於你而言是有弊的。”

Pull String首席執行官Oren Jacob表示,圍繞人工智能助理的炒作並不新鮮。Pull String是一家幫助客戶為Alexa和Google Assistant創建語音體驗的機構。

Jacob說:“自從Siri第一次在電視上播出以來,這個行業的前景就一直面臨威脅。”

這並不意外,Tawakol表示兌現承諾是對用戶是否會選擇更新到他公司的轉錄服務的付費版本的很好預測。

他說:“準確性和相關性只是核心,特別是如果你要把這封郵件轉發給某個人,那它的內容最好是完美的,我認為我們現在還不夠好。但每時每刻我們都在越來越好,而且我覺得我們還沒有達到這個行業已經兌現了承諾的地步。”

缺點即是機遇

Alpine.ai.為品牌和公司製作語音應用。首席執行官Adam Marchick說,在創建該公司之前,他的語音分析平台被3700多名語音應用程式開發人員用來跟蹤性能,並找出有效的解決方法。

今天,他的公司正在幫助Petco建立PetCoach Google Assistant功能和Alexa技能,它可以告訴用戶寵物吃什麽東西是安全的。

他說:“我們已經從所有分析中明白我們現在沒有機會獲得100%的匹配率。”

Marchick說,語音應用程式開發人員知道這項功能不能回答每個問題,所以不需要讓每一個查詢都變得失敗,從而使用戶失望。

他說:“Pet Coach不會回答‘你能重複一遍嗎?’或者說一些錯誤的內容,而是會講‘這是一個偉大的問題。我們現在沒有你的答案,但我們的獸醫會很樂意回答的。如果你留下你的電話號碼,當我們得到答案時,我們會給你發簡訊。’因為這是一個對該客戶的高價值搜索查詢,它將激發對客戶的親和力以及增加商店內的訪問。”

他說,這種方法可能與絕大多數語音應用的貨幣策略不符,因為它需要快速維護和資訊支持,但這是一種規避缺點、確保客戶感受到被關照的方法,也有利於完善該應用的智能知識庫。

語音應用程式發展艱難

人工智能助理們正在開發越來越多的視覺界面,比如電視和智能顯示器,但想要鼓勵採用第三方語音應用程式來建立一個沒有主頁的界面依然很艱難。

Marchick說,僅僅因為可以直接訪問語音應用程式的語音命令並不意味著人們會在最常用的用例之外使用它們,例如設定計時器、聽音樂或播客。

他說:“對於一個品牌或零售商,甚至是一個遊戲,想要形成一個沒有用戶界面的習慣,並棋王只需要一個命令就可以達到目的,這種事情現在還做不到。”人們更有可能通過問“我的貓能吃雞蛋嗎?” 來獲得Pet Coach的回答,而不是說“好的,谷歌,和Petco談談”。

谷歌和亞馬遜已經開始推薦一些語音應用程式來回應自然語言的問題。

Jacob說,事實是,今天消費者可做出的大多數選擇都並不是很好。他說:“我會評論說,很多技能和行動基本上都很糟糕,而且回歸用戶和花在他們身上的時間都顯得非常糟糕。”

語音應用程式可以幫助增加人工智能助理提供的服務,其中之一是選擇一個特定的主題,並深入研究,而不是試影像Alexa那樣,為各種各樣的問題提供通用的事實答案。

這方面的一個例子是PullString的Westworld Google Assistant。

他說,因為做得很深入,所以一些用戶花了一個多小時來玩遊戲。

他說:“這是一種特別有針對性的虛擬體驗,因此它是有限度的,如果你能將它綁定起來,並左右約束,你就可以進行深入研究,因為你不需要回答任何宇宙般深奧的問題。這就是Alexa、Siri、Cortana或其他助手的承諾的張力。”

不能“一刀切”

Voicera有一個罕見的區別,那就是它是一家擁有投資者的人工智能公司。其投資者來自於人工智能行業的一些最大競爭對手,包括GV(前谷歌風投公司)和Microsoft Ventures。

但與Pullstring或Alpan.ai不同的是,它試圖為企業客戶而不是消費者創建服務。

當公司第一次提供EVA助理來記錄會議和突出行動項目時,參加會議的人必須主動地說出這樣的話:“OK,Eva,這是一個行動項目,提醒我發送一份演示文稿,謝謝Eva。”在發布後的一個月內,用戶就讓Voicera明白了這是個糟糕的主意。

Tawakol說,一位首席執行官把他拉到一邊,說要擺脫指揮結構,因為他不想打斷一個10到15人的會議,以記錄一個行動項目。

他說:“這教會了我們,對企業而言,你不能複製消費者的使用模型。”

語音很難做

與鍵盤或螢幕上點擊按鈕的精確性不同,語音界面會帶來一系列其他用戶界面中不存在的挑戰和細微差別。

Jacob說:“在語言方面,人類語言的模糊性一直在向你襲來。話題的變化是迅速而直接的,談話中的聲音沒有連續性。口語是由片段:呃、啊哈和口吃組成的。”

要確保助手理解帶有口音的人,主要的語音計算平台可能將需要多年的工作才能做到。而且,一般來說,語音接口帶來的挑戰並不像鍵盤或觸摸屏界面上的那樣容易解決。

考慮亞馬遜和谷歌的商業選擇

Marchick說,要明智地選擇你所選擇的垂直方向。例如,你也許可以依賴亞馬遜而不涉足你的業務,但其他垂直市場卻不能這樣說。

“我認為遊戲是非常安全的垂直市場。如果你建立了一個引人注目的遊戲,他們所要做的就是推銷你,因為它可以銷售更多的設備。它帶來了更多的日常活躍用戶、更多的參與。正如Yelp在網絡上發現的那樣,如果你去旅行或做當地的生意,你就得仔細瞧瞧能獲得多少交易。但如果你想要做語音的話會比這難上一百倍。”

Jacob同意這一評估,並補充說,在Alexa平台上建立電子商務體驗應該會給你帶來一些停頓。他建議在這麽做之前,先與亞馬遜溝通一下。

出了問題,誰來負責?

與第三方平台的人工智能助理一起製作語音應用的開發商和品牌,必須弄清楚,當體驗失敗時,責任在哪裡。

Jacob說:“我認為你已經注意到並將會看到不同的科技巨頭對於標準是什麽做出不同的決定,語音作業系統方面負責的對話數量和第三方開發者的數量兩種觀點針鋒相對。這十分不清楚,事實上,你在問谷歌(一個問題),但PETCO會回答:它在這條標準的兩邊浮動。”

語音應用的作業系統目前在市場上處於一個動態移動的位置,開發人員和平台都必須共同努力,以整合第三方開發人員為Alexa和Siri等助手帶來最佳貢獻。

Jacob說:“我們正在互相推動著把這些方面的東西整理出來。目睹我們進步,以決定我們如何能夠最好地為它作出貢獻,是一件非常重要的事情。”

獲得更多的PTT最新消息
按讚加入粉絲團