每日最新頭條.有趣資訊

2019語音技術報告:語音經濟規模將超移動應用

劃重點:

騰訊科技訊 美國投資機構Mangrove Capital Partners本周發布了2019年“語音技術報告”。報告題為“語音:歡迎下一代的顛覆者”,分析了語音助理服務的日益普及,並對2020年Siri的動向做出了有趣的預測。

以下為騰訊科技(微信號ID:qqtech)編譯整理的報告全文:

在過去多年的鍵盤輸入和點擊手機螢幕之後,我們正在回歸到最初的“用戶界面”:語音。雖然我們尚未感受到語音技術帶來的全部影響,但這種技術正在改變我們與數字世界互動的方式。

重要的是,這種轉變影響的遠遠不止是查看氣象預報,獲取音樂,以及設置鬧鐘。語音帶來了平台和用戶界面的轉變,足以與網頁和智能手機相媲美。作為人工智能和機器學習的入口,語音技術將通過強大的新方式為我們提供服務。

在Mangorve,我們相信,語音將成為未來10年決定性的主題之一。除了用數字服務影響各行各業以外,語音技術還將培育出新一代的科技公司。與人工智能一起,語音技術將從根本上改變人和機器的關係,給下一代軟體創造巨大價值。

向語音的轉移

自2011年蘋果推出Siri以來,語音技術已經取得了長足發展。隨著機器學習的發展,我們在語音識別(語音轉文字)和自然語言處理(識別文本中的指令)兩方面都獲得了相當大的進步。事實上,語音系統的單詞識別準確率已超過95%,這意味著它們已經具備了與人類相仿的語言理解能力。相對於打字,語音產品提供了更自然、更便利、更高效的溝通形式。因此,語音注定將成為最主要的人機互動接口。

根據Juniper Research的數據,目前市面上已有25億個語音助理存在。隨著科技巨頭爭相加入競爭,越來越多家庭正在啟用語音服務。在美國,家用智能音箱的總數2018年大幅增長78%,從6670萬台增加至1.855億台。亞馬遜在這個市場的份額達到64.6%。Canalys預計,全球範圍內智能音箱的裝機量到2023年將增長至5億台。

語音也在成為智能家居和物聯網的入口。亞馬遜宣布,已有4500個品牌提供2.8萬款支持Alexa的智能家居設備,包括電視機、炊具和機器人吸塵器。除了進入家庭場景之外,語音助手也在進入萬豪等酒店的房間,並且在汽車信息娛樂系統中也很受歡迎。亞馬遜正在與多家汽車公司展開談判,有報導稱亞馬遜的車內產品Echo Auto預售訂單已超過100萬。Echo Auto提供全方位的免提體驗,包括打電話、導航,以及操控智能家居設備。

語音技術也在超越語言障礙。目前谷歌的服務已經支持30種語言,甚至可以同時理解用戶所說的多種語言。有趣的是,在中國語音服務的普及更快,阿里巴巴在中國的智能音箱市場處於領先。

各類受歡迎應用的出現令人聯想到App Store發展的早期。亞馬遜Alexa提供的功能包括為新媽媽提供母乳餵養支持,鼓勵孩子們刷牙,幫助用戶鍛煉,指導足球隊,以及指引人們如何禱告。

語音電商的崛起

由於亞馬遜Alexa直接關聯至全球最大的電商平台之一,語音購物也在初步發展。亞馬遜已經看到,Alexa平台的電商交易在2018年假日季同比增長至三倍。沃爾瑪近期也推出了基於谷歌語音助手的在線生鮮購物服務,支持消費者通過谷歌Home、智能手機或智能手錶將產品添加到購物車。

根據Juniper的數據,在美國和英國,語音電商的規模將從2018年的20億美元增長至2022年的400億美元。有趣的是,語音電商最熱門的三大商品品類都是低價商品:生鮮雜貨(20%)、娛樂(19%)和電子(17%)。

因此對零售商來說,獲得“亞馬遜精選”的地位將會比以往更加重要。根據OC&C戰略谘詢公司的數據,亞馬遜消費者中有85%最終會選擇亞馬遜推薦的商品。不過目前外界仍然不清楚,具體商品要如何才能獲得這樣的推薦。

無論是在線上還是線下,語音技術已經在指引消費者購物。快消品廠商正在探索,基於語音體驗,對於製作雞尾酒和品嚐威士忌等場景,可以如何提升產品定位和用戶忠誠度。

你不會再感到孤單

重要的是,語音服務正在從事務性向對話性轉變。這種趨勢的最終結果很難完全被理解,但你可以考慮這一點:你永遠不會再感到孤單,無論是在與Alexa說話,還是與另一個人或人工智能說話。人工智能的第一次浪潮使用算法去建立推薦引擎,提供訪問互聯網服務,例如谷歌、亞馬遜和Facebook的快捷方式。而第二次浪潮則是幫助企業利用結構化數據去優化決策流程。類似Palantir的公司開始崛起,它們挖掘大量結構化數據,找出人眼和人腦難以發現的信息關聯性。

人工智能的第三次浪潮正在到來。人工智能獲得了眼睛、耳朵和無數其他感官,從而可以收集從來沒有過的新數據,隨後使用這些數據推動更複雜的流程自動化。與此同時,我們也在從基於命令的靜態流程轉向動態流程。這是計算領域的結構性變化,將徹底改變我們體驗軟體,與軟體互動的方式,模糊了數字世界和現實世界之間的關聯。

隨著人工智能系統在對話中變得更熟練,收集關於人們及其周圍世界的更多數據,它們將可以了解情景信息。人類通常可以不費力地掌握這些關聯信息,並將其應用在對話中。情景信息將幫助人類和機器以更自然的方式互動和協作。而隨著體驗的優化,變得更有用,他們將會更加頻繁的互動,而機器也將掌握更多知識。

這樣的良性循環意味著,在未來3到5年內,計算機的對話能力將變得更複雜,更具變革性。與其將我們的時間花在鍵盤打字和智能手機觸控上,我們可以很方便地與無所不在的人工智能交談。重要的是,我們與軟體互動的方式將被永久改變:表單將會消亡,接觸點將變成“監聽點”。

這就可以解釋,為何全球最大的科技公司向語音技術進行了大筆投資。語音技術帶來了平台和用戶界面的改變,這足以媲美此前的網頁和智能手機,而不同之處僅僅只是,用戶向語音的轉移不需要任何訓練。對於這種未來主導性的平台,大型科技公司不容有失。因此,亞馬遜已有超過1萬名員工從事Alexa項目,而亞馬遜也是對語音技術創業公司最熱衷的投資方之一。

語音優先界面的黎明

語音技術的影響非常深遠,每家公司都需要重新考慮如何與用戶進行互動。這不僅僅是調整SEO(搜索引擎優化)等方面的工作,或是開發自己的Alexa“技能”或谷歌的“操作”。

企業最終需要提供能感知情景、語音優先的界面。能建立用戶認知和情感連接的企業將可以更好地吸引用戶,而如果只是用預設腳本去被動響應用戶問題,那麽企業將處於明顯的劣勢。嚴重依賴通知去驅動應用使用的科技公司可能需要重新審視策略。消費者對於那些用太多通知去打破“聲音門檻”的公司(例如LinkedIn)不會再有太多耐心。

最熱門的移動應用成為了今天的主導平台,而最能吸引用戶的語音優先界面將會成為明天的主導服務。很難預測理想的界面應該是什麽樣,但下一代Airbnb、Monzo和Uber的出現很可能只要3到5年。

無螢幕手機,例如Light Phone的出現向我們展示了未來,這樣的手機不依賴於我們了解並喜愛的移動應用。考慮到語音服務的學習曲線很短,能明顯減少用戶的使用障礙,因此可以很合理地假設,在我們注意到全部潛力之後,語音經濟將快速發展。

語音時代的工作

在我們與軟體互動的過程中,所花費時間最長的場景就是工作。因此可以合理假設,在工作場景我們將會看到最明顯的變化。儘管我們可能仍然需要與螢幕互動,但鍵盤很可能會變成多餘的。畢竟,普通人每分鐘可以用鍵盤輸入40個單詞,但卻可以說出150個單詞。

無所不在的人工智能可以支持我們日常工作中的許多任務和流程,例如回復電子郵件,整理會議信息,向團隊成員發布信息,以及用數據更新相關係統等。這也可能意味著,我們將不再被捆綁在辦公桌,不必再久坐不動。

更進一步,無所不在的人工智能可以注意到效率最高的員工,並告知他人他的工作方式,從而優化工作產出。能持續識別高績效者的特定策略,並將最佳績效建議分發給網絡中其他人的人工智能學習循環已經開始出現。這些優化網絡不是為了取代人工,而是依靠人類去學習並優化流程。人類仍然會處於循環中。

一個值得關注的案例是Chorus.ai,該服務能加入通話,同時就有效回復做出提示。Chorus.ai並不是給銷售電話提供預設的腳本,而是會分析團隊成員的不同方法,帶來更積極的成果,並鼓勵創造性。

通過讓人類變得更聰明、更高效,新一代的SaaS(軟體即服務)產品將可以收取更高的訂購費用,從而成為更具價值的一代企業軟體。

從虛擬人物到虛擬醫生

我們已經看到,虛擬KOL逐漸興起。例如,來自洛杉磯、19歲的虛擬KOL莉兒·米克拉(Lil Miquela)在Instagram上積累了150萬粉絲,目前已經參與過Calvin Klein等知名時尚品牌的行銷活動。

位於舊金山的創意工作室Fable正在虛擬人物方面邁進更多一步。該公司的虛擬人物具有完整的互動能力,並且有自己的個性。很快,我們就能創建人工智能全息伴侶,例如《銀翼殺手》中的喬伊。喬伊由Wallace Corp製造,可以成為“你想看到的全部一切”。

虛擬人物很可能會改變娛樂和客服的表現形式,與此同時在給老年人和其他需要幫助的人群提供服務方面也可以扮演關鍵角色。畢竟,被認為孤獨的人群健康下降的風險要高出59%,而社交孤立也是造成抑鬱症的最常見原因之一。

總部位於巴塞隆納的Safe365作為由科技驅動的社區和互助網絡已經吸引了許多老年人。語音產品提供了對用戶非常友好的方式,監控健康和認知能力,並提供關於鍛煉和服藥的提醒。

事實上,語音和人工智能最終有可能完全取代醫生。K Health已經開發了一款人工智能,將數千名醫生的經驗結合在一起,以做出準確的診斷。借助語音技術,人工智能還可以像人類醫生一樣給病人提供安慰。

對語音技術融資的分析

根據我們的分析,對語音創業公司的投資正在加速。語音技術創業公司今年已融資7.86億美元,遠遠超過2018年的5.81億美元以及2017年的2.98億美元。這樣的融資增長表明了市場的信心,即語音技術將帶來變革。融資的規模也在大幅上升,2019年到目前為止平均交易規模是3000萬美元,而2018年和2017年分別為1800萬美元和1750萬美元。

娛樂和播客是已經吸引了大量興趣的領域之一。Spotify收購了播客創業公司Gimlet和Anchor,總共花費3.37億美元。這個領域其他值得關注的創業公司還包括製作語音優先收費內容的Sybel。

與此同時,從2015年成立以來,亞馬遜Alexa基金已經進行了72筆投資。過去18個月中,該基金投資的創業公司涉及娛樂、健康、教育、交通、電商、酒店和SaaS等行業。這表明,亞馬遜相信語音技術將改變一系列行業。

我們的分析還顯示,在語音技術創業公司的融資活動中,美國處於領先。美國此類創業公司獲得了超過10億美元的投資,而歐洲只有1.18億美元。這尤其值得關注,因為語音技術代表著範式轉換。如果歐洲希望在下一代技術發展中建立自己的地位,歐洲的創業者和投資人需要快速做出響應。

挑戰

語音技術領域最大的挑戰之一是隱私保護。微軟的數據顯示,41%的語音助手用戶對信任、隱私和被動監聽感到擔憂。谷歌Nest設備中被發現存在隱藏的麥克風造成了不利影響,而亞馬遜申請專利“監聽房間裡的所有對話”也是如此。

如何回應這些關切取決於科技公司,而蘋果在這方面的工作卓有成效。蘋果收購Silk Labs值得讚賞,後者開發在設備中運行的人工智能軟體,而不必使用雲計算平台去處理數據。

蘋果在圍繞語音服務構建生態方面進展緩慢。實際上,蘋果1987年提出的“知識導航工具”給出了更明確的語音服務願景。語音服務社區期望蘋果在2020年全球開發者大會(WWDC)上為開發者社區發布Siri作業系統,從而加速創新和普及。

Voicebot.ai的編輯和出版人布雷特·金塞拉(Bret Kinsella)表示:“Siri作業系統對於鼓勵創新是有必要的。許多人認為,蘋果需要匹配亞馬遜和谷歌語音助手取得的進展。”

《機械姬》等熱門電影中提出的一個問題是,如果我們癡迷於機器人,愛上代碼而不是其他人,那麽人工智能將成為人類的威脅。儘管對某些人來說這種說法聽起來很牽強,但約會模擬遊戲已被證明非常受歡迎。在中國,名為《戀與製作人》的遊戲在上線首個月下載量突破700萬。

儘管挑戰了我們對隱私保護的觀念,就人類與技術的關係提出了新問題,但我們仍然有很多理由對語音技術保持樂觀。這種技術將驅動新的生產力提升浪潮,造福消費者、企業和社會。並且,這也將幫助我們更好地照料老年人,同時讓全球7.74億不識字的人群可以使用互聯網。

語音時代的預測

- 鍵盤的消亡:我們不再需要打字,而是可以使用語音和手勢。鍵盤將在未來5到10年內基本上消亡。

- 語音技術將帶來全新的產品門類,包括無螢幕智能手機。

- 品牌很快需要通過“聲音身份”來被識別,產品搜索將被徹底改變。

- 因為在使用語音服務時用戶不太能注意到具體應用,因此硬體將重新變得比軟體更重要。

- 虛擬伴侶將變成現實,滿足你生活的全部需求。

- 蘋果將於2020年推出Siri作業系統,從而在語音經濟中推動巨大的創新。到2025年,語音經濟的規模將達到1兆美元,超過移動應用經濟。(騰訊科技編譯/陳樺)

獲得更多的PTT最新消息
按讚加入粉絲團