每日最新頭條.有趣資訊

從藍牙語音到大屏互動,剖析百度在對話式 AI 上的創新

藍牙設備可以像 WiFi 設備一樣具備語音互動的能力,這是非常有意義的事情。

-shenzhenware-

2017 年,伴隨人工智能音箱行業的火熱,基於 AI 的語音互動也正逐漸改變人機互動的方式。同時,集語音技術以及內容、服務生態的語音平台應運而生,這些語音平台大多背靠互聯網巨頭、AI 公司,試圖發展成為「AI 時代的安卓」。

對於這些的公司而言,除了 AI 技術和內容閉環服務打通,他們更注重將技術、應用落地到產品,帶給用戶價值,這樣才能反過來促進技術的進步,繁榮生態。

作為國內最繁榮的語音 AI 生態,百度 DuerOS 在產品落地方面有不少領先的成果。在最近由深圳灣主辦的「ON THE GO:隨行 AI 場景的產品創新」峰會上,來自百度智能生活事業群組的劉悅發表了主題為《百度在對話式人工智能上的創新探索》。

以下為演講實錄,內容經深圳灣整理和編輯。

人機互動發展:從人理解機器到機器理解人

每一次人機互動的迭代都在推動著時代和產品的發展。

我們簡單回顧一下人機互動發展經歷的三個階段:第一階段的 PC 時代,以滑鼠和鍵盤的互動方式促進了 PC 設備發展,相關軟體也應運而生。第二階段的觸屏時代,從過去的滑鼠、鍵盤到觸控手機,使得硬體的使用成本極大的降低。第三階段,也就是目前,語音對話的人機互動方式的發展,使得我們理解機器成本進一步降低。

從人理解機器到機器理解人的互動方式的改變,催生了智能音箱、智能大屏設備、智能可穿戴設備、智能車載等設備的發展。

基於語音對話的人工智能產業已經全面爆發

從國外的市場來看,亞馬遜 、Google、蘋果、微軟以及許多創業型的公司加入到這場智能化的變革當中,他們的競爭已經進入白熱化階段,並推動整個市場和產業的發展。

回過頭來看,國內的市場情況也跟國外非常像。我們預測,2020 年,對話式人工智能在各個場景上的滲透將大幅度增加:智能家居(上升 27%)、智能車載(上升 51%)、智能可穿戴(上升 68%)。

中國市場的潛力非常巨大,我們發現,目前有非常多的音箱、大屏設備、穿戴設備、耳機等設備都在變成一個可人機自然對話的智能設備,基於語音對話的人工智能產業已經全面爆發。

小度自誕生以來取得的成績

百度在 2015 年的時候發布了第一款

小度產品

,從那時候我們開始嘗試和探索如何做一款這樣的產品。至今,小度助手已經成為中國市場最繁榮的語音 AI 生態。

在 2016、2017 年,我們更多的持「生態賦能」的思路,不斷跟業界的其他硬體公司合作,包括音箱企業、電視企業(TCL、創維等)、汽車企業、手錶企業、耳機企業、手機企業等。我們把 AI 能力賦予不同場景下不同的硬體,讓這些硬體成為可語音互動的設備。

2018 年,我們統計了搭載小度助手設備的激活數:從年初的 5000 萬漲到 2018 年年底的 2 億,至今這個數字還在不斷提升。當然,激活數據並不能代表這個生態已經達到繁榮,只能從一個側面反映了搭載的能力。而這樣的能力是否真正被用戶使用,以及用戶是否接受我們給他的新互動方式?

實際上,我們也會非常興奮地看到,從語音互動次數來看,用戶的接受程度也在不斷提升。從 2018 年 3 月到 2018 年年底,我們通過月語音互動次數的指標來反映用戶互動頻率,從最開始的 2 億次到達去年年底的 16 億次,這個數字至今還在持續上升,並且速度非常迅速。

從這兩方面看來,小度已經變成了中國最繁榮的對話式人工智能平台。

這裡面有另外兩個指標,我也想分享給大家,一個是語音技能數量,目前小度已經有上千個各式各樣的語音技能,我們自己只能做一些頭部的技能,更多長尾的技能需要開發者不斷提供,這些技能絕大部分都來自於我們社區當中對這方面感興趣的開發者,使得生態變得更加健康和更加活躍。

另外,根據 Strategy Analytics 的統計,2018 年第四季度,小度系列智能設備的出貨量提升到中國第二,增長率達到了全球第一,增勢非常迅猛。從現在來看,小度逐漸進入千家萬戶,成為用戶貼心可靠的助手,這也是百度在做對話式人工智能方面的理念和終極目標。

小度的產品發展經歷

我們經歷了從開始發布產品,到後面不斷給第三方賦能,一直到後面自研硬體,一路走下來的過程。

百度對話式人工智能的創新一:藍牙語音解決方案

接下來講一講百度在對話式人工智能所做的創新。除了大家熟悉的無屏音箱、帶屏智能音箱,我們還在其他方向做了探索,今天借這個機會給大家來簡單分享。

第一個是藍牙設備。面對各種各樣的藍牙設備(藍牙耳機和手環等),我們萌生出了給這些藍牙設備賦能的想法——使得藍牙設備可以像 WiFi 設備一樣具備語音互動的能力,這是非常有意義的事情。

我們首先來看一下藍牙設備的趨勢:根據 SIG 的調查,截止到 2022 年,整個藍牙設備全球鋪貨量達到 8.8 億台。這意味著有很多藍牙設備等待著我們去升級,對話式 AI 技術將對傳統的藍牙市場帶來新的機遇。

從場景上來看,藍牙設備也存在許多痛點。我們主要總結了三個場景,一個是家中,一個是路上,一個是在車內。在家中,智能音箱既支持 WiFi 又支持藍牙,可進行語音互動。在路上有穿戴設備和智能耳機,蘋果前不久發布第二代 AirPods 支持了 Siri 語音喚醒。第三個場景是車內,人在開車的時候雙手被限制在方向盤上,這時候語音互動就會變成非常自然的互動方式。

基於這三個場景,我們怎麽幫助用戶提升他的體驗,怎麽幫助設備商更好地提升產品呢?這就是我們之前半年到一年時間探索當中希望解決的問題。

小度藍牙解決方案

在 2018 年 7 月的百度開發者大會上,百度在國內率先提出了藍牙設備的語音解決方案——DMA 藍牙解決方案。在 11 月的百度世界大會上,我們發布了第一款基於 DMA 藍牙協議的車載支架,這也是我們在車載場景上基於藍牙解決方案做的實踐產品。這個產品並不希望攪亂市場,我們更多是想告訴其他相關的廠商,這樣的一個方案是 work 的、是被用戶買账的。

同時,因為精力有限,我們也不希望完全自己來做所有語音藍牙設備,而是希望把藍牙合作方案輸出給更多合作夥伴,讓大家打造出具備智能對話能力的藍牙設備。

而做這件事情的時候,會給廠商帶來一系列的問題,比如:

用戶是否有需求?對這樣的產品感興趣嗎?

是否會增加很大的生產成本?

AI 技術接入門檻高嗎?是否需要投入很多人力和周期?

有成型的方案幫助我們落地嗎?

語音能力、NLP 打包在方案中嗎?

可以給用戶提供哪些內容資源?是否收費?

實際中,我們對這些問題也進行了研究和探討:

小度的裝機量、活躍度,以及小度車載支架的熱賣,從市場角度印證了,用戶對這個產品有非常大的剛需。

產品的功能方面,我們在小度藍牙方案上基於不同的場景做深度的打磨,比如車載支架相應的車載場景,剛需的內容就包括娛樂、導航、接打電話,針對這些場景深度打磨的產品都會在小度 APP 上得以體現。

針對技術門檻,我們也做了很多優化,提供 SDK 的開發套件,把研發的門檻降到非常低。

DMA 整套方案是免費的一體化解決方案,包括語音技術、背後的內容資源和開放生態,以及第三方技能。

關於小度藍牙的解決方案

接下來是具體的方案介紹,小度藍牙的解決方案主要包含兩部分,一個是小度 APP,第二個是 DMA 協議。DMA 協議的主要作用是幫助藍牙硬體和手機上的 APP 之間進行對話式互動通訊。

通過我們提供的 DMA SDK,可以快速把 AI 移植到藍牙設備,讓數以千萬的藍牙設備瞬間變成可以對話的人工智能設備。

當這些藍牙設備有了語音互動的能力,就能夠讓用戶通過語音互動獲取小度雲端的內容,包括聽音樂、有聲節目、導航、控制家居等等。

小度的 DMA 語音解決方案有效解決了經典藍牙協議的以下痛點:觸碰和按鍵觸發、語音輸入延時明顯、APP 之間的串擾和搶佔等。

DMA 解決方案的語音互動不需要觸發按鈕,並針對遠場的語音互動做了非常多的優化,在車內複雜的環境下,喚醒率達到了 97% 以上;DMA 解決方案的 BLE/RFCOMM 通道和 A2DP 可以同時使用,延時從 500ms-2000ms 下降到 200ms-300ms,不影響佔用錄音通道的 App。

百度對話式人工智能的創新二:大屏互動

今天還會跟大家分享我們另外一個在做的創新探索,即大屏體驗。

「讓用戶放下遙控器」是我們做大屏探索時給自己設定的一個目標。針對找不到遙控器、找片很費勁、音質不理想的幾大痛點,我們做了小度電視伴侶這樣一個設備,它有很好的 Hi-Fi 音質,全語音遠場互動,和全天候人工智能助手,這個產品最終的銷量也遠高於我們的預期。

在小度電視伴侶,我們專門設計的小度智能電視 UI 可以告訴用戶,放下遙控器、試著通過語音來跟這個設備進行互動;

我們還創造了「大屏信息流」的概念,把好的內容通過信息流呈現,並通過語音互動做定製化的推送;

同時,這一設備的整套系統全面接入了小度語音助手,使得語音無處不在,它開機時就是智能電視,關上之後就變成智能音箱,語音互動一直在線……

針對電視上 APP 應用安裝麻煩的痛點,小度電視伴侶搭載了 DuerOS 的語音技能,不需要安裝,只需一句話就可以調用。

我們希望在後續中不斷探索人機互動,以及人工智能如何賦能不同場景的智能硬體,希望對話式硬體被更多人使用。

微信號:shenzhenware

整理、編輯:大林/ 深圳灣

審校:森林木/ 深圳灣

/////////////

獲得更多的PTT最新消息
按讚加入粉絲團