每日最新頭條.有趣資訊

車載語音互動江湖紛爭,誰是最後贏家?

撰文 | 陳雪峰

圖片 | 網 絡

在智能電動汽車的盛世狂歡中,一則與車載語音相關的專業新聞卻被許多人忽略。

5月8日,全球最大的語音和語言解決方案提供商Nuance宣布與斑馬網絡達成合作,將Nuance會話型人工智能語音識別技術引入斑馬網絡最新的智能網聯繫統斑馬智行MARS(V3.0)。

有業內人士驚呼,斑馬是不是要放棄阿里雲ET智能語音?當然不是。

也許你沒聽說過Nuance,但一定知道蘋果公司的Siri,該系統就採用了Nuance的語音技術。在2013年之前,Nuance幾乎是車載語音的代名詞,佔據了國際主流OEM語音互動的市場。但是,它一直寂寂無名,直到與蘋果合作後,聲名鵲起。

現在,Nuance Automotive 以超過40種語言為道路上行駛的超過2.5億輛汽車提供技術支持,為奧迪、寶馬、戴姆勒、菲亞特、福特、通用、現代、上汽、豐田等幾乎全部主流汽車製造商打造會話型智能移動體驗。

據長期關注該領域的資深媒體人孟為分析,斑馬與Nuance合作原因有二:其一、斑馬2.0中對於英語的識別一直是軟肋;其二、從斑馬1.0 的Nuance,到2.0換為阿里雲ET智能語音,再到3.0可以在阿里雲或Nuance兩者之間選其一,這可以看作是一直生長於阿里生態中的斑馬嘗試努力接入更多外部資源的嘗試。

如果從另一個角度解讀,兩家公司的分分合合,則昭示著車載語音江湖錯綜複雜的競合關係。

在車載語音領域布局的不只是這些軟體供應商,主機廠也在加速布局。不久前,特斯拉首席執行官伊隆·馬斯克表示,特斯拉正在研究一系列新的語音命令,努力為車輛帶來更好的人工智能助理體驗。

特斯拉是智能汽車的全球領先者,而智能的汽車一定離不開智能的語音互動。因為它可以簡化車內的操控界面、操控方式,讓駕駛者更方便地操控車輛的功能。在取代傳統的互動方式後,還可以與駕駛員甚至車內乘客進行更深層次的“數據互動”,達到心領神會的境界。

如果到了真正的智能時代,智能語音將會成為乘員的AI助手。這是車載智能互動的終極奧義,但實現起來並不容易。這也是近年來諸多勢力前仆後繼,在此領域爭鋒、競合的原因所在。

車載語音起航

智能語音互動的發展,離我們並不遙遠。

對於普羅大眾而言,智能語音互動最初的概念,來源於微軟的小冰、蘋果的Siri。它們能聽懂用戶說話,並通過大量的語音數據庫訓練,找到用戶會話之間的某種關聯性,提取相應規則內的詞語或語句,反饋給人類。

這是一個複雜的過程,需要一定實力的公司才能推進。

在國內,提到語音互動的先驅,必然繞不開中科大的科大訊飛。早在2012年,科大訊飛即提出基於雲加端的架構,以及自然語言理解的技術,使汽車上的語音互動更加自然。

幾乎在同一時期,未來車載語音互動的選手也開始入場。2011年,博泰與科大訊飛合作推出全球第一台自然語言的互動系統iVoka;2012年06月,雲知聲成立,同年出門問問成立;這一年,已在劍橋成立5年的思必馳也有所動作,聯合創始人俞凱在上海交通大學創建智能語音技術實驗室,將人機口語對話系統的全面技術引入國內。

2014年,思必馳推出業內首個麥克風陣列的降噪技術,可用於對聲場的空間特性進行采樣並處理,使得“聲控”成為可能,尤其是在複雜的車載環境中。

這段期間,由於中文環境的特殊性,科大訊飛在國內車載語音市場獨領風騷,佔據了大半市場。與之相對應的是,各大OEM都在推出功能重疊、幾無差異的車載語音功能。

正是這些當年的語音互動新人,共同拉開了車載語音互動的大幕。接下來的三年,則是初創公司與OEM和Tier親密接觸的美好歲月。

2015年3月23日,上市公司均勝電子的全資子公司均勝車聯宣布,收購語音識別公司車音網10%的股權。

2016年9月1日,成立近7年的車載語音互動廠商普強信息宣布C輪融資,迎來在車載導航領域低調布局的戰略投資者四維圖新。

2017年1月,剛剛獲得1000萬美金融資的初創公司驀然認知,宣布要重點布局車載領域,其合作夥伴包括四維圖新;同年4月,出門問問獲得大眾汽車集團1.8億美元D輪融資,雙方還成立了合資公司。

這一時期,車載語音互動不再只是語音廠商的獨角戲,越來越多的OEM、供應商開始重視語音互動在智能座艙中的應用,紛紛與語音廠商建立深度合作關係,或者直接投資入股。

對於車載語音提供商而言,汽車廠商和Tier1的入局加速了行業的發展進程,也意味著越來越多的資本和玩家將湧入賽道。

2017年6月,雲知聲發布智能中控方案Pandora,隨即完成近3億元C輪融資。一年之後,其C輪系列融資總額定格在13 億元人民幣,創下語音技術領域單輪融資最高記錄。

雲知聲CEO黃偉

幾乎在同一時間,思必馳宣布獲得D輪5億元人民幣融資,元禾控股、中國民生投資集團領投,深創投、富士康、聯發科跟投。

BAT欲一統江湖

在互聯網領域,如果某個細分市場出現了巨大的市場機遇,一定少不了BAT的身影。

毋庸置疑,語音互動是一個未來車載互動的重要入口,也是用戶數據、服務數據、定製化數據的重要采集端。初創公司們的優勢是先行一步,BAT則是瞄準時機,重兵湧入。

2017年7月5日,百度正式對外發布DuerOS開放平台,該平台包括智能設備開放平台和技能開放平台,支撐這兩個平台的則是DuerOS對話核心系統,其應用領域之一即是車載互動。

博泰集團創始人兼董事長應宜倫

發布會當天,車聯網供應商博泰集團宣布與DuerOS合作,讓“AI賦能汽車”。隨後,百度相繼與東風、福特等OEM建立合作關係,推進落地。

2017年底,騰訊發布騰訊車聯“AI in car生態系統”,並與廣汽、長安、吉利、比亞迪、東風柳汽等主機廠達成戰略合作。AI in car系統的核心,事實上就是以騰訊語音助手為車載語音輸出控制能力,建立車載互動中心,用騰訊生態體系下的內容澆灌成長。

號稱要打造國產車載OS的阿里AliOS,在同上汽合作成功後,也沒有忘記替換掉Nuance,研發自己的語音互動系統。

BAT的入局,凸顯出車載語音互動的重要性,但對於語音互動廠商而言,苦樂參半。特別是國內創業公司,在上升過程中一旦遇到BAT,不是被收購就是被針對,鮮少有突圍者。

雲知聲CEO黃偉曾透露,2013年BAT其中一家想要收購雲知聲,但最終他拒絕了收購邀約,選擇了另一條路。

2018年9月,雲知聲與吉利集團旗下億咖通科技(ECARX)宣布共同出資成立一家合資公司,落地在合肥高新區。

雙方的合作將基於雲知聲的語音識別、語音合成、聲紋識別、語義理解以及後續不斷拓展的圖像等AI技術,融合億咖通科技在車載雲平台、內容和車載產品等方面的設計經驗,開展面向汽車前裝市場的車規級 AI 芯片研發。

2019年初,思必馳發布AI語音芯片:深聰TAIHANG芯片(TH1520),可應用於車載、智能終端等領域。普強信息則借助四維圖新旗下的傑發科技,推進其“雲+端+芯片”的車載語音方案。

為提升與BAT同台競技的砝碼,語音廠商們在獲得巨額融資後,直接將語音識別處理的軟體算法之爭,拉到芯片競爭的層面。這時,從表面看起來大家都站在了同一起跑線上。

但是,熱衷於軍備競賽的自主車載語音廠商,真的能依靠資本贏下這一城嗎?

鷸蚌相爭,漁翁得利

語音互動分為三個階段,聽清、聽懂和會意。首先要解決語音的識別,其次要能讓機器讀懂語音的意思,這都需要依靠深度學習神經網絡的不斷迭代升級。

但是,由於車載環境的特殊性,不能隨意增大處理器算力以及功耗,目前的語音識別多依賴雲端處理,在網絡環境良好的情況下才能達到較好的語音識別。識別之後,自然語音理解、對話管理、自然語言生成才能進行下去。

這是一個複雜的過程,需要專業的廠商來做。眾所周知,未來的社會,是數據為王,無論OEM、語音廠商還是終端集成商,都希望擁有數據。但各自為政,並不能促進語音技術的升級,服務的多樣化,應用的便利性。

一位業內資深人士表示,車載語音互動不能走車聯網發展的老路,供應商的角色在供應鏈中處於被動局面,OEM擁有大量數據卻不能有效利用。

他認為,行業需要一個集成化、定製化語音互動的服務提供商,站在語音技術供應商和OEM之間,充當二者的橋梁。既可以靈活選擇不同的語音技術方案,也可以提供定製化、多樣化的語音互動產品,供OEM放心使用,無須擔憂數據落灰。

換言之,對於OEM而言,一個靈活可插拔式的服務平台,更具有吸引力。對於整個車載語音互動產業鏈而言,開放、靈活、自主型的平台型服務提供商,可能會成為未來的趨勢。

時下,國產車載語音互動的江湖亂戰仍在繼續。有一種觀點認為,最終的得利者可能並不是語音技術的提供方,而是中立的第三方平台型服務商。也就是說,誰擁有成熟的上下遊資源,誰就最有可能成為未來車載智能語音互動產業鏈的話事人。

至於語音互動的下一個時代,智能不再只是空談,而是真正走進人們的體驗當中。

首先,語音互動不再僅限於簡單的語音識別,提供命令式的服務,而是會通過記錄用戶使用習慣、喜好等數據,當用戶提出相應的服務要求時,為其提供滿足甚至超出預期的服務。

達到這一步,既需要在用戶數據方面的積累,同時也要有強大的語音互動引擎做支撐,這些都是基礎能力,有了基礎能力才能更聚焦探索智能化的服務。

其次,在語音之外,因為部分互動的便利性,手勢、視覺等互動也會發揮作用。屆時,車載互動將會呈現出一個多模態互動的狀態。

—END—

ROAD

BOOK

為了人、車、生活的更好連接。

獲得更多的PTT最新消息
按讚加入粉絲團