每日最新頭條.有趣資訊

造芯火熱、場景突圍、轉向C端……變局中的AI語音

2007年,劍橋大學商學院的高始興與工程系的俞凱一見如故,2008年,兩人歸國創立了思必馳,主攻口語教育。

那時正是互聯網和移動互聯網的天下,因此對於思必馳來說,前幾年的探索更像是蒙眼打仗,找不準方向,發展緩慢。此後,思必馳真正快速發展是在這三四年:2016年,獲得來自阿里的近2億元投資;2018年6月,再次獲得D輪5億元人民幣融資。

這是一個AI語音獨角獸典型的養成故事:強技術背景的創始團隊,成立時間較早,直到AI風口引來資本的追捧,估值在短時間內快速攀升。

AI語音作為人機互動的新希望,造成了行業的激蕩,並帶動了新的競合關係,有早早卡位如科大訊飛、思必馳、雲知聲者,有隨風口起舞者,也能看到不少巨頭的身影。

中國報告網顯示,2017年國內視覺、語音、自然語言處理成為AI融資前三甲,語音佔比為24.8%,排名第二。

有業內人士甚至向投中網CV智識形容,2016、2017年左右如果你的項目融資計劃書中沒有NLP、CNN這些AI元素都不好意思跟投資人打招呼。

但這種熱鬧在很多業內人士眼裡就意味著泡沫,“回想一下,2016年很多人工智能公司在做什麽?刷榜。刷榜本身是個開卷考試,但開卷考試考得好就代表你真正有這個能力嗎?不見得。2017年大家更多是在描繪一些願景,就是講故事,2016、2017年的人工智能論壇大媽都來聽,在我個人看來這都是泡沫的體現。”雲知聲創始人黃偉表示。

距離喧囂已經過去三年,與泡沫共舞的AI語音又有哪些新的變化?這些變化究竟是泡沫的助推力還是行業趨於冷靜的表現?投中網CV智識帶著好奇與行業內多位從業者聊了聊。

造芯運動,虛火還是實熱?

“對雲知聲來說,不做芯片就意味著死的很快嗎?”

“是的”,雲知聲創始人黃偉斬釘截鐵地回答。

從2018年開始,AI語音公司不約而同地開始了一波新造芯運動。雲知聲發布了面向AIoT市場的UniOne芯片,出門問問發布了AI語音芯片模組“問芯”Mobvoi A1,Rokid發布了AI語音芯片KAMINO18。

2019年1月2日,雲知聲再次發布正在研發中的三款定位不同場景的AI芯片。兩天后,思必馳也推出了AI語音芯片深聰TAIHANG芯片。

這些擅長做軟體算法部分的語音公司們為何會紛紛打破“術業有專攻”的邊界,湧入造芯陣營呢?

Rokid聯合創始人王舜德曾提到,成本居高不下、非常耗電、集成度低讓產品做起來十分痛苦,也正是基於這些痛點,才想要研發AI芯片。

雲知聲創始人兼CEO黃偉表示,現有的芯片架構並非為AI專門設計,不能滿足物聯網AI算力需求。

但缺少半導體硬體基因的語音公司們如何做到“從軟到硬”的呢?

從目前頭部幾家公司來看,做AI語音芯片的思路還是選擇和有經驗的芯片公司深度合作。比如思必馳選擇中芯國際,共同注資成立上海深聰半導體有限責任公司;Rokid宣布自己的芯片是基於杭州國芯科技的芯片深度定製;獵豹移動旗下獵戶星空選擇和瑞芯微電子合作。

從開發周期和成本的角度來看,比較成熟的芯片公司已經有積累,很多東西不需要重新去設計,因此聯合研發能夠縮短開發周期。

AI芯片的確為語音公司帶來了新一波的熱度,但真實的市場如何呢?

一般來說,語音公司做AI芯片的思路無外乎兩種:一種是和自己的解決方案搭配出售,另外一種則是直接對外賣硬體。

觀察目前幾家語音公司的芯片產品進展,思必馳今年7月8日量產版芯片剛剛點亮,其它的AI語音芯片大多是採用第一種方式,雲知聲的芯片目前已經通過自己的解決方案落地到終端產品上,截止到3月份,雲知聲有5-6家客戶圍繞雨燕芯片落地方案。Rokid發布的KAMINO18也已經搭載到今年3月360剛推出的智能音箱上。

但在深圳鯤雲信息科技有限公司創始人兼CEO牛昕宇看來,第一種方式雖然不需要承擔外界競爭壓力,壓力較小,只要保證芯片夠自己用就可以了,但對於算法公司來說,動輒幾億美金投入的芯片成本如何去和自己的業務收入平衡?

芯片的運作至少需要3年,2年時間做出芯片,1年時間合作方做出產品,之後才能推向市場。

除了時間成本之外,AI芯片研發還需要巨額的資金成本,黃偉表示第二代芯片的投入要以億為部門,而雲知聲的營收也不過是去年才剛剛官方宣傳達到9位數而已。

自研AI芯片的成本既然如此之大,有些語音公司為了更高效也更市場化,就會選擇模組的形式,比如出門問問就與杭州國芯科技的芯片合作,發布了模組產品“問芯”。

據業內人士透露,普通單個模組的價格大概在1-2美元,而AI芯片的價格雖然隨著產業鏈的成熟有所下降,但價格差距依舊很大,據了解,搭載了雲知聲自研AI芯片的語音模組目前的價格在50元人民幣以內,即使搭載了更加輕巧的“蜂鳥”芯片的語音模組也在20-30元人民幣之間。

即便如此,模組的銷量也並不好,去年底李志飛曾向新浪科技這樣說道,裝有這一模組的產品至少要一年時間才能到用戶手上。如此長的周期,遠沒有想象中那麽容易快速起量。

雖然AI語音芯片也被認為是AI語音技術落地的一種方式,一定程度上緩解了落地焦慮,但對於AI語音公司們來說,AI芯片所考驗的不僅僅是技術能力,還有商業化落地能力以及風險承擔能力。

正如黃偉所說,造芯不是目的,只是起點。

外包模式變了嗎?

除了上述的芯片,對於AI公司的商業化落地,無論是語音互動,還是圖像識別,眾多AI公司一直被詬病的便是:商業模式本質是“外包”。

最直接的體現就是AI領域幾乎沒有公司能將技術以規模化、產品化的方式輸出,不同的領域不同的項目都需要定製化方案,這就導致了如果想接更多的項目就必須招更多的人,技術密集型變成人力密集型,直接導致攤子越鋪越大,客單利潤卻越來越低的後果。

雲知聲創始人黃偉表示,除了營收壓力使得有些公司會不得不選擇先把天花板打高之外,這個行業現階段的現狀就是需要比較多定製化,尤其是一些大公司項目。

但三年過去,困於外包的集體難題是否解決了呢?在對多位行業從業者採訪的過程中,不少人表示,有所改善,其中縱橫雙線並進是從困境中突圍的最主要方法。

橫線做平台,開發通用型產品,目前多家AI語音公司開放API接口給第三方,走To B路線。

縱線則是選擇特定的垂直行業深扎,通過不同行業的經驗積累,拉開競爭差距。即使是科大訊飛這樣體量的語音頭部公司,也在向垂直行業和產品延伸,來挖掘新的利潤增長點。

思必馳CMO龍夢竹介紹,思必馳2018年的營收在8000萬到1億之間,預計今年會翻三倍左右,倍數增長的背後是業務線的擴展。

智能音箱、兒童玩具、車載後裝是思必馳經營多年的領域,除此之外,龍夢竹表示,白電、車載前裝、企業服務是思必馳目前增速最快的三大領域,今年又新增了政府政務、酒店地產、金融、醫療四大業務領域,但目前還未開始大規模推廣。

在向垂直領域拓展的過程中,語音公司們之間不免會出現重合的領域。比如雲知聲的業務布局就分為AI+生活和AI+服務,其中AI+生活主要做家庭和汽車,家庭部分包括機器人、智能家電行業,汽車則是從後裝向前裝布局;AI+服務主要是醫療、教育。這與前面提到的思必馳的業務領域重合率相當高。

去年6月份,雲知聲還和思必馳隔空互懟,黃偉在朋友圈發文直言要競爭對手“回歸商業本質”,雖然並未提具體名字,但龍夢竹發了一則朋友圈並附上了黃偉朋友圈截圖。其中龍夢竹寫到一句“您的客戶的確選擇了我們——這點各憑本事,沒得罵”,足以可見語音公司的競爭激烈。

面對同行競爭,龍夢竹也坦言,現在各個行業都在+AI,在這麽大的市場盤子下,語音的公司不可能是一家獨大,而且大家對各個行業的滲透都是在最近四五年才開始的,這裡面各家要比的有三點:技術的持續創新能力、技術產品化能力以及服務對接能力。

縱向路線發展過程中,除了與同行競爭之外,語音公司們還必須面對AI語音與傳統行業存在間隔的集體難題。

多數傳統企業對於AI的了解,僅僅局限於其能夠讓業務變得“更智能”,但具體怎麽做,哪家AI公司能勝任這些工作,答案都十分模糊,這就尤其考驗AI語音公司們如何快速進行跨界融合和溝通。

To C是門好生意嗎?

科大訊飛輪值總裁胡鬱曾解釋科大訊飛決定發力C端的真正原因,首先,C端有足夠大的利潤空間,其次就是將技術從軟體到硬體、完整地呈現給用戶。

從這兩點來看,To C的確是一門好生意,財報數據顯示,C端的確為科大訊飛貢獻了穩定的現金流:2018年科大訊飛的To C業務實現全年實現營業收入25.17 億,同比增長96.54%;實現毛利12.96 億,同比增長70.77%。

5 月 21 日,科大訊飛召開了一場面向 C 端消費者的新品發布會。與過去發布技術不同,這是科大訊飛第一場以產品為主的發布會。

當天,科大訊飛密集發布了訊飛翻譯機 3.0、訊飛轉寫機、訊飛智能錄音筆、訊飛智能辦公本、訊飛學習機、iFLYOS ,六款新品中有五款都是面向 C 端的消費品。

但問題是,對於AI語音公司們來說,這門好生意真的好做嗎?

出門問問是AI語音領域較早發力C端的公司,從2014年發布全球首款中文智能手錶作業系統Ticwear開始,5年時間內研發出了16款產品,包括智能手錶、智能車載後視鏡、智能音箱、智能耳機等。

其中智能音箱是AI領域最為火熱的C端產品,奧維雲網(AVC)全渠道推總數據顯示,2019年上半年,中國智能音箱市場在售機型數達到86個,銷量為1556萬台,同比增長233%;銷額30.1億元,同比增長149%。

2019年上半年中國智能音箱市場規模

出門問問方面也曾經透露,公司主要營收以To C為主,在2018年To C營收佔比是80%以上,To B業務隻佔據了10%以上。

但就在今年5月,投中網CV智識獨家獲悉,出門問問拿到了大眾汽車1億美元的融資,而谷歌則沒有再次跟進本輪次的融資。在文章《獨家|大眾一億美元風火馳援,出門問問何時東山再起?》中投中網CV智識也援引多位行業人士分析,出門問問陷入困境的最主要原因就是沒有找到一個剛需的C端應用場景。

出門問問發布的C端產品品類基本與市面上的主流智能設備類似,從產品本身來說,出門問問並未建立起一個足夠堅固的壁壘,從競爭來說,面對阿里和百度、小米等公司不惜大打“價格戰”搶奪市場的時候,又明顯沒有補貼的底氣。

以智能音箱為例,我們看到這幾年的價格一路從幾百元到199元、129元、99元、79元……去年京東、阿里、百度的mini款音箱都已經到了百元以下,但據一位在智能硬體工作多年的業內人士透露,當時一台mini款智能音箱的成本還在100元左右。

巨頭們搶佔入口的決心不可謂不大,博弈過程中,巨頭們紛紛亮出殺手鐧:我有錢。奧維雲網(AVC)全渠道推總數據還顯示,2018年下半年開始,智能音箱市場進入天貓、百度、小米三足鼎立的時代。

這種情況下,即使初創公司產品技術好或者音質好也難做到差異化競爭,更何況許多初創公司本身在技術、產品層面的競爭力並非無可比擬,這些都讓To C成了一個並不是那麽好做的生意,至少在主賽道產品上事實的確如此。

因此我們看到現在大部分AI語音公司還是以To B業務為主,這背後既有技術與To B業務的天然連接,也有B端客戶的技術敏感性以及付費能力等多重因素。

結語

相比之前的用戶互動方式,語音互動更自然、更便利、更高效,也將會從根本上改變人和機器的關係。

根據Juniper的數據,在美國和英國,語音電商的規模將從2018年的20億美元增長至2022年的400億美元。Canalys預計,全球範圍內智能音箱的裝機量到2023年將增長至5億台。

除此之外,虛擬醫生、虛擬偶像.....這些背後都是對AI語音商業價值的認可。

只是如何讓技術發揮出產業應用的價值,並獲得商業回報,這是 AI 語音公司需要集體思考的課題,參與的各方注定要在曾經的喧囂和退潮的冷靜中動蕩前進。(文/韓敬嫻 編輯/張麗娟 來源/投中網旗下CV智識)

獲得更多的PTT最新消息
按讚加入粉絲團