每日最新頭條.有趣資訊

20年風雨路,科大訊飛行至繁花盛開處

回想起創業之初的情形,劉慶峰說,我們在工作室旁邊的農村裡找了一戶人家給我們做飯,中午吃飯也沒椅子,大家就都蹲在那個地上。因為做語音需要,我們請了一個播音員女孩子,她來的時候還很興奮,結果來了三天,她很委屈,一邊吃飯一邊說,這哪是搞研究的,就是一幫民工兄弟。

近日,618年中大促正如火如荼進行,各大電商平台已早早開始了這場消費狂歡的競速。數據顯示,在競爭激烈的智能網絡產品中,科大訊飛脫穎而出,成功奪得翻譯機、錄音筆、智能機器人等多個產品品類的銷售冠軍。

在普通大眾的印象中,這家以語音技術見長的人工智能企業似乎是近些年來國內的一股新鮮力量,畢竟人工智能熱潮前後才不過五六年的時間。但事實上,這家公司已在智能語音與人工智能領域深耕多年。2019年6月9日,科大訊飛迎來了它的20周歲生日。

Part.1

一個決定,一個誕生

在科大訊飛20周年內部講話中,劉慶峰說:“未來十年,我們有三個關鍵戰略路徑。第一,要堅定不移地實施頂天立地的技術戰略,我們的價值核心基礎是技術的持續領先和引領、立足於未來的產業需求、發展高科技並實現產業化;第二,要堅定不移地推行我們平台+賽道的產品戰略,產品要成功、生態也要成功;第三,要堅定不移地推動to B和to C的雙輪驅動。用A.I.賦能個人成為產業的拓荒者和領導者,我相信科大訊飛在未來十年產業版圖的前途會非常巨大。”

這些年劉慶峰做了無數次演講,而上述一幕只是這些年間的無數分之一。演講之後,面對滿堂的鼓掌與喝彩,也許劉慶峰眼前會掠過自己26歲時的影子。

1999年,26歲的劉慶峰必須做出一個至關重要的選擇。

一是出國讀博,已經有學校願意提供幾萬美元的獎學金。而這條路的盡頭,或許是窮經皓首的劉博士,亦或許是一顆耀眼的學界明星;

二是接受剛剛組建微軟亞洲研究院的李開複提供的微軟獎學金,到微軟實習一個月。更大的公司,更大的平台,更平穩的過渡;

三是帶領實驗室的師兄弟們,一起做一番事業,前路一片混沌。

三個選擇,三種人生。劉慶峰選擇了最難的第三條路,而這看似衝動的決定背後,卻是十分具體而審慎的選擇。

在當時,劉慶峰正擔任福建中銀集團與中科大建立的聯合實驗室、中文語音合成第一個產業化的實體中銀天鷹智能多媒體實驗室的總工程師,和師兄弟一起開始為中銀集團提供技術支持。

在上個世紀末,所有人都並不清楚語音要具體做什麽。今天想搞個語音PDA,明天又想做個語音聽寫軟體,後天又搞工商查詢系統,團隊疲憊不堪。兄弟們受不了,便找到劉慶峰說,要麽你出來當CEO,要麽我們就解散。

與此同時,劉慶峰的博士生導師王仁華也對他說,這個事情可以成,這麽多優秀的年輕人能團結在一起,在科大的歷史上還從來沒有過,要是解散就太可惜了。

而且,當時語音技術大都掌握在國外的高校和企業手中,而國內關於這片土地還仍是一片待開墾狀態。因此有一句話一直在劉慶峰腦袋裡揮之不去,那個聲音在說:“中文語音技術應當由中國人做到全球最好,中文語音產業應當掌握在中國人自己手中。

青年的熱血澆築理想,風華正茂,揮斥方遒。

夢開始的地方,在合肥市西園新村的出租小屋。由於計算機散發的熱量,本來狹窄局促的房間顯得更加悶熱,夏季來臨,計算機圍成一圈,房頂吊一個電扇,每個人都汗流浹背,一邊擦汗一邊擦鍵盤。

回想起創業之初的情形,劉慶峰說,我們在工作室旁邊的農村裡找了一戶人家給我們做飯,中午吃飯也沒椅子,大家就都蹲在那個地上。因為做語音需要,我們請了一個播音員女孩子,她來的時候還很興奮,結果來了三天,她很委屈,一邊吃飯一邊說,這哪是搞研究的,就是一幫民工兄弟。

而平行宇宙中的劉慶峰,或許正身穿白襯衫,出入於微軟研究院,做著一份更加“體面”的工作。

Part.2

等風來

創業生涯,九死一生,這不是開玩笑。

早在1998年,劉慶峰帶隊參加了在北京的863語音合成評測,這一次中科大在評測中獲得了3分(5分是播音員水準,4分是普通人發音表現,而3分則是勉強可以接受的),這是當時語音合成獲得最高的分數,“唯一達到了可實用階段”。

隨後,在1998年8月的“國家火炬計劃十周年成就暨高新技術產品博覽會”中,中科大的語音合成系統被選為唯一的軟體標誌性產品而列在特展位上。同年12月,在新加坡舉行的國際漢語口語處理研討會(ISCSL)上,中科大的KD語音合成系統被與會各國專家高度評價,劉慶峰介紹KD系統的論文也獲得了大會的最佳學生論文獎。

這是一個技術上極其強勁的團隊,但在商海中一樣必須面對暗礁湧動。

2000年,個人電腦開始進入中國家庭,很多用戶根本不會操作,科大訊飛看準了這個“痛點”,推出了第一款產品“暢言2000”。功能上相當於電腦上的Siri,借助語音方便電腦操作,在當時打出了“會說話就會用電腦”的廣告。

劉慶峰將銷售渠道鋪到了全國10多個省,他們甚至預想了產品熱銷的豐滿夢想,但由於語音輸入和控制並非硬需求,大多數人還是更習慣於使用鍵盤和滑鼠,加之價格太高,暢言2000幾乎無人問津,科大訊飛也由此虧掉兩千多萬。

秋末,科大訊飛經歷了市場的沉痛打擊後,於巢湖半湯溫泉,迎來自己命運的第二次抉擇。

半湯會議持續了兩天,雖然劉慶峰希望借助溫泉這樣一個放鬆的環境來想清楚公司的前路。但秋末的寒冷依然使會議的氣氛變得肅殺。

有人說直接解散吧。

有人說可以做別的賺錢更快的行業。

十幾個人各抒己見,會場一片狼藉。最後,劉慶峰做出了最終的決定:繼續做語音,誰不樂意,直接走人。

燃燒最亮的火把,要麽率先燎原,要麽最先熄滅”,這是劉慶峰在當年的年度大會上說的一句話,這句話至今仍被掛在訊飛大廈的牆上,激勵著每個訊飛人在智能語音與人工智能道路上不忘初心,堅守前行。

回顧科大訊飛二十年來的發展歷程,這是兩個關乎命運的決定。而隨後將科大訊飛帶到“全球50大最聰明公司第六名”、“中國第一個語音上市公司”、“中國第一個在校大學生創業上市的公司”這樣位置的,則是一個堅持。

智能語音和人工智能,這一在創業初期就決定好的方向,在二十年裡科大訊飛一直沒有動搖過,並且從來都是全力以赴,而非當作一個簡單的業務線來做。

而這樣的堅持,在最近幾年終於等到了屬於自己的風。

2010年6月,蘋果發布了擁有“100 多項創新設計”的經典產品iPhone 4,引發全球排隊購機熱潮。不過賈伯斯不喜歡大屏,iPhone 4螢幕僅為3.5英寸,用全鍵盤打字時存在不少困難。

既然用手指輸入文字體驗不好,可不可以用語音輸入?當時科大訊飛移動互聯事業部產品經理翟吉博,用了三天時間寫出一個Demo,後被公司討論後決定正式推向市場,迅速引爆市場,這讓科大訊飛上下歡欣鼓舞,也成為年度的創新產品之一。

這一年10月,科大訊飛發布國內首個以智能語音和人機互動為核心的人工智能開放平台——訊飛開放平台,隨後基於該平台相繼推出訊飛輸入法、訊飛聽見等示範性應用,推動與廣大合作夥伴攜手構建以訊飛為中心的人工智能產業生態。截至2019年5月31日,訊飛開放平台開發者總量超過103萬,總應用數超過64萬,累計終端用戶數超過23.9億,AI大學學員總量超過30萬。

除此之外,越來越多的企業也開始關注並加入到語音這一領域中,2008年,iPhone的走紅令谷歌意識到語音搜索的機會來臨了。谷歌決定重啟語音搜索開發項目,並首先針對iPhone推出了語音搜索應用程序。

兩年後,剛剛加入百度並為其組建自然語言處理部的王海峰找到聲學所顏永紅的團隊,引進了聲學所的語音技術,百度於2010年10月在掌上百度上推出語音搜索。

2012年,搜狗也開始研發語音技術,兩年後為搜狗輸入法引入語音搜索功能,並於2016年發布語音互動引擎“知音”。

短短幾年間,各式各樣的智能語音公司如雨後春筍般長了出來,行業終於開始蓬勃向上,而在此之前,科大訊飛已經深耕並等待了十幾年。

Part.3

前路繁花

遲子建說,年輕人回首往事是由於沒有經歷太多的人世滄桑,這種回首帶有某種浪漫和虛榮的成分。真正嘗遍人世間的的酸甜苦辣後,大約是不屑回頭遙望的。

對應到企業來說,大致也是如此。但有一點需要說明的是,它們不是“不屑回頭”,而是“顧不上”,“來不及”。

世界發展飛快,前沿科技更是如此。

5月21日下午,於上海世博中心,科大訊飛召開了2019新品發布會。

新品發布會上,劉慶峰透露,2018年11月,科大訊飛機器翻譯系統參加CATTI全國翻譯專業資格(水準)科研測試,達到英語二級《口譯實務(交替傳譯類)》和三級《口譯實務》合格標準,意味達到了專業譯員水準。

這是歷史上首次參加並通過國家級權威口譯水準科研評測的人工智能系統,這也標誌著機器自動翻譯在輔助人類跨語言信息溝通交流方面上了一個新台階。

此外,2019年3月,機器閱讀理解國際權威評測SQuAD 2.0任務中科大訊飛再次登頂冠軍,並同時在EM和F1兩個指標上全球首次均超越人類平均水準,一舉創下比賽的全新紀錄。

這個里程碑是由中國人寫下的,這是英文的自然語言理解,機器已經超過真人水準”,劉慶峰說。26歲劉慶峰腦子裡的那個聲音:“中文語音技術應當由中國人做到全球最好,中文語音產業應當掌握在中國人自己手中。”已經成為現實。

上述在語音智能領域所取得的歷史性突破,離不開背後堅定的戰略決心。早在2015年訊飛的年度董事會上,相關高層就已經作出了一個非常重要的決定:不再隻追求當前的稅後利潤增長,要把資金投到決定未來的戰略方向上。

結合財報來看,科大訊飛連續多年的研發投入佔銷售收入的比例達到20%、甚至25%,這就是在為未來做大量儲備,把利潤填充到了未來發展的戰略準備之中。

而這些投入也獲得了相應的回報。現如今,科大訊飛在語音合成、語音識別、機器翻譯、醫學影像、人臉識別、自然語言理解等方面的國際比賽中,多次刷新全球紀錄,僅2018年,科大訊飛拿12個國際權威賽事的“世界第一”。此外,目前,科大訊飛主持和參與制定的國家標準有2項、國際標準有1項,累計獲得國內外的有效專利有 260 件。

而在具體成果方面,科大訊飛更是提出了嚴謹的AI價值兌現標準。劉慶峰認為,跨越鴻溝後的人工智能技術價值兌現有三大標準,分別是:“必須要有看得見摸得著的真實應用案例”,“要有能夠規模化和可推廣的對應產品”,“要可以通過統計數據去說明應用成效”。

同時根據該標準,推出了一系列切實可用的新產品。

Part.4

雙輪驅動初露鋒芒

在中國,想只靠提供技術就成為一家大企業,在客觀上存在有諸多困境,而清楚意識到這一點的科大訊飛,從來都沒有放棄過C端的布局。

2016年年底,科大訊飛做出新的組織結構調整,拆分出消費者事業部。經過兩年的勵精圖治,在2018年這一調整也已經初見成效。

科大訊飛2018年財報顯示,ToC業務實現營業收入25.17億,同比增長96.54%;實現毛利12.96億,同比增長70.77%;ToC業務在整體營收中佔比達31.80%,毛利佔比達32.72%。,To B - To C雙輪驅動的良好格局正在形成,在各種經濟周期下實現相互補充、相互促進。

而這一系列營收上的突破,很大程度上得益於產品突破。

在上文中我們提到的科大訊飛2019新品發布會中,發布了五大單品和一個作業系統,具體是訊飛翻譯機3.0、訊飛智能錄音筆、訊飛智能辦公本、訊飛學習機X1 Pro、訊飛轉寫機和iFLYOS 2.0。

其中,在去年成為“新國禮”的訊飛翻譯機,全年提供翻譯服務5億+次,伴隨用戶走遍全球197個國家和地區,電商用戶好評率達99%。全新升級的訊飛翻譯機3.0實現了醫療、外貿、體育、金融、能源、計算機、法律等七大熱門行業翻譯,支持粵語、四川話、東北話、河南話四大方言與英語的互譯,整體支持的語言已經覆蓋到近200個國家和地區。

就在最近,訊飛翻譯機3.0、訊飛智能錄音筆SR501、訊飛智能錄音筆SR701等三款新產品還斬獲了2019亞洲消費電子展(CES Asia 2019)的創新大獎,代表了當屆該領域內的創新趨勢和產業方向。

錄音筆作為一款早已被市場驗證過的傳統工具,在科大訊飛AI技術的加持下,煥發出了全新生機。無論是硬體方面麥克風的豪華配置,還是訊飛自研的算法降噪,都使得智能錄音筆在拾音方面上了一個全新的台階。

而科大訊飛超強的語音識別技術,也使得錄音筆兼具了語音轉文字功能,識別準確率高達98%,真正實現了錄音1小時,出稿 5分鐘。

另一邊,在京東618年中大促實時競速榜中,訊飛智能辦公本更是拿下了電子書品類銷售額第二以及國產第一的好成績。這是一款面向職場人群而研發的大尺寸墨水屏智能硬體設備,採用的柔性墨水屏,在有效避免視疲勞的同時還原了在紙上書寫的真實手感。值得注意的是,而它獨有的降噪麥克風陣列可以在嘈雜環境下有效收音,配合語音轉寫技術,可以將錄音自動轉寫成文字,為商務人士更輕鬆地生成會議記錄。

這些都體現了深入還原需求場景,解決用戶痛點的產品思維。而這一系列產品所取得的成績,也為科大訊飛的商業前景和進一步生態布局,奠定了重要基礎。

結 語

回望來路,科大訊飛從語音合成技術提供商,到語音識別技術應用於彩鈴業務,從第一個基於深度學習的語音識別系統,到語音互動乃至人工智能領域的探索。

腳步不停,景色變幻。但唯一不變的是以智能語音與人工智能領域為核心的深耕。

或許有一天,隨著科技的飛速發展和外部環境的急速變化,科大訊飛會延展出更多的業務線條,但有一些內核是永遠不會變的,那就是底層的價值觀。

2019新品發布會中,劉慶峰登台展示了一段實時變聲黑科技,他在台上說什麽,台下立馬會以另外一種聲音傳達出來。科大訊飛的這項技術,可通過提取原聲語音中的內容信息,包括原聲的節奏和情感,再結合特定人的音色進行轉換結合,惟妙惟肖的複刻模仿特定人的聲音,這種基於音色與內容分離的聲音轉換技術,實現了聲音的cosplay。該項技術在Voice Conversion Challenge 2018國際音色轉換大賽中獲得全部指標第一名,也是音色和相似度上唯一一家超過4.0MOS分的系統。

不過,劉慶峰現場明確表示不會輕易將該技術在各種APP中對外開放,因為技術是一把雙刃劍,存在安全風險,“一定是要有一種健康、安全又有趣的方式來跟這個世界對接”。

“人工智能要持續發展,最核心的是它的價值觀如何陽光健康,與人為善。”

自2008年上市以來,科大訊飛始終秉持著這樣的價值觀。無論是“方言保護計劃”,還是“AI教育公益”,抑或是“AI醫療公益”,“AI無障礙公益計劃”等一系列行為舉措,都體現出了科大訊飛的價值導向,以及積極承擔起的社會責任。

科大訊飛2019新品發布會的slogan是“你的世界,因AI而能”,旨在宣揚人工智能(AI)對世界的巨大影響。

但事實上,科技本無善惡,其背後的研發運營人員才是決定科技應用的關鍵因素。

仔細想想,這何嘗不也是我們的世界,“因AI(科技)而能,因愛而能”。

本文由科技新知原創出品,轉載請留言

獲得更多的PTT最新消息
按讚加入粉絲團