每日最新頭條.有趣資訊

七問達觀數據陳運文:泡沫?盈利?巨頭入場?

以客戶為中心是華為成功秘訣。

——任正非

創業有兩條鐵律:第一,做能為用戶創造價值的事;第二,做你有能力做到的事情。

人工智能領域同樣不例外。自動駕駛、金融科技、智能服務機器人、智能穿戴設備……過去幾年,人工智能領域的初創企業爭奇鬥豔,群雄逐鹿。

數據顯示,2018年中國人工智能領域共融資1311億元,增長率超過100%。據富比士最新發布的研究報告顯示,到2024年,全球人工智能市場的規模將達710億美元。

但在資本狂潮之下,概念大過應用,故事多過收入,行業虛火持續上升。市場開始意識到,拋開看得見摸不著的“概念們”,在已經存在的行業和需求中尋找突破點才是當務之急。

在大數據時代,每一個企業都存在著大量文字文本,法律、金融、媒體等等行業,需要對文本進行審核、分類、提取關鍵詞等。“文本智能處理”應運而生,作為是人工智能的一個分支,它試圖讓機器來理解人類的語言,通過模擬人腦的機制來解釋文本,並處理大量的重複機械工作。

不僅如此,文本的智能處理目前已經可以被應用在智能問答、機器翻譯、文本分類、文本摘要、標簽提取、主題模型等諸多方面。當艾問嘗試尋找到這個領域的Top5企業時,我們發現在國內市場,目前有且只有一家技壓群雄的開拓者——達觀數據。

這是一家成立不過4年的初創企業,創始人陳運文是個低調的工程師。

這家企業融資拿得多自己也能盈利,截至今年7月,達觀數據已經獲得了寬頻資本、軟銀賽富、真格基金等著名投資機構的近3億元投資,是語義分析人工智能細分領域的獲得融資金額最多的企業。

這是一家大眾有些陌生的企業,但企業客戶卻對他們的系統愛不釋手。

帶著好奇和疑惑,艾問走進達觀數據,獨家專訪創始人陳運文。

一問:十年之內,RPA代替人類?

艾問:我們應該怎樣認識達觀數據?

陳運文:達觀是一個文本智能處理的公司,做的是讓計算機能夠像人一樣看得懂文章資料,並且能夠代替人來完成日複一日的重復工作。

我們統計過,每天每個人大概有1/3的時間是花在文字資料處理上面的,不是在看一個文件,就是在審核一個文件或者就在寫一個文件。但只要計算機具備了文字閱讀理解能力,它就可以代替人來完成很多工作。所以我們教會計算機一個達觀智能文本處理的RPA系統,這和教一個學生學語文的過程是類似的,要教他認識漢字、組詞、造句、寫文章,最後能夠讓他上崗工作。

艾問:什麽是RPA系統?

陳運文:文本智能處理主要依靠兩個技術:NLP和RPA,就是自然語言處理和機器人流程自動化。達觀開發的RPA叫基層流程自動化系統,它可以像人一樣去閱讀文檔資料,大幅度提高企業的運作效率。

艾問:RPA提升的效率可以被量化嗎?

陳運文:在我們所有的RPA系統裡,文件資料自動填寫系統是特別受用戶歡迎的。比如打開一個網站,我們要填寫很多很多的表格,這些信息的填寫非常繁瑣,以前可能要花半個小時才能完成的一個表單填寫工作,計算機一分鐘就能完成。

問:你曾經說希望未來跟文字相關的工作90%都靠計算機來做,最後把關的10%交給人類就好了,那預計發展到這個階段需要多久?

陳運文:10年之內這個目標一定能夠實現。我們今天開發的這些系統,每一年計算機閱讀理解的能力都會上一個大的台階,所以隨著接下來幾年新技術的應用和大量數據的訓練,計算機系統可以進一步得到能力提升的,我們對未來充滿期待。

二問:為什麽是達觀數據?

艾問:為什麽要如此堅定地選擇自己創業呢?

陳運文:我之前是在百度、盛大、騰訊這些互聯網企業,但我後來發現其實中國的傳統行業是一個更加廣闊的天地。在這些傳統行業中,能不能把我所學的計算機和人工智能技術應用進來,對我來說是一件特別令我興奮,讓我感覺特別有成就感的事情。所以在2015年的時候我就出來創辦了達觀數據。

艾問:有業內人士預測到明年中國會成為亞洲範圍內的RPA第一市場,但相比於美國、新加坡等國家,中國其實起步晚、技術也不完善,達觀有這個感觸嗎?

陳運文:整體來看,美國比中國大概要領先兩年左右的時間,但我覺得大家仍然是在同樣一個起跑線上,中國市場孕育的機會更大。在文字資料處理領域,英文和中文其實區別是非常大的,同樣一個系統在英文領域處理很好,但到中國如果你不加改造是會水土不服的,這也是達觀獨特的優勢,因為我們一直是做中文文字資料自動化處理的,所以在中國的RPA市場,我們有自己的技術優勢。

三問:為什麽只服務B端客戶?

艾問:既然可以替代人類的重複操作,又具備很強的技術優勢,為什麽達觀只服務B端客戶?

陳運文:我們自己的判斷是現階段to B是達觀最重要的研發方向,未來我們覺得從to B到to C也是自然而然過渡的一個過程,因為不管是企業還是個人,我們每天都需要智能化的工具來幫著進行文件資料的自動化處理,所以在扎穩了to B的腳跟以後,也會把業務拓展到to C這個領域。包括最近也在和WPS合作,把文本智能化處理的模塊內嵌到WPS的生態裡面去,用戶在使用WPS的時候,可以使用一鍵智能化來進行文件資料的自動化處理、比對和糾錯工作。

四問:為什麽如此受資本偏愛?

艾問:截至目前,達觀數據已經獲得了寬頻資本、軟銀賽富、真格基金等著名投資機構的數億元投資,是語義分析人工智能細分領域的獲得融資金額最多的企業。你認為投資人最看重達觀的是什麽?

陳運文:達觀能受到這麽多投資機構的認可,非常重要一點是我們團隊非常的務實。達觀特別貼近於客戶的應用場景,所以在和投資機構交流的時候,特別強調我們是實實在在能夠把這些技術落地到每個應用場景底下,真正為客戶創造價值的。這一點也得到了投資人的充分認可,他們期待的人工智能也不是停留在紙面上,停留在電視裡,而是能夠真正落地到企業的每一個應用系統裡面去的。

五問:行業存在泡沫嗎?

艾問:文本智能處理行業存在泡沫嗎?

陳運文:文字資料處理它是看上去容易,但是要讓計算機達到人類閱讀理解的水準是非常難的。所以進入這個行業的企業並不多,真正落地的商業化應用系統就更少了。相較其他的人工智能應用領域,這個行業的發育其實比較滯後,也不像其他領域泡沫那麽多,所以對我們來說也是一個比較好的事情,炒作沒那麽多,競爭沒那麽激烈。

艾問:聽上去達觀一切都很好,難道沒有挑戰和壓力嗎?

陳運文:挑戰當然有,現階段非常大的一個挑戰是尋找更多優秀的人才。團隊在擴大的時候如何能夠保持一個非常好的節奏,同時能夠吸納優秀的人才,能夠讓人才在組織裡面得到成長,我覺得是非常重要的事情。

整個中國人工智能領域優秀的人才其實是稀缺資源,非常非常難找,我們花了非常多的時間和精力來做,尤其達觀的人才很多是在傳統行業,比如說銀行會計師事務所、政府機構,我們很需要相關行業的專家也加入我們,共同打造適合各個行業使用的業務系統。但傳統行業對人工智能互聯網創業企業還是心存疑慮的,覺得是不是有泡沫,是不是不靠譜等等,引進人才是我們現在最費時費力的事情。

六問:公司盈利嗎?

艾問:作為一家高科技的初創公司,人工智能領域被詬病最多的可能就是融資多,估值高,但盈利少,達觀目前在盈利方面做得怎麽樣?

運文:達觀的團隊非常務實,我們在商業化落地方面花了非常多的心血,所以我們也是在中國人工智能產業裡面少數能夠一直保持盈利的公司,這一點我是非常驕傲的。也就是說我們一方面在研發方面投入巨大的人力和資金,但一方面我們也能夠從客戶那邊源源不斷收到訂單,確保公司能夠非常穩健地向前發展。

七問:巨頭為什麽不入場?

艾問:這麽好的一個生意和賽道,巨頭為什麽沒有來做這件事情?除了RPA系統,你們還有其他競爭優勢嗎?

陳運文:文字資料處理你要達到一個很高的水準其實挺難的,我們也不是第一天就達到現在的水準,我也是在這麽多企業工作了十幾年,包括我們團隊這些同學,此前在各大公司都做資料處理,工作了十幾年,積累了很多經驗以後,才達到一個比較高的水準。像BAT這些巨頭是非常擅長做C端的,但B端的話做起來很吃力,為什麽呢?to B你要俯下身去為客戶解決問題,巨頭更傾向做生態做平台,他們做一個通用的系統,但這些通用的功能很難滿足B端客戶。

第二,在這個領域的積累是特別重要的事情,中國有句古話叫讀書破萬卷,下筆如有神。只有積累了足夠多的文字資料數據,才能夠讓計算機具備一個非常優秀的文字處理的效果,文字資料積累這件事情是一個細水長流的事情。假設現在一個企業要瞬間積累1000億次的文字資料,你根本就沒地方去找這麽多公司的資料,需要花很長時間去收集、去整理、去歸檔、去分析。這其實也是很高的一個門檻,所以對其他企業來說,我們有這麽多行業資料和數據,也是一個重要的競爭壁壘。

投資人說

蔣馳華 賽富投資基金合夥人

“和運文第一次見面是在2016年10月,當時賽富正在看NLP領域的早期項目,達觀數據和另一家做互動的三角獸科技進入了我們的視野。和運文的溝通非常愉快,他本人有極強的專業背景,身處一個急速發展的賽道但依然可以把心靜下來做研發,這也就是為什麽達觀可以在文本智能處理領域建立自己的技術壁壘。一拍即合,我們很快就決定投資達觀。

這幾年我們也看到有一些企業試圖進入這個領域,包括阿里也在推進RPA的研發,但因為互聯網巨頭自身的價值網絡對於他們在某些新興領域的拓展,不是增值而是製約,在NLP及RPA領域他們並沒有先天優勢。觀察下來,達觀依然是這個賽道絕對的頭部企業。”

獲得更多的PTT最新消息
按讚加入粉絲團