每日最新頭條.有趣資訊

對話李世鵬:加盟科大訊飛意味著什麽?

雷鋒網 AI 科技評論按:前不久,科大訊飛宣布曾任微軟亞洲研究院副院長、硬蛋科技 CTO 的李世鵬博士正式加盟科大訊飛,擔任科大訊飛副總裁、訊飛 AI 研究院聯席院長,並稱「李世鵬博士將長官科大訊飛研究團隊在人工智能核心技術上的探索和創新,助力科大訊飛的 AI 技術應用落地,並主導科大訊飛的國際技術合作拓展。」(《前MSRA副院長李世鵬加入科大訊飛,任訊飛 AI 研究院聯席院長》)

這不免讓人感到些許詫異。科大訊飛作為一家在語音和自然語言研究具有雄厚科研實力的企業,為何要引入在電腦視覺領域享有盛譽的李世鵬博士呢?李世鵬博士又為何選擇科大訊飛?他將在科大訊飛研究院發揮什麽樣的作用?

雷鋒網就此來到訊飛北京總部拜訪了科大訊飛副總裁、訊飛 AI 研究院聯席院長李世鵬博士,並就相關問題,對李世鵬博士進行採訪。以下為採訪內容,做了不改變原意的調整和編輯。近期科大訊飛在 IDRiD 眼底圖分析競賽、SQuAD 挑戰賽均取得優異成績,加上引入李世鵬博士擔任訊飛 AI 研究院聯席院長,在雷鋒網旗下學術頻道 AI 科技評論的數據庫項目「AI影響因子」中有突出表現。

李世鵬,IEEE Fellow,國家「千人計劃」專家,新一代人工智能產業技術創新戰略聯盟聯合秘書長。在加盟科大訊飛之前,為硬蛋科技 CTO,創立了硬蛋實驗室;在此之前,從 1999 年至 2015 年間任微軟亞洲研究院首席研究員、副院長、微軟公司合夥人,為微軟亞洲研究院共同創始人之一。作為《IEEE 電路與系統會刊-影片技術專刊》現任總編輯 (2018-2019) 和 IEEE Fellow,李世鵬博士在多媒體、互聯網、電腦視覺、雲計算及人工智能領域極具國際影響力,擁有 195 項美國專利及 330 多篇國際論文。同時,李博士培養出四位 MIT TR35 創新獎的獲得者(《麻省理工科技評論》「全球 35 位 35 歲以下科技創新青年」),目前擔任微軟亞洲研究院院友會秘書長。

雷鋒網:在加入科大訊飛之前,您是硬蛋科技的 CTO。請問目前硬蛋科技怎麽樣?

李世鵬:我在硬蛋工作大概有兩年半時間,主要負責人工智能使能平台——Kepler 系統(K-系統)的搭建,去年 5 月份這個平台已經發布,可以說基本的技術框架已經完成,研發方面的工作已經不是太多,剩下的主要就是一些技術落地方面的工作了。這個不是我所擅長的,所以現在硬蛋實驗室由首席架構師苑貴強博士負責,我擔任技術顧問。

雷鋒網:2015 年您從微軟亞洲研究院出來,隨後進入硬蛋科技,現在加盟到科大訊飛。您如何看待這兩次身份轉變呢?

李世鵬:總的來說,我在微軟做研究,然後到硬蛋做產品,現在是回來繼續做研究。

當時我從微軟出來,是想給自己留一段時間對中國整個技術生態做一個完整的了解,硬蛋科技對我來說是一個很好的平台,給我一個機會了解中國產業的趨勢、痛點以及他們亟待解決的問題;同時,我也幫助硬蛋將研發團隊和能力給帶動了起來。這兩年多的時間裡,我確實學了很多東西。現在我加入科大訊飛,再次回到研究領域,也是帶著一些實際中需要解決的問題的。所以整個大方向就是回到自己比較擅長的研究領域。

雷鋒網:目前國內有許多具有研究團隊的企業,您為什麽最終選擇了科大訊飛呢?

李世鵬:國內研究機構很多,但是要看哪個平台更適合發揮自己的研究特長。我覺得有很多因素促成了這樣一件事。首先,我本身是中科大畢業的,而科大訊飛也是出身於中科大,同根同源,彼此之間文化、交流、理念都特別相近。其次,科大訊飛是一家以技術為主導的公司,大部分人員屬於技術人員,他們在技術研發方面投入了很多資源,這是我特別欣賞的。另外一個原因是,科大訊飛是做語音的公司,我本身是做影像和電腦視覺這塊兒的,對語音不太熟悉,所以我加入訊飛正好是一個強強聯合。我會把很多做視覺的資源帶到公司,用我的經驗和技術背景來增強公司在視覺方面的研發能力。

雷鋒網:您是從什麽時候開始考慮加盟科大訊飛的?

李世鵬:這個時間其實蠻長了。去年在蘇州的一次創業會議上,訊飛研究院的胡國平院長和我都去做了演講。在這個會上我們建立了聯繫,他問我:“有沒有想過訊飛的機會?”不過我當時真沒想過。

訊飛一直以來都是我心目中比較佩服的公司,我記得訊飛的董事長劉慶峰是歷史上唯一一個拒掉微軟獎學金的人。他說當時在創業,真的沒有時間去拿微軟獎學金。從那個時候起,我就對訊飛比較關注了。但是也只是遠望,知道訊飛語音做的好,近幾年在語義、機器翻譯等方面做的也特別好,但是最近在做什麽卻並不是特別了解。

後來,胡國平院長深入地給我介紹了公司的方向;然後在今年年初,我和劉慶峰董事長也詳細聊了聊。他講,訊飛未來的產品其實定位很清晰,就是抓住人類社會的三個剛需:教育、醫療和司法;這三個剛需(雷鋒網注:訊飛稱為「賽道」)會把人工智能所有的技術都串起來。我覺得挺受啟發,同時我也覺得這裡面有很多需要深入研究的地方,我過來後會有很多太空施展自己的才華。

雷鋒網:科大訊飛在語音、NLP 領域有很強的研究,您是做視覺的。為什麽說在科大訊飛您會有更多的太空施展自己的才華呢?

李世鵬:由於現在人工智能技術的普及,現在的人工智能公司,已經不可能靠一個技術打遍天下了,所以總的趨勢都是往全棧方向發展。當技術不強的時候,你可以和其他公司在技術上進行合作,以彌補自己的技術短缺;但是當越做越好的時候,就需要建立自己的核心技術了,這樣才能在做大項目時不求於人。訊飛目前走的是平台+賽道的路線,而賽道所需要的不是單一的技術,而是全棧的技術。訊飛在語音、NLP 等領域在業界做的非常頂尖;我希望加入訊飛之後能把視覺這一塊也同樣帶起來。

雷鋒網:那麽科大訊飛在視覺方面目前做的怎麽樣?

李世鵬:其實訊飛在視覺方面的研究已經很強了,包括文字識別、醫療等方面,其實都有產品。如果你記得的話,訊飛去年在 LUNA 的比賽中獲得了平均召回率 94.1% 的檢測效果,刷新了世界紀錄

從某種意義上來講,現在人工智能(包括視覺)能不能做好,關鍵取決於有沒有足夠的標注好的數據。很多公司只是在拿一些標準的訓練集、測試集在做;但真正到實際應用時,還必須得采集足夠多的真實數據集。訊飛在數據這一塊花了很多資源,包括請一些專業的醫生來標注醫學影像等,這個力度是我在其他公司見得比較少的。這也是我加入訊飛的原因之一。

雷鋒網:所以訊飛的整體策略是認為 AI 在未來很多年都會以大數據為基礎嗎?

李世鵬:我說一下我個人的觀點。完全靠大數據的方法有其局限性;但是在技術突破之前,大家拚的只能是數據,所以你必須在數據上下功夫。

我們意識到未來不會是完全依靠大數據驅動,所以我們不會完全停止在以大數據為基礎的技術研究之上。這也是為什麽我們會跟世界上最好的學校、研究所去合作,就是要去發現將來的人工智能是什麽樣的架構,什麽樣的新模式,是否可以從認知科學裡面得到啟發,是否可以靠知識或推理來補全等。這些也是我比較感興趣的,即 what beyond 大數據+深度學習。把推理、知識的東西融入到人工智能當中,即使沒有大數據也能把機器變得更智能。所以你這個問題問地特別好,我也正在看這方面的東西。但是現階段要想往前走,還是得拚數據。

雷鋒網:加入訊飛後,您工作的思路和研究方向分別是什麽?

李世鵬:首先,訊飛現在有一個 60 多人的團隊在做視覺,但視覺裡面需要做的東西太多了,所以我們想隨後將這個團隊加強和擴大。另外,我們也有計劃在北京跟一些研究所、高校進行深度合作,或者在北京建立一個電腦視覺的團隊。

在研究方面,一方面我們仍然會和其他公司一樣,繼續用現在大數據的方式,解決現在的問題。另一方面,我們更多的還得看將來,例如 3 - 5 年,人工智能技術會發展到什麽樣的地步?我們從現在開始就做一些技術儲備,等真正時機來臨的時候,就遊刃有余了。因此在研究方向上,我們從一開始就會做一些結合認知科學方法+大數據方法的研究。

雷鋒網:為什麽在訊飛的通稿中,說 2018 年是訊飛國際化的元年呢?

李世鵬:不管是從市場還是技術合作商,今年都是訊飛真正正式進入國際的一年,我們追求的目標也更大更遠。市場上,包括在今年 CES 大會上,我們也去展示了我們的產品;我們的翻譯機在美國市場上已經開賣,目前很受歡迎。在合作上,我們的董事長劉慶峰今年親自帶隊,下定決心跟美國很多高校展開正式合作,包括 MIT、斯坦福、伯克利等高校都在談。

雷鋒網:您的加入將會促進訊飛的國際化嗎?

李世鵬:我本身曾是從跨國公司出來的,同時也在學術圈接觸許多世界各地的教授。所以在訊飛這個平台上,我可以與他們建立一些新的聯繫和合作,這是一個很自然的工作。現在這項工作已經開展,而且還不錯。

雷鋒網:所以訊飛今年有兩個重大調整:國際化和向視覺全面發力嗎?

李世鵬:國際化是一個主要方向;但視覺只是很多技術的方向之一,準確來講是向人工智能的全面化進軍。不過我們沒有想那麽高調,想先踏踏實實做事,完了之後再說,這是訊飛的風格,也是我特別喜歡訊飛的地方。

獲得更多的PTT最新消息
按讚加入粉絲團