每日最新頭條.有趣資訊

騰訊AI Lab張正友:中國人工智能的未來到底通向何方?

雷鋒網按:7 月 12 日-7 月 14 日,2019 第四屆全球人工智能與機器人峰會(CCF-GAIR 2019)於深圳正式召開。峰會由中國計算機學會(CCF)主辦,雷鋒網、香港中文大學(深圳)承辦,深圳市人工智能與機器人研究院協辦,得到了深圳市政府的大力指導,是國內人工智能和機器人學術界、工業界及投資界三大領域的頂級交流博覽盛會,旨在打造國內人工智能領域極具實力的跨界交流合作平台。

7 月 12 日,中國人工智能學術界首次公開舉辦了「華人頂會主席圓桌」。五大國際 AI 頂會華人主席分別就各自領域會議的文章水準、大會主題和形式等方面相關變化的觀察分享了相關觀點,該圓桌論壇主持人由京東集團副總裁鄭宇擔任。

出席本次圓桌論壇的嘉賓有:

馬頌德,原科技部副部長、歐美同學會副會長、ICCV 2005 大會主席;

張正友,騰訊 AI Lab & Robotics X 主任、CVPR 2017 大會主席;

周明,微軟亞洲研究院副院長,國際計算語言學會(ACL)會長;

楊強,香港科技大學講席教授、微眾銀行首席 AI 官、IJCAI 理事會主席;

陳義明;新加坡工程院院士、南洋理工大學教授、ICRA 2017 大會主席。

中國人工智能四十年 • 華人頂會主席圓桌

圓桌探討

以下是圓桌會議的全部精彩內容,雷鋒網(公眾號:雷鋒網)做了不變原意的整理與編輯:

一、頂會現狀,一場過去與現在的思維碰撞

鄭宇:近幾年,各大頂會裡面的文章水準、大會主題以及形式有發生哪些變化?尤其是現在相對 10 年前,我們的論文水準、學者參會情況上發生了哪些明顯的變化?

周明:這是一個值得探討的好問題,現在的 ACL 的文章主要有這樣的特點——聚焦大數據驅動、神經網絡方面的內容,所以文章的技術水準很高;但內容都千篇一律。20 年前大家是基於規則的,語言學規則大家有各自的想法,那時是皓首窮經要寫上萬條規則,所以 20 年前的文章,個性化更強,在研究方面所下的功夫會比現在更深。

現在是一個好的時代,但是我們更應該用開放的心胸看待歷史,充分尊重前輩的工作,從而找到未來新的增長點,即不要拘泥於現在所謂的「深度學習方法」,也應該考慮到人類知識和大數據以及人的各種因素,將其糅合在一起,從而開創一個新的時代。

馬頌德:回顧這些會議這麽多年來「想解決什麽問題、在做什麽努力」會對今後很有用。因為我們可能會碰到類似的問題,就可以有類似的解決辦法。而反觀這些年計算機視覺方麵包括 ICPR、ICCV 做的事情可以發現,雖然我們想構築一個人工智能計算系統或者計算機視覺系統,但這些年的文章、討論的問題卻是在努力尋求突破,而這些內容的本質就是加知識。當然現在計算機視覺領域也有許多做的東西可能方向不太對,但所做的很多努力是能結合今後需要再繼續深入研究下去的。

鄭宇: ICCV 和 CVPR 有沒有區別?有多大區別?

張正友:兩者有很大的區別。從頻率來講,ICCV 兩年一屆,CVPR 一年一屆;從規模來講,我第一次參加 ICCV,規模是兩百多人,那時 CVPR 也差不多兩三百人,而今年 CVPR 已經達到了九千多人參會;從內容來講,ICCV 更偏向理論的,更有指導性的工作;CVPR 是更偏向於應用方向的研究;所以 ICCV 的門檻要比 CVPR 更高。

而近年來,會議的一個很大變化是中國人的參會比例。今年 CVPR 的會議,華人投稿比例達到 40%,參會華人估計超過 50%,華人在計算機視覺這個領域參會的人數非常多。除了門檻原因,這也側面反映中國人掌握應用技術的能力是相當強的;但也希望我們今後的發展,可以更多往原創性方向努力。

鄭宇: IJCAI 和 AAAI 有沒有什麽獨立存在的意義?AAAI 與 KDD 的變化以及兩者的聯繫是什麽?

楊強:IJCAI 從 1959 年走到今天也犯了很多錯誤,這些錯誤既對我們有教育意義,也反映了人工智能走的一些彎路。人工智能一開始追求的是比較高級的智能,比如:推理、證明定理、下棋,所以有很多這方面的人工智能的研究;但是它卻忘記直接讓機器去接觸這些最原始的數據。所以現今 NLP 大火則告訴我們,不要追求那些看上去高大上的內容而忘記基礎。其次,因為 IJCAI 追求這些高級智能,所以一開始 IJCAI 就決定了哪些方面不是 AI,並拒收該類論文。但今天這些拒收領域的參會人數比 IJCAI 更多,包括 CVPR、ICCV 等等的會議就是在這個基礎上建立的。儘管這些會議各自蓬勃發展,但會延遲整個人工智能的發展,甚至對這些單獨的領域起到延遲作用。

而談到 AAAI 和 IJCAI,首先 AAAI 的歷史是來自美國人工智能的,它是以美國人為主所建立的,至今沒有出過北美,隻去過一次加拿大。但是 IJCAI 由世界輪流舉辦,所以每次開會都有一天時間是各國的人工智能學會,大家一起討論各國的人工智能發展,只是很可惜每次中國人工智能學會都沒有參加,也希望這一點在未來能有所改變。

至於 KDD,它本身是由數據庫那個方向發展過來的,它裡面匯聚了很多數據庫的人士,專注於數據科學這個方向;和 AlphaGo、無人車這些全自動驅動的人工智能還是有一定的區別。

鄭宇:關於 ICRA 會議,有什麽變化?

陳義明:ICRA 是從 1984 年開始的,至今已有 35 年的歷史。這個會議過去是偏理論為主,但近 10 年來開始偏向應用方面,並且參會人員也從只有學校和研究部門,逐漸加入了越來越多的公司。但不管哪個行業應用,針對機器人領域來說,最重要的就是落地。

既然是一個應用學問,它會跟整個技術發展有一連串相關關係。最早機器人跟隨汽車業,中國的機器人起源也都是跟汽車工業有關。之後才開始有了移動機器人、醫療機器人等等,所以從它的內容來講,也主要與時代熱點相關。2000 年左右,因為本田推出雙足機器人,所以那段時間雙足機器人的文章就非常多。在前三五年無人機比較熱門,所以無人機的文章就非常多。一直到最近這兩年,大家都要用深度學習,很多人就一定要用深度學習來做工業機器人、無人機等等。但最重點是可以從中看出,現在大家對這個應用越來越重視,尤其是落地行業的應用。

鄭宇:這些會議最近一屆參會人數是多少?

周明:ACL 去年是 2000 多人,今年大概會突破到 2500 至 3000 人。

張正友:CVPR 今年有 9000 人。

楊強:上一屆 IJCAI 在瑞典,大概 7000 人。

陳義明:ICRA 今年剛在加拿大蒙特利爾辦的,大概有 4000 人。

二、新會迅速崛起,是挑戰還是機遇?

鄭宇:NeurIPS 最近參會人數有 1 萬多,這個會議為什麽能崛起?背後有什麽樣的原因?這些現象說明了什麽?

周明:其實 ACL 最近提交論文數量也是爆增,主要原因我認為有四點。第一,現在數據集太多,幾乎每年都會新增幾個數據集;第二,方法層出不窮;第三,博士生畢業需要撰寫相應的論文;第四,被拒論文流於各個會議,所以每個會都會承接部分相同的論文。但總體來講,現在的會議都特別相似,所以會議規模太大並非好事,因為大家都從眾來做這些事。相反,我更傾向於一個小而精的會議,這樣的會更容易讓大家坐在一起深入討論一些方法。

張正友:CVPR 2017 年的時候是 5000 人,今年是 9000 人,假如按照這樣的曲線發展,會議量將非常大。我們去開會沒有時間聽報告,更多是見見老朋友,朋友之間聊聊互相做的事情,所以現在參加會議目的已經很不一樣了。真正要做學術,正如周明所說,還是在小會議、閉門會議聊得會深入些。

陳義明:ICRA 是機器人領域最大的會議,它基本上是一支獨大,規模也在成長;但畢竟學者總數還不多,因此成長空間有限。現狀是很多小會依附於大會,然後大家在大會上見老朋友,在這些小會上討論詳細的領域,所以現在大小會的交叉融合,我認為是一個生態的演化。

鄭宇:NeurIPS 的火熱程度與深度學習的爆發和應用有很大的關係,但深度學習是不是也會遇到寒冬呢?

楊強:我覺得「深度學習熱」是有原因的,因為之前我們主要是從邏輯的角度來做的人工智能,知識的方法根據規則而來,並沒有考慮人的大腦結構。但現在發現人是一個魯棒性非常強的分布式的知識表達,在這種知識表達的思想下設計出來的機器雖然不一定是深度學習的表達,但是它確實是當前最有代表性的。我覺得再往下應該沿著這個方向繼續走下去,不一定是接著深挖現在有的神經網絡式深度學習,也許還有其它的秉承這種分布式的思想,並且具有高魯棒性、高並行,能夠做知識的非線性轉化的方法。所以在這一領域,我們還有很多的路要走。

三、聚焦 AI 大勢,學界、業界何解?

鄭宇:深度學習在自然語言處理這個領域裡面,其重要性和未來的前景如何?現在學生應該花更多精力在深度學習,還是應該反思之前的方法?

周明:我有兩個打引號的著名觀點,第一個觀點是要「與時俱進」,即在你還對這個領域不太了解之前,就先跟隨別人。第二個觀點是「挑戰權威」,即在已經了解這個行業的情況下,提出獨到的觀點,實現超越。人在任意時刻都是這兩個矛盾的有機統一,不同時刻要有不同取捨。

張正友:深度學習的成就還是有目共睹的,無論是在計算機視覺、語音識別還是在 NLP 方面都有很大的進展,深度學習可能會成為一個工具。對每個學生來講,是需要花時間去了解這個工具的;而之後的發展則要根據個人興趣。有些學生目的不是要做研究,可能需要掌握深度學習,因為目前在工業界最有用的工具可能就是深度學習;但如果要做研究,那麽你去深入思考深度學習背後的一些問題,然後進行創新,可能會更好。

鄭宇:在學界和在工業界做人工智能,各有什麽樣的利弊以及優勢與劣勢,特別是從學界到工業界,最大的變化和挑戰是什麽?

楊強:我在學術界往往是深挖一個東西,持續做 10 年、20 年。遷移學習我做了 20 多年,最後寫出一本書,這是在學術界的做法。而在工業界就是發現問題,比如在工業界我就發現公司和公司之間、部門和部門之間數據不通,即部門牆。很多人就認為 AI 沒法做,但我認為這是機會,所以我嘗試在保護數據隱私的情況下,打破部門牆。這是到了工業界才發現的問題。

張正友:工業界和學術界確實是很不一樣的,學術界在現在這個大數據時代往往拿不到大數據,只能在相對較小的數據裡面做研究,最終效果可能很好,但到工業界要在實際中應用,你會發現很多問題;在學術界可能你會專注於寫文章、發表,但是在工業界則是把重要的問題都解決掉,其中可能不光是一個問題;在學術界可能你喜歡某一個方法,你就沿著這個方法深挖、鑽研,這個問題本身可能沒有實際應用,但在工業界則是以問題為出發點,有哪些重要的問題,那麽我們就需要想辦法來解決這個問題。

鄭宇:請馬老師說一下學術界的優勢,之前有個觀點說好像工業界把學界的人挖得差不多了。

馬頌德:因為人工智能很火,學生畢業後假如還留在一般的研究機構,可能收入會和工業界差很多倍。現在可能我們不需要這麽多研究,所以有很多人轉到工業界,國際上也是這樣,很多人進入了工業界的研究所,這是正常現象。我們不太能說清學術界在基礎研究方面能夠提出很多有價值的問題或者在近期可以做出重要的突破,但我們仍然需要研究,它是必須的,也是應該的,只是它的隊伍的穩定或者價值觀等,還需要大家來共同努力。

鄭宇:有什麽好的辦法可能保持隊伍的穩定性並培養優秀人才?

陳義明:事實上,國內很多做 AI 的人士是從新加坡回國的,所以現今新加坡還能維持當前的狀態,主要還是因為它比較國際化。除了吸引華人之外,新加坡也吸引了世界各國的人來工作。但機器人的狀況不太一樣,因為真正懂機器人的人是比較少的,現在全世界都缺這類人才,而且培養起來要花較長時間,所以解決方法只能是從頭培養。

周明:首先看到學術界的人才流失是正常的現象,這是它自身規律所在。第一,因為學校是培養人才的地方,出很多全新的研究成果較難,更多的都是跟隨別人;所以很多人的想法是與其跟隨別人,不如到工業界發揮更大的作用;第二,反觀現在出現這種情況有深層的社會原因,可能有政府政策導向、市場因素等等,這需要國家共同帶動好的研究氣氛與文化,來將優秀的人才留在學校;第三,業界跟學校的真誠合作並非挖人,而是真正幫助學校將其研究土壤立起來,幫助老師走向國際化,把更好的學生培養出來。

鄭宇:在 AI 的道路上,學生應該有哪些東西要注意的,怎麽樣培養自己的能力?

周明:我覺得最重要的就是找一個好的導師。

馬頌德:因為各個學科不一樣,在人工智能領域,對地點、對老師、對各方面的選擇非常重要。

張正友:一個學生如果真想做研究的話,還是要帶著一種熱情,你就能夠比較持續地堅持你要走的科研道路。不要怕坐冷板凳,現在看起來人工智能很火紅,但之前這個領域的圖靈獎獲得者也坐了 30 多年的冷板凳,所以真想要做科研,要有坐冷板凳的精神。

楊強:除了找好老師,還得多跟老師交流,要善於交流,要勇敢;其次是要有一個好的平台,這個平台會有很多資源給你,包括數據資源、問題資源、周邊的一些朋友圈;然後個人要勤奮、要好奇、要有熱情。

陳義明:我覺得還有一點也很重要,希望各位同學一定要保持一個開放的心態。做研究,你的熱情很重要,你不能只等老師給你題目,自己也要主動去發掘題目。

四、AI 未來何去何從

鄭宇:用一句話總結你心目中中國的未來 AI 將是如何?

陳義明:我覺得未來中國的 AI 發展一定會非常好,因為中國的應用場景是全世界第一,機器人需要很多的應用場景。

楊強:我覺得科學不分國籍,要本著開放的心態。

張正友:我也同意陳老師的講法,中國的應用場景無論是人工智能還是機器人都非常強大,前景是非常好的,希望中國人工智能發展越來越好。

馬頌德:中國在 AI 方面的應用一定會是全世界規模最大的,但是在 AI 的基礎研究方面要有重大突破,我現在並不樂觀,也可能全世界都沒有這樣的突破。我們採訪了全世界目前在人工智能方面最有權威的一些專家,他們也都表示對 AI 的未來有不同的看法,比如「到底能不能實現真正的人工智能」,大家的看法的差別很大。有人說要 20 年以後能實現,有人說 200 年以後才能實現。而這一切都依賴於重大的突破,這方面我現在無法預測。但可以確定的是,目前中國能夠看到的 AI 應用是世界組成中最大的一部分。

周明:理論研究固然重要,但是它是需要時間的,我認為中國把實用系統做實做好,踏實苦乾可能是最重要的。

獲得更多的PTT最新消息
按讚加入粉絲團