LSTM之父，被圖靈獎遺忘的大神

新智元原創

作者：張乾、金磊、大明

【新智元導讀】圖靈獎為何不頒給LSTM之父Jürgen Schmidhuber？作為AI界特立獨行的人，Schmidhuber與深度學習三巨頭有過口水戰，並現場對質GAN的提出者，可謂得罪了一圈人。

一個被遺忘的大神。

前幾天，

2018圖靈獎獲得者

公布，深度學習三巨頭：Yoshua Bengio、Geoffrey Hinton、Yann LeCun榮獲桂冠。

HLB（Hinton、LeCun、Bengio）三人獲圖靈獎實至名歸，消息一出，計算機界紛紛送上祝福。

不過，在恭賀之餘，也有不少的網友發出了質疑：圖靈獎為什麽沒頒給LSTM之父Jürgen Schmidhuber？他也是深度學習領域的大家啊。

獲得圖靈獎的為什麽是Yoshua Bengio、Geoffrey Hinton、Yann LeCun，而不是Jürgen Schmidhuber呢？

Yoshua Bengio、Geoffrey Hinton和Yann LeCun獲得了圖靈獎(計算機界的諾貝爾獎)，讓深度神經網絡成為計算機中的重要環節。非常酷！但是Jürgen Schmidhuber呢？

就連南京大學人工智能學院院長周志華教授也發微博稱，LSTM是教科書級的貢獻。

Jürgen Schmidhuber是瑞士Dalle Molle人工智能研究所的聯合主任，他1997年提出的LSTM現在被廣泛應用在谷歌翻譯、蘋果Siri、亞馬遜Alex等應用中，可謂是深度學習領域最商業化的技術之一。

除了LSTM之外，Jürgen Schmidhuber“引以為傲”的還有他在1992年提出的一種PM（Predictability Minimization）模型。

為什麽“引以為傲要”打引號？

因為他堅持認為現在大火的GAN就是PM的變種，兩者的區別就在於方向是反的，為此，Jürgen Schmidhuber還和GAN的提出者Ian Goodfellow有過線上線下激烈的交鋒，業界至今記憶猶新。

至於對深度學習三巨頭HLB，Jürgen Schmidhuber也打過幾輪口水仗，認為HLB三人在自己的圈子裡玩，對深度學習領域其他更早期先驅人物的貢獻則隻字不提，之後LeCun發文反擊。

Jürgen Schmidhuber這個暴脾氣沒得獎，是因為得罪人了嗎？

LSTM之父交戰GAN之父

故事還得從五年前講起。

2014年，Ian Goodfellow第一篇GAN論文投到了NIPS大會，三位評審中，兩位直接通過，一位直接斃掉。

這位拒稿的評審就是Jürgen Schmidhuber。

Jürgen Schmidhuber為什麽給出Goodfellow這位年輕的後輩如此截然相反的評審意見？

原來，Jürgen Schmidhuber認為，GAN不能稱為第一個對抗網絡，他自己在1992年提出的PM模型才是。

在給Goodfellow的評審意見中，Jürgen Schmidhuber直接質疑Goodfellow：GAN和PM在許多方面看起來很相似。這兩種方法都使用“對抗性”MLP來估計某些概率，並學習編碼分布。不同之處在於，新系統學會根據統計獨立的隨機輸入生成非平凡分布，而舊的PM學習生成統計獨立的隨機輸出以響應非平凡分布(通過提取相互獨立的因子特徵編碼分布)。

因此，GAN本質上改變了PM的方向——這是主要的區別嗎？GAN應該被稱為“反向PM”嗎?

最後，無奈之下的Goodfellow只好在論文的最終版本裡加入了GAN和PM不同之處的比較，這才有了第一篇GAN論文的誕生。

然而Jürgen Schmidhuber依舊不依不饒，私下裡通過郵件跟Goodfellow幾番爭論。

最激烈的事情發生在2016年。

當時GAN已經在學術界名氣日旺，2016年NIPS大會，Goodfellow在現場有個Tutorial，正當他講到GAN與其他模型相比較時，被一個聽眾的提問打斷了。

這個聽眾就是Jürgen Schmidhuber。

JürgenSchmidhuber的問題很長，大概說了兩分鐘，主要內容是強調說自己在1992年就已經提出來PM，接著說了一大堆它的原理、實現過程等等，最後圖窮匕見：你說說你的GAN和我的PM有沒有相似之處？

Goodfellow也不示弱：你說的問題我們之前在郵件裡已經交流過很多次了，我也早就公開回應過你了，不想在現在的場合浪費聽眾的耐心。（掌聲）

Ian Goodfellow在2016年NIPS上回應Jürgen Schmidhuber

一位五十多歲的長者試圖碾壓三十出頭的小夥子，但被小夥子反殺，場面一度十分尷尬。

後來，Goodfellow在Quora上海透露，他聯繫了NIPS的主辦方，詢問JürgenSchmidhuber是否有辦法向他提出投訴，並由NIPS代表委員會判斷Goodfellow的論文是否不公平。但主辦方說並沒有這樣的流程。

除此之外，JürgenSchmidhuber還提出和Goodfellow一起寫合一篇描述PM和GAN之間相同點和不同點的論文，但前提是兩人真正能達成一致。現在看起來，這是不太可能了。

交惡深度學習三巨頭

Ian Goodfellow是Bengio的得意門生，而在懟Goodfellow之前，Jürgen Schmidhuber已經與Goodfellow的師傅Bengio以及HLB三人組合有過口水戰。

2015年5月，Bengio、Hinton和LeCun三位大神聯手在Nature上發了一篇review，題目直接就叫《Deep Learning》。此文從傳統的機器學習技術講起，總結了現代機器學習的主要架構和方法，描述了訓練多層網絡架構的反向傳播算法，以及卷積神經網絡的誕生，分布式表示和語言處理，以及遞歸神經網絡及其應用等等。

這篇文章堪稱是深度學習領域的經典之作，Google學術統計的統計顯示，論文被引用數已接近14000次。

從這篇文章的行文風格和內容來看，相當一部分內容是三位作者賴以成名的劃時代成就，大有為深度學習“回顧歷史、展望未來”的意思，字裡行間透露出“蓋棺定論”的豪邁之意擋也擋不住。

不過Nature上這篇文章發表後不到一個月，他就在自己的部落格上發文，對這篇論文進行了批評。

Schmidhuber在文中表示，這篇文章讓他非常不爽，因為全文多次引用三位作者自己的研究成果，而對於其他先驅人物對深度學習更早的貢獻則隻字不提，比如：

三位作者儼然以AI先驅自居，在參考文獻信息中對深度學習之父Alexey GrigorevichIvakhnenko根本提都沒提，後者早在1965年就發表了第一篇面向深度網絡的通用深度學習算法的論文。1971年的論文中就提出了8層深度神經網絡。

文章提到了反向傳播（BP），但引用的都是自己的論文，根本沒有提到反向傳播的發明者和早期開拓者的成果。實際上，最早的反向傳播模型誕生於上世紀60-70年代。

關於前饋神經網絡，Review說是CIFAR實驗室的研究人員2006年努力導致FNN的再度複興，這裡又是在自誇，而且是一種誤導。實際上，研究人員已經使用Ivakhnenko幾十年了。

文章在提到無監督預訓練FNN時還是在引用作者自己的研究，但卻沒提Schmidhuber本人早在1992-1993年就提出的無監督式預訓練RNN，只不過那時候還不叫RNN，但原理和思想是一致的。

在說到非監督學習對深度學習複興的深遠影響時，仍然隻引用了作者們自己的成果。

同樣，在卷積神經網絡一節，文章提到了“池化”，但卻沒有提及提出最大池化技術的先驅人物等等。

總之，在Schmidhuber這篇文章中認為，今年獲得圖靈獎的“深度學習三巨頭”儼然成了貪他人之功，以為己利的雞賊、借助江湖地位互相吹捧，壓製老前輩的學閥。這一篇文章的操作也真是剛的很。

並且，Schmidhuber還發表過Hinton、LeCun等人出名，是因為背後有谷歌、Facebook這樣的大公司在背後做宣傳的言論。

後來，LeCun在一封email回復中寫道：“Jürgen 對眾人的認可過於癡迷，總是說自己沒有得到應得的很多東西。幾乎是慣性地，他總是在別人每次講話結束時都要站起來，說剛剛提出的成果有他的功勞，大體上看，這種行為並不合理。”

由此看來，Schmidhuber和三巨頭這梁子算是結下了。

被圖靈獎遺忘的大神？

1997年，Jürgen Schmidhuber和Sepp Hochreiter發表了一篇關於一種遞歸神經網絡的論文，就是大名鼎鼎的長短期記憶網絡（LSTM）。

2015年，LSTM被用於谷歌智能手機軟體中的語音識別新實現。谷歌也使用LSTM作為智能助手Allo和谷歌翻譯。後來蘋果在iPhone和Siri的“Quicktype”功能中使用了LSTM。Amazon的Alexa也使用了LSTM。在2017年，Facebook每天使用LSTM網絡進行約45億次自動翻譯，LSTM可以說是商業化做廣泛的AI技術之一。

除了LSTM，2011年Jürgen Schmidhuber還與他的博士後學生在GPU上實現CNN(卷積神經網絡)的顯著加速，現在這種方法已經成為計算機視覺領域的核心。

當今年的圖靈獎公布之後，有不少人認為單純從貢獻上來講，提出LSTM的Jürgen Schmidhuber也應該獲獎。

祝賀三位，當之無愧。但貢獻如此顯著的Jürgen Schmidhuber被排除在外的還是非常意外和錯誤的。

京東集團副總裁、加拿大Simon Fraser大學計算科學學院教授、統計與精算系教授、加拿大一級研究講座教授、ACM Fellow、IEEE Fellow、ACM SIGKDD Chair裴健教授告訴新智元：圖靈獎揭曉後，經常有人有疑問，那個誰誰誰對這個方向這個領域也作出了突出貢獻，甚至比其中某一位獲獎者貢獻還大，為什麽沒有一起獲獎？然後就順理成章的地有各種揣測。

“我個人的理解是，每一屆圖靈獎是授予一個個人或一個團隊，而不是給一個領域相對獨立的多位先驅。“The ACM A.M. Turing Award is an annual prize given by the Association for Computing Machinery (ACM) to an individual selected for contributions ‘of lasting and major technical importance to the computer field’.”

圖靈獎歷史上多次發生過在同一領域獨立作出突出貢獻的多位科學家和團隊陸續獲獎的佳話，如計算複雜性理論和數據庫理論等都有多位獲獎者。

所以，各位看官不要著急，也不要以看宮廷戲的心態看圖靈獎。

OpenCV的創造者、AI科學家 Gary Bradski曾評價Schmidhuber：”他是做了很多開創性的工作，但他不是那個使這些成果流行起來的人。這就像最早發現美洲的是維京人，但千古留名的是哥倫布。”

大神總是孤獨的

Jürgen Schmidhuber和HLB各有各的成就，但大神們總有相似之處，那就是堅持。

Hinton在上大學時期堅信神經網絡是未來，並為此堅持了三十年。

出生於1963年的Jürgen Schmidhuber，在他15歲時就堅信通用人工智能一定會實現，當時那個年代中國剛剛改革開放。

“作為一個少年，我意識到人們可以做的最重要的事情就是建立一種學會變得比人類聰明的東西。”

Jürgen Schmidhuber在年輕時候曾對他弟弟講，人類可以一個原子一個原子地重建大腦，可以用銅線代替我們緩慢的神經元作為連接，想象力非常大膽。弟弟剛開始很反對哥哥這套人造大腦可以模仿人類情感和自由意志的觀點。但最終，”我意識到他是對的。“

高中畢業後，Schmidhuber從1981年開始學習計算機科學和數學，並在西德軍隊服役15個月，服兵役時就展現出他特立獨行的性格，他不喜歡被人頤指氣使，特別是被要求做一些他認為沒用的事情。

他的在線簡歷精心編制了他在學術界的歷程，包括諸如“加州理工學院拒絕了他的博士後申請”等等，到現在，Schmidhuber的個人主頁也是頗有特色。

Schmidhuber對通用人工智能的追求一直持續了40多年，他還夢想建立一個智能機器勞動的烏托邦，因此在1988年，他捐贈了數百萬美元來創建瑞士的Dalle Molle人工智能研究所。它與當地大學的合作，加上政府源源不斷的資助，幫助這座小鎮變成了人工智能的天堂中心。

通用AI將掌管並改變整個宇宙

《矽谷鋼鐵俠》的作者在2018年5月寫過一篇Jürgen Schmidhuber的特稿，題目是《這個人是AI圈想要忘記的教父》。

這篇文章提到，在大多數學術界之外，Schmidhuber仍然很不為人知。主要是因為學術圈裡的同伴不喜歡他，不少同行評價他自私、狡猾，給人帶來痛苦。

由於Schmidhuber頻繁在學術期刊和會議上懟研究人員，打斷他人演講要求同行承認他們借用甚至竊取了他的想法，後來業內創造了一個動詞”Schmidhubered“，誰被別人攻擊了就可以用Schmidhubered。

Schmidhuber被邊緣化的另一部分原因是因為他的研究所位於阿爾卑斯山，位置孤立，遠離科技大公司。

2013年，Schmidhuber還在瑞士創辦了一家創業公司Nnaisense，這家公司肩負著實現通用人工智能的使命，並影響到DeepMind。

DeepMind聯合創始人Shane Legg以及首批員工之一Daan Wierstra就是Schmidhuber的學生，他的一些其他博士也加入了DeepMind。

Jürgen Schmidhuber曾說，他從15歲起就決定，創造出比人類更聰明的機器人然後退休，並把這個觀點一致保持到了現在。

他認為，擁有自我意識的（self-aware）或“有知覺的機器”（conscious machines）不久就將出現。這個觀點更加劇了同行對他的不屑。而對這場辯論需要提出一個問題：人工智能是一個工程學科，還是一場創造新的超智能生物的“造神運動”？

Schmidhuber堅定地站在造神的立場，他認為這些技術的基本概念已經存在，而且人類的意識並不神奇，認為機器的意識將從更強大的計算機和算法中出現，而這些算法與他早已設計好的那些非常接近。

這種信念背後，是他堅定不移的認為：我們生活在《黑客帝國》形式的(Matrix-style)計算機模擬中。

“在我的成長的過程中，我一直追問自己，我能產生的最大的影響是什麽？”Schmidhuber 博士回憶道，“這個問題後來變得清楚了，就是我要造出比我自己更聰明的東西，而這個東西又將造出更聰明的東西，如此等等，最終它將掌管並改變整個宇宙，使整個宇宙變得智能。”

今天，他已經不再困惑這樣的機器是否會出現，他說，只要計算能力得到大飛躍，很快就會出現。

參考資料：

https://www.bloomberg.com/news/features/2018-05-15/google-amazon-and-facebook-owe-j-rgen-schmidhuber-a-fortune

https://www.quora.com/Was-J%C3%BCrgen-Schmidhuber-right-when-he-claimed-credit-for-GANs-at-NIPS-2016

https://www.inverse.com/article/25521-juergen-schmidhuber-ai-consciousness