DeepMind大突破！AI模擬大腦學會“抄近路”

DeepMind新Nature論文發布

　　文章來源：量子位公眾號 QbitAI（嶽排槐綜合自澎湃、wired英國等）

　　今天凌晨，DeepMind又有新Nature論文發布！

　　這次他們又訓練出了一個AI智能體，學會了類似哺乳動物一樣的“抄近路”能力，這次研究的目的，就是設法模仿人類大腦，用複雜的方式在周圍太空裡導航。這是一個前所未有的探索，被認為是理解大腦的一次重大進步。

　　太空感知，對已經輕鬆成為圍棋大師的AI來說，還是一件難事。

　　當你沿著熟悉的街道前進，繞過障礙，找到最快抵達目的地的捷徑時，大腦裡發生了什麽？這是一個非常複雜的事情。

　　科學家們在動物和人類大腦中找到了三種跟認路相關的細胞，分別是位置細胞、方向細胞和網格細胞。

　　位置細胞能在主體到達特定地點時放電，從而賦予對過往地點的記憶；方向細胞能感應前進的方向；網格細胞則是最神秘的一種：它們能將整個太空環境劃分成蜂窩狀的六邊形網格，仿佛地圖上的坐標系。

　　發現網格細胞的的莫索爾夫婦因此獲得了2014年的諾貝爾生理學或醫學獎。不過，網格細胞僅僅是在太空環境中提供GPS定位服務嗎？

　　一些科學家猜測，它們也會參與矢量計算，輔助動物規劃路徑。

　　DeepMind團隊決定用人工神經網絡檢驗上述猜想。

　　人工神經網絡是一種利用多層處理模擬大腦神經網絡的運算結構。團隊首先用深度學習算法訓練神經網絡學習哺乳動物的覓食運動路徑，利用線速度、角速度等信號在視覺環境中進行定位。

　　研究人員隨後發現，一種類似於網格細胞活動特徵的結構自動誕生了！在此前的訓練中，研究人員並未刻意引導神經網絡產生此種結構。

　　DeepMind團隊隨後利用強化學習檢驗這種網格結構是否能夠進行矢量導航。強化學習被普遍用於訓練遊戲AI，人類告訴AI一種遊戲的得分獎懲機制，但卻不教授遊戲方法，由AI在反覆進行遊戲、努力爭取更高分的過程中自我進化。

　　研究人員將之前自動出現的網格結構與一個更大型的神經網絡架構結合成了人工智能體，置於虛擬現實的遊戲環境中。經歷強化學習後，該人工智能在遊戲迷宮中向目的地前進的導航能力超越了一般人，達到了職業遊戲玩家水準。它能像哺乳動物一樣尋找新路線和抄近路。

　　最關鍵的是，當研究人員“靜默”原來的網格結構後，人工智能體的導航能力就會變弱，判斷目標的距離和方向都更不準確了。

　　論文作者之一Dharshan Kumaran說道：“我們證明了網格細胞遠不只是給我們提供GPS定位信號，也是一種大腦賴以計算兩個地點間的最短距離的核心導航機制。”

　　哈薩比斯說，要證明我們能構建出來我們想做的那種通用智能，大腦的存在就是一個證據。所以從神經科學中為新的算法尋找靈感，是很有道理的。但我們同時也相信這種啟發應該是雙向的，人工智能研究的見解也能為神經科學中的開放問題提供靈感。

　　“這項工作就是一個很好的例子：通過構建一個能在複雜環境中導航的人工智能體，我們強調了生物網格細胞在哺乳動物導航中的重要性，也拓寬了這方面的理解。”哈薩比斯表示。

　　DeepMind團隊相信，類似的研究方法還可以用來探索大腦聽覺和控制四肢的機制。在更遠的將來，神經科學家們甚至可以用人工智能代替小白鼠來做實驗。

　　同時也用人工智能體驗證了哺乳動物大腦中的“網格細胞”對基於向量的導航有支持作用。

　　這還有兩篇研究人員的影片訪談，更細致的進行解讀。

　　論文

　　這篇論文題目為：Vector-based navigation using grid-like representations in artificial agents 。

　　論文作者20多人，其中也包括哈薩比斯本人。

地址在此：https：//www.nature.com/articles/s41586-018-0102-6

　　論文預覽傳送門： http://t.cn/R3283LN