像FIFA一樣踢球的AI，比打遊戲更強嗎？

圖片來源@視覺中國

文 | 腦極體

還記得被阿爾法狗支配的恐懼嗎？最新的“AI恐怖故事”，是谷歌教AI踢足球，打造“AI版貝克漢”。

其實，這個足球人工智慧研究專案Google Research Football，早在今年6月就出現在了谷歌報告上，而更早一些時間，就在Github上以開源的形式發布了足球環境遊戲的測試版代碼。

以谷歌“AI界頂流”的咖位，加上當今的資訊效率，現在才突然一波走紅，反射弧委實有點過長了。難道是媒體們集體不蹭熱點，改成冷飯熱炒了？

答案或許處在“下一代AI”這個充滿遐想的泛濫標題裡，用一個上古時期的互聯網話術來說，就是聽起來很性感。

此前在《星海爭霸》《DOTA2》裡超越人類電競隊伍的AI，都沒能獲此殊榮，踢個足球就引領未來，AI和AI的差別怎就這麽大呢？

這一代AI的上升空間還有多大？

大眾已經越來越明白，AI不能變魔術了。然而將時間倒回到2016年，相信絕大部分人都不會否認，擔心工作被AI替代，被機器人網紅索菲亞嚇得瑟瑟發抖，覺得《終結者》《黑客帝國》《西部世界》早晚要來，都是切身體會過的心路歷程。

傳統的“AI恐怖故事”宣告破產，一方面得益於各路技術大牛日積月累地科（懟）普（人），同時也跟建立在深度學習基礎上的技術上限有關。

比如建立在龐大的數據運算基礎上，訓練AI玩電子遊戲往往就需要花費數十萬美元；比如黑箱性，沒有一個深度學習結構(卷積、RNN、LSTM、GAN 等)可以解釋自己的決策，暗搓搓地搞歧視、罵人、發明新語種之類的事情層出不窮；再比如只會做“填空題”，面對需要引用常識、共識、推理等問題的時候就會表現的像個智障，容易被糊弄，比如將列印的人臉識別成真的，要麽就是智商不及預期，醫療診斷、機器人、自動駕駛等始終進展緩慢……一貫反骨的馬斯克，前不久就推出了基於計算機視覺感知的無人駕駛新方案。

總體來說，深度學習真正能成功做到的，還是在給定大量人為標注數據的情況下，實現兩個空間事物之間的映射。距離人們預想中的AGI強人工智能真是“事倍功半”，極其遙遠。

所以，著名的“唱衰AI”專家 Filip Piekniewski聲稱將“AI寒冬”的鍋甩給了深度學習，雖然有些聳人聽聞，也未嘗不是指出了一個切實而嚴峻的問題——如果以深度學習為基礎的AI應用不再繼續提升，那麽相關產業走到“窮途末路”（尤其是那些to VC項目），也是早晚的事~

DL不是終極算法，不妨繼續沉迷遊戲

既然都這樣了，那還怎麽做AI？理論上有兩個角度：一是深度學習的自我進化，在原有的基礎上引入新技術彌補一些先天不足；另一個則是尋找“備胎”，扶持AI領域的其他流派上位。

目前看來，科技企業也確實都極其渴盼變量出現，不過他們更青睞於做溫和的“改良派”，畢竟“徹底推翻腐朽政權”還需要一個漫長的培養接班人的過程。

以谷歌Football Engine為例，就讓智能體借助獎勵機制來自己get動態策略，從而學會規則與踢球技能（強化學習）。

不過，要稱之為“下一代AI”未免有點拔苗助長。

首先，“可玩性足球”（Gameplay Football）並沒有完全擺脫深度學習的窠臼。系統根據對手的實力不同，提出了簡單、終極、困難這三個版本的基準問題，其中簡單級別的比賽應用單一機器算法，而困難級別則是由分布式深度學習算法來處理的。

而且，系統所採用的訓練方式（即強化學習），與OpenAI Five在遊戲Dota 2中擊敗了世界級電子競技隊OG，deepmind在《魔獸爭霸》人機對戰中獲勝時所採用的訓練方式，並沒有本質上的區別，都是讓智能體在複雜的即時戰略遊戲中學會與環境互動，並解決複雜的任務。

同時，作為機器學習的一個分支，強化學習之於AGI依然遙遠。深度學習三巨頭的Yann LeCun 和Hinton都認為，當前用來實現“人工智能效果”的技術，對實現（真正的）人工智能是行不通的。就像怎麽優化馬車的核心技術，也無法造出汽車一樣。

更何況，類似的彌補深度學習不足的機器學習方法還有很多。

比如小樣本學習、無監督學習就擺脫了對大規模數據集和人類專家監督的需求，提升自主訓練效率；元學習解決了深度學習訓練出的智能體技能單一、缺乏常識的問題。深度學習大神Hinton在2015年還提出了一個黑科技——知識蒸餾（Knowledge Distillation），通過遷移知識，借助訓練好的大模型得到更加適合推理的小模型，從而提升深度學習在大規模計算集群上的訓練表現。

總而言之，所謂的“下一代AI”，核心還是彌補深度學習在理解能力、多模態仿生、應用性價比等方面的不足。作為過渡型方案，這種“深度學習+”估計還會持續很長時間。不過距離真正實現AGI的預期，依然相去甚遠。

追尋下一代AI，或許要走向更寬廣的技術海域

今日我們看到的大多數AI產品思路，都是以DL(Deep Learning) + GOFAI (Good Old Fashioned AI) 的模式建立起來的。也就是將深度學習與其他算法相結合，讓“AI”走向千行萬業。

不過也有不少科學家是徹底的“革命派”，想了不少幫助AI的新辦法，其中或許也隱藏著破局的可行性。

比如Hinton就試圖通過膠囊網絡Capsule Networks來顛覆傳統的深度學習算法，用神經元向量代替傳統神經網絡的單個神經元節點，讓不同的神經元攜帶不同屬性的信息傳導到下一層運算，已經證明可以像人類的視覺系統一樣，自動將學到的知識推廣到不同的新場景中，這被認為是未來讓AI被賦予常識推理的關鍵技術。

還有的專家堅持基於邏輯規則的符號系統能夠實現AI推理，一些學者和創業公司就正在用Prolog(一種基於符號學的編程語言)開發新工具。理論上可以通過非常少的數據來進行訓練，自己處理事實和概念，然後自動生成事實推論。

但總體而言，其他分支的AI流派想要撼動“深度學習2.0”的主流地位，仍然比較困難。除了產業端正在大舉投入對深度學習及衍生技術的應用之外，美國國防高級研究計劃局DARPA甚至籌備了一個名為“機器常識(Machine Common Sense)”的計劃，旨在推進和分享模擬人類常識性推理的技術創意，總投資預計約為6000萬美元。

作為標杆的深度學習及延伸技術，其商業化潛力，即使“靠山吃山”，也有數年的好光景可以期待。但必須承認，面對其自身的瓶頸，大眾的腎上腺素與技術期待也開始回歸正常值，甚至有點審美疲勞。技術專家們再不搞個大事件，熱愛“AI鬼故事”的科技編輯們都要被逼禿頭了……

值得探索的下一代產業AI方向會在哪裡，恐怕與我們的現有認知都相去甚遠。畢竟世界上每一次巨大的變革，總是開始於某一些被忽視的技術角落。除了繼續挑戰技術的穹頂，谷歌們似乎別無選擇。