“阿爾法星際”戰勝人類玩家，人工智能邊界不斷擴大

公開日: 2019-01-25

1月25日凌晨，DeepMind與暴雪在網上直播，公布了在《星海爭霸2》遊戲中取得的進展，名為“AlphaStar”（阿爾法星際）的人工智能在與兩位人類職業選手“TLO”和“MANA”的比賽中，均以5比0取勝。人工智能再次“碾壓人類”。

由於《星海爭霸2》是公認的策略極其複雜的遊戲，DeepMind在這個遊戲中取得的成績被認為是有一個人工智能領域中里程碑式的事件。

“這又是一個非常有意思的進展，DeepMind確實很厲害，令人佩服。” 中國科學院計算技術研究所陳雲霽研究員對第一財經記者表示。陳雲霽愛打星海爭霸，也密切關注DeepMind在人機大戰方面的進展。他表示：“場景邊界明確、規則明確的領域，機器遲早都能戰勝人類。”

去年8月，DeepMind和遊戲公司暴雪（Blizzard）宣布合作發布一項叫做SC2LE的工具，希望能夠加速人工智能在實時策略遊戲《星海爭霸2》中的研究。DeepMind當時表示：“我們的目標是不斷擴大人工智能的邊界，開發能夠解決複雜問題的系統。為了實現這一目標，DeepMind實驗室設計了一系列的機器人特工，並測試他們在不同環境下的能力，讓他們去玩一些人類玩了幾十年的遊戲。打敗人類不是我們設計的最終目的，但這對於對標機器人的性能非常重要。”

此前DeepMind在圍棋項目AlphaGo中戰勝柯潔和李世石，一度引起人工智能界的轟動。DeepMind在克服了很多技術上的難題之後，“AlphaStar”正式誕生，並開始與人類職業選手的測試。

AlphaStar跟AlphaGo有些類似，最開始都是通過學習人類選手的Replay（比賽錄像）來提升水準。直播中展示的10場比賽都是在一張相同的比賽地圖上進行，並且人工智能的APM（每分鐘操作的次數）限制在與人類選手相仿的程度。

人工智能醫療企業珠海醫凱電子科技有限公司技術團隊負責人張國峰對第一財經記者表示：“人工智能對付遊戲確實非常有效，因為遊戲是人類設計的有限規則環境，即便它再複雜也是有限的規則，永遠沒有‘意外’。在這種環境之下的對弈，人工智能的響應速度和判斷參數要全面優於人類。因此AI在很長一段時間的未來，在可控的有限規則環境下，將全面取代人類，比如工廠生產等。”

然而，現實世界在大多數情況下都是無限的規則環境，比如安防或者無人駕駛。以無人駕駛為例，目前大多數的無人駕駛都仍然處於全封閉的路線測試階段，而如果放開至開放路線，則將面臨更多的不確定因素。

張國峰認為，即便是在無限規則環境之下，人工智能也將對人類起到非常大的輔助作用。人類的智慧將被大大解放，僅僅使用在需要突破和創新的領域，而不用去做簡單重複的勞動。“人類智能的特點是發現新事物，創造新方法。”張國峰對第一財經記者表示，“比如在遊戲中，當人類玩家在通過技能無法戰勝對手的情況下，就會想出‘旁門左道’，用諸如網絡攻擊等方法使得對方down機來獲勝，這是AI無法做到的。”