每日最新頭條.有趣資訊

人類全面潰敗!AI訓練4.5萬年,DOTA 2人機大戰大結局

新智元報導

編輯:大明、張乾

【新智元導讀】OpenAI Five在Dota 2中以2:0擊敗了世界冠軍團隊,人機大戰人類最終不敵AI。OpenAI Five在去年輸掉比賽後進行了優化,訓練時間相當於人類玩了4.5萬年。

OpenAI可以宣布自己是世界第一了。

今天凌晨,OpenAI Five在Dota 2中以2:0擊敗了世界冠軍團隊OG,再次顯示出了AI的強大威力,也正式宣告人類在Dota這種高難度遊戲中成為AI的手下敗將。

這次比賽,OpenAI Five的表現出是迄今為止展示出的最高水準:人類對手去年贏得了世界上最令人垂涎的電子競技賽事TI8的冠軍;OpenAI Five在去年輸掉比賽後進行了優化,訓練時間相當於人類玩了4.5萬年,贏得比賽也並不出乎意料。

2:0,AI戰勝人類

在這場人機大戰中,每隊只有17個英雄可供選擇。 OpenAI還選擇了所謂的“Captain's Draft”遊戲模式。與之前的比賽一樣,OpenAI也禁用了召喚和幻覺功能,這兩項功能都涉及以英雄副本的形式引入其他變量,以及OpenAI訓練系統時未考慮的一些特殊因素和部門。

除此之外,這場比賽與正常的Dota 2比賽一樣,其最終目標是摧毀敵方隊伍的“水晶”,即每個團隊領土末端的大型塔樓,在敵人的隊伍成功摧毀其他小型塔後,水晶是很脆弱的整個比賽過程的中心是對塔的攻防,以及英雄與英雄之間的團戰。

在第一場比賽中,OpenAI Five讓對手OG大吃一驚,通過一系列激進戰術獲得了勝利,其中包括對遊戲中獲取的金幣的花費方式,在本方英雄死亡時立即買活,即使在比賽初期也是如此。

對此,OpenAI首席技術官Greg Brockman指出,OpenAI喜歡有利於短期收益的戰略,說明在長期規劃上不如人類,而且DOTA2這種遊戲通常要依賴於長期規劃才能獲勝。然而,在這場比賽中,這種早期的買活策略得到了回報,OpenAI Five獲得了優勢,當比賽拖入30分鐘時,OG頂不住了。

在第二場比賽中,OpenAI表現更好,在最初的幾分鐘內即獲得了對OG的早期優勢,然後無情碾壓了人類玩家,在第一場比賽時間剛剛過半的時間點上即取得勝利。

值得注意的是,OpenAI Five在第二場比賽中開始玩得異常激進,以及OG在AI全圖範圍內的推進時有些無力對抗。OpenAI Five能夠利用其特定的英雄選擇帶來的優勢。

飛速進化的OpenAI Five:已經訓練4.5萬年

去年8月,OpenAI Five曾以3:2擊敗半職業人類玩家,不過當面對職業對手時,OpenAI便輸給了paiN Gaming戰隊,帥不過三秒。

根據OpenAI聯合創始人兼主席Greg Brockman(也是該組織的CTO)的說法,在輸掉比賽之後,OpenAI Five是通過在加速的虛擬環境中進行自我改進而變得更加強大的。

OpenAI Five由深度強化學習提供支持,也就是說它的編碼目的不是“如何遊戲”,而是“如何學習”。Brockman在比賽開始前表示。,AI在10個月中,已經玩了45000年的Dota 2遊戲,而且,玩了這麽長時間也沒有覺得無聊。

這場比賽採用三局兩勝製,所有bot都使用相同的深度強化學習技術進行訓練,並由同一OpenAI系統的不同層獨立控制。

OpenAI向公眾開放與AI對決,終極目標是實現通用人工智能

對於OpenAI來說,值得慶祝的不僅僅是這次勝利,還因為其證明了對強化學習的態度及其關於AI的普適哲學樹立的里程碑。

研究團隊將不再公開展示其AI 遊戲bot,而是致力於開發軟體,讓人類與OpenAI Five軟體實時協作,與機器人一起玩遊戲,並學習他們獨特的前所未有的戰略和行為。

OpenAI Five還發布了一個平台,供公眾與OpenAI Five對戰,這種模式稱為“競技場”模式,將於4月18日起開放三天。OpenAI表示,協作軟體可能永遠不會向公眾開放,不過大家可以在活動中親自嘗試一下。

OpenAI的聯合創始人兼首席執行官Sam Altman還表示,此類工作證明了與AI智能體的合作可能會在未來帶來巨大的利益。

Altman說:“對於世界如何運作,如何訓練這些智能體,令其實現協作上,這次活動是重要的一課。實現人類與AI的合作,是我們對未來世界更積極的願景之一,人工智能與人類共同努力,使人類變得更好、更有趣、更有影響力。”

OpenAI可能會繼續涉足Dota 2和其他視頻遊戲,主要是因為這些遊戲是人工智能的良好測試平台,也是衡量AI技術進步的良好基準測試工具。

現在可能還沒有一個遊戲像OpenAI Five這樣,AI系統最終無法具備超出人類能力的水準。對於更廣泛的AI行業而言,精通視頻遊戲可能很快就會變得過時,我們需要簡單的方式來證明AI系統可以快速學習,並能夠更快速高效地的解決現實世界的困難任務,獲得更有意義的好處。

最終,OpenAI希望將其Dota 2學習並擴展到遊戲之外的新領域,並最終擴展到現實世界中。為此,OpenAI正致力於使用強化學習和其他技術,為機器人手提供更靈巧、更精細、更人性化的動作。

“OpenAI正在努力的方向建立通用人工智能(AGI),並與世界分享這些好處,同時確保其安全性。”Altman說的是建立一個能夠執行任何人類任務的多功能AI系統。“我們的目標不是戰勝電子遊戲,雖然這很有趣。我們的目標是揭開實現AGI道路上的秘密。”

參考鏈接:

https://www.theverge.com/2019/4/13/18309459/openai-five-dota-2-finals-ai-bot-competition-og-e-sports-the-international-champion

獲得更多的PTT最新消息
按讚加入粉絲團