AlphaZero令國象重具藝術性 世冠與DeepMind合作
作者:新浪體育綜合文章來源:足球直播吧發布日期:2020-09-21 11:56:18
據 大數據文摘 報道
來源:wired
編譯:lin
國際象棋一向以冷酷的邏輯著稱,但弗拉基米爾·克拉姆尼克卻因其魅力而熱愛這項運動。
“這是一種創造,”他說。他對棋局上思想沖突的藝術感、復雜而優雅的挑釁和反擊的熱情,幫助他在2000年擊敗加里·卡斯帕羅夫(Garry Kasparov),并成為數年的世界冠軍。
然而,去年從國際象棋比賽中退休的克拉姆尼克也認為,他心愛的這項運動已經失去了創造性。他將此部分歸咎于計算機,因為計算機無情的計算創造了大量的開局和防守,一流的球員都熟悉這些??死纺峥苏f:“在相當多的最高水平的游戲中,一半的游戲——有時是整個的游戲——是在內存中進行的?!薄澳闵踔敛挥米约鹤鰷蕚??!?/p>
近日,克拉姆尼克提出了一些關于如何在世界上最強大的國際象棋計算機的幫助下恢復人類象棋藝術的想法。他與Alphabet人工智能實驗室DeepMind合作,后者的研究人員向他們的超人棋類軟件AlphaZero發起挑戰,以學習9種國際象棋變體,這些變體可以讓棋手產生創造性的新模式。
在2017年,AlphaZero展示了它可以通過自學徹底打敗國際象棋、圍棋或日本圍棋高手。Kramnik說,最新的研究結果表明,如果人們愿意對現有的規則做出一些小的改變,國際象棋將會有新的誘人的前景有待探索。
該項目還展示了象棋玩家和機器之間的協作模式?!皣H象棋引擎最初用來擊敗人類,”Nenad Tomaev說DeepMind研究員曾參與該項目?!艾F在,我們看到像AlphaZero這樣的系統被用于與人類合作進行創造性探索,而不是與人類對立?!?/p>
人們下國際象棋已有1500年的歷史,對規則進行微調并不是什么新鮮事。也沒有人抱怨電腦讓這個游戲變得無聊。
前國際象棋世界冠軍弗拉基米爾克拉姆尼克(左)與杰米斯哈薩比斯(右)創立的Alphabet旗下的DeepMind合作,探索使用人工智能的新型國際象棋。
國際象棋在大約500年前迅速傳播,當時歐洲棋手將一種移動緩慢的棋子提升為現代強大的王后,這給了這個游戲更多的活力。1996年,也就是IBM的“深藍”擊敗卡斯帕羅夫的前一年,國際象棋神童、現逃犯鮑比菲舍爾(Bobby Fischer)在布宜諾斯艾利斯召開了一場新聞發布會,抱怨國際象棋需要重新設計,以降低電腦強化記憶能力,鼓勵創新。他推出了費舍爾隨機國際象棋(Fischer Random Chess),這種象棋保留了通常的游戲規則,但隨機化了每局棋盤背面強大棋子的起始位置。菲舍爾隨機牌,也被稱為960象棋,慢慢地在國際象棋世界中贏得了一席之地,現在有了自己的比賽。
DeepMind和Kramnik發掘了AlphaZero從零開始學習游戲的能力,以比人類幾十年或幾個世紀的游戲更快地探索新的變種,人類的游戲會揭示出它們的美麗和缺陷。“你不想投資數月或數年的你的生活想玩的東西,只有意識到,“哦,這并不是一個美麗的游戲,“”Tomaev說。
AlphaZero是AlphaGo更靈活、更強大的繼任者。2016年,AlphaGo打敗了圍棋冠軍,在人工智能歷史上留下了一個里程碑。它開始學習一個只有規則、記分的方法和一種預先設定好的嘗試和勝利的沖動的游戲。參與該項目的另一位DeepMind研究員烏爾里希帕奎特(Ulrich Paquet)表示:“當它開始玩的時候,它的表現非常糟糕,我都想躲到桌子底下?!薄暗吹剿鼜奶摕o的虛空中進化出來,令人興奮,幾乎是純粹的?!?/p>
在國際象棋中,AlphaZero最初并不知道它可以拿走對手的棋子。在幾個小時的高速游戲中,不斷地對抗更強大的化身,它變得更熟練,對一些人來說,比之前的象棋引擎更自然。在這個過程中,它重新發現了人類幾個世紀以來的象棋理念,并增加了自己的天賦。英國特級大師馬修·薩德勒(Matthew Sadler)將鉆研AlphaZero的游戲描述為“發現過去一些偉大棋手的秘密筆記本”。
AlphaZero測試的九種備選國際象棋方案中,包括克拉姆尼克和其他人已經在考慮的無castling國際象棋,并在1月份舉行了第一場專門的比賽。它消除了一種叫castling的移動方法,該方法允許玩家將自己的國王隱藏在其他棋子的保護屏后——這種強大的防御方式也會令人窒息。五種變體改變了棋子的移動,包括魚雷象棋,在整個游戲中,棋子可以一次移動兩個方格,而不是只在第一次移動的時候。
讀取AlphaZero結果的一種方法是使用冷數字。與傳統規則相比,無等級象棋下的平局更少見。學習了不同的規則后,AlphaZero放在不同棋子上的值就會發生變化:在傳統規則下,皇后的值是9.5個卒子;在魚雷規則下,女王只值7.1卒。
最終,DeepMind的研究人員對該項目中另一個偉大的象棋大腦克拉姆尼克(Kramnik)的分析更感興趣?!斑@不是關于數字,而是優質愉悅的感受人類坐下來玩游戲,”Tomaev說。周三發布的一份技術文件中,有70多頁克拉姆尼克對AlphaZero探索的評論。
克拉姆尼克在AlphaZero如何適應新規則的過程中看到了一些亮點。他說,無等級象棋激發了保護國王安全的豐富新模式。另一個更極端的變化,自我捕獲國際象棋,玩家可以自己拿棋子,被證明更有吸引力??死纺峥苏f,這一規則實際上給了玩家更多的機會,讓他們可以犧牲一部分來獲得成功。幾個世紀以來,這種戰術一直被視為優雅玩法的標志?!翱偠灾@只會讓比賽變得更美好,”他說。
克拉姆尼克希望AlphaZero在國際象棋中的冒險經歷能夠說服所有級別的玩家都嘗試一下?!斑@是我們給國際象棋世界的禮物,”他說。現在可能是一個合適的時機。
兩屆美國女子國際象棋冠軍詹妮弗·沙哈德說,國際象棋已經流行了多年,但隨著許多人尋求新的智力刺激,國際象棋經歷了大規模流行。人們對960國際象棋的興趣也在增加,這表明人們對包括一些超級明星在內的新型玩法有了興趣。本周晚些時候,沙哈德將為包括世界排名第一的卡爾森(Magnus Carlsen)和前冠軍卡斯帕羅夫(Kasparov)在內的960國際象棋(Chess960)錦標賽提供評論。
和克拉姆尼克一樣,沙哈德在AlphaZero測試的幾個變體中也看到了一些類似的東西,盡管像允許卒子橫向移動這樣的變化讓人感覺“難以置信”?!叭绻惺袌霁@得吸引力,一些玩家仍將希望依靠電腦和深入研究來領先,但重新設定周期可能會引人入勝。”Shahade同時也是美國國際象棋聯合會的女子項目主任,她說:“這些發現會讓人感覺新鮮——這將是非常令人興奮的,而且會讓不同類型的玩家受益?!奔热粰C器是不可戰勝的,DeepMind和克拉姆尼克的項目可能也會鼓勵計算機國際象棋變得更有創造性。
以色列巴伊蘭大學(Bar-Ilan University)研究員伊萊大衛(Eli David)表示:“我們可以專注于把國際象棋作為一種游戲形式的藝術,而不是讓計算機國際象棋變得更強大,從而摧毀人類?!贝笮l自己制造了一臺以機器學習為動力的國際象棋引擎。在他的實驗室里,一名研究生正在研究一種能模仿特定棋手風格的國際象棋軟件,這種軟件可以詢問機器過去或現在最喜歡的大師在特定情況下會做什么。
Kramnik的經驗表明,讓人類與機器一起工作,而不是對抗機器,可以擴展游戲的情感體驗和技術體驗。AlphaZero甚至把他帶到了他廣闊的理解力之外的地方。他說:“三招之后你就不知道該怎么做了?!薄案杏X很好,就像你是個孩子?!?/p>