論文の概要: Assessing Game Balance with AlphaZero: Exploring Alternative Rule Sets
in Chess
- arxiv url: http://arxiv.org/abs/2009.04374v2
- Date: Tue, 15 Sep 2020 16:11:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 08:48:10.801079
- Title: Assessing Game Balance with AlphaZero: Exploring Alternative Rule Sets
in Chess
- Title(参考訳): AlphaZeroでゲームバランスを評価する - チェスの代替ルールセットを探る
- Authors: Nenad Toma\v{s}ev, Ulrich Paquet, Demis Hassabis and Vladimir Kramnik
- Abstract要約: 私たちはAlphaZeroを使って、新しいチェスの変種を創造的に探索し、設計しています。
チェスのルールに原子的変化を含む他の9つの変種を比較した。
AlphaZeroを用いて各変種に対する準最適戦略を学習することにより、これらの変種が採用された場合、強い人間プレイヤー間のゲームがどのように見えるかを決定する。
- 参考スコア(独自算出の注目度): 5.3524101179510595
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is non-trivial to design engaging and balanced sets of game rules. Modern
chess has evolved over centuries, but without a similar recourse to history,
the consequences of rule changes to game dynamics are difficult to predict.
AlphaZero provides an alternative in silico means of game balance assessment.
It is a system that can learn near-optimal strategies for any rule set from
scratch, without any human supervision, by continually learning from its own
experience. In this study we use AlphaZero to creatively explore and design new
chess variants. There is growing interest in chess variants like Fischer Random
Chess, because of classical chess's voluminous opening theory, the high
percentage of draws in professional play, and the non-negligible number of
games that end while both players are still in their home preparation. We
compare nine other variants that involve atomic changes to the rules of chess.
The changes allow for novel strategic and tactical patterns to emerge, while
keeping the games close to the original. By learning near-optimal strategies
for each variant with AlphaZero, we determine what games between strong human
players might look like if these variants were adopted. Qualitatively, several
variants are very dynamic. An analytic comparison show that pieces are valued
differently between variants, and that some variants are more decisive than
classical chess. Our findings demonstrate the rich possibilities that lie
beyond the rules of modern chess.
- Abstract(参考訳): ゲームルールのエンゲージメントとバランスの取れたセットを設計するのは自明ではない。
現代のチェスは数世紀にわたって進化してきたが、歴史に類似した反省がなければ、ゲームダイナミクスへのルール変更の結果を予測することは困難である。
alphazeroは、シリコのゲームバランスアセスメントの代替手段を提供する。
人間の監督なしに、自身の経験から継続的に学習することで、スクラッチから設定されたあらゆるルールの最適に近い戦略を学ぶことができるシステムである。
本研究ではAlphaZeroを使って新しいチェスの変種を創造的に探索し設計する。
フィッシャー・ランダム・チェス (Fischer Random Chess) のようなチェスの変種への関心が高まっているのは、古典的なチェスの卓越したオープニング理論、プロのプレーにおけるドロー率の高さ、そして両方のプレイヤーがまだホーム準備中である間に終わる非無視の数のゲームのためである。
チェスのルールに原子的変化を含む他の9つの変種を比較した。
この変更により、新しい戦略的および戦術的パターンが出現し、ゲームはオリジナルに近づき続けることができる。
AlphaZeroを用いて各変種に対する準最適戦略を学習することにより、これらの変種が採用された場合、強い人間プレイヤー間のゲームがどのように見えるかを決定する。
定性的には、いくつかの変種は非常に動的である。
分析的な比較では、断片は変種によって異なる価値を持ち、いくつかの変種は古典的なチェスよりも決定的なものである。
本研究は,現代チェスのルールを超えた豊かな可能性を示す。
関連論文リスト
- Explore the Reasoning Capability of LLMs in the Chess Testbed [45.12891789312405]
我々は,注釈付き戦略と戦術を統合することで,チェスにおける大規模言語モデルの推論能力を向上させることを提案する。
我々はLLaMA-3-8Bモデルを微調整し、より優れたチェスの動きを選択するタスクにおいて、最先端の商用言語モデルと比較する。
論文 参考訳(メタデータ) (2024-11-11T01:42:56Z) - Enhancing Chess Reinforcement Learning with Graph Representation [21.919003715442074]
グラフニューラルネットワーク(GNN)に基づくより一般的なアーキテクチャを導入する。
この新しいアーキテクチャは、同じ数のパラメータで以前のアーキテクチャより優れていることを示す。
また、より小さな5倍のチェスでトレーニングすると、通常の8倍のチェスでプレイできるように素早く微調整できることも示しています。
論文 参考訳(メタデータ) (2024-10-31T09:18:47Z) - Predicting User Perception of Move Brilliance in Chess [3.434553688053531]
チェスの動きを華々しく分類する最初のシステムを示す。
精度は79%(ベースレート50%)、PPVは83%、NPVは75%である。
より弱いエンジンが低品質とみなすと、この動きは輝かしく、すべて等しいと予測される傾向が示される。
論文 参考訳(メタデータ) (2024-06-14T17:46:26Z) - Amortized Planning with Large-Scale Transformers: A Case Study on Chess [11.227110138932442]
本稿では,AIにおける画期的な計画問題であるチェスを用いて,計画課題の性能評価を行う。
ChessBenchは、Stockfishが提供する法的行動と価値アノテーション(1500億ポイント)を備えた1000万のチェスゲームの大規模なベンチマークである。
極めて優れた近似を教師付き学習により大規模変圧器に蒸留することは可能であるが, 完全蒸留は依然として到達範囲を超えている。
論文 参考訳(メタデータ) (2024-02-07T00:36:24Z) - All by Myself: Learning Individualized Competitive Behaviour with a
Contrastive Reinforcement Learning optimization [57.615269148301515]
競争ゲームのシナリオでは、エージェントのセットは、彼らの目標を最大化し、敵の目標を同時に最小化する決定を学習する必要があります。
本稿では,競争ゲームの表現を学習し,特定の相手の戦略をどうマップするか,それらを破壊するかを学習する3つのニューラルネットワーク層からなる新しいモデルを提案する。
我々の実験は、オフライン、オンライン、競争特化モデル、特に同じ対戦相手と複数回対戦した場合に、我々のモデルがより良いパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2023-10-02T08:11:07Z) - AlphaZero Gomoku [9.434566356382529]
我々は、AlphaZeroを「Five in a Row」とも呼ばれる古くからのボードゲーム「Gomoku」に拡張する。
我々のテストは、Go以外のゲームに適応するAlphaZeroの汎用性を示している。
論文 参考訳(メタデータ) (2023-09-04T00:20:06Z) - ApproxED: Approximate exploitability descent via learned best responses [61.17702187957206]
連続的なアクションセットを持つゲームの近似的ナッシュ均衡を求める問題について検討する。
本稿では,戦略プロファイルに対するエクスプロイラビリティの近似を最小化する2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2023-01-20T23:55:30Z) - Mastering the Game of Stratego with Model-Free Multiagent Reinforcement
Learning [86.37438204416435]
Strategoは、人工知能(AI)がまだマスターしていない数少ない象徴的なボードゲームの一つだ。
ストラテゴにおける決定は、行動と結果の間に明らかな結びつきがなく、多数の個別の行動に対してなされる。
DeepNashは、ストラテゴの既存の最先端AIメソッドを破り、Gravonゲームプラットフォームで年間(2022年)と最高3位を達成した。
論文 参考訳(メタデータ) (2022-06-30T15:53:19Z) - Measuring the Non-Transitivity in Chess [19.618609913302855]
我々は、人間のプレイヤーの実際のデータを通してチェスの非透過性を定量化する。
非透過性の度合いとチェス選手のレーティングの進行との間には強いつながりがある。
論文 参考訳(メタデータ) (2021-10-22T12:15:42Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。