論文の概要: Playing Against the Board: Rolling Horizon Evolutionary Algorithms
Against Pandemic
- arxiv url: http://arxiv.org/abs/2103.15090v1
- Date: Sun, 28 Mar 2021 09:22:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-30 14:42:53.781335
- Title: Playing Against the Board: Rolling Horizon Evolutionary Algorithms
Against Pandemic
- Title(参考訳): ボードに逆らう: 水平方向の進化アルゴリズムがパンデミックに対抗
- Authors: Konstantinos Sfikas and Antonios Liapis
- Abstract要約: 本稿では,短期的リスク軽減と長期的勝利戦略のバランスをとる必要があるため,コラボレーションボードゲームが人工知能に異なる課題をもたらすことを主張する。
本稿では,協調型ボードゲームにおけるパンデミックの例を示し,このゲームに展開する進化的アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 3.223284371460913
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Competitive board games have provided a rich and diverse testbed for
artificial intelligence. This paper contends that collaborative board games
pose a different challenge to artificial intelligence as it must balance
short-term risk mitigation with long-term winning strategies. Collaborative
board games task all players to coordinate their different powers or pool their
resources to overcome an escalating challenge posed by the board and a
stochastic ruleset. This paper focuses on the exemplary collaborative board
game Pandemic and presents a rolling horizon evolutionary algorithm designed
specifically for this game. The complex way in which the Pandemic game state
changes in a stochastic but predictable way required a number of specially
designed forward models, macro-action representations for decision-making, and
repair functions for the genetic operations of the evolutionary algorithm.
Variants of the algorithm which explore optimistic versus pessimistic game
state evaluations, different mutation rates and event horizons are compared
against a baseline hierarchical policy agent. Results show that an evolutionary
approach via short-horizon rollouts can better account for the future dangers
that the board may introduce, and guard against them. Results highlight the
types of challenges that collaborative board games pose to artificial
intelligence, especially for handling multi-player collaboration interactions.
- Abstract(参考訳): 競争的なボードゲームは、人工知能のための豊かで多様なテストベッドを提供している。
本稿では,短期的リスク軽減と長期的勝利戦略のバランスをとる必要があるため,コラボレーションボードゲームが人工知能に異なる課題をもたらすことを主張する。
協力的なボードゲームは、すべてのプレイヤーに、ボードと確率的なルールセットによって引き起こされるエスカレートする課題を克服するために、異なるパワーの調整やリソースのプールを義務付ける。
本稿では,模範的なコラボレーションボードゲームであるPandemicに着目し,本ゲーム用に設計された転動地平線進化アルゴリズムを提案する。
パンデミックゲーム状態が確率的だが予測可能な方法で変化する複雑な方法は、多くの特別に設計された前方モデル、意思決定のためのマクロアクション表現、進化アルゴリズムの遺伝的操作のための修復機能を必要とした。
楽観的・悲観的なゲーム状態評価,異なる突然変異率,事象の地平線を探索するアルゴリズムの変数を,基本的階層的政策エージェントと比較する。
結果は、短期水平ロールアウトによる進化的アプローチが、委員会が導入し、それらに対して防御する将来の危険を考慮しやすくしていることを示している。
結果は、人工知能、特にマルチプレイヤー協調インタラクションの処理において、協調ボードゲームが直面する課題の種類を強調する。
関連論文リスト
- Evolutionary Tabletop Game Design: A Case Study in the Risk Game [0.1474723404975345]
本研究は、テーブルトップゲームに対するアプローチの拡張を提案し、リスクの変種を生成することによってプロセスを評価する。
我々は、選択したパラメータを進化させる遺伝的アルゴリズムと、ゲームをテストするルールベースのエージェントを用いてこれを達成した。
結果は、より小さなマップを持つオリジナルゲームの新たなバリエーションが作成され、結果としてより短いマッチとなることを示している。
論文 参考訳(メタデータ) (2023-10-30T20:53:26Z) - Opponent Modeling in Multiplayer Imperfect-Information Games [1.024113475677323]
マルチプレイヤー不完全情報ゲームにおける対戦相手モデルへのアプローチを提案する。
我々は,3人プレイヤのクーンポーカーにおいて,種々の実敵と正確なナッシュ均衡戦略に対する実験を行う。
我々のアルゴリズムは、正確なナッシュ均衡戦略を含む全てのエージェントを著しく上回る。
論文 参考訳(メタデータ) (2022-12-12T16:48:53Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - A Survey of Decision Making in Adversarial Games [8.489977267389934]
ポーカー、チェス、エバダー追跡、麻薬の侵入、沿岸警備、サイバーセキュリティ、国防など多くの実践的応用において、プレイヤーは明らかに敵対的な姿勢をとる。
本稿では,対戦型ゲームに広く用いられている3つの主要ゲームモデルについて,体系的な調査を行う。
論文 参考訳(メタデータ) (2022-07-16T16:04:01Z) - Pick Your Battles: Interaction Graphs as Population-Level Objectives for
Strategic Diversity [49.68758494467258]
我々は、集団内の個人がどのように相互作用するかを慎重に構造化することで、多様なエージェントの集団を構築する方法について研究する。
我々のアプローチは,エージェント間の情報の流れを制御するインタラクショングラフに基づいている。
マルチエージェント・トレーニングにおける多様性の重要性を証明し,様々な相互作用グラフを適用したゲームにおけるトレーニング・トラジェクトリ,多様性,パフォーマンスに与える影響を解析する。
論文 参考訳(メタデータ) (2021-10-08T11:29:52Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z) - Collaborative Agent Gameplay in the Pandemic Board Game [3.223284371460913]
Pandemicは、すべてのプレイヤーがゲームの進行中に発生する出来事によって引き起こされる課題を克服するために調整する模範的な共同ボードゲームです。
本稿では,すべてのプレイヤーの行動を制御し,この高度に進化した環境において勝つ確率と負けるリスクをバランスさせる人工エージェントを提案する。
提案アルゴリズムは,様々な難易度を持つ異なるゲームにおいて,より一貫した勝利戦略を見出すことができることを示す。
論文 参考訳(メタデータ) (2021-03-21T13:18:20Z) - Learning to Play Imperfect-Information Games by Imitating an Oracle
Planner [77.67437357688316]
我々は、同時移動と大規模なステートアクションスペースでマルチプレイヤーの不完全な情報ゲームをプレイする学習を検討します。
我々のアプローチはモデルに基づく計画に基づいている。
我々は,Clash Royale と Pommerman のゲームにおいて,プランナーが効率的なプレイ戦略を発見することができることを示す。
論文 参考訳(メタデータ) (2020-12-22T17:29:57Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Efficient exploration of zero-sum stochastic games [83.28949556413717]
ゲームプレイを通じて,ゲームの記述を明示せず,託宣のみにアクセス可能な,重要で一般的なゲーム解決環境について検討する。
限られたデュレーション学習フェーズにおいて、アルゴリズムは両方のプレイヤーのアクションを制御し、ゲームを学習し、それをうまくプレイする方法を学習する。
私たちのモチベーションは、クエリされた戦略プロファイルの支払いを評価するのにコストがかかる状況において、利用可能性の低い戦略を迅速に学習することにあります。
論文 参考訳(メタデータ) (2020-02-24T20:30:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。