論文の概要: Hybrid Minimax-MCTS and Difficulty Adjustment for General Game Playing
- arxiv url: http://arxiv.org/abs/2310.16581v1
- Date: Wed, 25 Oct 2023 12:13:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-26 15:04:06.997372
- Title: Hybrid Minimax-MCTS and Difficulty Adjustment for General Game Playing
- Title(参考訳): 汎用ゲームのためのハイブリッドミニマックスMCTSと難易度調整
- Authors: Marco Ant\^onio Athayde de Aguiar Vieira, Anderson Rocha Tavares,
Renato Perez Ribas
- Abstract要約: ゼロサムゲームにおいて,難易度の高い人工知能に対抗するための一般的な手法を提案する。
我々は,ミニマックス探索プロセスとMCTSのGGPを組み合わせたミニマックス-MCTSハイブリッドアルゴリズムを提案する。
このアプローチは、視覚障害者にフレンドリーなモバイルアプリケーションであるLoBoGamesでテストされました。
- 参考スコア(独自算出の注目度): 0.1657441317977376
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Board games are a great source of entertainment for all ages, as they create
a competitive and engaging environment, as well as stimulating learning and
strategic thinking. It is common for digital versions of board games, as any
other type of digital games, to offer the option to select the difficulty of
the game. This is usually done by customizing the search parameters of the AI
algorithm. However, this approach cannot be extended to General Game Playing
agents, as different games might require different parametrization for each
difficulty level. In this paper, we present a general approach to implement an
artificial intelligence opponent with difficulty levels for zero-sum games,
together with a propose of a Minimax-MCTS hybrid algorithm, which combines the
minimax search process with GGP aspects of MCTS. This approach was tested in
our mobile application LoBoGames, an extensible board games platform, that is
intended to have an broad catalog of games, with an emphasis on accessibility:
the platform is friendly to visually-impaired users, and is compatible with
more than 92\% of Android devices. The tests in this work indicate that both
the hybrid Minimax-MCTS and the new difficulty adjustment system are promising
GGP approaches that could be expanded in future work.
- Abstract(参考訳): ボードゲームはあらゆる年齢層にとって大きなエンターテイメント源であり、競争的で魅力的な環境を作り、学習と戦略的思考を刺激する。
ボードゲームのデジタル版では、他の種類のデジタルゲームと同様に、ゲームの難易度を選択するオプションを提供するのが一般的である。
これは通常、AIアルゴリズムの検索パラメータをカスタマイズすることで行われる。
しかし、異なるゲームは難易度ごとに異なるパラメトリゼーションを必要とするため、このアプローチを一般ゲームプレイティングエージェントに拡張することはできない。
本稿では,ゼロサムゲームにおいて難易度の高い人工知能に対して,ミニマックス-MCTSハイブリッドアルゴリズムを提案するとともに,ミニマックス探索プロセスとMCTSのGGPアスペクトを組み合わせた汎用的手法を提案する。
このアプローチは、拡張可能なボードゲームプラットフォームであるモバイルアプリケーションlobogamesでテストされ、アクセシビリティを重視した幅広いゲームカタログを持つことを目的としています。
本研究の成果は,ハイブリッドのMinimax-MCTSと新しい困難調整システムの両方が,今後の作業で拡張可能なGPアプローチを約束していることを示している。
関連論文リスト
- Neural Population Learning beyond Symmetric Zero-sum Games [52.20454809055356]
我々はNuPL-JPSROという,スキルの伝達学習の恩恵を受けるニューラル集団学習アルゴリズムを導入し,ゲームの粗相関(CCE)に収束する。
本研究は, 均衡収束型集団学習を大規模かつ汎用的に実施可能であることを示す。
論文 参考訳(メタデータ) (2024-01-10T12:56:24Z) - Hardness of Independent Learning and Sparse Equilibrium Computation in
Markov Games [70.19141208203227]
マルコフゲームにおける分散型マルチエージェント強化学習の問題点を考察する。
我々は,全てのプレイヤーが独立に実行すると,一般のサムゲームにおいて,アルゴリズムが到達しないことを示す。
我々は,全てのエージェントが集中型アルゴリズムによって制御されるような,一見簡単な設定であっても,下位境界が保持されていることを示す。
論文 参考訳(メタデータ) (2023-03-22T03:28:12Z) - Exploring Adaptive MCTS with TD Learning in miniXCOM [0.0]
本研究では,モンテカルロ木探索(MCTS)におけるオンライン適応性について,事前学習を必要とせずに検討する。
時間差学習により改良された適応MCTSアルゴリズムMCTS-TDを提案する。
我々は,ターンベースの戦術ゲームからなる人気商業フランチャイズである miniXCOM に対して,我々の新しいアプローチを実証する。
論文 参考訳(メタデータ) (2022-10-10T21:04:25Z) - Towards General Function Approximation in Zero-Sum Markov Games [126.58493169301012]
本稿では,同時移動を伴う2プレーヤゼロサム有限ホライゾンマルコフゲームについて考察する。
分離された設定とコーディネートされた設定の両方の効率的なアルゴリズムが開発されている。
論文 参考訳(メタデータ) (2021-07-30T15:25:13Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z) - Playing Against the Board: Rolling Horizon Evolutionary Algorithms
Against Pandemic [3.223284371460913]
本稿では,短期的リスク軽減と長期的勝利戦略のバランスをとる必要があるため,コラボレーションボードゲームが人工知能に異なる課題をもたらすことを主張する。
本稿では,協調型ボードゲームにおけるパンデミックの例を示し,このゲームに展開する進化的アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-28T09:22:10Z) - Collaborative Agent Gameplay in the Pandemic Board Game [3.223284371460913]
Pandemicは、すべてのプレイヤーがゲームの進行中に発生する出来事によって引き起こされる課題を克服するために調整する模範的な共同ボードゲームです。
本稿では,すべてのプレイヤーの行動を制御し,この高度に進化した環境において勝つ確率と負けるリスクをバランスさせる人工エージェントを提案する。
提案アルゴリズムは,様々な難易度を持つ異なるゲームにおいて,より一貫した勝利戦略を見出すことができることを示す。
論文 参考訳(メタデータ) (2021-03-21T13:18:20Z) - TotalBotWar: A New Pseudo Real-time Multi-action Game Challenge and
Competition for AI [62.997667081978825]
TotalBotWarは、ゲームAIのための新しい擬似リアルタイムマルチアクションチャレンジだ。
ゲームはTotalWarのゲームシリーズに基づいており、プレイヤーは敵のゲームに勝つために軍隊を管理する。
論文 参考訳(メタデータ) (2020-09-18T09:13:56Z) - Finding Game Levels with the Right Difficulty in a Few Trials through
Intelligent Trial-and-Error [16.297059109611798]
ダイナミックな難易度調整の方法は、ゲームが特定のプレイヤーに調整されてエンゲージメントを最大化することを可能にする。
現在の手法では、相手の難易度やリソースの可利用性など、限られたゲーム機能だけを変更していることが多い。
本稿では,数回の試行で特定の目的の難易度で完全なレベルを生成・探索できる手法を提案する。
論文 参考訳(メタデータ) (2020-05-15T17:48:18Z) - Efficient exploration of zero-sum stochastic games [83.28949556413717]
ゲームプレイを通じて,ゲームの記述を明示せず,託宣のみにアクセス可能な,重要で一般的なゲーム解決環境について検討する。
限られたデュレーション学習フェーズにおいて、アルゴリズムは両方のプレイヤーのアクションを制御し、ゲームを学習し、それをうまくプレイする方法を学習する。
私たちのモチベーションは、クエリされた戦略プロファイルの支払いを評価するのにコストがかかる状況において、利用可能性の低い戦略を迅速に学習することにあります。
論文 参考訳(メタデータ) (2020-02-24T20:30:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。