論文の概要: Split Moves for Monte-Carlo Tree Search
- arxiv url: http://arxiv.org/abs/2112.07761v1
- Date: Tue, 14 Dec 2021 22:06:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-17 06:14:23.626220
- Title: Split Moves for Monte-Carlo Tree Search
- Title(参考訳): モンテカルロ木探索のための分割移動
- Authors: Jakub Kowalski, Maksymilian Mika, Wojciech Pawlik, Jakub Sutowicz,
Marek Szyku{\l}a, Mark H. M. Winands
- Abstract要約: 多くのゲームにおいて、動作はプレイヤーによってなされるいくつかの決定から構成される。これらの決定は別個の動作と見なすことができ、これは効率上の理由から既にマルチアクションゲームにおいて一般的な慣習である。
我々は,モンテカルロ木探索(MCTS)における分割移動を効果的に活用する方法と,分割設計がエージェントの強度に与える影響について検討する。
- 参考スコア(独自算出の注目度): 6.026538435601293
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In many games, moves consist of several decisions made by the player. These
decisions can be viewed as separate moves, which is already a common practice
in multi-action games for efficiency reasons. Such division of a player move
into a sequence of simpler / lower level moves is called \emph{splitting}. So
far, split moves have been applied only in forementioned straightforward cases,
and furthermore, there was almost no study revealing its impact on agents'
playing strength. Taking the knowledge-free perspective, we aim to answer how
to effectively use split moves within Monte-Carlo Tree Search (MCTS) and what
is the practical impact of split design on agents' strength. This paper
proposes a generalization of MCTS that works with arbitrarily split moves. We
design several variations of the algorithm and try to measure the impact of
split moves separately on efficiency, quality of MCTS, simulations, and
action-based heuristics. The tests are carried out on a set of board games and
performed using the Regular Boardgames General Game Playing formalism, where
split strategies of different granularity can be automatically derived based on
an abstract description of the game. The results give an overview of the
behavior of agents using split design in different ways. We conclude that split
design can be greatly beneficial for single- as well as multi-action games.
- Abstract(参考訳): 多くのゲームでは、プレイヤーがいくつかの決定を下す。
これらの決定は別個の動きと見なすことができ、効率上の理由から、すでにマルチアクションゲームでは一般的である。
プレイヤーのそのような分割は、より単純で低いレベルの動きの列に移動することを \emph{splitting} と呼ぶ。
これまでのところ, 分割動作は, 正解例のみに適用されており, さらに, エージェントの演奏力に対する影響を明らかにする研究はほとんどなかった。
ナレッジフリーの観点から,モンテカルロ木探索(mcts)におけるスプリット移動の有効利用法と,エージェントの強度に対するスプリット設計の実際的影響について考察する。
本稿では,任意の分割動作で動作するMCTSの一般化を提案する。
アルゴリズムのバリエーションをいくつか設計し、分割動作が効率、mctの品質、シミュレーション、およびアクションベースのヒューリスティックスに与える影響を別々に測定する。
テストは一連のボードゲーム上で実施され、通常のボードゲーム一般ゲームプレイングフォーマリズムを用いて実行され、ゲームの抽象的な記述に基づいて、異なる粒度の分割戦略を自動的に引き出すことができる。
その結果, スプリットデザインを用いたエージェントの挙動を, 異なる方法で概観した。
分割設計はシングルアクションゲームやマルチアクションゲームにおいて非常に有益である。
関連論文リスト
- Tree Search for Simultaneous Move Games via Equilibrium Approximation [13.89302587642183]
同時移動ゲームのクラスについて検討する。
どちらのエージェントも、相手の動き以外はゲーム状態を知っている。
本研究では,完全な情報設定から自己プレイを通じて学習した木探索アルゴリズムを,パフォーマンスを著しく損なうことなく同時移動ゲームに適応させることができるか?
論文 参考訳(メタデータ) (2024-06-14T21:02:35Z) - A Marriage between Adversarial Team Games and 2-player Games: Enabling
Abstractions, No-regret Learning, and Subgame Solving [31.29335755664997]
emphExのアンテ相関は、プレイヤーのチームがゼロサムゲームで別のチームと対決する、後続のチームゲームにおいて主流のアプローチになりつつある。
本研究は, 連勝チームゲームと2プレーヤゲームとのギャップを埋めることで, この弱点から回復できることを示す。
我々は,emphteam-public-informationと呼ばれる新しいゲーム表現を提案し,チーム全体で共通する情報のみを知り,各メンバーに可能なプライベートな状態に対するアクションを指示する単一コーディネータとして表現する。
論文 参考訳(メタデータ) (2022-06-18T10:02:08Z) - Elastic Monte Carlo Tree Search with State Abstraction for Strategy Game
Playing [58.720142291102135]
戦略ビデオゲームは、複雑なゲーム要素によって引き起こされる検索スペースでAIエージェントに挑戦する。
状態抽象化は、状態空間の複雑さを低減する一般的なテクニックである。
我々は,状態抽象化を用いてストラテジーゲームをプレイするアルゴリズムであるElastic MCTSを提案する。
論文 参考訳(メタデータ) (2022-05-30T14:18:45Z) - Off-Beat Multi-Agent Reinforcement Learning [62.833358249873704]
オフビート動作が一般的環境におけるモデルフリーマルチエージェント強化学習(MARL)について検討した。
モデルレスMARLアルゴリズムのための新しいエピソードメモリLeGEMを提案する。
我々は,Stag-Hunter Game,Quarry Game,Afforestation Game,StarCraft IIマイクロマネジメントタスクなど,オフビートアクションを伴うさまざまなマルチエージェントシナリオ上でLeGEMを評価する。
論文 参考訳(メタデータ) (2022-05-27T02:21:04Z) - Collusion Detection in Team-Based Multiplayer Games [57.153233321515984]
チームベースのマルチプレイヤーゲームにおいて,協調動作を検出するシステムを提案する。
提案手法は,ゲーム内行動パターンと組み合わせたプレイヤーの社会的関係を解析する。
次に,非教師なし学習手法であるアイソレーションフォレストによる検出を自動化する。
論文 参考訳(メタデータ) (2022-03-10T02:37:39Z) - Public Information Representation for Adversarial Team Games [31.29335755664997]
対戦チームゲームは、プレイ中にチームメンバーが利用可能な非対称情報の中にあります。
本アルゴリズムは,対戦相手を持つ逐次チームゲームから古典的な2プレイヤーゼロサムゲームに変換する。
この問題のNPハード性のため、結果のパブリックチームゲームは元のゲームよりも指数関数的に大きいかもしれない。
論文 参考訳(メタデータ) (2022-01-25T15:07:12Z) - MCTS Based Agents for Multistage Single-Player Card Game [0.0]
この記事では、カードゲームLord of the RingsにおけるMonte Carlo Tree Searchアルゴリズムの使用について紹介する。
主な課題はゲーム力学の複雑さであり、各ラウンドは5つの決定段階と2つのランダムステージから構成される。
様々な意思決定アルゴリズムをテストするために,ゲームシミュレータが実装されている。
論文 参考訳(メタデータ) (2021-09-24T10:56:54Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z) - TotalBotWar: A New Pseudo Real-time Multi-action Game Challenge and
Competition for AI [62.997667081978825]
TotalBotWarは、ゲームAIのための新しい擬似リアルタイムマルチアクションチャレンジだ。
ゲームはTotalWarのゲームシリーズに基づいており、プレイヤーは敵のゲームに勝つために軍隊を管理する。
論文 参考訳(メタデータ) (2020-09-18T09:13:56Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。