論文の概要: Deduction Game Framework and Information Set Entropy Search
- arxiv url: http://arxiv.org/abs/2407.21178v1
- Date: Tue, 30 Jul 2024 20:33:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-01 19:24:51.146556
- Title: Deduction Game Framework and Information Set Entropy Search
- Title(参考訳): 推論ゲームフレームワークと情報集合エントロピー探索
- Authors: Fandi Meng, Simon Lucas,
- Abstract要約: そこで本研究では,シャノンエントロピーの変動を考慮した構造化解析が可能なゲームフレームワークを提案する。
本稿では,新しいフォワード検索アルゴリズムであるISES(Information Set Entropy Search)を導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a game framework tailored for deduction games, enabling structured analysis from the perspective of Shannon entropy variations. Additionally, we introduce a new forward search algorithm, Information Set Entropy Search (ISES), which effectively solves many single-player deduction games. The ISES algorithm, augmented with sampling techniques, allows agents to make decisions within controlled computational resources and time constraints. Experimental results on eight games within our framework demonstrate the significant superiority of our method over the Single Observer Information Set Monte Carlo Tree Search(SO-ISMCTS) algorithm under limited decision time constraints. The entropy variation of game states in our framework enables explainable decision-making, which can also be used to analyze the appeal of deduction games and provide insights for game designers.
- Abstract(参考訳): そこで本研究では,シャノンエントロピーの変動を考慮した構造化解析が可能なゲームフレームワークを提案する。
さらに,新しいフォワード検索アルゴリズムである情報集合エントロピー探索(ISES)を導入し,多くのシングルプレイヤー演目ゲームを効果的に解決する。
ISESアルゴリズムはサンプリング技術で拡張され、エージェントが制御された計算資源と時間制約内で決定することができる。
本フレームワークの8つのゲームに対する実験結果から,限定的な決定時間制約下でのモンテカルロ木探索(SO-ISMCTS)アルゴリズムに対して,本手法が有意な優位性を示した。
本フレームワークにおけるゲーム状態のエントロピー変化は,説明可能な意思決定を可能にし,推論ゲームの魅力を分析し,ゲームデザイナに洞察を与えるためにも使用できる。
関連論文リスト
- Semi-Strongly solved: a New Definition Leading Computer to Perfect Gameplay [0.0]
「ゲーム解決のための定義はいくつかあるが、計算コストと導出した洞察の詳細については明らかに異なる。」
半強解」と呼ばれる新しい定義を導入し、このタイプの解を効率的に実現するためのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-11-01T21:00:46Z) - Perfect Information Monte Carlo with Postponing Reasoning [4.111084095218968]
In this study introduceds Extended Perfect Information Monte Carlo (EPIMC), a online algorithm that the state-of-the-the-art determinization-based approach Perfect Information Monte Carlo (PIMC)。
EPIMCは完全な情報解決を延期し、戦略融合に関連する問題を緩和する。
戦略融合がゲームプレイに大きく影響を与えるゲームでは,特に顕著なパフォーマンス向上がみられた。
論文 参考訳(メタデータ) (2024-08-05T11:12:48Z) - Playing Board Games with the Predict Results of Beam Search Algorithm [0.0]
本稿では,PROBS(Predict Results of Beam Search)と呼ぶ完全情報を持つ2プレイヤー決定型ゲームのための新しいアルゴリズムを提案する。
提案手法は,ベースライン対戦相手に対する勝利率の増大を連続的に示すボードゲームの中から,アルゴリズムの性能を評価する。
この研究の重要な結果は、ビーム探索サイズがゲームの平均ターン数よりもかなり小さい場合でも、PROBSアルゴリズムが効果的に動作することである。
論文 参考訳(メタデータ) (2024-04-23T20:10:27Z) - The Update-Equivalence Framework for Decision-Time Planning [78.44953498421854]
本稿では,サブゲームの解決ではなく,更新等価性に基づく意思決定時計画のための代替フレームワークを提案する。
ミラー降下に基づく完全協調型ゲームに対する有効音声探索アルゴリズムと、磁気ミラー降下に基づく対戦型ゲームに対する探索アルゴリズムを導出する。
論文 参考訳(メタデータ) (2023-04-25T20:28:55Z) - Automated Graph Genetic Algorithm based Puzzle Validation for Faster
Game Desig [69.02688684221265]
本稿では,コンピュータゲームにおける論理パズルを効率的に解くための進化的アルゴリズムを提案する。
制約満足度問題に対するハイブリッド遺伝的アプローチの様々なバリエーションについて論じる。
論文 参考訳(メタデータ) (2023-02-17T18:15:33Z) - On the Convergence of No-Regret Learning Dynamics in Time-Varying Games [89.96815099996132]
時間変化ゲームにおける楽観的勾配降下(OGD)の収束を特徴付ける。
我々のフレームワークは、ゼロサムゲームにおけるOGDの平衡ギャップに対して鋭い収束境界をもたらす。
また,静的ゲームにおける動的後悔の保証に関する新たな洞察も提供する。
論文 参考訳(メタデータ) (2023-01-26T17:25:45Z) - A unified stochastic approximation framework for learning in games [82.74514886461257]
ゲームにおける学習の長期的挙動(連続的・有限的)を解析するためのフレキシブルな近似フレームワークを開発する。
提案する分析テンプレートには,勾配に基づく手法,有限ゲームでの学習のための指数的/乗算的重み付け,楽観的および帯域的変異など,幅広い一般的な学習アルゴリズムが組み込まれている。
論文 参考訳(メタデータ) (2022-06-08T14:30:38Z) - No-Regret Learning in Time-Varying Zero-Sum Games [99.86860277006318]
固定ゼロサムゲームにおける繰り返しプレイからの学習は、ゲーム理論とオンライン学習における古典的な問題である。
提案手法は,3つの性能基準の下で,良好な保証を同時に享受できる1つのパラメータフリーアルゴリズムである。
本アルゴリズムは,ある特性を満たすブラックボックスベースラーナー群に対するメタアルゴリズムを用いた2層構造に基づく。
論文 参考訳(メタデータ) (2022-01-30T06:10:04Z) - Revisiting Game Representations: The Hidden Costs of Efficiency in
Sequential Decision-making Algorithms [0.6749750044497732]
不完全な情報の下でのシーケンシャルな意思決定アルゴリズムの進歩は、大きなゲームで顕著な成功を収めている。
これらのアルゴリズムは伝統的に広義のゲーム形式を用いてゲームを形式化する。
プレイヤー固有の情報状態木に基づく特殊表現の使用が,一般的な回避策であることを示す。
論文 参考訳(メタデータ) (2021-12-20T22:34:19Z) - Temporal Induced Self-Play for Stochastic Bayesian Games [32.88124137877018]
我々は,任意の意思決定点から適切なパフォーマンスの戦略を見つけるために,TISP(Temporal-induced Self-Play)を提案する。
TISPは、信念空間表現、後方誘導、ポリシー学習、および非パラメトリック近似を使用する。
TISPに基づくアルゴリズムは、有限地平線を持つゼロサム片面ゲームにおいて、近似されたパーフェクトベイズ平衡を見つけることができることを証明している。
論文 参考訳(メタデータ) (2021-08-21T05:36:42Z) - Stochastic Regret Minimization in Extensive-Form Games [109.43344748069933]
Monte-Carlo counterfactual regret minimization (MCCFR) は、完全な木には大きすぎるシーケンシャルゲームを解くための最先端のアルゴリズムである。
後悔の最小化手法を開発するための新しい枠組みを開発する。
MCCFRよりも優れた方法がいくつかある3つのゲームについて広範な実験を行った。
論文 参考訳(メタデータ) (2020-02-19T23:05:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。