論文の概要: Finding optimal strategies in sequential games with the novel selection
monad
- arxiv url: http://arxiv.org/abs/2105.12514v1
- Date: Wed, 26 May 2021 12:33:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-27 13:20:49.890037
- Title: Finding optimal strategies in sequential games with the novel selection
monad
- Title(参考訳): 新規選択モナドを用いたシーケンシャルゲームにおける最適戦略の探索
- Authors: Johannes Hartmann
- Abstract要約: モナド Tx = Selection (x -> r) -> r は、シーケンシャルゲームにおいて最適な戦略を導くエレガントな方法を提供する。
選択モナドを使って最適なゲームとAIを逐次ゲームのために計算する関数セットを提供するライブラリが開発された。
- 参考スコア(独自算出の注目度): 0.38073142980732994
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recently discovered monad, Tx = Selection (x -> r) -> r, provides an
elegant way to finnd optimal strategies in sequential games. During this
thesis, a library was developed which provides a set of useful functions using
the selection monad to compute optimal games and AIs for sequential games. In
order to explore the selection monads ability to support these AI
implementations, three example case studies were developed using Haskell: The
two-player game Connect Four, a Sudoku solver and a simplified version of
Chess. These case studies show how to elegantly implement a game AI.
Furthermore, a performance analysis of these case studies was done, identifying
the major points where performance can be increased.
- Abstract(参考訳): 最近発見されたモナド Tx = Selection (x -> r) -> r は、シーケンシャルゲームにおいて最適な戦略を導くエレガントな方法を提供する。
この論文の中で,選択モナドを用いて最適なゲームと逐次ゲームのためのaiを計算する有用な機能セットを提供するライブラリを開発した。
これらのai実装をサポートするための選択モナド機能を検討するために、haskellを使った3つのケーススタディが開発された。
これらのケーススタディは、ゲームAIをエレガントに実装する方法を示している。
さらに、これらのケーススタディのパフォーマンス分析を行い、パフォーマンスを向上させる主要なポイントを特定した。
関連論文リスト
- Runtime analysis of a coevolutionary algorithm on impartial combinatorial games [1.104960878651584]
進化的アルゴリズム(CoEA)は、現代人との相互作用に基づいて最強を反復的に選択し、次の世代で両親として選択した個体群を用いて、個体群を進化させる。
しかし,CoEAのゲームプレイへの応用はサイクリングなどの病理的行動のため,実行時のペイオフ状況において特に問題となる。
本稿では,解析の範囲を推し進め,公平なゲームのための最適な戦略を見出す。
この結果はどんな公平なゲームにも当てはまり、多くのゲームでは、インプリッド・バウンドは数の関数として、あるいは準ポリノミアルである。
論文 参考訳(メタデータ) (2024-09-06T10:39:17Z) - Playing Board Games with the Predict Results of Beam Search Algorithm [0.0]
本稿では,PROBS(Predict Results of Beam Search)と呼ぶ完全情報を持つ2プレイヤー決定型ゲームのための新しいアルゴリズムを提案する。
提案手法は,ベースライン対戦相手に対する勝利率の増大を連続的に示すボードゲームの中から,アルゴリズムの性能を評価する。
この研究の重要な結果は、ビーム探索サイズがゲームの平均ターン数よりもかなり小さい場合でも、PROBSアルゴリズムが効果的に動作することである。
論文 参考訳(メタデータ) (2024-04-23T20:10:27Z) - Learning to Play Stochastic Two-player Perfect-Information Games without
Knowledge [5.071342645033634]
我々はDescentフレームワークを拡張し、完全な情報を持つ2人プレイヤゲームのコンテキストにおける学習と計画を可能にする。
我々は、最先端のアルゴリズムに対してEin wurfelt!で評価する。
最良の結果を得るのはDescentの一般化である。
論文 参考訳(メタデータ) (2023-02-08T20:27:45Z) - Strategizing against Learners in Bayesian Games [74.46970859427907]
プレイヤーの1人である学習者が無学習の学習戦略を採用する2人プレイヤゲームについて検討した。
一般のベイズゲームでは,学習者と学習者の双方の報酬の支払いが,そのタイプに依存する可能性がある。
論文 参考訳(メタデータ) (2022-05-17T18:10:25Z) - Spatial State-Action Features for General Games [5.849736173068868]
汎用ゲームのための空間状態対応機能の設計と効率的な実装を定式化する。
これらは、局所的な状態の変数にマッチするかどうかに基づいて、アクションをインセンティブまたは非インセンティブ化するようにトレーニングできるパターンである。
任意の機能セットに対して,アクティブな機能を評価するための効率的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-01-17T13:34:04Z) - Portfolio Search and Optimization for General Strategy Game-Playing [58.896302717975445]
ローリングホライズン進化アルゴリズムに基づく最適化とアクション選択のための新しいアルゴリズムを提案する。
エージェントのパラメータとポートフォリオセットの最適化について,N-tuple Bandit Evolutionary Algorithmを用いて検討する。
エージェントの性能分析により,提案手法はすべてのゲームモードによく一般化し,他のポートフォリオ手法よりも優れることが示された。
論文 参考訳(メタデータ) (2021-04-21T09:28:28Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z) - Efficient Pure Exploration for Combinatorial Bandits with Semi-Bandit
Feedback [51.21673420940346]
コンビナーシャルバンディットはマルチアームバンディットを一般化し、エージェントが腕のセットを選択し、選択したセットに含まれる各腕の騒々しい報酬を観察します。
我々は, 最善の腕を一定の信頼度で識別する純粋爆発問題と, 応答集合の構造が動作集合の1つと異なるような, より一般的な設定に注目する。
有限多面体に対するプロジェクションフリーオンライン学習アルゴリズムに基づいて、凸的に最適であり、競争力のある経験的性能を持つ最初の計算効率の良いアルゴリズムである。
論文 参考訳(メタデータ) (2021-01-21T10:35:09Z) - Faster Algorithms for Optimal Ex-Ante Coordinated Collusive Strategies
in Extensive-Form Zero-Sum Games [123.76716667704625]
我々は,不完全情報ゼロサム拡張形式ゲームにおいて,対戦相手と対決する2人の選手のチームにとって最適な戦略を見つけることの課題に焦点をあてる。
この設定では、チームができる最善のことは、ゲーム開始時の関節(つまり相関した)確率分布から潜在的にランダム化された戦略(プレイヤー1人)のプロファイルをサンプリングすることである。
各プロファイルにランダム化されるのはチームメンバーの1人だけであるプロファイルのみを用いることで、そのような最適な分布を計算するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-21T17:51:57Z) - Near-Optimal Reinforcement Learning with Self-Play [50.29853537456737]
我々は,直接の監督なしに自己対決で最適な政策を学習するセルフプレイアルゴリズムに焦点をあてる。
本稿では,サンプル複雑性を$tildemathcalO(SAB)$,サンプル複雑性を$tildemathcalO(S(A+B)$とする新しいemphNash Vラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T05:00:13Z) - Evolutionary Approach to Collectible Card Game Arena Deckbuilding using
Active Genes [1.027974860479791]
アリーナゲームモードでは、各試合に先立って、プレイヤーは以前知らなかった選択肢から1枚ずつデッキ選択カードを組み立てなければならない。
そこで本研究では,遺伝子型の世代別サブシーケンスのみに対する演算子の範囲を減らすために,活性遺伝子の概念を用いた進化的アルゴリズムの変種を提案する。
論文 参考訳(メタデータ) (2020-01-05T22:46:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。