論文の概要: Valet: A Standardized Testbed of Traditional Imperfect-Information Card Games
- arxiv url: http://arxiv.org/abs/2603.03252v1
- Date: Tue, 03 Mar 2026 18:46:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.934772
- Title: Valet: A Standardized Testbed of Traditional Imperfect-Information Card Games
- Title(参考訳): Valet: 従来の不完全な情報カードゲームの標準化テストベッド
- Authors: Mark Goadrich, Achille Morenville, Éric Piette,
- Abstract要約: Valetは21の伝統的な不完全な情報カードゲームの多様で包括的なテストベッドである。
これらのゲームは、複数のジャンル、文化、プレイヤー数、デッキ構造、メカニック、勝利条件、情報の隠蔽と開示方法にまたがる。
ランダムシミュレーションを用いて,各ゲームの分岐係数と期間を実験的に評価し,ベンチマークスイートとしてのValetの適合性を実証する。
- 参考スコア(独自算出の注目度): 0.6417777780911224
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI algorithms for imperfect-information games are typically compared using performance metrics on individual games, making it difficult to assess robustness across game choices. Card games are a natural domain for imperfect information due to hidden hands and stochastic draws. To facilitate comparative research on imperfect-information game-playing algorithms and game systems, we introduce Valet, a diverse and comprehensive testbed of 21 traditional imperfect-information card games. These games span multiple genres, cultures, player counts, deck structures, mechanics, winning conditions, and methods of hiding and revealing information. To standardize implementations across systems, we encode the rules of each game in RECYCLE, a card game description language. We empirically characterize each game's branching factor and duration using random simulations, reporting baseline score distributions for a Monte Carlo Tree Search player against random opponents to demonstrate the suitability of Valet as a benchmarking suite.
- Abstract(参考訳): 不完全な情報ゲームのためのAIアルゴリズムは、通常、個々のゲームのパフォーマンス指標を使用して比較される。
カードゲームは、隠された手と確率的な引き分けによる不完全な情報の自然な領域である。
不完全情報ゲームプレイングアルゴリズムとゲームシステムの比較研究を容易にするため,従来の21種類の不完全情報カードゲームを対象とした多種多様なテストベッドであるValetを紹介した。
これらのゲームは、複数のジャンル、文化、プレイヤー数、デッキ構造、メカニック、勝利条件、情報の隠蔽と開示方法にまたがる。
システム間の実装を標準化するために、カードゲーム記述言語であるRECYCLEで各ゲームのルールを符号化する。
モンテカルロ・ツリー・サーチ・プレイヤーのベースラインスコア分布をランダムな対戦相手に対して報告し、ベンチマーク・スイートとしてのValetの適合性を実証する。
関連論文リスト
- From Gameplay Traces to Game Mechanics: Causal Induction with Large Language Models [64.43268969806098]
本稿では,観測データから法則を推定できる因果誘導について検討する。
本稿では,VGDL生成に対する2つのアプローチを比較する。観測からの直接コード生成と,まず構造因果モデル(SCM)を推定し,次にVGDLに変換する2段階法である。
その結果,SCMに基づくアプローチは,直接生成よりも基礎的真実に近いVGDL記述を多く生み出すことがわかった。
論文 参考訳(メタデータ) (2026-01-30T08:48:23Z) - Improve Value Estimation of Q Function and Reshape Reward with Monte Carlo Tree Search [0.4450107621124637]
強化学習は、GoやAtariといった完璧な情報ゲームで大きな成功を収めた。
不完全な情報ゲームのための強化学習の研究は、より複雑なゲーム構造とランダム性のために比較的限られている。
本稿では,不完全な情報ゲームであるUnoに着目し,Q値過大評価を減らし,報酬関数を書き換えることにより,これらの問題に対処することを目的とする。
論文 参考訳(メタデータ) (2024-10-15T14:31:54Z) - Instruction-Driven Game Engines on Large Language Models [59.280666591243154]
IDGEプロジェクトは、大規模な言語モデルが自由形式のゲームルールに従うことを可能にすることで、ゲーム開発を民主化することを目的としている。
我々は、複雑なシナリオに対するモデルの露出を徐々に増大させるカリキュラム方式でIDGEを訓練する。
私たちの最初の進歩は、汎用的なカードゲームであるPoker用のIDGEを開発することです。
論文 参考訳(メタデータ) (2024-03-30T08:02:16Z) - Closed Drafting as a Case Study for First-Principle Interpretability,
Memory, and Generalizability in Deep Reinforcement Learning [3.018656336329545]
本稿では,DQN(Deep Q-Network)モデルの解釈可能性,一般化性,メモリについて検討する。
我々は、最先端の演技を行う「寿司囲碁会」と呼ばれる、クローズドドラフトゲームの人気ファミリを使用している。
論文 参考訳(メタデータ) (2023-10-31T17:24:40Z) - PerfectDou: Dominating DouDizhu with Perfect Information Distillation [51.069043489706836]
本研究では,現在最先端のDouDizhuAIシステムであるPerfectDouを提案する。
実験では、PerfectDouが既存のAIプログラムをすべて破り、最先端のパフォーマンスを達成する方法と理由を示します。
論文 参考訳(メタデータ) (2022-03-30T15:37:57Z) - Revisiting Game Representations: The Hidden Costs of Efficiency in
Sequential Decision-making Algorithms [0.6749750044497732]
不完全な情報の下でのシーケンシャルな意思決定アルゴリズムの進歩は、大きなゲームで顕著な成功を収めている。
これらのアルゴリズムは伝統的に広義のゲーム形式を用いてゲームを形式化する。
プレイヤー固有の情報状態木に基づく特殊表現の使用が,一般的な回避策であることを示す。
論文 参考訳(メタデータ) (2021-12-20T22:34:19Z) - Student of Games: A unified learning algorithm for both perfect and
imperfect information games [22.97853623156316]
Students of Gamesは、ガイド付き検索、自己学習、ゲーム理論推論を組み合わせたアルゴリズムである。
学生ゲームは,計算能力と近似能力が増大するにつれて,完全プレイに収束し,健全であることを示す。
学生はチェスと囲碁で強い成績を収め、無期限のテキサスホールディングスのポーカーで最強の公開エージェントを破り、スコットランドヤードで最先端のエージェントを倒した。
論文 参考訳(メタデータ) (2021-12-06T17:16:24Z) - Contextual Games: Multi-Agent Learning with Side Information [57.76996806603094]
各ラウンドでコンテキスト情報によって駆動されるコンテキストゲームの新しいクラスを定式化する。
カーネルベースの規則性仮定を用いて、異なるコンテキストとゲーム結果の相関関係をモデル化する。
本研究では,個々のプレイヤーの文脈的後悔を最小限に抑えるために,そのような相関を利用した新しいオンライン(メタ)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-07-13T18:37:37Z) - Evolving Evaluation Functions for Collectible Card Game AI [1.370633147306388]
本研究は,機能ベースゲーム評価機能の進化における2つの重要な側面について述べる。
ゲノム表現の選択とモデルをテストするために使用される相手の選択について検討した。
私たちは、戦略カードゲームAIコンペティションで使用されるプログラミングゲーム、Regends of Code and Magicで実験をエンコードしました。
論文 参考訳(メタデータ) (2021-05-03T18:39:06Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Towards Game-Playing AI Benchmarks via Performance Reporting Standards [0.9137554315375919]
本稿では,AIゲームプレイパフォーマンスの報告ガイドラインを提案し,従えば,異なるAIアプローチの非バイアス比較に適した情報を提供する。
私たちが説明するビジョンは、さまざまなAIアルゴリズムの振る舞いに関するより一般的な結論を引き出すために、このようなガイドラインに基づいたベンチマークとコンペを構築することです。
論文 参考訳(メタデータ) (2020-07-06T13:27:00Z) - From Poincar\'e Recurrence to Convergence in Imperfect Information
Games: Finding Equilibrium via Regularization [49.368421783733815]
モノトーンゲームにおいて,報酬の適応が強い収束保証を与えることを示す。
また、この報酬適応手法を用いて、Nash平衡に正確に収束するアルゴリズムを構築する方法を示す。
論文 参考訳(メタデータ) (2020-02-19T21:36:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。