論文の概要: A Marriage between Adversarial Team Games and 2-player Games: Enabling
Abstractions, No-regret Learning, and Subgame Solving
- arxiv url: http://arxiv.org/abs/2206.09161v1
- Date: Sat, 18 Jun 2022 10:02:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-22 19:16:40.956186
- Title: A Marriage between Adversarial Team Games and 2-player Games: Enabling
Abstractions, No-regret Learning, and Subgame Solving
- Title(参考訳): 敵対的チームゲームと2人プレイゲームとの結婚 : 抽象化の実現、ノンリグレット学習、サブゲーム解決
- Authors: Luca Carminati, Federico Cacciamani, Marco Ciccone, Nicola Gatti
- Abstract要約: emphExのアンテ相関は、プレイヤーのチームがゼロサムゲームで別のチームと対決する、後続のチームゲームにおいて主流のアプローチになりつつある。
本研究は, 連勝チームゲームと2プレーヤゲームとのギャップを埋めることで, この弱点から回復できることを示す。
我々は,emphteam-public-informationと呼ばれる新しいゲーム表現を提案し,チーム全体で共通する情報のみを知り,各メンバーに可能なプライベートな状態に対するアクションを指示する単一コーディネータとして表現する。
- 参考スコア(独自算出の注目度): 31.29335755664997
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: \emph{Ex ante} correlation is becoming the mainstream approach for
\emph{sequential adversarial team games}, where a team of players faces another
team in a zero-sum game. It is known that team members' asymmetric information
makes both equilibrium computation \textsf{APX}-hard and team's strategies not
directly representable on the game tree. This latter issue prevents the
adoption of successful tools for huge 2-player zero-sum games such as,
\emph{e.g.}, abstractions, no-regret learning, and subgame solving. This work
shows that we can recover from this weakness by bridging the gap between
sequential adversarial team games and 2-player games. In particular, we propose
a new, suitable game representation that we call
\emph{team-public-information}, in which a team is represented as a single
coordinator who only knows information common to the whole team and prescribes
to each member an action for any possible private state. The resulting
representation is highly \emph{explainable}, being a 2-player tree in which the
team's strategies are behavioral with a direct interpretation and more
expressive than the original extensive form when designing abstractions.
Furthermore, we prove payoff equivalence of our representation, and we provide
techniques that, starting directly from the extensive form, generate
dramatically more compact representations without information loss. Finally, we
experimentally evaluate our techniques when applied to a standard testbed,
comparing their performance with the current state of the art.
- Abstract(参考訳): \emph{Ex ante}相関は、プレイヤーのチームがゼロサムゲームで他のチームと対決する「emph{sequential adversarial team game}」の主流のアプローチになりつつある。
チームメンバーの非対称情報により、平衡計算 \textsf{APX}-hard とチームの戦略がゲームツリー上で直接表現できないことが知られている。
後者の問題は、\emph{e.g}, abstracts, no-regret learning, and subgame solveのような巨大な2人のプレイヤーのゼロサムゲームで成功するツールの採用を妨げる。
本研究は, 連勝チームゲームと2プレーヤゲームとのギャップを埋めることで, この弱点から回復できることを示す。
具体的には,チーム全体の共通する情報のみを知り,各メンバに対して,可能なプライベート状態に対するアクションを規定する単一コーディネータとして,チームが表現される,新たな適切なゲーム表現を提案する。
結果として得られる表現は高度に \emph{explainable} であり、抽象を設計する際、チームの戦略が直接解釈され、元の広範な形式よりも表現力が高い2-player tree である。
さらに、当社の表現のペイオフ同値性を証明し、広範な形式から直接、情報損失を伴わずに劇的にコンパクトな表現を生成する技術を提供する。
最後に,本手法を標準テストベッドに適用した場合,その性能を現在の技術と比較し,実験的に評価した。
関連論文リスト
- State-Constrained Zero-Sum Differential Games with One-Sided Information [19.964883571758502]
状態制約と一方的な情報を持つゼロサム差分ゲームについて検討する。
我々の貢献は、状態制約のあるゲームの拡張であり、行動戦略の計算に必要な原始的および双対的準力学原理の導出である。
論文 参考訳(メタデータ) (2024-03-05T07:51:38Z) - All by Myself: Learning Individualized Competitive Behaviour with a
Contrastive Reinforcement Learning optimization [57.615269148301515]
競争ゲームのシナリオでは、エージェントのセットは、彼らの目標を最大化し、敵の目標を同時に最小化する決定を学習する必要があります。
本稿では,競争ゲームの表現を学習し,特定の相手の戦略をどうマップするか,それらを破壊するかを学習する3つのニューラルネットワーク層からなる新しいモデルを提案する。
我々の実験は、オフライン、オンライン、競争特化モデル、特に同じ対戦相手と複数回対戦した場合に、我々のモデルがより良いパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2023-10-02T08:11:07Z) - Individual and Collective Performance Deteriorate in a New Team: A Case
Study of CS:GO Tournaments [11.86905804972623]
本研究の目的は,eスポーツトーナメントにおけるチーム変更が個人的,集団的パフォーマンスに与える影響に答えることである。
人気1人シューティングゲームのプロトーナメントのデータを収集した。
選手が新しいチームに転向した後、個人と集団のパフォーマンスが低下し、徐々に回復した。
論文 参考訳(メタデータ) (2022-05-19T16:54:49Z) - Collusion Detection in Team-Based Multiplayer Games [57.153233321515984]
チームベースのマルチプレイヤーゲームにおいて,協調動作を検出するシステムを提案する。
提案手法は,ゲーム内行動パターンと組み合わせたプレイヤーの社会的関係を解析する。
次に,非教師なし学習手法であるアイソレーションフォレストによる検出を自動化する。
論文 参考訳(メタデータ) (2022-03-10T02:37:39Z) - Public Information Representation for Adversarial Team Games [31.29335755664997]
対戦チームゲームは、プレイ中にチームメンバーが利用可能な非対称情報の中にあります。
本アルゴリズムは,対戦相手を持つ逐次チームゲームから古典的な2プレイヤーゼロサムゲームに変換する。
この問題のNPハード性のため、結果のパブリックチームゲームは元のゲームよりも指数関数的に大きいかもしれない。
論文 参考訳(メタデータ) (2022-01-25T15:07:12Z) - Contextual Games: Multi-Agent Learning with Side Information [57.76996806603094]
各ラウンドでコンテキスト情報によって駆動されるコンテキストゲームの新しいクラスを定式化する。
カーネルベースの規則性仮定を用いて、異なるコンテキストとゲーム結果の相関関係をモデル化する。
本研究では,個々のプレイヤーの文脈的後悔を最小限に抑えるために,そのような相関を利用した新しいオンライン(メタ)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-07-13T18:37:37Z) - Multi-Agent Coordination in Adversarial Environments through Signal
Mediated Strategies [37.00818384785628]
チームメンバーはゲームの開始前に戦略を調整できるが、ゲームのプレイ段階ではコミュニケーションが取れない。
この設定では、エージェントのポリシーが分散的に実行されるため、モデルフリーのRLメソッドはコーディネーションをキャプチャできないことが多い。
我々は,従来の最先端マルチエージェントRLアルゴリズムが適用しなかった場合に,座標平衡に収束することを示す。
論文 参考訳(メタデータ) (2021-02-09T18:44:16Z) - Faster Algorithms for Optimal Ex-Ante Coordinated Collusive Strategies
in Extensive-Form Zero-Sum Games [123.76716667704625]
我々は,不完全情報ゼロサム拡張形式ゲームにおいて,対戦相手と対決する2人の選手のチームにとって最適な戦略を見つけることの課題に焦点をあてる。
この設定では、チームができる最善のことは、ゲーム開始時の関節(つまり相関した)確率分布から潜在的にランダム化された戦略(プレイヤー1人)のプロファイルをサンプリングすることである。
各プロファイルにランダム化されるのはチームメンバーの1人だけであるプロファイルのみを用いることで、そのような最適な分布を計算するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-21T17:51:57Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。