論文の概要: State-Constrained Zero-Sum Differential Games with One-Sided Information
- arxiv url: http://arxiv.org/abs/2403.02741v2
- Date: Tue, 4 Jun 2024 17:26:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-06 12:28:47.828431
- Title: State-Constrained Zero-Sum Differential Games with One-Sided Information
- Title(参考訳): 片側情報による状態制約ゼロサム差分ゲーム
- Authors: Mukesh Ghimire, Lei Zhang, Zhe Xu, Yi Ren,
- Abstract要約: 状態制約と一方的な情報を持つゼロサム差分ゲームについて検討する。
我々の貢献は、状態制約のあるゲームの拡張であり、行動戦略の計算に必要な原始的および双対的準力学原理の導出である。
- 参考スコア(独自算出の注目度): 19.964883571758502
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study zero-sum differential games with state constraints and one-sided information, where the informed player (Player 1) has a categorical payoff type unknown to the uninformed player (Player 2). The goal of Player 1 is to minimize his payoff without violating the constraints, while that of Player 2 is to violate the state constraints if possible, or to maximize the payoff otherwise. One example of the game is a man-to-man matchup in football. Without state constraints, Cardaliaguet (2007) showed that the value of such a game exists and is convex to the common belief of players. Our theoretical contribution is an extension of this result to games with state constraints and the derivation of the primal and dual subdynamic principles necessary for computing behavioral strategies. Different from existing works that are concerned about the scalability of no-regret learning in games with discrete dynamics, our study reveals the underlying structure of strategies for belief manipulation resulting from information asymmetry and state constraints. This structure will be necessary for scalable learning on games with continuous actions and long time windows. We use a simplified football game to demonstrate the utility of this work, where we reveal player positions and belief states in which the attacker should (or should not) play specific random deceptive moves to take advantage of information asymmetry, and compute how the defender should respond.
- Abstract(参考訳): 状態制約のあるゼロサム差分ゲームと、情報提供者(プレイヤ1)が非インフォームドプレイヤー(プレイヤ2)に対してカテゴリ的なペイオフ型を未知とする一方的な情報について検討する。
プレイヤー1のゴールは、制限を犯さずに支払いを最小化することであり、プレイヤー2のゴールは、可能であれば国家の制約に違反したり、その他の場合の支払いを最大化することである。
試合の1つの例は、サッカーにおける対人試合である。
国家の制約がなければ、カーデリアゲット (2007) はそのようなゲームの価値が存在しており、プレイヤーの共通の信念と接していることを示した。
我々の理論的貢献は、状態制約のあるゲームに対するこの結果の拡張であり、行動戦略の計算に必要な原始的および双対的準力学原理の導出である。
離散力学を持つゲームにおける非回帰学習のスケーラビリティに関する既存の研究と異なり、情報非対称性と状態制約から生じる信念操作のための戦略の基盤構造を明らかにする。
この構造は、継続的なアクションと長時間のウィンドウを持つゲームにおいて、スケーラブルな学習のために必要となる。
そこでは,攻撃者が情報非対称性を活かすために,特定のランダムな詐欺行為をすべき(あるいはすべきでない)プレイヤーの位置と信念状態を明らかにし,ディフェンダーがどう対応すべきかを計算する。
関連論文リスト
- Imperfect-Recall Games: Equilibrium Concepts and Their Complexity [74.01381499760288]
エージェントが以前保持していた情報を忘れたとき、不完全なリコールの下で最適な意思決定を行う。
不完全なリコールを伴う広範囲形式のゲームフレームワークにおいて、マルチプレイヤー設定における平衡を求める際の計算複雑性を解析する。
論文 参考訳(メタデータ) (2024-06-23T00:27:28Z) - Adversarial Knapsack and Secondary Effects of Common Information for Cyber Operations [0.9378911615939924]
本稿では,CTF(Capture the Flag)コンペティションのための動的ネットワーク制御ゲームを形式化し,各タイムステップごとに静的ゲームの詳細を示す。
我々は、重み付きKnapsack問題を相互作用するシステムとして、Adversarial Knapsack最適化問題を定義する。
シナリオ、報酬、コストに対する一般的な認識は、非協力的なゲームのステージにつくでしょう。
論文 参考訳(メタデータ) (2024-03-16T03:41:12Z) - Abstracting Imperfect Information Away from Two-Player Zero-Sum Games [85.27865680662973]
Nayyar et al. (2013) は、プレイヤーがプレイ中にポリシーを公に発表することで、不完全な情報を共通のペイオフゲームから抽象化できることを示した。
この研究は、ある正規化された平衡が上記の非対応問題を持たないことを示している。
これらの正規化された平衡はナッシュ平衡に任意に近づくことができるので、この結果は2つのプレイヤーゼロサムゲームを解くための新たな視点への扉を開く。
論文 参考訳(メタデータ) (2023-01-22T16:54:06Z) - Learning Correlated Equilibria in Mean-Field Games [62.14589406821103]
我々は平均場相関と粗相関平衡の概念を発展させる。
ゲームの構造に関する仮定を必要とせず,効率よくゲーム内で学習できることが示される。
論文 参考訳(メタデータ) (2022-08-22T08:31:46Z) - A Marriage between Adversarial Team Games and 2-player Games: Enabling
Abstractions, No-regret Learning, and Subgame Solving [31.29335755664997]
emphExのアンテ相関は、プレイヤーのチームがゼロサムゲームで別のチームと対決する、後続のチームゲームにおいて主流のアプローチになりつつある。
本研究は, 連勝チームゲームと2プレーヤゲームとのギャップを埋めることで, この弱点から回復できることを示す。
我々は,emphteam-public-informationと呼ばれる新しいゲーム表現を提案し,チーム全体で共通する情報のみを知り,各メンバーに可能なプライベートな状態に対するアクションを指示する単一コーディネータとして表現する。
論文 参考訳(メタデータ) (2022-06-18T10:02:08Z) - Public Information Representation for Adversarial Team Games [31.29335755664997]
対戦チームゲームは、プレイ中にチームメンバーが利用可能な非対称情報の中にあります。
本アルゴリズムは,対戦相手を持つ逐次チームゲームから古典的な2プレイヤーゼロサムゲームに変換する。
この問題のNPハード性のため、結果のパブリックチームゲームは元のゲームよりも指数関数的に大きいかもしれない。
論文 参考訳(メタデータ) (2022-01-25T15:07:12Z) - Rigidity for Monogamy-of-Entanglement Games [0.6091702876917281]
本研究では,レフェリーが算術的・アダマール的に測定するゲームのプロトタイプ事例について検討する。
このゲームは、いくつかの非局所ゲームで知られているような剛性特性を満たすことを示す。
また,並列にプレイするゲームの複数のコピーに対して剛性を示す。
論文 参考訳(メタデータ) (2021-11-15T20:59:17Z) - Fictitious play in zero-sum stochastic games [1.9143447222638694]
ゲームにおける古典的な遊びとQ-ラーニングを組み合わせた架空の遊び力学の新たな変種を提案する。
2プレイヤーゼロサムゲームにおける収束特性を解析する。
論文 参考訳(メタデータ) (2020-10-08T19:06:45Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Chaos, Extremism and Optimism: Volume Analysis of Learning in Games [55.24050445142637]
本稿では,ゼロサムにおける乗算重み更新 (MWU) と最適乗算重み更新 (OMWU) のボリューム解析と協調ゲームについて述べる。
我々は、OMWUが、その既知の収束挙動の代替的な理解を提供するために、ボリュームを契約していることを示します。
我々はまた、コーディネートゲームを調べる際に役割が逆になるという意味で、自由ランチ型の定理も証明する: OMWU は指数関数的に高速に体積を拡大するが、MWU は契約する。
論文 参考訳(メタデータ) (2020-05-28T13:47:09Z) - Efficient exploration of zero-sum stochastic games [83.28949556413717]
ゲームプレイを通じて,ゲームの記述を明示せず,託宣のみにアクセス可能な,重要で一般的なゲーム解決環境について検討する。
限られたデュレーション学習フェーズにおいて、アルゴリズムは両方のプレイヤーのアクションを制御し、ゲームを学習し、それをうまくプレイする方法を学習する。
私たちのモチベーションは、クエリされた戦略プロファイルの支払いを評価するのにコストがかかる状況において、利用可能性の低い戦略を迅速に学習することにあります。
論文 参考訳(メタデータ) (2020-02-24T20:30:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。