論文の概要: Non-Cooperative Games with Uncertainty
- arxiv url: http://arxiv.org/abs/2503.01889v1
- Date: Thu, 27 Feb 2025 14:31:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:17:09.867214
- Title: Non-Cooperative Games with Uncertainty
- Title(参考訳): 不確実性を伴う非協調ゲーム
- Authors: Jozsef Konczer,
- Abstract要約: 本稿では,各プレイヤが共通の事前パラメータを伴わずにグローバルに不確実なパラメータに直面するような,有限非協調ゲームのためのフレームワークを提案する。
我々は、一方的な戦略変更により、プレイヤーが期待するユーティリティを改善できないよう要求することで、「拡張平衡」を定義する。
ブリューワーの不動点定理に基づいて、ナッシュの構成を模倣する不動点論法は存在を保証する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This paper introduces a framework for finite non-cooperative games where each player faces a globally uncertain parameter with no common prior. Every player chooses both a mixed strategy and projects an emergent subjective prior to the uncertain parameters. We define an "Extended Equilibrium" by requiring that no player can improve her expected utility via a unilateral change of strategy, and the emergent subjective priors are such that they maximize the expected regret of the players. A fixed-point argument -- based on Brouwer's fixed point theorem and mimicking the construction of Nash -- ensures existence. Additionally, the "No Fictional Faith" theorem shows that any subjective equilibrium prior must stay non-concentrated if the parameter truly matters to a player. This approach provides a framework that unifies regret-based statistical decision theory and game theory, yielding a tool for handling strategic decision-making in the presence of deeply uncertain parameters.
- Abstract(参考訳): 本稿では,各プレイヤが共通の事前パラメータを伴わずにグローバルに不確実なパラメータに直面するような,有限非協調ゲームのためのフレームワークを提案する。
各プレイヤーは混合戦略を選択し、不確実なパラメータに先立って創発的主観を投影する。
我々は、一方的な戦略変更によって、プレイヤーが期待するユーティリティを改善できないこと、そして、創発的な主観的事前は、プレイヤーが期待する後悔を最大化することを要求することにより、「拡張平衡」を定義する。
ブリューワーの不動点定理に基づいて、ナッシュの構成を模倣する不動点論法は存在を保証する。
さらに、"No Fictional Faith"定理は、パラメータが真にプレイヤーにとって重要であるならば、いかなる主観的均衡も無集中でなければならないことを示している。
このアプローチは、後悔に基づく統計的決定理論とゲーム理論を統一する枠組みを提供し、深い不確実なパラメータの存在下で戦略的意思決定を扱うためのツールを提供する。
関連論文リスト
- Learning to Mitigate Externalities: the Coase Theorem with Hindsight Rationality [62.18973784316808]
経済理論において、外部性の概念は、社会的福祉に影響を与えるプレイヤー間の相互作用から生じる間接的な効果を指す。
我々の研究は、バーゲンが根底にあるゲームについて完全な知識を持っているという古典的な仮定を取り除いている。
次に、プレイヤーが全福祉を最大化する交渉戦略を学習できるようにするための政策を設計する。
論文 参考訳(メタデータ) (2024-06-28T11:00:53Z) - Auto-Encoding Bayesian Inverse Games [36.06617326128679]
ゲームの性質が不明な逆ゲーム問題を考える。
既存の最大推定手法は、未知のパラメータの点推定のみを提供する。
ベイズ的視点を採り、ゲームパラメータの後方分布を構成する。
この構造化されたVAEは、観測された相互作用のラベルのないデータセットから訓練することができる。
論文 参考訳(メタデータ) (2024-02-14T02:17:37Z) - Abstracting Imperfect Information Away from Two-Player Zero-Sum Games [85.27865680662973]
Nayyar et al. (2013) は、プレイヤーがプレイ中にポリシーを公に発表することで、不完全な情報を共通のペイオフゲームから抽象化できることを示した。
この研究は、ある正規化された平衡が上記の非対応問題を持たないことを示している。
これらの正規化された平衡はナッシュ平衡に任意に近づくことができるので、この結果は2つのプレイヤーゼロサムゲームを解くための新たな視点への扉を開く。
論文 参考訳(メタデータ) (2023-01-22T16:54:06Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Regret Minimization and Convergence to Equilibria in General-sum Markov
Games [57.568118148036376]
汎用マルコフゲームにおいて,全てのエージェントが実行した場合のサブ線形後悔保証を提供する学習アルゴリズムを初めて提示する。
我々のアルゴリズムは分散化され、計算効率が良く、エージェント間の通信は不要である。
論文 参考訳(メタデータ) (2022-07-28T16:27:59Z) - Provably Efficient Fictitious Play Policy Optimization for Zero-Sum
Markov Games with Structured Transitions [145.54544979467872]
本研究では,ゼロサムマルコフゲームに対して,構造的だが未知の遷移を伴う架空のプレイポリシー最適化アルゴリズムを提案し,解析する。
我々は、2年制の競争ゲームシナリオで、$K$のエピソードに続き、$widetildemathcalO(sqrtK)$ regret boundsを証明した。
提案アルゴリズムは,アッパー信頼境界(UCB)型最適化と,同時政策最適化の範囲内での架空のプレイの組み合わせを特徴とする。
論文 参考訳(メタデータ) (2022-07-25T18:29:16Z) - A Variational Inequality Approach to Bayesian Regression Games [90.79402153164587]
我々は凸類の一意性の存在を証明し、それを滑らかなコスト関数に一般化する。
必然的に強い収束で解くための2つの簡単なアルゴリズムを提供する。
論文 参考訳(メタデータ) (2021-03-24T22:33:11Z) - Hindsight and Sequential Rationality of Correlated Play [18.176128899338433]
私たちは、修正された振る舞いで達成できたことに対して、強いパフォーマンスを後見で保証するアルゴリズムを検討します。
我々は,学習の隠れた枠組みを,逐次的な意思決定の場で開発し,提唱する。
本稿では,それぞれの平衡の強さと弱さを文献に示す例を示す。
論文 参考訳(メタデータ) (2020-12-10T18:30:21Z) - On the Impossibility of Convergence of Mixed Strategies with No Regret
Learning [10.515544361834241]
最適無後悔学習戦略の一般クラスから得られる混合戦略の収束特性について検討する。
各ステップに設定された情報を相手の実演の実証平均とする戦略のクラスを考察する。
論文 参考訳(メタデータ) (2020-12-03T18:02:40Z) - Multi-agent Bayesian Learning with Adaptive Strategies: Convergence and
Stability [0.43012765978447565]
本研究では,未知のペイオフ関連パラメータで繰り返しゲームをする戦略エージェントが引き起こす学習ダイナミクスについて検討する。
信念と戦略が確率 1 の定点に収束することを証明する。
論文 参考訳(メタデータ) (2020-10-18T22:37:26Z) - Equilibria for Games with Combined Qualitative and Quantitative
Objectives [15.590197778287616]
我々は,各プレイヤーが独立して戦略的に行動することが想定されるプロセスである並行ゲームについて研究する。
我々の主な結果は、そのようなゲームにおける厳密なエプシロン・ナッシュ均衡の存在を決定することは2ExpTime完全であるということである。
論文 参考訳(メタデータ) (2020-08-13T01:56:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。