論文の概要: Learnable Mixed Nash Equilibria are Collectively Rational
- arxiv url: http://arxiv.org/abs/2510.14907v1
- Date: Thu, 16 Oct 2025 17:25:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.974804
- Title: Learnable Mixed Nash Equilibria are Collectively Rational
- Title(参考訳): 学習可能な混合ナッシュ平衡は集合的合理的である
- Authors: Geelon So, Yi-An Ma,
- Abstract要約: 等安定性は, 漸進的スムーズな最適応答ダイナミクスの族に対する最終点収束挙動を決定することを示す。
社会的に非効率な解に安定化できる厳密な平衡に関する力学とは異なり、混合ナッシュ平衡の近傍での個別に実用性を求める挙動は合理性をもたらす。
- 参考スコア(独自算出の注目度): 17.93053401419066
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We extend the study of learning in games to dynamics that exhibit non-asymptotic stability. We do so through the notion of uniform stability, which is concerned with equilibria of individually utility-seeking dynamics. Perhaps surprisingly, it turns out to be closely connected to economic properties of collective rationality. Under mild non-degeneracy conditions and up to strategic equivalence, if a mixed equilibrium is not uniformly stable, then it is not weakly Pareto optimal: there is a way for all players to improve by jointly deviating from the equilibrium. On the other hand, if it is locally uniformly stable, then the equilibrium must be weakly Pareto optimal. Moreover, we show that uniform stability determines the last-iterate convergence behavior for the family of incremental smoothed best-response dynamics, used to model individual and corporate behaviors in the markets. Unlike dynamics around strict equilibria, which can stabilize to socially-inefficient solutions, individually utility-seeking behaviors near mixed Nash equilibria lead to collective rationality.
- Abstract(参考訳): ゲームにおける学習の研究を非漸近的安定性を示すダイナミクスに拡張する。
我々は、一様安定性の概念を通じて実現し、これは個別に実用性を求める力学の平衡に関係している。
おそらく驚くべきことに、これは集合的合理性の経済的性質と密接に関連していることが判明した。
穏やかな非退化条件と戦略的等価性の下では、混合平衡が均一に安定でなければ、パレートが最適でない。
一方、局所的に一様安定であれば、平衡は弱パレート最適でなければならない。
さらに, 市場における個人的, 企業的行動のモデル化に使用される, 漸進的スムーズな最適応答ダイナミクスの族に対する最終項目収束挙動を均一に決定することを示す。
社会的に非効率な解に安定化できる厳密な平衡に関する力学とは異なり、混合ナッシュ平衡の近傍での個別に実用性を求める挙動は合理性をもたらす。
関連論文リスト
- On Tractable $Φ$-Equilibria in Non-Concave Games [53.212133025684224]
非コンケーブゲームにおいて、抽出可能な$Phi$-equilibriaについて検討する。
Phi$が有限であるとき、対応する$Phi$-equilibriaに収束する効率的な非結合学習アルゴリズムが存在することを示す。
論文 参考訳(メタデータ) (2024-03-13T01:51:30Z) - The Bayesian Stability Zoo [18.074002943658055]
学習理論文献に見られる安定性の多くの定義が互いに等価であることを示す。
各家族において、近似微分プライバシー、純粋微分プライバシー、複製可能性、グローバル安定性、完全一般化、テレビの安定性、相互情報安定性、KL分割安定性、R'enyi分割安定性を含む様々な定義の等価性を確立する。
この研究は、学習理論における安定性概念のより体系的な分類への一歩であり、これは明確性を促進し、近年出現した安定性概念の一連の理解を改善することができる。
論文 参考訳(メタデータ) (2023-10-27T18:59:31Z) - Bayes correlated equilibria, no-regret dynamics in Bayesian games, and the price of anarchy [8.430481660019451]
本稿では,非直交スワップ後悔を線形上界で最小化するための効率的なアルゴリズムを提案する。
我々は、ベイズ-ナッシュ均衡から平衡への滑らかさの議論に基づいて、アナーキーの価格に関する既存の下限を拡大する。
論文 参考訳(メタデータ) (2023-04-11T06:22:51Z) - Game-Theoretical Perspectives on Active Equilibria: A Preferred Solution
Concept over Nash Equilibria [61.093297204685264]
マルチエージェント強化学習における効果的なアプローチは,エージェントの学習プロセスを検討し,今後の政策に影響を与えることである。
この新たな解の概念は、ナッシュ均衡のような標準解の概念が活性平衡の特別な場合である、という一般的なものである。
我々は,ゲーム理論の観点から,ナッシュ平衡が知られている実例を綿密に研究することにより,アクティブ平衡を解析する。
論文 参考訳(メタデータ) (2022-10-28T14:45:39Z) - How Bad is Selfish Driving? Bounding the Inefficiency of Equilibria in
Urban Driving Games [64.71476526716668]
我々は,任意の平衡選手がプレーに同意するであろう効率について検討する。
我々は、アナーキーの価格に関する既存の境界を洗練させる保証を得る。
提案手法はオープンループ軌道に対する懸念を保証しているが,エージェントがクローズドループポリシーを採用する場合においても,効率的な平衡を観測する。
論文 参考訳(メタデータ) (2022-10-24T09:32:40Z) - Efficient Model-based Multi-agent Reinforcement Learning via Optimistic
Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。
自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文 参考訳(メタデータ) (2022-03-14T17:24:03Z) - On the Nash equilibrium of moment-matching GANs for stationary Gaussian
processes [2.25477613430341]
我々は、一貫したナッシュ均衡の存在は、判別器ファミリーの選択に大きく依存していることを示す。
さらに、一貫した平衡に向けた勾配降下法における局所安定性と大域収束について検討する。
論文 参考訳(メタデータ) (2022-03-14T14:30:23Z) - Simultaneous Transport Evolution for Minimax Equilibria on Measures [48.82838283786807]
最小限の最適化問題は、敵対的学習や生成的モデリングなど、いくつかの重要な機械学習設定で発生する。
この研究では、代わりに混合平衡を見つけることに集中し、関連する持ち上げ問題を確率測度の空間で考察する。
エントロピー正則化を加えることで、我々の主な成果はグローバル均衡へのグローバル収束を確立する。
論文 参考訳(メタデータ) (2022-02-14T02:23:16Z) - Survival of the strictest: Stable and unstable equilibria under
regularized learning with partial information [32.384868685390906]
一般Nプレイヤーゲームにおける非回帰学習のナッシュ平衡収束特性について検討する。
ナッシュ平衡の安定性と支持との包括的な等価性を確立します。
ゲームにおける非学習の日々の行動を予測するための明確な洗練基準を提供する。
論文 参考訳(メタデータ) (2021-01-12T18:55:11Z) - Fine-Grained Analysis of Stability and Generalization for Stochastic
Gradient Descent [55.85456985750134]
我々は,SGDの反復的リスクによって制御される新しい境界を開発する,平均モデル安定性と呼ばれる新しい安定性尺度を導入する。
これにより、最良のモデルの振舞いによって一般化境界が得られ、低雑音環境における最初の既知の高速境界が導かれる。
我々の知る限りでは、このことはSGDの微分不能な損失関数でさえも初めて知られている安定性と一般化を与える。
論文 参考訳(メタデータ) (2020-06-15T06:30:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。