論文の概要: Provably convergent quasistatic dynamics for mean-field two-player
zero-sum games
- arxiv url: http://arxiv.org/abs/2202.10947v1
- Date: Tue, 15 Feb 2022 20:19:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-27 17:45:09.017440
- Title: Provably convergent quasistatic dynamics for mean-field two-player
zero-sum games
- Title(参考訳): 平均場2人プレイゼロサムゲームにおける有理収束準静的ダイナミクス
- Authors: Chao Ma, Lexing Ying
- Abstract要約: 我々は、ある確率分布がワッセルシュタイン勾配の流れに従うような準静的ワッセルシュタイン勾配流れのダイナミクスを考察し、他方の確率分布は常に平衡状態にある。
確率分布の連続力学に着想を得て、内外反復を伴う擬静的なランゲヴィン勾配降下法を導出する。
- 参考スコア(独自算出の注目度): 10.39511271647025
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we study the problem of finding mixed Nash equilibrium for
mean-field two-player zero-sum games. Solving this problem requires optimizing
over two probability distributions. We consider a quasistatic Wasserstein
gradient flow dynamics in which one probability distribution follows the
Wasserstein gradient flow, while the other one is always at the equilibrium.
Theoretical analysis are conducted on this dynamics, showing its convergence to
the mixed Nash equilibrium under mild conditions. Inspired by the continuous
dynamics of probability distributions, we derive a quasistatic Langevin
gradient descent method with inner-outer iterations, and test the method on
different problems, including training mixture of GANs.
- Abstract(参考訳): 本論文では,平均場2プレーヤゼロサムゲームにおける混合ナッシュ平衡を求める問題について検討する。
この問題を解決するには、2つの確率分布を最適化する必要がある。
我々は、ある確率分布がワッセルシュタイン勾配の流れに従うような準静的ワッセルシュタイン勾配流れのダイナミクスを考察し、他方の確率分布は常に平衡状態にある。
この力学について理論的解析を行い、穏やかな条件下での混合ナッシュ平衡への収束を示す。
確率分布の連続的ダイナミクスに着想を得て、内外反復を伴う擬静的なランゲヴィン勾配降下法を導出し、GANの訓練混合を含む様々な問題に対する試験を行う。
関連論文リスト
- Symmetric Mean-field Langevin Dynamics for Distributional Minimax
Problems [78.96969465641024]
平均場ランゲヴィンのダイナミクスを、対称で証明可能な収束した更新で、初めて確率分布に対する最小の最適化に拡張する。
また,時間と粒子の離散化機構について検討し,カオス結果の新たな均一時間伝播を証明した。
論文 参考訳(メタデータ) (2023-12-02T13:01:29Z) - PAPAL: A Provable PArticle-based Primal-Dual ALgorithm for Mixed Nash Equilibrium [58.26573117273626]
2プレイヤゼロサム連続ゲームにおける非AL平衡非漸近目的関数について考察する。
連続分布戦略のための粒子ベースアルゴリズムに関する新しい知見を述べる。
論文 参考訳(メタデータ) (2023-03-02T05:08:15Z) - An Exponentially Converging Particle Method for the Mixed Nash
Equilibrium of Continuous Games [0.0]
我々は,2プレイヤーゼロサムゲームの混合ナッシュ平衡と,純戦略の連続的なセットと,ペイオフ関数への一次アクセスとの問題を考察する。
この問題は例えば、分散ロバスト学習のようなゲームにインスパイアされた機械学習アプリケーションで発生する。
本稿では,この問題に対する局所収束性を保証する粒子法の導入と解析を行う。
論文 参考訳(メタデータ) (2022-11-02T17:03:40Z) - Decentralized Policy Gradient for Nash Equilibria Learning of
General-sum Stochastic Games [8.780797886160402]
遷移確率密度関数の未知な一般サムゲームのナッシュ平衡学習について検討する。
正確な擬似勾配を持つ場合、ナッシュ平衡と変分不等式の問題の等価性による2ループアルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-10-14T09:09:56Z) - Global Convergence of Over-parameterized Deep Equilibrium Models [52.65330015267245]
ディープ均衡モデル(Deep equilibrium model, DEQ)は、入射を伴う無限深度重み付きモデルの平衡点を通して暗黙的に定義される。
無限の計算の代わりに、ルートフィンディングで直接平衡点を解き、暗黙の微分で勾配を計算する。
本稿では,無限深度重み付きモデルの非漸近解析における技術的困難を克服する新しい確率的枠組みを提案する。
論文 参考訳(メタデータ) (2022-05-27T08:00:13Z) - Simultaneous Transport Evolution for Minimax Equilibria on Measures [48.82838283786807]
最小限の最適化問題は、敵対的学習や生成的モデリングなど、いくつかの重要な機械学習設定で発生する。
この研究では、代わりに混合平衡を見つけることに集中し、関連する持ち上げ問題を確率測度の空間で考察する。
エントロピー正則化を加えることで、我々の主な成果はグローバル均衡へのグローバル収束を確立する。
論文 参考訳(メタデータ) (2022-02-14T02:23:16Z) - Convex Analysis of the Mean Field Langevin Dynamics [49.66486092259375]
平均場ランゲヴィン力学の収束速度解析について述べる。
ダイナミックスに付随する$p_q$により、凸最適化において古典的な結果と平行な収束理論を開発できる。
論文 参考訳(メタデータ) (2022-01-25T17:13:56Z) - A mean-field analysis of two-player zero-sum games [46.8148496944294]
混合ナッシュ平衡はより一般的に存在し、ミラー降下によって見られる。
我々は、この力学をワッサーシュタイン-フィッシャー-ラオ計量によって与えられる測度空間上の相互作用する勾配流として研究する。
本手法は高次元の混合平衡を同定し, GANの混合の訓練に有効であることを示す。
論文 参考訳(メタデータ) (2020-02-14T22:46:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。