論文の概要: A mean-field analysis of two-player zero-sum games
- arxiv url: http://arxiv.org/abs/2002.06277v4
- Date: Thu, 6 May 2021 14:02:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 04:31:53.696780
- Title: A mean-field analysis of two-player zero-sum games
- Title(参考訳): 2プレイヤーゼロサムゲームの平均場解析
- Authors: Carles Domingo-Enrich, Samy Jelassi, Arthur Mensch, Grant Rotskoff,
Joan Bruna
- Abstract要約: 混合ナッシュ平衡はより一般的に存在し、ミラー降下によって見られる。
我々は、この力学をワッサーシュタイン-フィッシャー-ラオ計量によって与えられる測度空間上の相互作用する勾配流として研究する。
本手法は高次元の混合平衡を同定し, GANの混合の訓練に有効であることを示す。
- 参考スコア(独自算出の注目度): 46.8148496944294
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Finding Nash equilibria in two-player zero-sum continuous games is a central
problem in machine learning, e.g. for training both GANs and robust models. The
existence of pure Nash equilibria requires strong conditions which are not
typically met in practice. Mixed Nash equilibria exist in greater generality
and may be found using mirror descent. Yet this approach does not scale to high
dimensions. To address this limitation, we parametrize mixed strategies as
mixtures of particles, whose positions and weights are updated using gradient
descent-ascent. We study this dynamics as an interacting gradient flow over
measure spaces endowed with the Wasserstein-Fisher-Rao metric. We establish
global convergence to an approximate equilibrium for the related Langevin
gradient-ascent dynamic. We prove a law of large numbers that relates particle
dynamics to mean-field dynamics. Our method identifies mixed equilibria in high
dimensions and is demonstrably effective for training mixtures of GANs.
- Abstract(参考訳): 2プレイヤのゼロサム連続ゲームにおけるナッシュ均衡の発見は、例えばGANとロバストモデルの両方をトレーニングする機械学習における中心的な問題である。
純粋なナッシュ平衡の存在は、実際には満たされない強い条件を必要とする。
混合ナッシュ平衡はより一般に存在し、ミラー降下を用いることができる。
しかし、このアプローチは高次元にスケールしない。
この制限に対処するために,粒子の位置と重みを勾配降下法を用いて更新する混合戦略を混合粒子の混合としてパラメトリライズする。
我々は、このダイナミクスを、ワッサーシュタイン・フィッシャー・ラオ計量に与えられた測度空間上の相互作用する勾配流として研究する。
我々は、関連するランゲヴィン勾配-指数力学の近似平衡に対する大域収束を確立する。
粒子動力学と平均場動力学を関連付ける大きな数の法則を証明する。
本手法は高次元の混合平衡を同定し, GANの混合の訓練に有効であることを示す。
関連論文リスト
- Symmetric Mean-field Langevin Dynamics for Distributional Minimax
Problems [78.96969465641024]
平均場ランゲヴィンのダイナミクスを、対称で証明可能な収束した更新で、初めて確率分布に対する最小の最適化に拡張する。
また,時間と粒子の離散化機構について検討し,カオス結果の新たな均一時間伝播を証明した。
論文 参考訳(メタデータ) (2023-12-02T13:01:29Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - An Exponentially Converging Particle Method for the Mixed Nash
Equilibrium of Continuous Games [0.0]
我々は,2プレイヤーゼロサムゲームの混合ナッシュ平衡と,純戦略の連続的なセットと,ペイオフ関数への一次アクセスとの問題を考察する。
この問題は例えば、分散ロバスト学習のようなゲームにインスパイアされた機械学習アプリケーションで発生する。
本稿では,この問題に対する局所収束性を保証する粒子法の導入と解析を行う。
論文 参考訳(メタデータ) (2022-11-02T17:03:40Z) - A note on large deviations for interacting particle dynamics for finding
mixed equilibria in zero-sum games [0.0]
連続ミニマックスゲームにおける平衡点の発見は、機械学習において重要な問題となっている。
最近の発展は純平衡から混合平衡点に焦点を移している。
本研究では,粒子の数が無限に増加するにつれて,粒子系の経験的測定の順序が大きな偏差原理を満たすことを示す。
論文 参考訳(メタデータ) (2022-06-30T10:29:21Z) - Global Convergence of Over-parameterized Deep Equilibrium Models [52.65330015267245]
ディープ均衡モデル(Deep equilibrium model, DEQ)は、入射を伴う無限深度重み付きモデルの平衡点を通して暗黙的に定義される。
無限の計算の代わりに、ルートフィンディングで直接平衡点を解き、暗黙の微分で勾配を計算する。
本稿では,無限深度重み付きモデルの非漸近解析における技術的困難を克服する新しい確率的枠組みを提案する。
論文 参考訳(メタデータ) (2022-05-27T08:00:13Z) - Provably convergent quasistatic dynamics for mean-field two-player
zero-sum games [10.39511271647025]
我々は、ある確率分布がワッセルシュタイン勾配の流れに従うような準静的ワッセルシュタイン勾配流れのダイナミクスを考察し、他方の確率分布は常に平衡状態にある。
確率分布の連続力学に着想を得て、内外反復を伴う擬静的なランゲヴィン勾配降下法を導出する。
論文 参考訳(メタデータ) (2022-02-15T20:19:42Z) - Simultaneous Transport Evolution for Minimax Equilibria on Measures [48.82838283786807]
最小限の最適化問題は、敵対的学習や生成的モデリングなど、いくつかの重要な機械学習設定で発生する。
この研究では、代わりに混合平衡を見つけることに集中し、関連する持ち上げ問題を確率測度の空間で考察する。
エントロピー正則化を加えることで、我々の主な成果はグローバル均衡へのグローバル収束を確立する。
論文 参考訳(メタデータ) (2022-02-14T02:23:16Z) - No-regret learning and mixed Nash equilibria: They do not mix [64.37511607254115]
我々はFTRL(Follow-the-regularized-leader)のダイナミクスについて検討する。
厳密でないナッシュ均衡は、FTRLの下で安定して引き寄せることは不可能である。
この結果は,学習過程の結果を予測する上で重要な意味を持つ。
論文 参考訳(メタデータ) (2020-10-19T13:49:06Z) - Density dynamics in the mass-imbalanced Hubbard chain [0.0]
一次元格子上で相互に相互作用するフェルミオン粒子種を2種検討する。
2種間の質量比$eta$が粒子の力学に与える影響について検討した。
論文 参考訳(メタデータ) (2020-04-28T15:38:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。