論文の概要: Convergence of the Min-Max Langevin Dynamics and Algorithm for Zero-Sum Games
- arxiv url: http://arxiv.org/abs/2412.20471v1
- Date: Sun, 29 Dec 2024 14:20:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-31 16:02:21.258444
- Title: Convergence of the Min-Max Langevin Dynamics and Algorithm for Zero-Sum Games
- Title(参考訳): ゼロサムゲームにおけるMin-Max Langevin Dynamicsとアルゴリズムの収束性
- Authors: Yang Cai, Siddharth Mitra, Xiuyuan Wang, Andre Wibisono,
- Abstract要約: エントロピー正則化を伴うユークリッド空間 $mathbbRd$ 上の確率分布空間におけるゼロサムゲームについて検討する。
平均場 min-max Langevin ダイナミクスに対する指数収束保証を証明し、平衡分布を計算する。
- 参考スコア(独自算出の注目度): 15.132772939268989
- License:
- Abstract: We study zero-sum games in the space of probability distributions over the Euclidean space $\mathbb{R}^d$ with entropy regularization, in the setting when the interaction function between the players is smooth and strongly convex-concave. We prove an exponential convergence guarantee for the mean-field min-max Langevin dynamics to compute the equilibrium distribution of the zero-sum game. We also study the finite-particle approximation of the mean-field min-max Langevin dynamics, both in continuous and discrete times. We prove biased convergence guarantees for the continuous-time finite-particle min-max Langevin dynamics to the stationary mean-field equilibrium distribution with an explicit bias estimate which does not scale with the number of particles. We also prove biased convergence guarantees for the discrete-time finite-particle min-max Langevin algorithm to the stationary mean-field equilibrium distribution with an additional bias term which scales with the step size and the number of particles. This provides an explicit iteration complexity for the average particle along the finite-particle algorithm to approximately compute the equilibrium distribution of the zero-sum game.
- Abstract(参考訳): ユークリッド空間 $\mathbb{R}^d$ 上の確率分布の空間におけるゼロサムゲームとエントロピー正則化について、プレイヤー間の相互作用関数が滑らかで凸凸凸であるような環境で研究する。
平均場 min-max Langevin ダイナミクスに対する指数収束保証を証明し、ゼロサムゲームの平衡分布を計算する。
また、平均場 min-max Langevin 力学の有限粒子近似を連続時間と離散時間の両方で研究する。
本研究では, 定常平均場平衡分布に対する連続時間有限粒子 min-max Langevin の収差保証を, 粒子数に比例しない明示的偏差推定で証明する。
また、離散時間有限粒子 min-max Langevin アルゴリズムの定常平均場平衡分布に対するバイアス収束保証を、ステップサイズと粒子数に応じてスケールする追加バイアス項で証明する。
これは、ゼロサムゲームの平衡分布をおよそ計算するために、有限粒子アルゴリズムに沿った平均粒子に対して明示的な反復複雑性を与える。
関連論文リスト
- Convergence of Score-Based Discrete Diffusion Models: A Discrete-Time Analysis [56.442307356162864]
連続時間マルコフ連鎖(CTMC)に基づくスコアベース離散拡散モデルの理論的側面について検討する。
本稿では,事前定義された時間点におけるスコア推定値を利用する離散時間サンプリングアルゴリズムを一般状態空間$[S]d$に導入する。
我々の収束解析はジルサノフ法を用いて離散スコア関数の重要な性質を確立する。
論文 参考訳(メタデータ) (2024-10-03T09:07:13Z) - Exponential tail estimates for quantum lattice dynamics [1.2499537119440245]
格子上の粒子の量子力学を長時間検討する。
測度のサポートの厳密な外にある総確率は、$t$で指数関数的にゼロとなることを示す。
論文 参考訳(メタデータ) (2024-08-04T18:35:36Z) - Improved Particle Approximation Error for Mean Field Neural Networks [9.817855108627452]
MFLD(Mean-field Langevin dynamics)は、確率分布の空間上で定義されるエントロピー規則化された非線形凸関数を最小化する。
最近の研究は、MFLDにおけるカオスの時間的一様伝播を実証している。
粒子近似誤差における対数的ソボレフ不等式(LSI)定数の依存性を改善する。
論文 参考訳(メタデータ) (2024-05-24T17:59:06Z) - Symmetric Mean-field Langevin Dynamics for Distributional Minimax
Problems [78.96969465641024]
平均場ランゲヴィンのダイナミクスを、対称で証明可能な収束した更新で、初めて確率分布に対する最小の最適化に拡張する。
また,時間と粒子の離散化機構について検討し,カオス結果の新たな均一時間伝播を証明した。
論文 参考訳(メタデータ) (2023-12-02T13:01:29Z) - Convergence of mean-field Langevin dynamics: Time and space
discretization, stochastic gradient, and variance reduction [49.66486092259376]
平均場ランゲヴィンダイナミクス(英: mean-field Langevin dynamics、MFLD)は、分布依存のドリフトを含むランゲヴィン力学の非線形一般化である。
近年の研究では、MFLDは測度空間で機能するエントロピー規則化された凸関数を地球規模で最小化することが示されている。
有限粒子近似,時間分散,勾配近似による誤差を考慮し,MFLDのカオスの均一時間伝播を示す枠組みを提供する。
論文 参考訳(メタデータ) (2023-06-12T16:28:11Z) - Fluctuation without dissipation: Microcanonical Langevin Monte Carlo [0.0]
ランゲヴィン・モンテカルロサンプリングアルゴリズムは熱浴中の物理系にインスパイアされている。
フル位相空間分布ではなく、構成空間分布のみを正準化する必要があるため、揺らぎ散逸定理は不要であることを示す。
微分方程式の散逸のないシステム(SDE)として連続時間マイクロカノニカルLangevin Monte Carlo(MCLMC)を提案する。
論文 参考訳(メタデータ) (2023-03-31T17:24:33Z) - Non-asymptotic analysis of Langevin-type Monte Carlo algorithms [0.0]
連続性の有限モジュラーを持つギブス分布からサンプリングするランゲヴィン型アルゴリズムについて、必ずしも0に収束しない。
ランゲヴィン・モンテカルロアルゴリズムは、ポテンシャルが散逸し、勾配が一様連続である場合、ギブス分布を任意の精度で近似できることを示す。
論文 参考訳(メタデータ) (2023-03-22T09:16:17Z) - PAPAL: A Provable PArticle-based Primal-Dual ALgorithm for Mixed Nash Equilibrium [58.26573117273626]
2プレイヤゼロサム連続ゲームにおける非AL平衡非漸近目的関数について考察する。
連続分布戦略のための粒子ベースアルゴリズムに関する新しい知見を述べる。
論文 参考訳(メタデータ) (2023-03-02T05:08:15Z) - Simultaneous Transport Evolution for Minimax Equilibria on Measures [48.82838283786807]
最小限の最適化問題は、敵対的学習や生成的モデリングなど、いくつかの重要な機械学習設定で発生する。
この研究では、代わりに混合平衡を見つけることに集中し、関連する持ち上げ問題を確率測度の空間で考察する。
エントロピー正則化を加えることで、我々の主な成果はグローバル均衡へのグローバル収束を確立する。
論文 参考訳(メタデータ) (2022-02-14T02:23:16Z) - Convex Analysis of the Mean Field Langevin Dynamics [49.66486092259375]
平均場ランゲヴィン力学の収束速度解析について述べる。
ダイナミックスに付随する$p_q$により、凸最適化において古典的な結果と平行な収束理論を開発できる。
論文 参考訳(メタデータ) (2022-01-25T17:13:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。