論文の概要: GANs May Have No Nash Equilibria
- arxiv url: http://arxiv.org/abs/2002.09124v1
- Date: Fri, 21 Feb 2020 04:30:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 01:02:27.678340
- Title: GANs May Have No Nash Equilibria
- Title(参考訳): GANにはナッシュ均衡がないかもしれない
- Authors: Farzan Farnia, Asuman Ozdaglar
- Abstract要約: GAN(Generative Adversarial Network)は、ジェネレータとディスクリミネータの2つのマシンプレーヤ間のゼロサムゲームを表す。
我々は、GANゼロサムゲームが局所的なナッシュ平衡を持たないかもしれないといういくつかの理論的および数値的な結果を示す。
我々は,GAN問題の解法として,近位学習と呼ばれる新しいアプローチを提案する。
- 参考スコア(独自算出の注目度): 12.691047660244331
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative adversarial networks (GANs) represent a zero-sum game between two
machine players, a generator and a discriminator, designed to learn the
distribution of data. While GANs have achieved state-of-the-art performance in
several benchmark learning tasks, GAN minimax optimization still poses great
theoretical and empirical challenges. GANs trained using first-order
optimization methods commonly fail to converge to a stable solution where the
players cannot improve their objective, i.e., the Nash equilibrium of the
underlying game. Such issues raise the question of the existence of Nash
equilibrium solutions in the GAN zero-sum game. In this work, we show through
several theoretical and numerical results that indeed GAN zero-sum games may
not have any local Nash equilibria. To characterize an equilibrium notion
applicable to GANs, we consider the equilibrium of a new zero-sum game with an
objective function given by a proximal operator applied to the original
objective, a solution we call the proximal equilibrium. Unlike the Nash
equilibrium, the proximal equilibrium captures the sequential nature of GANs,
in which the generator moves first followed by the discriminator. We prove that
the optimal generative model in Wasserstein GAN problems provides a proximal
equilibrium. Inspired by these results, we propose a new approach, which we
call proximal training, for solving GAN problems. We discuss several numerical
experiments demonstrating the existence of proximal equilibrium solutions in
GAN minimax problems.
- Abstract(参考訳): generative adversarial networks (gans) は、2人のマシンプレーヤー、ジェネレータと判別器の間のゼロサムゲームであり、データの分布を学習するために設計された。
GANはいくつかのベンチマーク学習タスクで最先端のパフォーマンスを達成したが、GAN minimaxの最適化は依然として大きな理論的および実証的な課題を呈している。
一階最適化法を用いて訓練されたGANは、プレイヤーが目的、すなわち基礎となるゲームのナッシュ均衡を改善することができない安定した解に収束しない。
このような問題は、GANゼロサムゲームにおけるナッシュ平衡解の存在を疑問視する。
本研究では,ganゼロサムゲームが局所nash平衡を持たない可能性があることを理論的および数値的に示す。
GANに適用可能な平衡概念を特徴づけるために、原目的に適用される近似作用素によって与えられる目的関数を持つ新しいゼロサムゲーム、すなわち、近似平衡と呼ばれる解の平衡を考える。
ナッシュ平衡とは異なり、近位平衡はganのシーケンシャルな性質を捉え、生成器はまず判別器を伴って移動する。
我々はワッサーシュタイン GAN 問題における最適生成モデルが近似平衡をもたらすことを証明した。
これらの結果に触発されて、我々は近位学習と呼ばれる新しいアプローチを提案し、GAN問題を解く。
GANミニマックス問題における近位平衡解の存在を示す数値実験について論じる。
関連論文リスト
- PAPAL: A Provable PArticle-based Primal-Dual ALgorithm for Mixed Nash Equilibrium [58.26573117273626]
2プレイヤゼロサム連続ゲームにおける非AL平衡非漸近目的関数について考察する。
連続分布戦略のための粒子ベースアルゴリズムに関する新しい知見を述べる。
論文 参考訳(メタデータ) (2023-03-02T05:08:15Z) - Differentiable Arbitrating in Zero-sum Markov Games [59.62061049680365]
ゼロサムマルコフゲームにおいて、2人のプレイヤーが望ましいナッシュ均衡、すなわち仲裁を誘導する報酬を摂動する方法を研究する。
低いレベルでは、与えられた報酬関数の下でのナッシュ均衡の解決が必要であり、それによって全体的な問題をエンドツーエンドで最適化することが難しくなる。
上層階の勾配フィードバックを提供するナッシュ平衡を微分するバックプロパゲーション方式を提案する。
論文 参考訳(メタデータ) (2023-02-20T16:05:04Z) - Global Nash Equilibrium in Non-convex Multi-player Game: Theory and
Algorithms [66.8634598612777]
ナッシュ均衡(NE)はマルチプレイヤーゲームにおいて全てのプレイヤーに受け入れられることを示す。
また、一般理論から一歩ずつ一方的に利益を得ることはできないことも示している。
論文 参考訳(メタデータ) (2023-01-19T11:36:50Z) - Game-Theoretical Perspectives on Active Equilibria: A Preferred Solution
Concept over Nash Equilibria [61.093297204685264]
マルチエージェント強化学習における効果的なアプローチは,エージェントの学習プロセスを検討し,今後の政策に影響を与えることである。
この新たな解の概念は、ナッシュ均衡のような標準解の概念が活性平衡の特別な場合である、という一般的なものである。
我々は,ゲーム理論の観点から,ナッシュ平衡が知られている実例を綿密に研究することにより,アクティブ平衡を解析する。
論文 参考訳(メタデータ) (2022-10-28T14:45:39Z) - Efficient Model-based Multi-agent Reinforcement Learning via Optimistic
Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。
自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文 参考訳(メタデータ) (2022-03-14T17:24:03Z) - On the Nash equilibrium of moment-matching GANs for stationary Gaussian
processes [2.25477613430341]
我々は、一貫したナッシュ均衡の存在は、判別器ファミリーの選択に大きく依存していることを示す。
さらに、一貫した平衡に向けた勾配降下法における局所安定性と大域収束について検討する。
論文 参考訳(メタデータ) (2022-03-14T14:30:23Z) - Towards convergence to Nash equilibria in two-team zero-sum games [17.4461045395989]
2チームゼロサムゲームは、プレイヤーが2つの競合するエージェントに分割されるマルチプレイヤーゲームとして定義される。
我々はNash equilibria(NE)の解の概念に焦点をあてる。
このクラスのゲームに対する計算 NE は、複雑性クラス $mathrm$ に対して $textithard$ であることを示す。
論文 参考訳(メタデータ) (2021-11-07T21:15:35Z) - Learning to Compute Approximate Nash Equilibrium for Normal-form Games [15.321036952379488]
有限$n$-playerの正規形式ゲームに対して,Nash平衡を近似的に計算するための一般的なメタ学習手法を提案する。
ゲーム毎のナッシュ均衡をスクラッチから近似あるいは学習する既存の解とは異なり、メタソルバはゲームユーティリティ行列からジョイント戦略プロファイルへの写像を直接構築する。
論文 参考訳(メタデータ) (2021-08-17T07:06:46Z) - Characterizing GAN Convergence Through Proximal Duality Gap [3.0724051098062097]
理論上は、近似双対性ギャップは、より広い平衡スペクトルへのGANの収束を監視することができることを示した。
また, 近似双対性ギャップと実データ分布と生成データ分布のばらつきの関係を, GANの異なる定式化に対して確立する。
論文 参考訳(メタデータ) (2021-05-11T06:27:27Z) - Sample-Efficient Learning of Stackelberg Equilibria in General-Sum Games [78.65798135008419]
一般的なゲームでStackelberg平衡を効率的に学習する方法は、サンプルから非常にオープンなままです。
本稿では,2プレーヤターンベース汎用ゲームにおけるStackelberg平衡のサンプル効率学習に関する理論的研究を開始する。
論文 参考訳(メタデータ) (2021-02-23T05:11:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。