論文の概要: HessianFR: An Efficient Hessian-based Follow-the-Ridge Algorithm for
Minimax Optimization
- arxiv url: http://arxiv.org/abs/2205.11030v1
- Date: Mon, 23 May 2022 04:28:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-24 20:14:17.503054
- Title: HessianFR: An Efficient Hessian-based Follow-the-Ridge Algorithm for
Minimax Optimization
- Title(参考訳): HessianFR:ミニマックス最適化のための効率の良いHessian-based Follow-the-Ridgeアルゴリズム
- Authors: Yihang Gao, Huafeng Liu, Michael K. Ng and Mingjie Zhou
- Abstract要約: HessianFR は理論的な保証を持つ効率的な Hessian-based Follow-the-Ridge アルゴリズムである。
合成および実世界の大規模画像データセットを用いてGAN(Generative Adversarial Network)のトレーニング実験を行った。
- 参考スコア(独自算出の注目度): 18.61046317693516
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Wide applications of differentiable two-player sequential games (e.g., image
generation by GANs) have raised much interest and attention of researchers to
study efficient and fast algorithms. Most of the existing algorithms are
developed based on nice properties of simultaneous games, i.e., convex-concave
payoff functions, but are not applicable in solving sequential games with
different settings. Some conventional gradient descent ascent algorithms
theoretically and numerically fail to find the local Nash equilibrium of the
simultaneous game or the local minimax (i.e., local Stackelberg equilibrium) of
the sequential game. In this paper, we propose the HessianFR, an efficient
Hessian-based Follow-the-Ridge algorithm with theoretical guarantees.
Furthermore, the convergence of the stochastic algorithm and the approximation
of Hessian inverse are exploited to improve algorithm efficiency. A series of
experiments of training generative adversarial networks (GANs) have been
conducted on both synthetic and real-world large-scale image datasets (e.g.
MNIST, CIFAR-10 and CelebA). The experimental results demonstrate that the
proposed HessianFR outperforms baselines in terms of convergence and image
generation quality.
- Abstract(参考訳): 微分可能な2プレイヤーシーケンシャルゲーム(例えば、GANによる画像生成)の幅広い応用は、効率的で高速なアルゴリズムを研究する研究者の関心と関心を高めている。
既存のアルゴリズムのほとんどは同時ゲーム、すなわち凸凸ペイオフ関数の優れた特性に基づいて開発されているが、異なる設定のシーケンシャルゲームでは適用できない。
従来の勾配降下上昇アルゴリズムのいくつかは、理論的および数値的に同時ゲームの局所ナッシュ平衡や、シーケンシャルゲームの局所ミニマックス(すなわち局所スタッケルバーグ平衡)を見つけることができない。
本稿では,理論的保証のあるヘッセン式Follow-the-RidgeアルゴリズムであるHessianFRを提案する。
さらに、確率アルゴリズムの収束とヘッセン逆の近似を利用してアルゴリズム効率を向上させる。
合成画像と実世界の大規模画像データセット(mnist、cifar-10、celebaなど)で、gan(generative adversarial network)を訓練する一連の実験が行われている。
実験結果から,提案したHessianFRは収束および画像生成品質の点でベースラインを上回っていることが示された。
関連論文リスト
- Stochastic Optimization for Non-convex Problem with Inexact Hessian
Matrix, Gradient, and Function [99.31457740916815]
信頼領域(TR)と立方体を用いた適応正則化は、非常に魅力的な理論的性質を持つことが証明されている。
TR法とARC法はヘッセン関数,勾配関数,関数値の非コンパクトな計算を同時に行うことができることを示す。
論文 参考訳(メタデータ) (2023-10-18T10:29:58Z) - Efficient Last-iterate Convergence Algorithms in Solving Games [20.00785679098103]
非回帰アルゴリズムは、2プレイヤゼロサム正規形式ゲーム(NFG)およびワイドフォームゲーム(EFG)におけるナッシュ均衡の学習に人気がある。
近年,MWU に対するリワード変換 (RT) フレームワークが提案されている。
RTアルゴリズムのボトルネックは凸凹最適化問題(SCCP)の解法であることを示す。
論文 参考訳(メタデータ) (2023-08-22T07:59:49Z) - Ordering for Non-Replacement SGD [7.11967773739707]
我々は,アルゴリズムの非置換形式に対する収束率を改善する順序付けを求める。
我々は,強い凸関数と凸関数のステップサイズを一定かつ小さくするための最適順序付けを開発する。
さらに、注文とミニバッチを組み合わせることで、より複雑なニューラルネットワークにも適用できます。
論文 参考訳(メタデータ) (2023-06-28T00:46:58Z) - Stochastic Unrolled Federated Learning [85.6993263983062]
本稿では,UnRolled Federated Learning (SURF)を導入する。
提案手法は,この拡張における2つの課題,すなわち,非学習者へのデータセット全体の供給の必要性と,フェデレート学習の分散的性質に対処する。
論文 参考訳(メタデータ) (2023-05-24T17:26:22Z) - Differentiable Bilevel Programming for Stackelberg Congestion Games [47.60156422249365]
Stackelberg Congestion Game (SCG) において、リーダーは、群集が集まる平衡状態を予測し、操作することで、自身の利益を最大化することを目的としている。
本稿では,従来の手法と機械学習における最新の微分可能プログラミング技術を組み合わせることで,この計算課題に挑戦する。
本稿では,SCGの局所探索アルゴリズムを2つ提案する。第1に,微分可能プログラミングを用いてILDをアンロールすることで導関数を求める勾配降下アルゴリズムを提案する。
第二のアルゴリズムは、フォロワーの進化軌道を短くすることでツイストを加える。
論文 参考訳(メタデータ) (2022-09-15T21:32:23Z) - Last-iterate Convergence in Extensive-Form Games [49.31256241275577]
逐次ゲームにおける楽観的アルゴリズムの最後の点収束について検討する。
これらのアルゴリズムはいずれも最終点収束を楽しみ、そのいくつかは指数関数的に高速に収束する。
論文 参考訳(メタデータ) (2021-06-27T22:02:26Z) - Minimax Optimization with Smooth Algorithmic Adversaries [59.47122537182611]
対戦相手が展開するスムーズなアルゴリズムに対して,Min-playerの新しいアルゴリズムを提案する。
本アルゴリズムは,制限周期のない単調進行を保証し,適切な勾配上昇数を求める。
論文 参考訳(メタデータ) (2021-06-02T22:03:36Z) - Single-Timescale Stochastic Nonconvex-Concave Optimization for Smooth
Nonlinear TD Learning [145.54544979467872]
本稿では,各ステップごとに1つのデータポイントしか必要としない2つの単一スケールシングルループアルゴリズムを提案する。
本研究の結果は, 同時一次および二重側収束の形で表される。
論文 参考訳(メタデータ) (2020-08-23T20:36:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。