論文の概要: Stabilizing GANs' Training with Brownian Motion Controller
- arxiv url: http://arxiv.org/abs/2306.10468v1
- Date: Sun, 18 Jun 2023 03:36:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 20:34:36.864573
- Title: Stabilizing GANs' Training with Brownian Motion Controller
- Title(参考訳): ブラウン運動制御器によるgansトレーニングの安定化
- Authors: Tianjiao Luo, Ziyu Zhu, Jianfei Chen, Jun Zhu
- Abstract要約: GAN(Generative Adversarial Network)のトレーニングプロセスは不安定であり、グローバルに収束しない。
我々はBrownian Motion Controller (BMC) と呼ばれる広帯域高次ノイズベースコントローラを提案する。
理論上は、DiracGANs-BMCのトレーニング過程が、大域的に指数関数的に安定であり、収束率に依存することを証明している。
実験の結果,我々のGANs-BMCは,より高速な収束率,発振域の小さい,FIDスコアの点で優れた性能で,StyleGANv2-adaフレームワーク下でのGANsのトレーニングを効果的に安定化することがわかった。
- 参考スコア(独自算出の注目度): 24.149460563406286
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The training process of generative adversarial networks (GANs) is unstable
and does not converge globally. In this paper, we examine the stability of GANs
from the perspective of control theory and propose a universal higher-order
noise-based controller called Brownian Motion Controller (BMC). Starting with
the prototypical case of Dirac-GANs, we design a BMC to retrieve precisely the
same but reachable optimal equilibrium. We theoretically prove that the
training process of DiracGANs-BMC is globally exponential stable and derive
bounds on the rate of convergence. Then we extend our BMC to normal GANs and
provide implementation instructions on GANs-BMC. Our experiments show that our
GANs-BMC effectively stabilizes GANs' training under StyleGANv2-ada frameworks
with a faster rate of convergence, a smaller range of oscillation, and better
performance in terms of FID score.
- Abstract(参考訳): generative adversarial networks(gans)のトレーニングプロセスは不安定であり、グローバルに収束しない。
本稿では,制御理論の観点からGANの安定性を考察し,BMC(Brownian Motion Controller)と呼ばれる高次騒音制御系を提案する。
ディラックGANの原型の場合から、我々はBMCを設計し、正確に同じだが到達可能な最適平衡を求める。
理論上、diracgans-bmcの訓練過程は指数関数的に安定であり、収束率の境界が導かれることを証明している。
次に、BMCを通常のGANに拡張し、GANs-BMCの実装手順を提供する。
実験の結果,我々のGANs-BMCは,より高速な収束率,発振域の小さい,FIDスコアの点で優れた性能で,StyleGANv2-adaフレームワーク下でのGANsのトレーニングを効果的に安定化することがわかった。
関連論文リスト
- Improved Sample Complexity of Imitation Learning for Barrier Model Predictive Control [27.609098229134]
システムの汎用クラスに対して,スムーズな専門家コントローラを設計する方法を示す。
MPCの障壁は, 何らかの方向に沿って, 理論的に最適な誤差-平滑性トレードオフを達成できることを示す。
論文 参考訳(メタデータ) (2024-10-01T16:52:23Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z) - Skip Training for Multi-Agent Reinforcement Learning Controller for
Industrial Wave Energy Converters [94.84709449845352]
近年のウェーブ・エナジー・コンバータ(WEC)は、発電を最大化するために複数の脚と発電機を備えている。
従来のコントローラは複雑な波のパターンを捕捉する制限を示しており、コントローラはエネルギー捕獲を効率的に最大化する必要がある。
本稿では,従来のスプリングダンパよりも優れたマルチエージェント強化学習コントローラ(MARL)を提案する。
論文 参考訳(メタデータ) (2022-09-13T00:20:31Z) - Actor-Critic based Improper Reinforcement Learning [61.430513757337486]
我々は,未知のマルコフ決定プロセスに対して,学習者に100万ドルのベースコントローラを付与する不適切な強化学習環境を考える。
本稿では,(1)ポリシーグラディエントに基づくアプローチ,(2)単純なアクター・クリティカル・スキームとNatural Actor-Criticスキームを切り替えるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-19T05:55:02Z) - Bayesian Controller Fusion: Leveraging Control Priors in Deep
Reinforcement Learning for Robotics [17.660913275007317]
従来の手作りコントローラーの強みとモデルフリー深部強化学習(RL)を組み合わせたハイブリッド制御戦略を提案する。
BCFはロボティクス領域で成長し、多くのタスクに対して信頼性はあるが最適でない制御が優先されるが、スクラッチからのRLは安全であり、データ非効率である。
実世界におけるゼロショットsim-to-realセッティングへのBCFの適用性と,そのアウト・オブ・ディストリビューション状態に対処する能力を示す。
論文 参考訳(メタデータ) (2021-07-21T00:43:32Z) - Model-free Reinforcement Learning for Branching Markov Decision
Processes [6.402126624793774]
分岐マルコフ決定過程の最適制御のための強化学習について検討する。
状態 (discrete-time) BMC は、他のエンティティを生成している間にペイオフを生成するエンティティの集合である。
モデルフリー強化学習手法を一般化し、未知のBMDPの最適制御戦略をその極限で計算する。
論文 参考訳(メタデータ) (2021-06-12T13:42:15Z) - Bayesian Bellman Operators [55.959376449737405]
ベイズ強化学習(RL)の新しい視点について紹介する。
我々のフレームワークは、ブートストラップが導入されたとき、モデルなしアプローチは実際には値関数ではなくベルマン作用素よりも後部を推測する、という洞察に動機づけられている。
論文 参考訳(メタデータ) (2021-06-09T12:20:46Z) - What Are Bayesian Neural Network Posteriors Really Like? [63.950151520585024]
ハミルトニアンモンテカルロは、標準およびディープアンサンブルよりも大きな性能向上を達成できることを示す。
また,深部分布は標準SGLDとHMCに類似しており,標準変動推論に近いことが示された。
論文 参考訳(メタデータ) (2021-04-29T15:38:46Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Reciprocal Adversarial Learning via Characteristic Functions [12.961770002117142]
GAN(Generative Adversarial Nets)は、複雑な分散を伴うタスクに好まれるツールである。
特徴関数(CF)を用いて分布を時間ではなく時間的に比較する方法を示す。
次に、逆数が存在する場合の埋め込み領域とデータ領域の等価性を証明し、自動エンコーダ構造で自然にGANを開発する。
この効率的な構造は、単純なトレーニング戦略とともに2つのモジュールのみを使用して、双方向で鮮明な画像を生成する。
論文 参考訳(メタデータ) (2020-06-15T14:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。