論文の概要: Discretization Drift in Two-Player Games
- arxiv url: http://arxiv.org/abs/2105.13922v1
- Date: Fri, 28 May 2021 15:38:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-31 15:14:27.288349
- Title: Discretization Drift in Two-Player Games
- Title(参考訳): 2人プレイゲームにおける離散ドリフト
- Authors: Mihaela Rosca and Yan Wu and Benoit Dherin and David G. T. Barrett
- Abstract要約: 2人でプレイするゲームのグラディエントベースの手法は、難題を解決するためのリッチなダイナミクスを生み出す。
この複雑さの一部は、同時または交互な勾配降下によって与えられる離散的な更新ステップに由来する。
離散力学を忠実に追従する修正された連続力学系を導出する。
- 参考スコア(独自算出の注目度): 12.925287409215127
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Gradient-based methods for two-player games produce rich dynamics that can
solve challenging problems, yet can be difficult to stabilize and understand.
Part of this complexity originates from the discrete update steps given by
simultaneous or alternating gradient descent, which causes each player to drift
away from the continuous gradient flow -- a phenomenon we call discretization
drift. Using backward error analysis, we derive modified continuous dynamical
systems that closely follow the discrete dynamics. These modified dynamics
provide an insight into the notorious challenges associated with zero-sum
games, including Generative Adversarial Networks. In particular, we identify
distinct components of the discretization drift that can alter performance and
in some cases destabilize the game. Finally, quantifying discretization drift
allows us to identify regularizers that explicitly cancel harmful forms of
drift or strengthen beneficial forms of drift, and thus improve performance of
GAN training.
- Abstract(参考訳): 2人プレイゲームのための勾配ベースの手法は、難しい問題を解決できるが、安定や理解が難しいリッチなダイナミクスを生み出す。
この複雑さの一部は、同時または交互に勾配降下によって与えられる離散的な更新ステップに起因しており、それによって各プレイヤーは連続的な勾配流から遠ざかる。
後方誤差解析を用いて,離散力学に密接に従う修正連続力学系を導出する。
これらの修正されたダイナミクスは、生成的敵ネットワークを含むゼロサムゲームに関連する悪名高い課題に対する洞察を与える。
特に,ゲームの性能を変動させ,ゲームが不安定になるような離散化ドリフトの異なる構成要素を識別する。
最後に, 離散化ドリフトの定量化により, 有害なドリフトを明示的にキャンセルしたり, 有効なドリフトの強化を行う正則化器を同定し, GAN訓練の性能を向上させることができる。
関連論文リスト
- Dissipative Dynamics of Graph-State Stabilizers with Superconducting
Qubits [0.0]
本研究では,クラウドを介してアクセス可能な超伝導量子ビットデバイスに焦点をあてて,多粒子交絡状態の雑音的進化について検討する。
拡張マルコフ環境を用いたチャージパリティ分割のモデル化手法を提案する。
基礎となる多体力学は、量子誤差補正の文脈で広く用いられる安定化器の崩壊と復活を生じることを示す。
論文 参考訳(メタデータ) (2023-08-03T16:30:35Z) - On the Convergence of No-Regret Learning Dynamics in Time-Varying Games [89.96815099996132]
時間変化ゲームにおける楽観的勾配降下(OGD)の収束を特徴付ける。
我々のフレームワークは、ゼロサムゲームにおけるOGDの平衡ギャップに対して鋭い収束境界をもたらす。
また,静的ゲームにおける動的後悔の保証に関する新たな洞察も提供する。
論文 参考訳(メタデータ) (2023-01-26T17:25:45Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Asynchronous Gradient Play in Zero-Sum Multi-agent Games [25.690033495071923]
ゼロサムポリマトリクスゲームにおける遅延フィードバック下での非同期勾配プレイについて検討した。
我々の知る限りでは、この研究はゼロサムポリマトリクスゲームにおける非同期勾配プレイを理解することを目的とした最初のものである。
論文 参考訳(メタデータ) (2022-11-16T15:37:23Z) - No-Regret Learning in Games with Noisy Feedback: Faster Rates and
Adaptivity via Learning Rate Separation [76.61911795703062]
学習者が他の最適化エージェントと連続したゲームに関わった場合の後悔の問題を考察する。
この場合、全てのプレイヤーが非相対的アルゴリズムに従えば、完全に敵対する環境に対してかなり低い後悔を達成することができる。
本稿では,最悪とベストケースの後悔の保証を円滑に補間する完全適応手法を提案する。
論文 参考訳(メタデータ) (2022-06-13T10:13:51Z) - Control of Two-way Coupled Fluid Systems with Differentiable Solvers [22.435002906710803]
本研究では、複雑な非線形力学系を制御するためにディープニューラルネットワークを用いることを検討する。
ナヴィエ・ストークス方程式を2方向のカップリングで解き、非線形摂動を生じさせる。
提案手法を用いてトレーニングしたコントローラは,評価指標や一般化能力の点で,古典的,学習的な代替品よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-01T09:12:08Z) - Dynamic Collective Intelligence Learning: Finding Efficient Sparse Model
via Refined Gradients for Pruned Weights [31.68257673664519]
動的プルーニング法は, STE(Straight-Through-Estimator)を用いて, プルーニング重量の勾配を近似することにより, トレーニング中に多様なスペーサ性パターンを求める。
我々は,2組の重みから2つの前方経路を形成することにより,刈り上げ重みを更新するための洗練された勾配を導入する。
本稿では,両重み集合の集合的知性間の学習相乗効果を利用した新しい動的集団知能学習(DCIL)を提案する。
論文 参考訳(メタデータ) (2021-09-10T04:41:17Z) - gradSim: Differentiable simulation for system identification and
visuomotor control [66.37288629125996]
本稿では,微分可能マルチフィジカルシミュレーションと微分可能レンダリングを活用し,3次元監督への依存を克服するフレームワークであるgradsimを提案する。
当社の統合グラフは、状態ベースの(3D)監督に頼ることなく、挑戦的なバイスモメータ制御タスクで学習を可能にします。
論文 参考訳(メタデータ) (2021-04-06T16:32:01Z) - Training Generative Adversarial Networks by Solving Ordinary
Differential Equations [54.23691425062034]
GANトレーニングによって引き起こされる連続時間ダイナミクスについて検討する。
この観点から、GANのトレーニングにおける不安定性は積分誤差から生じると仮定する。
本研究では,有名なODEソルバ(Runge-Kutta など)がトレーニングを安定化できるかどうかを実験的に検証する。
論文 参考訳(メタデータ) (2020-10-28T15:23:49Z) - Continuous-in-Depth Neural Networks [107.47887213490134]
まず最初に、このリッチな意味では、ResNetsは意味のある動的でないことを示します。
次に、ニューラルネットワークモデルが連続力学系を表現することを実証する。
ResNetアーキテクチャの詳細な一般化としてContinuousNetを紹介します。
論文 参考訳(メタデータ) (2020-08-05T22:54:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。