Fugu-MT 論文翻訳(概要): Finite-Time Decoupled Convergence in Nonlinear Two-Time-Scale Stochastic Approximation

論文の概要: Finite-Time Decoupled Convergence in Nonlinear Two-Time-Scale Stochastic Approximation

arxiv url: http://arxiv.org/abs/2401.03893v1
Date: Mon, 8 Jan 2024 13:44:35 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-09 16:31:32.560040
Title: Finite-Time Decoupled Convergence in Nonlinear Two-Time-Scale Stochastic Approximation
Title（参考訳）: 非線形2時間スケール確率近似における有限時間デカップリング収束
Authors: Yuze Han, Xiang Li, Zhihua Zhang
Abstract要約: 本稿では,非線形二時間スケール近似における有限時間デカップリング収束の可能性について検討する。分離収束は相変わらず実現可能であり、滑らか度パラメータに関連するステップサイズの選択に留意する。
参考スコア（独自算出の注目度）: 30.313512704085184
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In two-time-scale stochastic approximation (SA), two iterates are updated at varying speeds using different step sizes, with each update influencing the other. Previous studies in linear two-time-scale SA have found that the convergence rates of the mean-square errors for these updates are dependent solely on their respective step sizes, leading to what is referred to as decoupled convergence. However, the possibility of achieving this decoupled convergence in nonlinear SA remains less understood. Our research explores the potential for finite-time decoupled convergence in nonlinear two-time-scale SA. We find that under a weaker Lipschitz condition, traditional analyses are insufficient for achieving decoupled convergence. This finding is further numerically supported by a counterexample. But by introducing an additional condition of nested local linearity, we show that decoupled convergence is still feasible, contingent on the appropriate choice of step sizes associated with smoothness parameters. Our analysis depends on a refined characterization of the matrix cross term between the two iterates and utilizes fourth-order moments to control higher-order approximation errors induced by the local linearity assumption.
Abstract（参考訳）: 2時間スケールの確率近似(sa)では、2つのイテレートが異なるステップサイズで異なる速度で更新され、それぞれの更新が他方に影響を与える。線形二時間スケールsaにおける以前の研究では、これらの更新に対する平均二乗誤差の収束率は、それぞれのステップサイズのみに依存しており、分離収束と呼ばれる。しかし、この分離収束を非線形saで達成する可能性はまだ分かっていない。本研究は,非線形2時間スケールSAにおける有限時間疎結合収束の可能性を探る。より弱いリプシッツ条件下では、従来の解析は疎収束を達成するには不十分である。この発見は反例によってさらに数値的に支持される。しかし,入れ子付き局所線形性の条件を付加することにより,分離収束は相変わらず実現可能であり,滑らか性パラメータに関連するステップサイズの選択が適切であることを示す。本解析は, 2つのイテレート間の行列クロス項の洗練されたキャラクタリゼーションに依存し, 4次モーメントを用いて局所線形性仮定による高次近似誤差を制御する。

関連論文リスト

Revisiting Zeroth-Order Optimization: Minimum-Variance Two-Point Estimators and Directionally Aligned Perturbations [57.179679246370114]
乱摂動の分布は, 摂動段差がゼロになる傾向にあるため, 推定子の分散を最小限に抑える。以上の結果から, 一定の長さを維持するのではなく, 真の勾配に方向を合わせることが可能であることが示唆された。
論文参考訳（メタデータ） (2025-10-22T19:06:39Z)
Gaussian Approximation for Two-Timescale Linear Stochastic Approximation [4.4491311274892436]
We establish algorithm driven by martingale difference or Markov noise。確率間の凸距離の観点から正規近似のバウンダリを導出する。また,線形TTSAアルゴリズムの誤差に対する高次モーメント境界も提供する。
論文参考訳（メタデータ） (2025-08-11T12:41:14Z)
A Local Polyak-Lojasiewicz and Descent Lemma of Gradient Descent For Overparametrized Linear Models [6.734175048463699]
正方形損失を学習した2層線形ニューラルネットワークの勾配降下に対する線形収束率を導出した。我々の収束分析は、事前の結果を改善するだけでなく、ステップサイズに対するより良い選択を示唆している。
論文参考訳（メタデータ） (2025-05-16T19:57:22Z)
Gradient Descent Converges Linearly to Flatter Minima than Gradient Flow in Shallow Linear Networks [0.0]
本研究では,1つの入力と出力を持つディープ2線形ニューラルネットワークの勾配勾配勾配ダイナミクスについて検討する。また, GD は, たとえ大きなステップサイズであっても, 訓練損失の最小値に比例して直線的に収束することを示した。
論文参考訳（メタデータ） (2025-01-15T20:43:36Z)
Decoupled Functional Central Limit Theorems for Two-Time-Scale Stochastic Approximation [28.07082348529648]
2回のスケール近似では、異なるステップサイズで異なるレートで2つのイテレーションが更新され、それぞれが他方に影響を与える。以前の研究では、これらの更新に対する誤差項の収束率はそれぞれのステップサイズにのみ依存していることが示されており、これは分離収束と呼ばれる性質である。我々の研究はこのギャップを埋めるために、2段階のSAに対して分離された機能中心極限定理を確立し、その挙動をより正確に評価する。
論文参考訳（メタデータ） (2024-12-22T15:43:01Z)
Stable Nonconvex-Nonconcave Training via Linear Interpolation [51.668052890249726]
本稿では,ニューラルネットワークトレーニングを安定化(大規模)するための原理的手法として,線形アヘッドの理論解析を提案する。最適化過程の不安定性は、しばしば損失ランドスケープの非単調性によって引き起こされるものであり、非拡張作用素の理論を活用することによって線型性がいかに役立つかを示す。
論文参考訳（メタデータ） (2023-10-20T12:45:12Z)
Efficient Interpretable Nonlinear Modeling for Multiple Time Series [5.448070998907116]
本稿では,複数時系列に対する効率的な非線形モデリング手法を提案する。異なる時系列変数間の非線形相互作用を含む。実験結果から,提案アルゴリズムは相似的にVAR係数の支持値の同定を改善することが示された。
論文参考訳（メタデータ） (2023-09-29T11:42:59Z)
Smoothing ADMM for Sparse-Penalized Quantile Regression with Non-Convex Penalties [8.294148737585543]
本稿では,非二次絶対および非平滑収束ペナルティの存在下での凹凸および切断された量子レグレッションについて検討する。本稿では,スパース回帰に特化してSIADと呼ばれるペナルティ乗算器が増加する新しいループADMアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-09-04T21:48:51Z)
Dynamics of correlation spreading in low-dimensional transverse-field Ising models [0.0]
1(1D)と2次元(2D)における横場イジングモデルにおける磁気乱れ状態から始まる量子クエンチ後の相関の動的拡散について検討する。いくつかの手法を用いて縦・横スピン相関関数を等時解析する。本研究は, 将来のリブ・ロビンソン境界の相関拡散と理論的洗練に関する量子シミュレーション実験に有用なベンチマークを提供する。
論文参考訳（メタデータ） (2023-01-04T02:02:21Z)
Fixed-Time Convergence for a Class of Nonconvex-Nonconcave Min-Max Problems [5.787117733071416]
min-max問題を解くための固定時間収束サドル点力学系を開発した。提案手法は他のどの状態法と比較しても高速に実現できる。
論文参考訳（メタデータ） (2022-07-26T12:25:05Z)
Minibatch vs Local SGD with Shuffling: Tight Convergence Bounds and Beyond [63.59034509960994]
シャッフルに基づく変種(ミニバッチと局所ランダムリシャッフル)について検討する。ポリアック・ロジャシエヴィチ条件を満たす滑らかな函数に対して、これらのシャッフル型不変量(英語版)(shuffling-based variants)がそれらの置換式よりも早く収束することを示す収束境界を得る。我々は, 同期シャッフル法と呼ばれるアルゴリズムの修正を提案し, ほぼ均一な条件下では, 下界よりも収束速度が速くなった。
論文参考訳（メタデータ） (2021-10-20T02:25:25Z)
On the Convergence of Stochastic Extragradient for Bilinear Games with Restarted Iteration Averaging [96.13485146617322]
本稿では, ステップサイズが一定であるSEG法の解析を行い, 良好な収束をもたらす手法のバリエーションを示す。平均化で拡張した場合、SEGはナッシュ平衡に確実に収束し、スケジュールされた再起動手順を組み込むことで、その速度が確実に加速されることを証明した。
論文参考訳（メタデータ） (2021-06-30T17:51:36Z)
The Connection between Discrete- and Continuous-Time Descriptions of Gaussian Continuous Processes [60.35125735474386]
我々は、一貫した推定子をもたらす離散化が粗粒化下での不変性を持つことを示す。この結果は、導関数再構成のための微分スキームと局所時間推論アプローチの組み合わせが、2次または高次微分方程式の時系列解析に役立たない理由を説明する。
論文参考訳（メタデータ） (2021-01-16T17:11:02Z)
Sample Complexity Bounds for Two Timescale Value-based Reinforcement Learning Algorithms [65.09383385484007]
2つの時間スケール近似(SA)は、値に基づく強化学習アルゴリズムで広く使われている。本稿では,2つの時間スケール線形および非線形TDCとGreedy-GQアルゴリズムの漸近収束率について検討する。
論文参考訳（メタデータ） (2020-11-10T11:36:30Z)
Nonlinear Two-Time-Scale Stochastic Approximation: Convergence and Finite-Time Performance [1.52292571922932]
非線形2時間スケール近似の収束と有限時間解析について検討する。特に,本手法は期待値の収束を$mathcalO (1/k2/3)$で達成し,$k$は反復数であることを示す。
論文参考訳（メタデータ） (2020-11-03T17:43:39Z)
Random extrapolation for primal-dual coordinate descent [61.55967255151027]
本稿では,データ行列の疎度と目的関数の好適な構造に適応する,ランダムに外挿した原始-双対座標降下法を提案する。一般凸凹の場合, 主対差と目的値に対するシーケンスのほぼ確実に収束と最適サブ線形収束率を示す。
論文参考訳（メタデータ） (2020-07-13T17:39:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。