論文の概要: Nonlinear Two-Time-Scale Stochastic Approximation: A Sharp Phase Transition and How to Beat It
- arxiv url: http://arxiv.org/abs/2606.14488v1
- Date: Fri, 12 Jun 2026 14:24:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.930768
- Title: Nonlinear Two-Time-Scale Stochastic Approximation: A Sharp Phase Transition and How to Beat It
- Title(参考訳): 非線形2時間スケール確率近似:シャープ相転移とそれを打ち負かす方法
- Authors: Dhruv Sarkar, Vaneet Aggarwal,
- Abstract要約: 位相遷移機構を一般非線形TTSAに拡張する局所移動定理を証明した。
証明は漸近的ではなく、2つのアベル変換のキャンセルに依存している。
- 参考スコア(独自算出の注目度): 46.80389197344682
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent finite-time analyses of nonlinear two-time-scale stochastic approximation show that under contractive assumptions the slow iterate $Y_k$ with stepsizes $β_k=Θ(k^{-1})$ and $α_k=Θ(k^{-a})$, $a\in(1/2,1)$, generally satisfies a mean-square rate of order $k^{-a}$; decoupled $k^{-1}$ rates require strong local linearity. We identify a sharp regularity-dependent boundary. In a rate-determining normal form where the slow drift contains a locally linear leakage and a nonlinear remainder of order $1+ρ$ ($ρ\in[0,1]$), the uncorrected recursion satisfies \[ \mathbb{E}\|Y_k\|^2 \le C\bigl(k^{-1}+k^{-a(1+ρ)}\bigr), \] and a matching scalar Gaussian lower bound shows that the slower term is unavoidable without modifying the update. Thus the decoupled $k^{-1}$ rate is guaranteed for the uncorrected recursion exactly when $a(1+ρ)\ge 1$. This lower bound concerns only the naive update; it is not an information-theoretic obstruction. We demonstrate this by equipping the normal-form recursion with an auxiliary online bias estimator \[ M_{k+1}=M_k+γ_k(R(X_k)-M_k),\qquad β_k\llγ_k\llα_k, \] and subtracting $M_k$ from the slow update. Under the same stability, moment, and remainder assumptions, the corrected recursion achieves $\mathbb{E}\|\widetilde Y_k\|^2=O(k^{-1})$ for every $ρ\in[0,1]$, including regimes where the uncorrected update provably suffers the slower rate. Finally, we prove localized transfer theorems that extend the phase-transition mechanism to general nonlinear TTSA in fast-manifold coordinates. The proofs are non-asymptotic and rely on two Abel-transform cancellations: one for the locally linear fast-error leakage, and one for the tracked nonlinear bias.
- Abstract(参考訳): 非線形二時間スケール確率近似の最近の有限時間解析によると、契約的仮定の下では、遅く反復する$Y_k$とステップ化される$β_k=((k^{-1})$と$α_k=((k^{-a})$, $a\in(1/2,1)$は概して位数$k^{-a}$の平均二乗率を満たす。
鋭い正則性に依存した境界を同定する。
遅いドリフトが局所的な線形リークと1+ρ$(ρ\in[0,1]$)の非線形残差を含む速度決定正規形式において、補正されない再帰満足度 \[ \mathbb{E}\|Y_k\|^2 \le C\bigl(k^{-1}+k^{-a(1+ρ)}\bigr), \] と一致するスカラーガウスの下界は、更新を変更することなく遅い項が避けられないことを示している。
したがって、分離された$k^{-1}$レートは、$a(1+ρ)\ge 1$のときに正確に補正されていない再帰に対して保証される。
この低い境界は、単純な更新のみに関するもので、情報理論の障害ではない。
オンラインバイアス推定器 \[M_{k+1}=M_k+γ_k(R(X_k)-M_k),\qquad β_k\llγ_k\llα_k, \] を補助的オンラインバイアス推定器に装備し、遅い更新からM_k$を差し引いてこれを実証する。
同じ安定性、モーメント、残りの仮定の下で、補正された再帰は、すべての$ρ\in[0,1]$に対して$\mathbb{E}\|\widetilde Y_k\|^2=O(k^{-1})$に達する。
最後に、位相遷移機構を高速多様体座標における一般非線形TTSAに拡張する局所化移動定理を証明した。
証明は漸近的ではなく、2つのアベル変換キャンセルに依存している。
関連論文リスト
- Tikhonov-regularised projected gradient flow for equality-constrained bilinear quantum control [0.0]
本研究では,$mathcalH=L(0,T;mathbbR)$に対する等式制約制御対象に対する投影型勾配流について検討する。
i) $(_varepsilon)=(_min2+varepsilon2)$; (ii) Objective monotonicity $mathrmdJ/
論文 参考訳(メタデータ) (2026-04-29T12:53:58Z) - Discrete Double-Bracket Flows for Isotropic-Noise Invariant Eigendecomposition [7.186083931122418]
本研究では,行列ベクトル積 (MVP) のオラクルによる行列フリー固有分解について検討した。
標準的な近似法では、安定性を$|C_k|$に結合する固定ステップを使用するか、あるいは更新の消滅によって遅くなる適応ステップを使用する。
対角化目標と入力-状態安定性解析のための厳密なサドルと、トレースフリーな摂動の下での複雑さのスケーリングを$O(|C_e|2 / (2))$とすることで、グローバル収束を確立する。
論文 参考訳(メタデータ) (2026-02-14T13:09:29Z) - Convergence of TD(0) under Polynomial Mixing with Nonlinear Function Approximation [49.1574468325115]
時間差分学習(TD(0))は強化学習の基本である。
マルコフデータを混合したバニラTD(0)の最初の高確率有限サンプル解析を行う。
論文 参考訳(メタデータ) (2025-02-08T22:01:02Z) - On the $O(\frac{\sqrt{d}}{T^{1/4}})$ Convergence Rate of RMSProp and Its Momentum Extension Measured by $\ell_1$ Norm [54.28350823319057]
本稿では、RMSPropとその運動量拡張を考察し、$frac1Tsum_k=1Tの収束速度を確立する。
我々の収束率は、次元$d$を除くすべての係数に関して下界と一致する。
収束率は$frac1Tsum_k=1Tと類似していると考えられる。
論文 参考訳(メタデータ) (2024-02-01T07:21:32Z) - Perseus: A Simple and Optimal High-Order Method for Variational
Inequalities [81.32967242727152]
VI は、$langle F(x), x - xstarrangle geq 0$ for all $x in MathcalX$ であるように、mathcalX$ で $xstar を見つける。
そこで本稿では,テキストitが行探索を必要とせず,$O(epsilon-2/(p+1))$で弱解に確実に収束する$pth$-order法を提案する。
論文 参考訳(メタデータ) (2022-05-06T13:29:14Z) - A first-order primal-dual method with adaptivity to local smoothness [64.62056765216386]
凸凹対象 $min_x max_y f(x) + langle Ax, yrangle - g*(y)$, ここで、$f$ は局所リプシッツ勾配を持つ凸関数であり、$g$ は凸かつ非滑らかである。
主勾配ステップと2段ステップを交互に交互に行うCondat-Vuアルゴリズムの適応バージョンを提案する。
論文 参考訳(メタデータ) (2021-10-28T14:19:30Z) - The ODE Method for Asymptotic Statistics in Stochastic Approximation and Reinforcement Learning [3.8098187557917464]
この論文は$d$-dimensional recursion approximation, $$theta_n+1=theta_n + alpha_n + 1 f(theta_n, Phi_n+1)に関するものである。
主な結果は、ドスカー・バラダン・リャプノフドリフト条件(DV3)の平均流とバージョンに関する追加条件の下で確立される。
a example is given where $f$ and $barf$ are linear in $theta$, and $Phi$ is a geometryal.
論文 参考訳(メタデータ) (2021-10-27T13:38:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。