論文の概要: Finite-Time Analysis of Projected Two-Time-Scale Stochastic Approximation
- arxiv url: http://arxiv.org/abs/2604.00179v1
- Date: Tue, 31 Mar 2026 19:30:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:31.695461
- Title: Finite-Time Analysis of Projected Two-Time-Scale Stochastic Approximation
- Title(参考訳): 二次元時間スケール確率近似の有限時間解析
- Authors: Yitao Bai, Thinh T. Doan, Justin Romberg,
- Abstract要約: 本研究では, 定数ステップサイズの線形2時間スケール近似とPolyak-Ruppert平均値の有限時間収束について検討した。
我々は,2つの解釈可能な成分,制約付き部分空間で決定される近似誤差,サブ線形速度で減衰する統計的誤差の2つに分解して,明示的な平均二乗誤差境界を確立する。
- 参考スコア(独自算出の注目度): 9.227034835080307
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the finite-time convergence of projected linear two-time-scale stochastic approximation with constant step sizes and Polyak--Ruppert averaging. We establish an explicit mean-square error bound, decomposing it into two interpretable components, an approximation error determined by the constrained subspace and a statistical error decaying at a sublinear rate, with constants expressed through restricted stability margins and a coupling invertibility condition. These constants cleanly separate the effect of subspace choice (approximation errors) from the effect of the averaging horizon (statistical errors). We illustrate our theoretical results through a number of numerical experiments on both synthetic and reinforcement learning problems.
- Abstract(参考訳): 本研究では, 定数ステップサイズの線形2時間スケール確率近似とPolyak--Ruppert平均化の有限時間収束について検討した。
我々は,2つの解釈可能な成分,制約付き部分空間で決定される近似誤差,およびサブ線形速度で減衰する統計的誤差に分解して,有意な平均二乗誤差境界を確立し,その定数を制限された安定性マージンと結合可逆条件で表現する。
これらの定数は、部分空間選択の影響(近似誤差)と平均水平線の影響(統計誤差)をきれいに分離する。
本稿では,合成学習問題と強化学習問題の両方に関する数値実験を通じて理論的結果について述べる。
関連論文リスト
- Extracting quantum field theory dynamics from an approximate ground state [0.0]
量子場理論において静的基底状態相関器から情報を抽出する線形プログラミング法を開発した。
真空への変分近似を用いて, 1+1$-dimensional 4$モデルを用いて実験を行った。
結果として生じる質量ギャップは、再正規化されたハミルトン・トランケーションとボレルが仮定する摂動理論と一致する。
論文 参考訳(メタデータ) (2025-12-22T17:25:24Z) - Dimension-free error estimate for diffusion model and optimal scheduling [22.20348860913421]
拡散生成モデルは、経験的に観察された分布から合成データを生成するための強力なツールとして登場した。
従来の分析では、生成したデータと真のデータ分布の誤差を、ワッサーシュタイン距離やクルバック・リーバーの偏差の観点から定量化していた。
本研究では, 生成したデータ分布と真のデータ分布との相違点に有意な次元自由境界を導出する。
論文 参考訳(メタデータ) (2025-12-01T15:58:20Z) - Generative Modeling with Continuous Flows: Sample Complexity of Flow Matching [60.37045080890305]
本稿では,フローマッチングに基づく生成モデルにおいて,サンプルの複雑さを初めて解析する。
速度場推定誤差をニューラルネットワーク近似誤差、有限標本サイズによる統計的誤差、速度場推定のための有限個の最適化ステップによる最適化誤差に分解する。
論文 参考訳(メタデータ) (2025-12-01T05:14:25Z) - Revisiting Zeroth-Order Optimization: Minimum-Variance Two-Point Estimators and Directionally Aligned Perturbations [57.179679246370114]
乱摂動の分布は, 摂動段差がゼロになる傾向にあるため, 推定子の分散を最小限に抑える。
以上の結果から, 一定の長さを維持するのではなく, 真の勾配に方向を合わせることが可能であることが示唆された。
論文 参考訳(メタデータ) (2025-10-22T19:06:39Z) - Convergence Rate in Nonlinear Two-Time-Scale Stochastic Approximation with State (Time)-Dependence [6.160559095588513]
Lyapunov 関数はどちらの場合も収束率を示す。
状態雑音パラメータがその極限値に完全に近づくと、リャプノフ函数は指数収束率を達成する。
論文 参考訳(メタデータ) (2025-09-14T02:06:15Z) - Finite-Time Analysis of Discrete-Time Stochastic Interpolants [32.27430900126022]
補間フレームワークの最初の離散時間解析を行い、分布推定誤差の有限時間上限を導出する。
この結果は収束加速のための効率的なスケジュールを設計するための新しい方法を提供する。
論文 参考訳(メタデータ) (2025-02-13T10:07:35Z) - Statistical Inference for Temporal Difference Learning with Linear Function Approximation [55.80276145563105]
The statistics properties of Temporal difference learning with Polyak-Ruppert averaging。
3つの理論的な貢献により、現在の最先端の成果が向上する。
論文 参考訳(メタデータ) (2024-10-21T15:34:44Z) - Sampling and estimation on manifolds using the Langevin diffusion [45.57801520690309]
離散化マルコフ過程に基づく$mu_phi $の線形汎函数の2つの推定器を検討する。
誤差境界は、本質的に定義されたランゲヴィン拡散の離散化を用いてサンプリングと推定のために導出される。
論文 参考訳(メタデータ) (2023-12-22T18:01:11Z) - Learning Discretized Neural Networks under Ricci Flow [48.47315844022283]
低精度重みとアクティベーションからなる離散ニューラルネットワーク(DNN)について検討する。
DNNは、訓練中に微分不可能な離散関数のために無限あるいはゼロの勾配に悩まされる。
論文 参考訳(メタデータ) (2023-02-07T10:51:53Z) - Optimal oracle inequalities for solving projected fixed-point equations [53.31620399640334]
ヒルベルト空間の既知の低次元部分空間を探索することにより、確率観測の集合を用いて近似解を計算する手法を検討する。
本稿では,線形関数近似を用いた政策評価問題に対する時間差分学習手法の誤差を正確に評価する方法について述べる。
論文 参考訳(メタデータ) (2020-12-09T20:19:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。