論文の概要: Central Limit Theorems for Asynchronous Averaged Q-Learning
- arxiv url: http://arxiv.org/abs/2509.18964v1
- Date: Tue, 23 Sep 2025 13:16:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.853646
- Title: Central Limit Theorems for Asynchronous Averaged Q-Learning
- Title(参考訳): Asynchronous Averaged Q-Learningのための中心極限定理
- Authors: Xingtu Liu,
- Abstract要約: 本稿では,非同期更新下でのPolyak-Ruppert平均Q-ラーニングに対する中心極限定理を確立する。
ここでは、ワッサーシュタイン距離における収束速度が、反復数、状態-作用空間サイズ、割引係数、探索の質に依存することを明示的に反映する非漸近的中心極限定理を提案する。
汎函数中心極限定理を導出し、部分サム過程がブラウン運動に弱収束することを示す。
- 参考スコア(独自算出の注目度): 1.0152838128195467
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper establishes central limit theorems for Polyak-Ruppert averaged Q-learning under asynchronous updates. We present a non-asymptotic central limit theorem, where the convergence rate in Wasserstein distance explicitly reflects the dependence on the number of iterations, state-action space size, the discount factor, and the quality of exploration. In addition, we derive a functional central limit theorem, showing that the partial-sum process converges weakly to a Brownian motion.
- Abstract(参考訳): 本稿では,非同期更新下でのPolyak-Ruppert平均Q-ラーニングに対する中心極限定理を確立する。
ここでは、ワッサーシュタイン距離における収束速度が、反復数、状態-作用空間サイズ、割引係数、探索の質に依存することを明示的に反映する非漸近的中心極限定理を提案する。
さらに、汎函数中心極限定理を導出し、部分サム過程がブラウン運動に弱収束することを示す。
関連論文リスト
- Sharp Convergence Rates of Empirical Unbalanced Optimal Transport for Spatio-Temporal Point Processes [0.0]
不均衡な最適輸送形式のための経験的プラグイン推定器を解析する。
実験的なカントロビッチ-ルビンシュタイン距離の最小値の最適値に近づいた。
論文 参考訳(メタデータ) (2025-09-04T13:55:01Z) - Exponential convergence rate for Iterative Markovian Fitting [58.760054965084656]
反復マルコフフィッティング(IMF)アルゴリズムは、基底真理解へのクルバック・リーバーの発散に収束する。
我々は、IMFが明示的な収縮係数を持つ指数収束を示すのを初めて確立する。
論文 参考訳(メタデータ) (2025-08-04T09:48:21Z) - Rates of Convergence in the Central Limit Theorem for Markov Chains, with an Application to TD Learning [9.989667515420898]
ベクトル値マーチンゲール差分に対して,スタイン法を用いて漸近的でない中心極限定理を証明した。
次に、これらの結果を用いて、平均化を伴う時間差分学習(TD)のための非漸近的中心極限定理を確立することができることを示す。
論文 参考訳(メタデータ) (2024-01-28T17:57:39Z) - Can Decentralized Stochastic Minimax Optimization Algorithms Converge
Linearly for Finite-Sum Nonconvex-Nonconcave Problems? [56.62372517641597]
分散化されたミニマックス最適化は、幅広い機械学習に応用されているため、ここ数年で活発に研究されている。
本稿では,非コンカブ問題に対する2つの新しい分散化ミニマックス最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-24T02:19:39Z) - Role of boundary conditions in the full counting statistics of
topological defects after crossing a continuous phase transition [62.997667081978825]
トポロジカル欠陥の統計学における境界条件の役割を解析する。
また, クイン数分布の累積は, クエンチ率に比例して普遍的なスケーリングを示すことを示した。
論文 参考訳(メタデータ) (2022-07-08T09:55:05Z) - Interplay between transport and quantum coherences in free fermionic
systems [58.720142291102135]
自由フェルミオン系のクエンチダイナミクスについて検討する。
特に,入力として定常電流の値をとり,出力として相関値を与えるEmphtransition Mapをダブする関数を同定する。
論文 参考訳(メタデータ) (2021-03-24T17:47:53Z) - On the Local Linear Rate of Consensus on the Stiefel Manifold [39.750623187256735]
我々は(連結でない問題に対して)シュティーフェル問題上のシュティーフェル勾配の性質の収束を制限する。
主な課題は、(i)分析のための技術を開発すること、(ii)常にローカルに留まっている状況(例えば、適切なステップサイズと、その下に常にローカルに留まっている状態)を特定することである。
論文 参考訳(メタデータ) (2021-01-22T21:52:38Z) - Distributed Saddle-Point Problems: Lower Bounds, Near-Optimal and Robust Algorithms [91.96505642426833]
本稿では,サドル点問題の分散最適化に着目する。
特に,本手法がGANを分散的に訓練する際の有効性を示す。
論文 参考訳(メタデータ) (2020-10-25T13:13:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。