論文の概要: A Closed-Form Upper Bound for Admissible Learning-Rate Steps in Belief-Space Dynamics
- arxiv url: http://arxiv.org/abs/2605.06741v1
- Date: Thu, 07 May 2026 14:28:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.504287
- Title: A Closed-Form Upper Bound for Admissible Learning-Rate Steps in Belief-Space Dynamics
- Title(参考訳): 空間力学における許容学習段階の閉形式上界
- Authors: Zixi Li, Youzhen Li,
- Abstract要約: 許容段階の上界は調律スローガンではなく公式である。
本稿では, 局所的信念空間の計算を分離し, 更新を確率的単純性上の投影された前進ステップとしてモデル化する場合, 許容性は自然なKL/ブレグマン幾何学における収縮性を意味する。
- 参考スコア(独自算出の注目度): 0.13750624267664155
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning-rate steps are usually treated as hyperparameters. This paper isolates a local beliefspace calculation: when an update is modeled as a projected forward step on the probability simplex, admissibility means contractivity in the natural KL/Bregman geometry. Under this model, the upper bound of an admissible step is not a tuning slogan but a formula.
- Abstract(参考訳): 学習速度のステップは通常、ハイパーパラメータとして扱われる。
本稿では, 局所的信念空間の計算を分離し, 更新を確率的単純性上の投影された前進ステップとしてモデル化する場合, 許容性は自然なKL/ブレグマン幾何学における収縮性を意味する。
このモデルの下では、許容されるステップの上界はチューニングスローガンではなく公式である。
関連論文リスト
- Empirical Likelihood for Nonsmooth Functionals [6.136848014288507]
経験的可能性(英語: Empirical chance)は、自然界を尊重する魅力的な推論の枠組みである。
既存のアプローチでは、これらの仮定が破られたとき、機能的および誤校正のスムーズさが要求される。
部分的非平滑関数に対するブートストラップ法を開発した。
論文 参考訳(メタデータ) (2026-03-29T15:51:37Z) - On the Convergence of Gradient Descent for Large Learning Rates [55.33626480243135]
固定ステップサイズを使用すると収束が不可能であることを示す。
正方形損失を持つ線形ニューラルネットワークの場合,これを証明した。
また、勾配に対するリプシッツ連続性のような強い仮定を必要とせず、より一般的な損失に対する収束の不可能性も証明する。
論文 参考訳(メタデータ) (2024-02-20T16:01:42Z) - Bridging Discrete and Backpropagation: Straight-Through and Beyond [62.46558842476455]
本稿では,離散潜在変数の生成に関わるパラメータの勾配を近似する新しい手法を提案する。
本稿では,Hunの手法とODEを解くための2次数値法を統合することで,2次精度を実現するReinMaxを提案する。
論文 参考訳(メタデータ) (2023-04-17T20:59:49Z) - SGD with AdaGrad Stepsizes: Full Adaptivity with High Probability to
Unknown Parameters, Unbounded Gradients and Affine Variance [33.593203156666746]
本稿では,AdaGradが一階最適化のための適応(自己調整)手法を段階化することを示す。
低ノイズと高レジの両方で、低ノイズと高レジの両方で急激な収束率を見出す。
論文 参考訳(メタデータ) (2023-02-17T09:46:08Z) - Beyond the Edge of Stability via Two-step Gradient Updates [49.03389279816152]
Gradient Descent(GD)は、現代の機械学習の強力な仕事場である。
GDが局所最小値を見つける能力は、リプシッツ勾配の損失に対してのみ保証される。
この研究は、2段階の勾配更新の分析を通じて、単純だが代表的でありながら、学習上の問題に焦点をあてる。
論文 参考訳(メタデータ) (2022-06-08T21:32:50Z) - Posterior Coreset Construction with Kernelized Stein Discrepancy for
Model-Based Reinforcement Learning [78.30395044401321]
我々は、強化学習(MBRL)のための新しいモデルベースアプローチを開発する。
ターゲット遷移モデルの仮定を緩和し、混合モデルの一般的な族に属する。
連続的な制御環境では、壁時計の時間を最大50%削減することができる。
論文 参考訳(メタデータ) (2022-06-02T17:27:49Z) - Agnostic Physics-Driven Deep Learning [82.89993762912795]
この研究は、物理系が勾配計算を使わずに統計的勾配学習を行えることを証明している。
Aeqpropでは、システムの詳細を知る必要はなく、プロシージャは外部操作に基づいている。
Aeqpropはまた、自然(生物)物理系において、真の勾配に基づく統計学習は、一般的な比較的単純なメカニズムによってもたらされることを証明している。
論文 参考訳(メタデータ) (2022-05-30T12:02:53Z) - Statistical Inference for Polyak-Ruppert Averaged Zeroth-order
Stochastic Gradient Algorithm [10.936043362876651]
過去10年間、複数の機械学習モデルにおける推定やトレーニングは、勾配アルゴリズムの実行と同義語になってきた。
まず、ゼロ次設定でPolyak-Ruppert平均勾配アルゴリズムの中心限界を確立する。
論文 参考訳(メタデータ) (2021-02-10T00:47:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。