論文の概要: A lower confidence sequence for the changing mean of non-negative right
heavy-tailed observations with bounded mean
- arxiv url: http://arxiv.org/abs/2210.11133v1
- Date: Thu, 20 Oct 2022 09:50:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 13:58:05.227091
- Title: A lower confidence sequence for the changing mean of non-negative right
heavy-tailed observations with bounded mean
- Title(参考訳): 有界平均を持つ非負の右重み付き観測の変動平均に対する低信頼シーケンス
- Authors: Paul Mineiro
- Abstract要約: 信頼シーケンスは、時間パラメトリックカバレッジ保証付き予測可能なパラメータシーケンスに対する適応されたセット列を生成する。
この研究は、スラックが0に収束するランニング平均条件付き期待値に対して、漸近的でない低CSを構成する。
- 参考スコア(独自算出の注目度): 9.289846887298854
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A confidence sequence (CS) is an anytime-valid sequential inference primitive
which produces an adapted sequence of sets for a predictable parameter sequence
with a time-uniform coverage guarantee. This work constructs a non-parametric
non-asymptotic lower CS for the running average conditional expectation whose
slack converges to zero given non-negative right heavy-tailed observations with
bounded mean. Specifically, when the variance is finite the approach dominates
the empirical Bernstein supermartingale of Howard et. al.; with infinite
variance, can adapt to a known or unknown $(1 + \delta)$-th moment bound; and
can be efficiently approximated using a sublinear number of sufficient
statistics. In certain cases this lower CS can be converted into a
closed-interval CS whose width converges to zero, e.g., any bounded
realization, or post contextual-bandit inference with bounded rewards and
unbounded importance weights. A reference implementation and example
simulations demonstrate the technique.
- Abstract(参考訳): 信頼シーケンス(英語: confidence sequence, CS)は、時間一様カバレッジを保証する予測可能なパラメータ列に対する集合の適応シーケンスを生成する任意の値のシーケンシャル推論プリミティブである。
この研究は、非負の右重尾観測を有界平均でゼロに収束するランニング平均条件付き期待値に対して、非パラメトリック非漸近低CSを構築する。
具体的には、分散が有限であるとき、アプローチはハワードらの経験的ベルンシュタインスーパーマーチンゲールを支配する。
アル
無限分散により、既知のあるいは未知の$(1 + \delta)$-th モーメント境界に適応でき、十分な統計量のサブ線形数を用いて効率的に近似することができる。
あるケースでは、この低い cs は、幅がゼロに収束する閉インターバル cs に変換できる(例えば、任意の有界な実現や、有界な報酬と非有界な重要度重みを持つポスト・コンテクスト・バンディット推論)。
リファレンス実装とサンプルシミュレーションがこのテクニックを実証する。
関連論文リスト
- Understanding Stochastic Natural Gradient Variational Inference [12.800664845601197]
グローバル収束率$mathcalO(frac1)$は暗黙的にNGVIの非漸近収束率を示す。
速度は降下(ブラックボックス変分推論)よりも悪くなく、一定の依存性がある。
論文 参考訳(メタデータ) (2024-06-04T00:45:37Z) - Revisiting the Last-Iterate Convergence of Stochastic Gradient Methods [25.831462008050387]
グラディエント・Descent(SGD)アルゴリズムは、実際の性能が良く、理論的な理解が欠如していることから、人々の関心を喚起している。
有限収束がより広い合成最適化や非ユークリッドノルムに証明可能な拡張が可能かどうかはまだ不明である。
論文 参考訳(メタデータ) (2023-12-13T21:41:06Z) - Breaking the Heavy-Tailed Noise Barrier in Stochastic Optimization Problems [56.86067111855056]
構造密度の重み付き雑音によるクリップ最適化問題を考察する。
勾配が有限の順序モーメントを持つとき、$mathcalO(K-(alpha - 1)/alpha)$よりも高速な収束率が得られることを示す。
得られた推定値が無視可能なバイアスと制御可能な分散を持つことを示す。
論文 参考訳(メタデータ) (2023-11-07T17:39:17Z) - Almost-sure convergence of iterates and multipliers in stochastic
sequential quadratic optimization [21.022322975077653]
等式制約付き連続最適化問題の解法が近年注目されている。
収束保証は、ゼロを測定するための勾配の期待値に制限されている。
また,SQPアルゴリズムにより生成した予備値,ラグランジュ測度,ステーション測度に対する新たなほぼ収束保証を証明した。
論文 参考訳(メタデータ) (2023-08-07T16:03:40Z) - High-Probability Bounds for Stochastic Optimization and Variational
Inequalities: the Case of Unbounded Variance [59.211456992422136]
制約の少ない仮定の下で高確率収束結果のアルゴリズムを提案する。
これらの結果は、標準機能クラスに適合しない問題を最適化するために検討された手法の使用を正当化する。
論文 参考訳(メタデータ) (2023-02-02T10:37:23Z) - Stochastic Gradient Descent-Ascent and Consensus Optimization for Smooth
Games: Convergence Analysis under Expected Co-coercivity [49.66890309455787]
本稿では,SGDA と SCO の最終的な収束保証として,期待されるコヒーレンシティ条件を導入し,その利点を説明する。
定常的なステップサイズを用いた場合、両手法の線形収束性を解の近傍に証明する。
我々の収束保証は任意のサンプリングパラダイムの下で保たれ、ミニバッチの複雑さに関する洞察を与える。
論文 参考訳(メタデータ) (2021-06-30T18:32:46Z) - On the Convergence of Stochastic Extragradient for Bilinear Games with
Restarted Iteration Averaging [96.13485146617322]
本稿では, ステップサイズが一定であるSEG法の解析を行い, 良好な収束をもたらす手法のバリエーションを示す。
平均化で拡張した場合、SEGはナッシュ平衡に確実に収束し、スケジュールされた再起動手順を組み込むことで、その速度が確実に加速されることを証明した。
論文 参考訳(メタデータ) (2021-06-30T17:51:36Z) - Time-uniform central limit theory and asymptotic confidence sequences [34.00292366598841]
信頼シーケンス(CS)は任意の停止時間に有効な推論を提供し、データに対する「覗き見」に対する罰則を生じさせない。
CSは漸近的ではなく、有限サンプルの保証を楽しむが、上記の信頼区間の広範な適用性はない。
CLTのような汎用性と(漸近的な)時間一様保証に対する漸近的CSは非漸近的妥当性を否定する。
論文 参考訳(メタデータ) (2021-03-11T05:45:35Z) - Convergence Rates of Stochastic Gradient Descent under Infinite Noise
Variance [14.06947898164194]
ヘビーテールは様々なシナリオで勾配降下 (sgd) で現れる。
SGDの収束保証は、潜在的に無限のばらつきを持つ状態依存性および重尾ノイズ下で提供します。
その結果,SGDは無限に分散した重尾雑音下であっても,地球最適値に収束できることが示された。
論文 参考訳(メタデータ) (2021-02-20T13:45:11Z) - The Convergence Indicator: Improved and completely characterized
parameter bounds for actual convergence of Particle Swarm Optimization [68.8204255655161]
我々は、粒子が最終的に単一点に収束するか、分岐するかを計算するのに使用できる新しい収束指標を導入する。
この収束指標を用いて、収束群につながるパラメータ領域を完全に特徴づける実際の境界を提供する。
論文 参考訳(メタデータ) (2020-06-06T19:08:05Z) - On Linear Stochastic Approximation: Fine-grained Polyak-Ruppert and
Non-Asymptotic Concentration [115.1954841020189]
The inequality and non-asymptotic properties of approximation procedure with Polyak-Ruppert averaging。
一定のステップサイズと無限大となる反復数を持つ平均的反復数に対する中心極限定理(CLT)を証明する。
論文 参考訳(メタデータ) (2020-04-09T17:54:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。