論文の概要: Linear Bandits with Non-i.i.d. Noise
- arxiv url: http://arxiv.org/abs/2505.20017v2
- Date: Tue, 27 May 2025 09:24:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 14:37:20.261046
- Title: Linear Bandits with Non-i.i.d. Noise
- Title(参考訳): 非i.d.雑音の線形帯域
- Authors: Baptiste Abélès, Eugenio Clerico, Hamish Flynn, Gergely Neu,
- Abstract要約: 本研究では,観測雑音に対する標準I.d.仮定を緩和し,線形帯域問題について検討する。
この制限的な仮定の代替として、ラウンド間のノイズ項はガウス的であるが相互依存的であることを許す。
不確実性に直面した楽観主義の原理に基づく帯域幅アルゴリズムを導出する。
- 参考スコア(独自算出の注目度): 8.937169040399775
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the linear stochastic bandit problem, relaxing the standard i.i.d. assumption on the observation noise. As an alternative to this restrictive assumption, we allow the noise terms across rounds to be sub-Gaussian but interdependent, with dependencies that decay over time. To address this setting, we develop new confidence sequences using a recently introduced reduction scheme to sequential probability assignment, and use these to derive a bandit algorithm based on the principle of optimism in the face of uncertainty. We provide regret bounds for the resulting algorithm, expressed in terms of the decay rate of the strength of dependence between observations. Among other results, we show that our bounds recover the standard rates up to a factor of the mixing time for geometrically mixing observation noise.
- Abstract(参考訳): 本研究では, 線形確率帯域問題について検討し, 観測雑音の標準的仮定を緩和する。
この制限的な仮定の代替として、ラウンド間のノイズ項はガウス的であるが依存的であり、時間とともに依存が減衰する。
この設定に対処するために、最近導入された逐次確率割当のための削減スキームを用いて新しい信頼度シーケンスを開発し、不確実性に直面した楽観主義の原理に基づく帯域幅アルゴリズムを導出する。
結果のアルゴリズムに対して,観測間の依存性の強度の減衰率で表現した後悔の限界を与える。
これらの結果から, 観測音を幾何混合するための混合時間の最大値まで, 基準値が回復できることが示唆された。
関連論文リスト
- Regularized least squares learning with heavy-tailed noise is minimax optimal [23.16162334363017]
本稿では,高次モーメントの再生回数が有限である雑音の存在下で,カーネルヒルベルト空間におけるリッジ回帰の性能について検討する。
我々は、よく知られた積分作用素の枠組みに基づいて、部分ガウス項と余剰項からなるリスク境界を確立する。
論文 参考訳(メタデータ) (2025-05-20T11:17:54Z) - Empirical Bound Information-Directed Sampling for Norm-Agnostic Bandits [0.0]
本稿では,アキュメレーションデータを用いて,真のパラメータノルム上の高確率上限を反復的に改善する,新しい頻繁なIDSアルゴリズムを提案する。
提案手法は,当初仮定されたパラメータノルム境界に依存しないアルゴリズムに対する後悔境界を確立し,その手法が最先端IDSおよびUPBアルゴリズムより優れていることを示す。
論文 参考訳(メタデータ) (2025-03-07T02:33:37Z) - Small steps no more: Global convergence of stochastic gradient bandits for arbitrary learning rates [61.091122503406304]
勾配帯域幅アルゴリズムは, 経験的定値学習率を用いて, ほぼ確実にグローバルな最適ポリシーに収束することを示す。
この結果は、標準の滑らかさと騒音制御の仮定が崩壊するシナリオにおいても、勾配アルゴリズムが適切な探索と利用のバランスを保ち続けていることを証明している。
論文 参考訳(メタデータ) (2025-02-11T00:12:04Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Breaking the Heavy-Tailed Noise Barrier in Stochastic Optimization Problems [56.86067111855056]
構造密度の重み付き雑音によるクリップ最適化問題を考察する。
勾配が有限の順序モーメントを持つとき、$mathcalO(K-(alpha - 1)/alpha)$よりも高速な収束率が得られることを示す。
得られた推定値が無視可能なバイアスと制御可能な分散を持つことを示す。
論文 参考訳(メタデータ) (2023-11-07T17:39:17Z) - Convergent regularization in inverse problems and linear plug-and-play
denoisers [3.759634359597638]
Plug-and-play () denoisingは、逆画像復号器を用いて画像の問題を解くための一般的なフレームワークである。
可算収束正則化スキームが証明収束正則化スキームであるかどうかというような測定におけるノイズレベルがゼロになるので、収束解の性質についてはあまり分かっていない。
線形デノイザでは、明らかに正則化関数に対するデノイザの暗黙的な正則化が収束正則化スキームにつながることを示す。
論文 参考訳(メタデータ) (2023-07-18T17:16:08Z) - Interpolation can hurt robust generalization even when there is no noise [76.3492338989419]
リッジの正規化による一般化の回避は,ノイズがなくても大幅に一般化できることを示す。
この現象は線形回帰と分類の両方のロバストなリスクを証明し、したがってロバストなオーバーフィッティングに関する最初の理論的結果を与える。
論文 参考訳(メタデータ) (2021-08-05T23:04:15Z) - Randomized benchmarking in the presence of time-correlated dephasing
noise [0.0]
典型的なランダム化されたベンチマーク手法は、ゲートのベンチマークシーケンスの長さが増加するにつれて、フィデリティの指数的崩壊を識別する。
しかし、忠実度は指数関数的に減衰するが、ゲート内の時間非依存または静的ノイズの仮定に依存する。
正確な偏差のメカニズムはまだ完全には解明されていない。
論文 参考訳(メタデータ) (2020-10-22T07:33:41Z) - Estimating means of bounded random variables by betting [39.98103047898974]
本稿では、境界観測から未知の平均を推定する古典的な問題に対して、信頼区間(CI)と時間一様信頼シーケンス(CS)を導出する。
本稿では,Chernoff法を一般化し改良したものと考えられる濃度境界を導出する一般手法を提案する。
我々は、これらのアイデアを、置換せずにサンプリングに拡張する方法を示し、また、非常に研究された問題である。
論文 参考訳(メタデータ) (2020-10-19T17:22:03Z) - Contextual Linear Bandits under Noisy Features: Towards Bayesian Oracles [65.9694455739978]
特徴不確実性の下での文脈線形帯域問題について検討する。
本分析により, 最適仮説は, 雑音特性に応じて, 基礎となる実現可能性関数から著しく逸脱しうることが明らかとなった。
これは、古典的アプローチが非自明な後悔境界を保証できないことを意味する。
論文 参考訳(メタデータ) (2017-03-03T21:39:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。