論文の概要: Statistical Inference under Adaptive Sampling with LinUCB
- arxiv url: http://arxiv.org/abs/2512.00222v1
- Date: Fri, 28 Nov 2025 21:48:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.119787
- Title: Statistical Inference under Adaptive Sampling with LinUCB
- Title(参考訳): LinUCBを用いた適応サンプリングによる統計的推測
- Authors: Wei Fan, Kevin Tan, Yuting Wei,
- Abstract要約: 線形帯域に対する線形上信頼境界(LinUCB)アルゴリズムは安定性という特性を満たすことを示す。
我々は、LinUCBアルゴリズムの中央極限定理を確立し、推定誤差の極限分布の正規性を確立する。
- 参考スコア(独自算出の注目度): 15.167069362020426
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adaptively collected data has become ubiquitous within modern practice. However, even seemingly benign adaptive sampling schemes can introduce severe biases, rendering traditional statistical inference tools inapplicable. This can be mitigated by a property called stability, which states that if the rate at which an algorithm takes actions converges to a deterministic limit, one can expect that certain parameters are asymptotically normal. Building on a recent line of work for the multi-armed bandit setting, we show that the linear upper confidence bound (LinUCB) algorithm for linear bandits satisfies this property. In doing so, we painstakingly characterize the behavior of the eigenvalues and eigenvectors of the random design feature covariance matrix in the setting where the action set is the unit ball, showing that it decomposes into a rank-one direction that locks onto the true parameter and an almost-isotropic bulk that grows at a predictable $\sqrt{T}$ rate. This allows us to establish a central limit theorem for the LinUCB algorithm, establishing asymptotic normality for the limiting distribution of the estimation error where the convergence occurs at a $T^{-1/4}$ rate. The resulting Wald-type confidence sets and hypothesis tests do not depend on the feature covariance matrix and are asymptotically tighter than existing nonasymptotic confidence sets. Numerical simulations corroborate our findings.
- Abstract(参考訳): 適応的に収集されたデータは、現代の実践の中でユビキタスになってきた。
しかし、一見した適応的なサンプリングスキームでさえ、深刻なバイアスを生じさせ、従来の統計的推論ツールを適用不可能にすることができる。
これは安定性と呼ばれる性質によって緩和され、アルゴリズムが作用を取る速度が決定論的極限に収束すると、あるパラメータが漸近的に正規であることが期待できる。
重武装バンディット設定のための最近の研究に基づいて、線形バンディットに対する線形上信頼度境界(LinUCB)アルゴリズムがこの性質を満たすことを示す。
そこで, ランダム設計特徴共分散行列の固有値と固有ベクトルの挙動を, アクションセットが単位球であるような設定で, 真のパラメータにロックするランク1方向と, 予測可能な$\sqrt{T}$レートで成長するほぼ等方的バルクに分解することを示す。
これにより、LinUCBアルゴリズムの中央極限定理を確立し、収束が$T^{-1/4}$レートで起こる推定誤差の極限分布に対する漸近正規性を確立することができる。
結果として得られるウォルド型の信頼集合と仮説テストは特徴共分散行列に依存しず、既存の漸近的信頼集合よりも漸近的に厳密である。
数値シミュレーションは我々の発見を裏付ける。
関連論文リスト
- Pointwise confidence estimation in the non-linear $\ell^2$-regularized least squares [12.352761060862072]
固定設計による $ell2$-regularized 非線形最小二乗集合の高確率非漸近信頼度推定について検討する。
つまり、任意の固定テスト入力に対して$x$の予測を保持することを意味する。
論文 参考訳(メタデータ) (2025-06-08T11:23:49Z) - C-Learner: Constrained Learning for Causal Inference [4.370964009390564]
本稿では,両世界の最適な重み付けを実現し,安定したプラグイン推定を実現する新しいデバイアス化手法を提案する。
我々の制約学習フレームワークは、プラグイン量に対する一階誤差がゼロであるという制約の下で、最高のプラグイン推定器を解く。
論文 参考訳(メタデータ) (2024-05-15T16:38:28Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Near-Optimal Non-Parametric Sequential Tests and Confidence Sequences
with Possibly Dependent Observations [44.71254888821376]
我々は、一般的な非データ生成プロセスの下で、最初のタイプIエラーと予測リジェクション時間保証を提供する。
本研究では, 平均処理効果など, 方程式を推定することによって定義されるパラメータの推測に, 結果を適用する方法を示す。
論文 参考訳(メタデータ) (2022-12-29T18:37:08Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - Benign Overfitting of Constant-Stepsize SGD for Linear Regression [122.70478935214128]
帰納バイアスは 経験的に過剰フィットを防げる中心的存在です
この研究は、この問題を最も基本的な設定として考慮している: 線形回帰に対する定数ステップサイズ SGD。
我々は、(正規化されていない)SGDで得られるアルゴリズム正則化と、通常の最小二乗よりも多くの顕著な違いを反映する。
論文 参考訳(メタデータ) (2021-03-23T17:15:53Z) - Amortized Conditional Normalized Maximum Likelihood: Reliable Out of
Distribution Uncertainty Estimation [99.92568326314667]
本研究では,不確実性推定のための拡張性のある汎用的アプローチとして,償却条件正規化最大値(ACNML)法を提案する。
提案アルゴリズムは条件付き正規化最大度(CNML)符号化方式に基づいており、最小記述長の原理に従って最小値の最適特性を持つ。
我々は、ACNMLが、分布外入力のキャリブレーションの観点から、不確実性推定のための多くの手法と好意的に比較することを示した。
論文 参考訳(メタデータ) (2020-11-05T08:04:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。