論文の概要: Efficient Inference after Directionally Stable Adaptive Experiments
- arxiv url: http://arxiv.org/abs/2602.21478v1
- Date: Wed, 25 Feb 2026 01:09:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-26 18:19:16.662001
- Title: Efficient Inference after Directionally Stable Adaptive Experiments
- Title(参考訳): 直進安定適応実験による効率的な推論
- Authors: Zikai Shen, Houssam Zenati, Nathan Kallus, Arthur Gretton, Koulik Khamaru, Aurélien Bibaut,
- Abstract要約: 本稿では,帯域幅などの適応データ収集後の経路微分可能な対象の推測について検討する。
本稿では,従来の目標パラメトリック安定性条件よりも厳格に弱い,新たな目標固有条件である指向性安定性を導入する。
- 参考スコア(独自算出の注目度): 47.32051320630248
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study inference on scalar-valued pathwise differentiable targets after adaptive data collection, such as a bandit algorithm. We introduce a novel target-specific condition, directional stability, which is strictly weaker than previously imposed target-agnostic stability conditions. Under directional stability, we show that estimators that would have been efficient under i.i.d. data remain asymptotically normal and semiparametrically efficient when computed from adaptively collected trajectories. The canonical gradient has a martingale form, and directional stability guarantees stabilization of its predictable quadratic variation, enabling high-dimensional asymptotic normality. We characterize efficiency using a convolution theorem for the adaptive-data setting, and give a condition under which the one-step estimator attains the efficiency bound. We verify directional stability for LinUCB, yielding the first semiparametric efficiency guarantee for a regular scalar target under LinUCB sampling.
- Abstract(参考訳): 本稿では,帯域幅アルゴリズムなどの適応データ収集後のスカラー値と経路方向の微分可能なターゲットの推測について検討する。
本稿では,従来の目標非依存安定性条件よりも厳格に弱い,新たな目標固有条件である指向性安定性を導入する。
向きの安定性の下では、適応的に収集された軌道から計算すると、データの下で効率的であった推定器は漸近的に正常で半パラメトリックに効率的であることが示される。
正準勾配はマーチンゲール形式を持ち、方向安定性は予測可能な二次変動の安定化を保証し、高次元の漸近正規性を可能にする。
適応データ設定のための畳み込み定理を用いて効率を特徴づけ、一段階推定器が効率境界に達する条件を与える。
我々はLinUCBの方向安定性を検証し、LinUCBサンプリングにおいて正規スカラーターゲットに対する最初の半パラメトリック効率を保証する。
関連論文リスト
- Not All Preferences Are Created Equal: Stability-Aware and Gradient-Efficient Alignment for Reasoning Models [52.48582333951919]
ポリシー更新の信号対雑音比を最大化することにより、アライメントの信頼性を高めるために設計された動的フレームワークを提案する。
SAGE(Stability-Aware Gradient Efficiency)は、モデル能力に基づいて候補プールをリフレッシュする粗いきめ細かいカリキュラムメカニズムを統合する。
複数の数学的推論ベンチマークの実験により、SAGEは収束を著しく加速し、静的ベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-02-01T12:56:10Z) - Bounded Hyperbolic Tangent: A Stable and Efficient Alternative to Pre-Layer Normalization in Large Language Models [20.802982614533615]
我々は,Pre-LNのドロップイン代替として,BHyT(Bunded Hyperbolic Tanh)を提案する。
BHyTは、非飽和領域内での活性化を維持するために、明示的でデータ駆動の入力バウンディングと接な非線形性を結合する。
RMSNormに比べて平均15.8%高速なトレーニングと平均4.2%高いトークン生成スループットを実現している。
論文 参考訳(メタデータ) (2025-12-26T06:22:13Z) - Statistical Inference under Adaptive Sampling with LinUCB [15.167069362020426]
線形帯域に対する線形上信頼境界(LinUCB)アルゴリズムは安定性という特性を満たすことを示す。
我々は、LinUCBアルゴリズムの中央極限定理を確立し、推定誤差の極限分布の正規性を確立する。
論文 参考訳(メタデータ) (2025-11-28T21:48:18Z) - Efficient Adaptive Experimentation with Noncompliance [37.85201197349216]
本研究では, 適応実験における平均治療効果 (ATE) の推定問題について検討する。
半パラメトリック効率理論に基づいて、任意の履歴に依存した機器割り当てポリシーの下で、ATE推定のための効率境界を導出する。
結果ノイズとコンプライアンス変数のバランスをとる分散アロケーションルールによって最小化できることを示す。
論文 参考訳(メタデータ) (2025-05-23T04:49:14Z) - Statistical Inference for Temporal Difference Learning with Linear Function Approximation [55.80276145563105]
The statistics properties of Temporal difference learning with Polyak-Ruppert averaging。
3つの理論的な貢献により、現在の最先端の成果が向上する。
論文 参考訳(メタデータ) (2024-10-21T15:34:44Z) - Integrated path stability selection [5.263910852465186]
本稿では,安定性を最大化するのではなく,安定経路の統合に基づく新しい安定性選択手法を提案する。
これにより、以前の境界よりもはるかに強いE(FP)上の上限が得られ、同じターゲットE(FP)に対して実際よりもはるかに真の正の値が得られる。
論文 参考訳(メタデータ) (2024-03-23T15:55:52Z) - Fine-Grained Analysis of Stability and Generalization for Stochastic
Gradient Descent [55.85456985750134]
我々は,SGDの反復的リスクによって制御される新しい境界を開発する,平均モデル安定性と呼ばれる新しい安定性尺度を導入する。
これにより、最良のモデルの振舞いによって一般化境界が得られ、低雑音環境における最初の既知の高速境界が導かれる。
我々の知る限りでは、このことはSGDの微分不能な損失関数でさえも初めて知られている安定性と一般化を与える。
論文 参考訳(メタデータ) (2020-06-15T06:30:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。