Fugu-MT 論文翻訳(概要): Efficient Inference after Directionally Stable Adaptive Experiments

論文の概要: Efficient Inference after Directionally Stable Adaptive Experiments

arxiv url: http://arxiv.org/abs/2602.21478v1
Date: Wed, 25 Feb 2026 01:09:18 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-26 18:19:16.662001
Title: Efficient Inference after Directionally Stable Adaptive Experiments
Title（参考訳）: 直進安定適応実験による効率的な推論
Authors: Zikai Shen, Houssam Zenati, Nathan Kallus, Arthur Gretton, Koulik Khamaru, Aurélien Bibaut,
Abstract要約: 本稿では,帯域幅などの適応データ収集後の経路微分可能な対象の推測について検討する。本稿では,従来の目標パラメトリック安定性条件よりも厳格に弱い,新たな目標固有条件である指向性安定性を導入する。
参考スコア（独自算出の注目度）: 47.32051320630248
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We study inference on scalar-valued pathwise differentiable targets after adaptive data collection, such as a bandit algorithm. We introduce a novel target-specific condition, directional stability, which is strictly weaker than previously imposed target-agnostic stability conditions. Under directional stability, we show that estimators that would have been efficient under i.i.d. data remain asymptotically normal and semiparametrically efficient when computed from adaptively collected trajectories. The canonical gradient has a martingale form, and directional stability guarantees stabilization of its predictable quadratic variation, enabling high-dimensional asymptotic normality. We characterize efficiency using a convolution theorem for the adaptive-data setting, and give a condition under which the one-step estimator attains the efficiency bound. We verify directional stability for LinUCB, yielding the first semiparametric efficiency guarantee for a regular scalar target under LinUCB sampling.
Abstract（参考訳）: 本稿では,帯域幅アルゴリズムなどの適応データ収集後のスカラー値と経路方向の微分可能なターゲットの推測について検討する。本稿では,従来の目標非依存安定性条件よりも厳格に弱い,新たな目標固有条件である指向性安定性を導入する。向きの安定性の下では、適応的に収集された軌道から計算すると、データの下で効率的であった推定器は漸近的に正常で半パラメトリックに効率的であることが示される。正準勾配はマーチンゲール形式を持ち、方向安定性は予測可能な二次変動の安定化を保証し、高次元の漸近正規性を可能にする。適応データ設定のための畳み込み定理を用いて効率を特徴づけ、一段階推定器が効率境界に達する条件を与える。我々はLinUCBの方向安定性を検証し、LinUCBサンプリングにおいて正規スカラーターゲットに対する最初の半パラメトリック効率を保証する。

関連論文リスト

Not All Preferences Are Created Equal: Stability-Aware and Gradient-Efficient Alignment for Reasoning Models [52.48582333951919]
ポリシー更新の信号対雑音比を最大化することにより、アライメントの信頼性を高めるために設計された動的フレームワークを提案する。 SAGE(Stability-Aware Gradient Efficiency)は、モデル能力に基づいて候補プールをリフレッシュする粗いきめ細かいカリキュラムメカニズムを統合する。複数の数学的推論ベンチマークの実験により、SAGEは収束を著しく加速し、静的ベースラインを上回っていることが示された。
論文参考訳（メタデータ） (2026-02-01T12:56:10Z)
Bounded Hyperbolic Tangent: A Stable and Efficient Alternative to Pre-Layer Normalization in Large Language Models [20.802982614533615]
我々は,Pre-LNのドロップイン代替として,BHyT(Bunded Hyperbolic Tanh)を提案する。 BHyTは、非飽和領域内での活性化を維持するために、明示的でデータ駆動の入力バウンディングと接な非線形性を結合する。 RMSNormに比べて平均15.8%高速なトレーニングと平均4.2%高いトークン生成スループットを実現している。
論文参考訳（メタデータ） (2025-12-26T06:22:13Z)
Statistical Inference under Adaptive Sampling with LinUCB [15.167069362020426]
線形帯域に対する線形上信頼境界(LinUCB)アルゴリズムは安定性という特性を満たすことを示す。我々は、LinUCBアルゴリズムの中央極限定理を確立し、推定誤差の極限分布の正規性を確立する。
論文参考訳（メタデータ） (2025-11-28T21:48:18Z)
Kernel Treatment Effects with Adaptively Collected Data [23.3862001690226]
本稿では,適応データ収集における分散推論のための最初のカーネルベース推論フレームワークを提案する。本手法は,Hilbert-space Martingale CLTによる2つの頑健なスコアと分散安定化を組み合わせることで,正規性を確保する。実験により、平均シフトとより高いモーメント差の両方に有効かつ効果的であることが示されている。
論文参考訳（メタデータ） (2025-10-11T15:01:21Z)
Efficient Adaptive Experimentation with Noncompliance [37.85201197349216]
本研究では, 適応実験における平均治療効果 (ATE) の推定問題について検討する。半パラメトリック効率理論に基づいて、任意の履歴に依存した機器割り当てポリシーの下で、ATE推定のための効率境界を導出する。結果ノイズとコンプライアンス変数のバランスをとる分散アロケーションルールによって最小化できることを示す。
論文参考訳（メタデータ） (2025-05-23T04:49:14Z)
Statistical Inference for Temporal Difference Learning with Linear Function Approximation [55.80276145563105]
The statistics properties of Temporal difference learning with Polyak-Ruppert averaging。 3つの理論的な貢献により、現在の最先端の成果が向上する。
論文参考訳（メタデータ） (2024-10-21T15:34:44Z)
Trust-Region Sequential Quadratic Programming for Stochastic Optimization with Random Models [57.52124921268249]
本稿では,1次と2次の両方の定常点を見つけるための信頼逐次準計画法を提案する。本手法は, 1次定常点に収束するため, 対象対象の近似を最小化して定義された各イテレーションの勾配ステップを計算する。 2階定常点に収束するため,本手法は負曲率を減少するヘッセン行列を探索する固有ステップも計算する。
論文参考訳（メタデータ） (2024-09-24T04:39:47Z)
Integrated path stability selection [5.263910852465186]
本稿では,安定性を最大化するのではなく,安定経路の統合に基づく新しい安定性選択手法を提案する。これにより、以前の境界よりもはるかに強いE(FP)上の上限が得られ、同じターゲットE(FP)に対して実際よりもはるかに真の正の値が得られる。
論文参考訳（メタデータ） (2024-03-23T15:55:52Z)
Fully Stochastic Trust-Region Sequential Quadratic Programming for Equality-Constrained Optimization Problems [62.83783246648714]
目的と決定論的等式制約による非線形最適化問題を解くために,逐次2次プログラミングアルゴリズム(TR-StoSQP)を提案する。アルゴリズムは信頼領域半径を適応的に選択し、既存の直線探索StoSQP方式と比較して不確定なヘッセン行列を利用することができる。
論文参考訳（メタデータ） (2022-11-29T05:52:17Z)
On the Convergence of Stochastic Extragradient for Bilinear Games with Restarted Iteration Averaging [96.13485146617322]
本稿では, ステップサイズが一定であるSEG法の解析を行い, 良好な収束をもたらす手法のバリエーションを示す。平均化で拡張した場合、SEGはナッシュ平衡に確実に収束し、スケジュールされた再起動手順を組み込むことで、その速度が確実に加速されることを証明した。
論文参考訳（メタデータ） (2021-06-30T17:51:36Z)
Fine-Grained Analysis of Stability and Generalization for Stochastic Gradient Descent [55.85456985750134]
我々は,SGDの反復的リスクによって制御される新しい境界を開発する,平均モデル安定性と呼ばれる新しい安定性尺度を導入する。これにより、最良のモデルの振舞いによって一般化境界が得られ、低雑音環境における最初の既知の高速境界が導かれる。我々の知る限りでは、このことはSGDの微分不能な損失関数でさえも初めて知られている安定性と一般化を与える。
論文参考訳（メタデータ） (2020-06-15T06:30:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。