論文の概要: Adaptive Off-Policy Inference for M-Estimators Under Model Misspecification
- arxiv url: http://arxiv.org/abs/2509.14218v1
- Date: Wed, 17 Sep 2025 17:51:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-18 18:41:50.945982
- Title: Adaptive Off-Policy Inference for M-Estimators Under Model Misspecification
- Title(参考訳): モデルミス種別下におけるM-Estimatorの適応的オフポリティ推論
- Authors: James Leiner, Robin Dunn, Aaditya Ramdas,
- Abstract要約: 本稿では,適応的に収集した帯域幅データを用いたM推定器の有効推定法を提案する。
この手法の主な要素は、適応データ収集によって誘導される分散を安定化するために、フレキシブルな機械学習アプローチを使用することである。
- 参考スコア(独自算出の注目度): 32.7750904494144
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: When data are collected adaptively, such as in bandit algorithms, classical statistical approaches such as ordinary least squares and $M$-estimation will often fail to achieve asymptotic normality. Although recent lines of work have modified the classical approaches to ensure valid inference on adaptively collected data, most of these works assume that the model is correctly specified. We propose a method that provides valid inference for M-estimators that use adaptively collected bandit data with a (possibly) misspecified working model. A key ingredient in our approach is the use of flexible machine learning approaches to stabilize the variance induced by adaptive data collection. A major novelty is that our procedure enables the construction of valid confidence sets even in settings where treatment policies are unstable and non-converging, such as when there is no unique optimal arm and standard bandit algorithms are used. Empirical results on semi-synthetic datasets constructed from the Osteoarthritis Initiative demonstrate that the method maintains type I error control, while existing methods for inference in adaptive settings do not cover in the misspecified case.
- Abstract(参考訳): バンディットアルゴリズムのようなデータを適応的に収集する場合、通常最小二乗法や$M$-estimationのような古典的な統計手法は漸近的正規性を達成するのに失敗する。
最近の研究の行は、適応的に収集されたデータに対する有効な推論を保証するために古典的なアプローチを変更しているが、ほとんどの研究はモデルが正しく特定されていると仮定している。
本稿では,適応的に収集した帯域幅データを(おそらく)不特定な作業モデルで推定する手法を提案する。
この手法の主な要素は、適応データ収集によって誘導される分散を安定化するために、フレキシブルな機械学習アプローチを使用することである。
処理方針が不安定で,一意の最適アームや標準バンディットアルゴリズムが使用されていないような非収束状態でも,有効な信頼セットの構築が可能であることが大きな特徴である。
変形性関節症イニシアチブから構築された半合成データセットの実証実験結果から, 適応的条件下での推論法は誤用しないが, タイプIの誤差制御は維持されていることが示された。
関連論文リスト
- Statistical Inference for Misspecified Contextual Bandits [6.178061357164435]
コンテキストバンディットアルゴリズムは、パーソナライズされた治療のためのリアルタイム適応を可能にすることで、近代的な実験を変革した。
しかし、これらの利点は適応性による統計的推測の課題を生み出す。
収束は適応実験の再現性とオンラインアルゴリズムの安定性を保証する。
論文 参考訳(メタデータ) (2025-09-08T02:19:37Z) - Conformal and kNN Predictive Uncertainty Quantification Algorithms in Metric Spaces [3.637162892228131]
オラクル推定器の有限サンプルカバレッジ保証と高速収束率を提供する共形予測アルゴリズムを開発した。
不整合性の設定では、統計的効率を得るためにこれらの非漸近性保証を強制する。
ランダム応答オブジェクトを含むパーソナライズ・メディカルアプリケーションにおいて,本手法の実用性を実証する。
論文 参考訳(メタデータ) (2025-07-21T15:54:13Z) - Noise-Adaptive Conformal Classification with Marginal Coverage [53.74125453366155]
本稿では,ランダムラベルノイズによる交換性からの偏差を効率的に処理できる適応型共形推論手法を提案する。
本手法は,合成および実データに対して,その有効性を示す広範囲な数値実験により検証する。
論文 参考訳(メタデータ) (2025-01-29T23:55:23Z) - Adaptive Conformal Inference by Betting [51.272991377903274]
データ生成プロセスについて仮定することなく適応型共形推論の問題を考察する。
適応型共形推論のための既存のアプローチは、オンライン勾配勾配の変種を用いたピンボール損失の最適化に基づいている。
本稿では,パラメータフリーなオンライン凸最適化手法を利用した適応型共形推論手法を提案する。
論文 参考訳(メタデータ) (2024-12-26T18:42:08Z) - Multi-model Ensemble Conformal Prediction in Dynamic Environments [14.188004615463742]
本稿では,複数の候補モデルから予測セットを作成するために使用されるモデルを選択する適応型共形予測フレームワークを提案する。
提案アルゴリズムは, 有効なカバレッジを維持しつつ, 全区間にわたる強い適応的後悔を達成できることが証明された。
論文 参考訳(メタデータ) (2024-11-06T05:57:28Z) - Efficient Conformal Prediction under Data Heterogeneity [79.35418041861327]
コンフォーマル予測(CP)は不確実性定量化のための頑健な枠組みである。
非交換性に対処するための既存のアプローチは、最も単純な例を超えて計算不可能なメソッドにつながる。
この研究は、比較的一般的な非交換可能なデータ分布に対して証明可能な信頼セットを生成する、CPに新しい効率的なアプローチを導入する。
論文 参考訳(メタデータ) (2023-12-25T20:02:51Z) - Statistical Inference After Adaptive Sampling for Longitudinal Data [9.468593929311867]
本研究では,Z推定による適応的なサンプルデータに対して,様々な統計的解析を行う新しい手法を開発した。
本研究は, 実験プロセスのための新しい理論ツールを開発し, 個別の関心を持つ可能性のある, 適応的にサンプル化された長手データについて述べる。
論文 参考訳(メタデータ) (2022-02-14T23:48:13Z) - Post-Contextual-Bandit Inference [57.88785630755165]
コンテキストバンディットアルゴリズムは、電子商取引、医療、政策立案における非適応的なA/Bテストを置き換える傾向にある。
研究参加者の成果を改善することもでき、良い方針や最良の政策を特定できる可能性を高めることもできる。
研究の終盤における新規介入の信頼性推論を支援するため, 平均治療効果, サブグループ効果, あるいは新政策の価値について, 有効な信頼区間を構築したい。
論文 参考訳(メタデータ) (2021-06-01T12:01:51Z) - Scalable Marginal Likelihood Estimation for Model Selection in Deep
Learning [78.83598532168256]
階層型モデル選択は、推定困難のため、ディープラーニングではほとんど使われない。
本研究は,検証データが利用できない場合,限界的可能性によって一般化が向上し,有用であることを示す。
論文 参考訳(メタデータ) (2021-04-11T09:50:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。