論文の概要: Simulation-Based Inference for Adaptive Experiments
- arxiv url: http://arxiv.org/abs/2506.02881v1
- Date: Tue, 03 Jun 2025 13:46:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 01:42:09.422043
- Title: Simulation-Based Inference for Adaptive Experiments
- Title(参考訳): 適応実験のためのシミュレーションに基づく推論
- Authors: Brian M Cho, Aurélien Bibaut, Nathan Kallus,
- Abstract要約: マルチアームバンディットの実験的な設計は、標準的なランダム化試験よりもますます採用されている。
そこで本研究では,腕特定手段の仮説テストと信頼区間構築のためのシミュレーションに基づくアプローチを提案する。
以上の結果から,提案手法は,設計対象でない腕の大幅な改善を図りながら,信頼性区間幅を最大50%削減し,所望のカバレッジを達成できることが示唆された。
- 参考スコア(独自算出の注目度): 38.841210420855276
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-arm bandit experimental designs are increasingly being adopted over standard randomized trials due to their potential to improve outcomes for study participants, enable faster identification of the best-performing options, and/or enhance the precision of estimating key parameters. Current approaches for inference after adaptive sampling either rely on asymptotic normality under restricted experiment designs or underpowered martingale concentration inequalities that lead to weak power in practice. To bypass these limitations, we propose a simulation-based approach for conducting hypothesis tests and constructing confidence intervals for arm specific means and their differences. Our simulation-based approach uses positively biased nuisances to generate additional trajectories of the experiment, which we call \textit{simulation with optimism}. Using these simulations, we characterize the distribution potentially non-normal sample mean test statistic to conduct inference. We provide guarantees for (i) asymptotic type I error control, (ii) convergence of our confidence intervals, and (iii) asymptotic strong consistency of our estimator over a wide variety of common bandit designs. Our empirical results show that our approach achieves the desired coverage while reducing confidence interval widths by up to 50%, with drastic improvements for arms not targeted by the design.
- Abstract(参考訳): マルチアームバンディット実験の設計は、研究参加者の成績を改善し、最高のパフォーマンスの選択肢を素早く識別し、鍵パラメータを推定する精度を向上する可能性から、標準的なランダム化試験よりも採用されつつある。
適応サンプリング後の推論の現在のアプローチは、制限された実験設計の下での漸近正規性に依存するか、または実際には弱い出力をもたらす低出力なマルティンゲール濃度の不等式に依存する。
これらの制限を回避し、仮説テストを行い、腕特定手段の信頼区間を構築するためのシミュレーションベースのアプローチを提案する。
我々のシミュレーションに基づくアプローチでは、正に偏りのあるニュアンサーを用いて実験のさらなる軌跡を生成し、それを「楽観主義によるtextit{simulation with optimism} 」と呼ぶ。
これらのシミュレーションを用いて,非正規サンプル平均試験統計量の分布を推定する。
保証します
i) asymptotic type I error control
(二)信頼区間の収束、及び
3) 様々な共通バンディットデザインに対する推定器の漸近的な強い整合性。
以上の結果から,提案手法が望まれる範囲を最大50%減らすとともに,設計対象でない腕の大幅な改善を図った。
関連論文リスト
- Doubly-Robust Estimation of Counterfactual Policy Mean Embeddings [24.07815507403025]
反ファクトポリシーの下での成果の分配を推定することは、推薦、広告、医療といった領域における意思決定にとって重要である。
我々は、再生されたカーネルヒルベルト空間の反事実分布全体を表す新しいフレームワーク-Counterfactual Policy Mean Embedding (CPME) を解析する。
論文 参考訳(メタデータ) (2025-06-03T12:16:46Z) - Probabilistic Conformal Prediction with Approximate Conditional Validity [81.30551968980143]
本研究では,共形手法の柔軟性と条件分布の推定を組み合わせ,予測セットを生成する手法を開発した。
我々の手法は、条件付きカバレッジの観点から既存の手法よりも一貫して優れています。
論文 参考訳(メタデータ) (2024-07-01T20:44:48Z) - Model Free Prediction with Uncertainty Assessment [7.524024486998338]
そこで本研究では,深部推定パラダイムを条件付き平均推定を行うプラットフォームに変換する新しいフレームワークを提案する。
本研究では, 条件付き拡散モデルに対する終端収束率を開発し, 生成した試料の正規性を確立する。
数値実験により,提案手法の有効性を実証的に検証した。
論文 参考訳(メタデータ) (2024-05-21T11:19:50Z) - Near-Optimal Non-Parametric Sequential Tests and Confidence Sequences
with Possibly Dependent Observations [44.71254888821376]
我々は、一般的な非データ生成プロセスの下で、最初のタイプIエラーと予測リジェクション時間保証を提供する。
本研究では, 平均処理効果など, 方程式を推定することによって定義されるパラメータの推測に, 結果を適用する方法を示す。
論文 参考訳(メタデータ) (2022-12-29T18:37:08Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。