Fugu-MT 論文翻訳(概要): Simulation-Based Inference for Adaptive Experiments

論文の概要: Simulation-Based Inference for Adaptive Experiments

arxiv url: http://arxiv.org/abs/2506.02881v1
Date: Tue, 03 Jun 2025 13:46:59 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-05 01:42:09.422043
Title: Simulation-Based Inference for Adaptive Experiments
Title（参考訳）: 適応実験のためのシミュレーションに基づく推論
Authors: Brian M Cho, Aurélien Bibaut, Nathan Kallus,
Abstract要約: マルチアームバンディットの実験的な設計は、標準的なランダム化試験よりもますます採用されている。そこで本研究では,腕特定手段の仮説テストと信頼区間構築のためのシミュレーションに基づくアプローチを提案する。以上の結果から,提案手法は,設計対象でない腕の大幅な改善を図りながら,信頼性区間幅を最大50%削減し,所望のカバレッジを達成できることが示唆された。
参考スコア（独自算出の注目度）: 38.841210420855276
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Multi-arm bandit experimental designs are increasingly being adopted over standard randomized trials due to their potential to improve outcomes for study participants, enable faster identification of the best-performing options, and/or enhance the precision of estimating key parameters. Current approaches for inference after adaptive sampling either rely on asymptotic normality under restricted experiment designs or underpowered martingale concentration inequalities that lead to weak power in practice. To bypass these limitations, we propose a simulation-based approach for conducting hypothesis tests and constructing confidence intervals for arm specific means and their differences. Our simulation-based approach uses positively biased nuisances to generate additional trajectories of the experiment, which we call \textit{simulation with optimism}. Using these simulations, we characterize the distribution potentially non-normal sample mean test statistic to conduct inference. We provide guarantees for (i) asymptotic type I error control, (ii) convergence of our confidence intervals, and (iii) asymptotic strong consistency of our estimator over a wide variety of common bandit designs. Our empirical results show that our approach achieves the desired coverage while reducing confidence interval widths by up to 50%, with drastic improvements for arms not targeted by the design.
Abstract（参考訳）: マルチアームバンディット実験の設計は、研究参加者の成績を改善し、最高のパフォーマンスの選択肢を素早く識別し、鍵パラメータを推定する精度を向上する可能性から、標準的なランダム化試験よりも採用されつつある。適応サンプリング後の推論の現在のアプローチは、制限された実験設計の下での漸近正規性に依存するか、または実際には弱い出力をもたらす低出力なマルティンゲール濃度の不等式に依存する。これらの制限を回避し、仮説テストを行い、腕特定手段の信頼区間を構築するためのシミュレーションベースのアプローチを提案する。我々のシミュレーションに基づくアプローチでは、正に偏りのあるニュアンサーを用いて実験のさらなる軌跡を生成し、それを「楽観主義によるtextit{simulation with optimism} 」と呼ぶ。これらのシミュレーションを用いて,非正規サンプル平均試験統計量の分布を推定する。保証します i) asymptotic type I error control (二)信頼区間の収束、及び 3) 様々な共通バンディットデザインに対する推定器の漸近的な強い整合性。以上の結果から,提案手法が望まれる範囲を最大50%減らすとともに,設計対象でない腕の大幅な改善を図った。

関連論文リスト

Doubly-Robust Estimation of Counterfactual Policy Mean Embeddings [24.07815507403025]
反ファクトポリシーの下での成果の分配を推定することは、推薦、広告、医療といった領域における意思決定にとって重要である。我々は、再生されたカーネルヒルベルト空間の反事実分布全体を表す新しいフレームワーク-Counterfactual Policy Mean Embedding (CPME) を解析する。
論文参考訳（メタデータ） (2025-06-03T12:16:46Z)
Statistical Inference for Temporal Difference Learning with Linear Function Approximation [62.69448336714418]
The statistics properties of Temporal difference learning with Polyak-Ruppert averaging。現在の最先端の成果を改善するために,3つの重要なコントリビューションを行います。
論文参考訳（メタデータ） (2024-10-21T15:34:44Z)
Probabilistic Conformal Prediction with Approximate Conditional Validity [81.30551968980143]
本研究では,共形手法の柔軟性と条件分布の推定を組み合わせ,予測セットを生成する手法を開発した。我々の手法は、条件付きカバレッジの観点から既存の手法よりも一貫して優れています。
論文参考訳（メタデータ） (2024-07-01T20:44:48Z)
Model Free Prediction with Uncertainty Assessment [7.524024486998338]
そこで本研究では,深部推定パラダイムを条件付き平均推定を行うプラットフォームに変換する新しいフレームワークを提案する。本研究では, 条件付き拡散モデルに対する終端収束率を開発し, 生成した試料の正規性を確立する。数値実験により,提案手法の有効性を実証的に検証した。
論文参考訳（メタデータ） (2024-05-21T11:19:50Z)
Non-Convex Robust Hypothesis Testing using Sinkhorn Uncertainty Sets [18.46110328123008]
非破壊仮説テスト問題に対処する新しい枠組みを提案する。目標は、最大数値リスクを最小限に抑える最適な検出器を探すことである。
論文参考訳（メタデータ） (2024-03-21T20:29:43Z)
Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。本手法は, 精度の高い問題に特に適している。提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文参考訳（メタデータ） (2023-11-08T00:10:21Z)
Communication-Efficient Distributed Estimation and Inference for Cox's Model [4.731404257629232]
我々は, 高次元のスパースコックス比例ハザードモデルにおいて, 推定と推定のための通信効率のよい反復分散アルゴリズムを開発した。高次元ハザード回帰係数の線形結合に対する信頼区間を構築するために,新しい縮退法を提案する。我々は、デコラートスコアテストに基づく任意の座標要素に対して、有効かつ強力な分散仮説テストを提供する。
論文参考訳（メタデータ） (2023-02-23T15:50:17Z)
Near-Optimal Non-Parametric Sequential Tests and Confidence Sequences with Possibly Dependent Observations [44.71254888821376]
我々は、一般的な非データ生成プロセスの下で、最初のタイプIエラーと予測リジェクション時間保証を提供する。本研究では, 平均処理効果など, 方程式を推定することによって定義されるパラメータの推測に, 結果を適用する方法を示す。
論文参考訳（メタデータ） (2022-12-29T18:37:08Z)
Trustworthy Multimodal Regression with Mixture of Normal-inverse Gamma Distributions [91.63716984911278]
このアルゴリズムは、異なるモードの適応的統合の原理における不確かさを効率的に推定し、信頼できる回帰結果を生成する。実世界のデータと実世界のデータの両方に対する実験結果から,多モード回帰タスクにおける本手法の有効性と信頼性が示された。
論文参考訳（メタデータ） (2021-11-11T14:28:12Z)
Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文参考訳（メタデータ） (2021-07-05T21:05:11Z)
Asymptotics of the Empirical Bootstrap Method Beyond Asymptotic Normality [25.402400996745058]
実験的なブートストラップ推定器の限界分布は, 安定条件下では一定であることを示す。本稿では,ブートストラップ法を用いて,カバレッジ保証付き信頼区間を構築するための3つの方法を提案する。
論文参考訳（メタデータ） (2020-11-23T07:14:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。