論文の概要: Minimax and Bayes Optimal Adaptive Experimental Design for Treatment Choice
- arxiv url: http://arxiv.org/abs/2512.08513v1
- Date: Tue, 09 Dec 2025 11:58:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.945312
- Title: Minimax and Bayes Optimal Adaptive Experimental Design for Treatment Choice
- Title(参考訳): 治療選択のためのミニマックスとベイズ最適適応実験設計
- Authors: Masahiro Kato,
- Abstract要約: 治療選択のための適応実験を考察し, 後悔に対する最小限の適応実験とベイズ最適適応実験を設計する。
この実験は、しばしばネイマン割当と呼ばれ、その後悔の上界が我々が導いた下界と正確に一致するという意味で、ミニマックスかつベイズ最適であることを示す。
- 参考スコア(独自算出の注目度): 6.44705221140412
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We consider an adaptive experiment for treatment choice and design a minimax and Bayes optimal adaptive experiment with respect to regret. Given binary treatments, the experimenter's goal is to choose the treatment with the highest expected outcome through an adaptive experiment, in order to maximize welfare. We consider adaptive experiments that consist of two phases, the treatment allocation phase and the treatment choice phase. The experiment starts with the treatment allocation phase, where the experimenter allocates treatments to experimental subjects to gather observations. During this phase, the experimenter can adaptively update the allocation probabilities using the observations obtained in the experiment. After the allocation phase, the experimenter proceeds to the treatment choice phase, where one of the treatments is selected as the best. For this adaptive experimental procedure, we propose an adaptive experiment that splits the treatment allocation phase into two stages, where we first estimate the standard deviations and then allocate each treatment proportionally to its standard deviation. We show that this experiment, often referred to as Neyman allocation, is minimax and Bayes optimal in the sense that its regret upper bounds exactly match the lower bounds that we derive. To show this optimality, we derive minimax and Bayes lower bounds for the regret using change-of-measure arguments. Then, we evaluate the corresponding upper bounds using the central limit theorem and large deviation bounds.
- Abstract(参考訳): 治療選択のための適応実験を考察し, 後悔に対する最小限の適応実験とベイズ最適適応実験を設計する。
二元的治療が与えられた場合、実験者の目標は、福祉を最大化するために、適応的な実験を通して、最も期待された結果による治療を選択することである。
本稿では, 治療選択相と治療選択相の2つの相からなる適応実験について考察する。
実験は治療割り当てフェーズから始まり、実験者は実験対象に治療を割り当て、観察を収集する。
この段階で、実験者は、実験で得られた観測を用いて割り当て確率を適応的に更新することができる。
割り当てフェーズ後、実験者は治療選択フェーズに進み、治療のうちの1つがベストに選択される。
この適応的な実験手法として, 処理割り当てフェーズを2段階に分割し, まず標準偏差を推定し, その標準偏差に比例して各処理を割り当てる適応実験を提案する。
この実験は、しばしばネイマン割当と呼ばれ、その後悔の上界が我々が導いた下界と正確に一致するという意味で、ミニマックスかつベイズ最適であることを示す。
この最適性を示すために、最小値とベイズの下限を測度の変化論を用いて導出する。
次に、中心極限定理と大きな偏差境界を用いて対応する上界を評価する。
関連論文リスト
- Minimax and Bayes Optimal Best-Arm Identification [6.44705221140412]
サンプリングフェーズとレコメンデーションフェーズからなる適応的な手順を検討する。
提案した戦略では,サンプリングフェーズは2段階で構成され,第1段階はパイロットフェーズであり,各アームを等比で均一に割り当てる。
サンプリングフェーズの後、推奨フェーズに入り、最も高いサンプル平均の腕をベストアームの推定値として選択する。
論文 参考訳(メタデータ) (2025-06-30T16:11:44Z) - Prediction-Powered Causal Inferences [59.98498488132307]
予測型因果推論(PPCI)に焦点をあてる
まず, 条件付きキャリブレーションにより, 人口レベルでの有効なPPCIが保証されることを示す。
次に、実験間での十分な表現制約伝達の妥当性を導入する。
論文 参考訳(メタデータ) (2025-02-10T10:52:17Z) - Adaptive Experimentation When You Can't Experiment [55.86593195947978]
本稿では,Emphcon founded the pure exploration transductive linear bandit (textttCPET-LB) problem。
オンラインサービスは、ユーザーを特定の治療にインセンティブを与える、適切にランダム化された励ましを利用することができる。
論文 参考訳(メタデータ) (2024-06-15T20:54:48Z) - Demistifying Inference after Adaptive Experiments [43.653628046172656]
マルチアームバンディットのような適応的な実験は、治療-割り当てポリシーに適応し、または、これまで観察されたデータに実験を停止する決定を下す。
適応的な実験アルゴリズムを一般的に満たさない濃度不等式と結合境界は、過度に保守的な推論をもたらす。
本稿では、なぜ、どのように、どのように、いつ適応性が推論の問題であるのか、そして、それがいつ、その修正方法を理解するのかを説明します。
論文 参考訳(メタデータ) (2024-05-02T13:39:51Z) - Active Adaptive Experimental Design for Treatment Effect Estimation with Covariate Choices [7.21848268647674]
本研究では,平均治療効果(ATE)を効率的に推定するための適応実験を設計する。
適応実験の各ラウンドでは、実験者が実験ユニットをサンプリングし、治療を割り当て、その結果を直ちに観察する。
実験の最後に、実験者は収集されたサンプルを用いてATEを推定する。
論文 参考訳(メタデータ) (2024-03-06T10:24:44Z) - Adaptive Instrument Design for Indirect Experiments [48.815194906471405]
RCTとは異なり、間接的な実験は条件付き機器変数を利用して治療効果を推定する。
本稿では,データ収集ポリシーを適応的に設計することで,間接実験におけるサンプル効率の向上に向けた最初のステップについて述べる。
我々の主な貢献は、影響関数を利用して最適なデータ収集ポリシーを探索する実用的な計算手順である。
論文 参考訳(メタデータ) (2023-12-05T02:38:04Z) - Choosing a Proxy Metric from Past Experiments [54.338884612982405]
多くのランダム化実験では、長期的な計量の処理効果は測定が困難または不可能であることが多い。
一般的な方法は、いくつかの短期的プロキシメトリクスを計測して、長期的メトリックを綿密に追跡することである。
ランダム化実験の同種集団において最適なプロキシメトリックを定義し構築するための新しい統計フレームワークを導入する。
論文 参考訳(メタデータ) (2023-09-14T17:43:02Z) - Optimal Experimental Design for Staggered Rollouts [11.187415608299075]
本研究は, 治療開始時刻が単位によって異なる複数時間にわたって, 一連の単位に対して実施した実験の設計と解析について検討する。
本稿では,設計段階と治療効果を推定する段階の課題に対処するアルゴリズムとして,精度誘導適応実験(PGAE)を提案する。
論文 参考訳(メタデータ) (2019-11-09T19:46:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。