論文の概要: Optimizing Adaptive Experiments: A Unified Approach to Regret Minimization and Best-Arm Identification
- arxiv url: http://arxiv.org/abs/2402.10592v2
- Date: Tue, 30 Jul 2024 08:48:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-31 22:15:57.094885
- Title: Optimizing Adaptive Experiments: A Unified Approach to Regret Minimization and Best-Arm Identification
- Title(参考訳): 適応実験の最適化:レグレット最小化とベストアーム同定のための統一的アプローチ
- Authors: Chao Qin, Daniel Russo,
- Abstract要約: 実験内性能と実験後の成果を同時に考慮した統一モデルを提案する。
実験期間の大幅な短縮は、実験内および実験後の後悔の両方に最小限の影響を伴って達成できることが示されている。
- 参考スコア(独自算出の注目度): 9.030753181146176
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Practitioners conducting adaptive experiments often encounter two competing priorities: maximizing total welfare (or `reward') through effective treatment assignment and swiftly concluding experiments to implement population-wide treatments. Current literature addresses these priorities separately, with regret minimization studies focusing on the former and best-arm identification research on the latter. This paper bridges this divide by proposing a unified model that simultaneously accounts for within-experiment performance and post-experiment outcomes. We provide a sharp theory of optimal performance in large populations that not only unifies canonical results in the literature but also uncovers novel insights. Our theory reveals that familiar algorithms, such as the recently proposed top-two Thompson sampling algorithm, can optimize a broad class of objectives if a single scalar parameter is appropriately adjusted. In addition, we demonstrate that substantial reductions in experiment duration can often be achieved with minimal impact on both within-experiment and post-experiment regret.
- Abstract(参考訳): 適応的な実験を行う実践者は、2つの競合する優先順位に直面することが多い。
現在の文献はこれらの優先順位を別々に扱い、前者および後者に関する最高の識別研究に焦点を当てた後悔の最小化研究を行っている。
本稿では,実験内性能と実験後の成果を同時に考慮した統一モデルを提案することによって,この分割を橋渡しする。
文献の標準結果を統一するだけでなく,新たな知見も明らかにする,大規模集団における最適性能の鋭い理論を提供する。
我々の理論は、最近提案されたトップ2のトンプソンサンプリングアルゴリズムのような親しみやすいアルゴリズムが、1つのスカラーパラメータが適切に調整された場合、幅広い目的を最適化できることを明らかにする。
さらに、実験期間の大幅な短縮は、実験内および実験後の後悔の両方に最小限の影響を伴って達成できることを実証した。
関連論文リスト
- Prediction-Guided Active Experiments [18.494123886098215]
予測誘導能動実験(PGAE)のための新しいフレームワークについて紹介する。
PGAEは、既存の機械学習モデルからの予測を活用して、サンプリングと実験をガイドする。
我々は、PGAEが効率的であり続け、一定の正則性仮定の下で同じ半パラメトリック境界を得ることを示す。
論文 参考訳(メタデータ) (2024-11-18T20:16:24Z) - Optimal Adaptive Experimental Design for Estimating Treatment Effect [14.088972921434761]
本稿では,治療効果を推定する際の最適精度を決定するための基本的な問題に対処する。
二重ロバストな手法の概念を逐次実験設計に取り入れることで、最適推定問題をオンラインバンディット学習問題としてモデル化する。
本稿では,バンディットアルゴリズム設計と適応統計的推定の両方のツールとアイデアを用いて,一般的な低スイッチング適応実験フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-07T23:22:51Z) - Adaptive Experimentation When You Can't Experiment [55.86593195947978]
本稿では,Emphcon founded the pure exploration transductive linear bandit (textttCPET-LB) problem。
オンラインサービスは、ユーザーを特定の治療にインセンティブを与える、適切にランダム化された励ましを利用することができる。
論文 参考訳(メタデータ) (2024-06-15T20:54:48Z) - Active Adaptive Experimental Design for Treatment Effect Estimation with Covariate Choices [7.21848268647674]
本研究では,平均治療効果(ATE)を効率的に推定するための適応実験を設計する。
適応実験の各ラウンドでは、実験者が実験ユニットをサンプリングし、治療を割り当て、その結果を直ちに観察する。
実験の最後に、実験者は収集されたサンプルを用いてATEを推定する。
論文 参考訳(メタデータ) (2024-03-06T10:24:44Z) - Effect Size Estimation for Duration Recommendation in Online Experiments: Leveraging Hierarchical Models and Objective Utility Approaches [13.504353263032359]
仮定効果サイズ(AES)の選択は、実験の期間を決定的に決定し、その結果、その精度と効率が決定される。
伝統的に、実験者はドメイン知識に基づいてAESを決定するが、この方法は多数の実験を管理するオンライン実験サービスにとって実用的ではない。
オンライン実験サービスにおけるデータ駆動型AES選択のための2つのソリューションを提案する。
論文 参考訳(メタデータ) (2023-12-20T09:34:28Z) - Adaptive Instrument Design for Indirect Experiments [48.815194906471405]
RCTとは異なり、間接的な実験は条件付き機器変数を利用して治療効果を推定する。
本稿では,データ収集ポリシーを適応的に設計することで,間接実験におけるサンプル効率の向上に向けた最初のステップについて述べる。
我々の主な貢献は、影響関数を利用して最適なデータ収集ポリシーを探索する実用的な計算手順である。
論文 参考訳(メタデータ) (2023-12-05T02:38:04Z) - Choosing a Proxy Metric from Past Experiments [54.338884612982405]
多くのランダム化実験では、長期的な計量の処理効果は測定が困難または不可能であることが多い。
一般的な方法は、いくつかの短期的プロキシメトリクスを計測して、長期的メトリックを綿密に追跡することである。
ランダム化実験の同種集団において最適なプロキシメトリックを定義し構築するための新しい統計フレームワークを導入する。
論文 参考訳(メタデータ) (2023-09-14T17:43:02Z) - Adaptive Identification of Populations with Treatment Benefit in
Clinical Trials: Machine Learning Challenges and Solutions [78.31410227443102]
確定的臨床試験において,特定の治療の恩恵を受ける患者サブポピュレーションを適応的に同定する問題について検討した。
サブポピュレーション構築のためのメタアルゴリズムであるAdaGGIとAdaGCPIを提案する。
論文 参考訳(メタデータ) (2022-08-11T14:27:49Z) - Robust Sampling in Deep Learning [62.997667081978825]
ディープラーニングは、オーバーフィッティングを減らし、一般化を改善するために正規化メカニズムを必要とする。
分散ロバスト最適化に基づく新しい正規化手法によりこの問題に対処する。
トレーニング中は、最悪のサンプルが最適化に最も貢献するものであるように、その正確性に応じてサンプルの選択が行われる。
論文 参考訳(メタデータ) (2020-06-04T09:46:52Z) - Incorporating Expert Prior Knowledge into Experimental Design via
Posterior Sampling [58.56638141701966]
実験者は、グローバルな最適な場所に関する知識を得ることができる。
グローバル最適化に関する専門家の事前知識をベイズ最適化に組み込む方法は不明である。
効率の良いベイズ最適化手法は、大域的最適の後方分布の後方サンプリングによって提案されている。
論文 参考訳(メタデータ) (2020-02-26T01:57:36Z) - Optimal Experimental Design for Staggered Rollouts [11.187415608299075]
本研究は, 治療開始時刻が単位によって異なる複数時間にわたって, 一連の単位に対して実施した実験の設計と解析について検討する。
本稿では,設計段階と治療効果を推定する段階の課題に対処するアルゴリズムとして,精度誘導適応実験(PGAE)を提案する。
論文 参考訳(メタデータ) (2019-11-09T19:46:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。