論文の概要: Optimizing Adaptive Experiments: A Unified Approach to Regret
Minimization and Best-Arm Identification
- arxiv url: http://arxiv.org/abs/2402.10592v1
- Date: Fri, 16 Feb 2024 11:27:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-19 16:41:57.314679
- Title: Optimizing Adaptive Experiments: A Unified Approach to Regret
Minimization and Best-Arm Identification
- Title(参考訳): 適応実験の最適化: 後悔の最小化と最善のアーム識別の統一的アプローチ
- Authors: Chao Qin, Daniel Russo
- Abstract要約: 本稿では,実験内性能と実験後結果の両方を考慮に入れた統一モデルを提案する。
次に、文献の正準結果を統一する大集団における最適性能の理論を提供する。
- 参考スコア(独自算出の注目度): 10.66863856524397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Practitioners conducting adaptive experiments often encounter two competing
priorities: reducing the cost of experimentation by effectively assigning
treatments during the experiment itself, and gathering information swiftly to
conclude the experiment and implement a treatment across the population.
Currently, the literature is divided, with studies on regret minimization
addressing the former priority in isolation, and research on best-arm
identification focusing solely on the latter. This paper proposes a unified
model that accounts for both within-experiment performance and post-experiment
outcomes. We then provide a sharp theory of optimal performance in large
populations that unifies canonical results in the literature. This unification
also uncovers novel insights. For example, the theory reveals that familiar
algorithms, like the recently proposed top-two Thompson sampling algorithm, can
be adapted to optimize a broad class of objectives by simply adjusting a single
scalar parameter. In addition, the theory reveals that enormous reductions in
experiment duration can sometimes be achieved with minimal impact on both
within-experiment and post-experiment regret.
- Abstract(参考訳): 適応実験を行う実践者は、実験自体に効果的に治療を割り当てることによる実験のコストの削減と、実験を完了し、集団で治療を実施するための情報収集の2つの課題にしばしば遭遇する。
現在論文は分割され、後悔の最小化の研究は孤立の優先事項に対処し、最善の武装識別の研究は後者のみに焦点をあてている。
本稿では,実験結果と実験結果の両方を考慮した統一モデルを提案する。
次に、文献の正準結果を統一する大集団における最適性能の鋭い理論を提供する。
この統一は、新しい洞察も露呈する。
例えば、この理論は、最近提案されたトップ2のトンプソンサンプリングアルゴリズムのように、単一のスカラーパラメータを単純に調整することで、幅広い目的のクラスを最適化できることを示した。
さらに、実験期間の大幅な短縮は、実験内および実験後の後悔の両方に最小限の影響を与えることができる。
関連論文リスト
- Prediction-Guided Active Experiments [18.494123886098215]
予測誘導能動実験(PGAE)のための新しいフレームワークについて紹介する。
PGAEは、既存の機械学習モデルからの予測を活用して、サンプリングと実験をガイドする。
我々は、PGAEが効率的であり続け、一定の正則性仮定の下で同じ半パラメトリック境界を得ることを示す。
論文 参考訳(メタデータ) (2024-11-18T20:16:24Z) - Optimal Adaptive Experimental Design for Estimating Treatment Effect [14.088972921434761]
本稿では,治療効果を推定する際の最適精度を決定するための基本的な問題に対処する。
二重ロバストな手法の概念を逐次実験設計に取り入れることで、最適推定問題をオンラインバンディット学習問題としてモデル化する。
本稿では,バンディットアルゴリズム設計と適応統計的推定の両方のツールとアイデアを用いて,一般的な低スイッチング適応実験フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-07T23:22:51Z) - Adaptive Experimentation When You Can't Experiment [55.86593195947978]
本稿では,Emphcon founded the pure exploration transductive linear bandit (textttCPET-LB) problem。
オンラインサービスは、ユーザーを特定の治療にインセンティブを与える、適切にランダム化された励ましを利用することができる。
論文 参考訳(メタデータ) (2024-06-15T20:54:48Z) - Active Adaptive Experimental Design for Treatment Effect Estimation with Covariate Choices [7.21848268647674]
本研究では,平均治療効果(ATE)を効率的に推定するための適応実験を設計する。
適応実験の各ラウンドでは、実験者が実験ユニットをサンプリングし、治療を割り当て、その結果を直ちに観察する。
実験の最後に、実験者は収集されたサンプルを用いてATEを推定する。
論文 参考訳(メタデータ) (2024-03-06T10:24:44Z) - Effect Size Estimation for Duration Recommendation in Online Experiments: Leveraging Hierarchical Models and Objective Utility Approaches [13.504353263032359]
仮定効果サイズ(AES)の選択は、実験の期間を決定的に決定し、その結果、その精度と効率が決定される。
伝統的に、実験者はドメイン知識に基づいてAESを決定するが、この方法は多数の実験を管理するオンライン実験サービスにとって実用的ではない。
オンライン実験サービスにおけるデータ駆動型AES選択のための2つのソリューションを提案する。
論文 参考訳(メタデータ) (2023-12-20T09:34:28Z) - Adaptive Instrument Design for Indirect Experiments [48.815194906471405]
RCTとは異なり、間接的な実験は条件付き機器変数を利用して治療効果を推定する。
本稿では,データ収集ポリシーを適応的に設計することで,間接実験におけるサンプル効率の向上に向けた最初のステップについて述べる。
我々の主な貢献は、影響関数を利用して最適なデータ収集ポリシーを探索する実用的な計算手順である。
論文 参考訳(メタデータ) (2023-12-05T02:38:04Z) - Choosing a Proxy Metric from Past Experiments [54.338884612982405]
多くのランダム化実験では、長期的な計量の処理効果は測定が困難または不可能であることが多い。
一般的な方法は、いくつかの短期的プロキシメトリクスを計測して、長期的メトリックを綿密に追跡することである。
ランダム化実験の同種集団において最適なプロキシメトリックを定義し構築するための新しい統計フレームワークを導入する。
論文 参考訳(メタデータ) (2023-09-14T17:43:02Z) - Adaptive Identification of Populations with Treatment Benefit in
Clinical Trials: Machine Learning Challenges and Solutions [78.31410227443102]
確定的臨床試験において,特定の治療の恩恵を受ける患者サブポピュレーションを適応的に同定する問題について検討した。
サブポピュレーション構築のためのメタアルゴリズムであるAdaGGIとAdaGCPIを提案する。
論文 参考訳(メタデータ) (2022-08-11T14:27:49Z) - Robust Sampling in Deep Learning [62.997667081978825]
ディープラーニングは、オーバーフィッティングを減らし、一般化を改善するために正規化メカニズムを必要とする。
分散ロバスト最適化に基づく新しい正規化手法によりこの問題に対処する。
トレーニング中は、最悪のサンプルが最適化に最も貢献するものであるように、その正確性に応じてサンプルの選択が行われる。
論文 参考訳(メタデータ) (2020-06-04T09:46:52Z) - Incorporating Expert Prior Knowledge into Experimental Design via
Posterior Sampling [58.56638141701966]
実験者は、グローバルな最適な場所に関する知識を得ることができる。
グローバル最適化に関する専門家の事前知識をベイズ最適化に組み込む方法は不明である。
効率の良いベイズ最適化手法は、大域的最適の後方分布の後方サンプリングによって提案されている。
論文 参考訳(メタデータ) (2020-02-26T01:57:36Z) - Optimal Experimental Design for Staggered Rollouts [11.187415608299075]
本研究は, 治療開始時刻が単位によって異なる複数時間にわたって, 一連の単位に対して実施した実験の設計と解析について検討する。
本稿では,設計段階と治療効果を推定する段階の課題に対処するアルゴリズムとして,精度誘導適応実験(PGAE)を提案する。
論文 参考訳(メタデータ) (2019-11-09T19:46:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。