論文の概要: Adaptive Experimentation When You Can't Experiment
- arxiv url: http://arxiv.org/abs/2406.10738v1
- Date: Sat, 15 Jun 2024 20:54:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-18 21:01:13.393554
- Title: Adaptive Experimentation When You Can't Experiment
- Title(参考訳): 実験できないときの適応実験
- Authors: Yao Zhao, Kwang-Sung Jun, Tanner Fiez, Lalit Jain,
- Abstract要約: 本稿では,Emphcon founded the pure exploration transductive linear bandit (textttCPET-LB) problem。
オンラインサービスは、ユーザーを特定の治療にインセンティブを与える、適切にランダム化された励ましを利用することができる。
- 参考スコア(独自算出の注目度): 55.86593195947978
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces the \emph{confounded pure exploration transductive linear bandit} (\texttt{CPET-LB}) problem. As a motivating example, often online services cannot directly assign users to specific control or treatment experiences either for business or practical reasons. In these settings, naively comparing treatment and control groups that may result from self-selection can lead to biased estimates of underlying treatment effects. Instead, online services can employ a properly randomized encouragement that incentivizes users toward a specific treatment. Our methodology provides online services with an adaptive experimental design approach for learning the best-performing treatment for such \textit{encouragement designs}. We consider a more general underlying model captured by a linear structural equation and formulate pure exploration linear bandits in this setting. Though pure exploration has been extensively studied in standard adaptive experimental design settings, we believe this is the first work considering a setting where noise is confounded. Elimination-style algorithms using experimental design methods in combination with a novel finite-time confidence interval on an instrumental variable style estimator are presented with sample complexity upper bounds nearly matching a minimax lower bound. Finally, experiments are conducted that demonstrate the efficacy of our approach.
- Abstract(参考訳): 本稿では, 純探索線形バンドイット (\texttt{CPET-LB}) 問題を紹介する。
モチベーションの例として、オンラインサービスは、しばしば、ビジネスまたは実践上の理由から、ユーザーを特定のコントロールや治療経験に直接割り当てることができない。
これらの設定では、自己選択によって引き起こされる治療群と対照群を鼻で比較すると、基礎となる治療効果の偏りが生じる可能性がある。
代わりに、オンラインサービスは、ユーザーが特定の治療にインセンティブを与える、適切にランダム化された励ましを利用することができる。
提案手法は, オンラインサービスに適応的な実験設計手法を提供することで, このような「textit{encouragement design}」の最適処理を学習する。
我々は、線形構造方程式によって得られたより一般的な基礎モデルを考え、この設定で純粋探索線形帯域を定式化する。
純粋探索は標準適応型実験設計設定において広範囲に研究されてきたが、ノイズが結合された環境を考える上でこれが最初のものであると我々は信じている。
実験的な設計手法と機器変数スタイル推定器上の新しい有限時間信頼区間を組み合わせた除去型アルゴリズムを,ミニマックス下界にほぼ一致するような複雑な上界をサンプルとして提示する。
最後に,本手法の有効性を示す実験を行った。
関連論文リスト
- Estimating Treatment Effects under Recommender Interference: A Structured Neural Networks Approach [13.208141830901845]
標準差分推定器は、推奨者干渉による偏差推定を導出できることを示す。
本稿では,処理項目と制御項目の両方を含むプールからどのアイテムが露出するかを記述した「レコメンダ選択モデル」を提案する。
提案した推定器はベンチマークに匹敵する結果が得られるのに対し,標準差分推定器は有意なバイアスを示し,また逆の兆候も生み出すことを示す。
論文 参考訳(メタデータ) (2024-06-20T14:53:26Z) - Machine Learning Assisted Adjustment Boosts Efficiency of Exact Inference in Randomized Controlled Trials [12.682443719767763]
提案手法は,I型誤差を頑健に制御し,ランダム化制御試験(RCT)の統計的効率を高めることができることを示す。
その応用は、第III相臨床試験のような、RCTの必要なサンプルサイズとコストを著しく削減する可能性がある。
論文 参考訳(メタデータ) (2024-03-05T15:48:07Z) - Adaptive Instrument Design for Indirect Experiments [48.815194906471405]
RCTとは異なり、間接的な実験は条件付き機器変数を利用して治療効果を推定する。
本稿では,データ収集ポリシーを適応的に設計することで,間接実験におけるサンプル効率の向上に向けた最初のステップについて述べる。
我々の主な貢献は、影響関数を利用して最適なデータ収集ポリシーを探索する実用的な計算手順である。
論文 参考訳(メタデータ) (2023-12-05T02:38:04Z) - Task-specific experimental design for treatment effect estimation [59.879567967089145]
因果推論の標準は大規模ランダム化試験(RCT)である。
近年の研究では、RCTのよりサンプル効率の良い代替案が提案されているが、これらは因果効果を求める下流の応用には適用できない。
実験的な設計のためのタスク固有のアプローチを開発し、特定の下流アプリケーションにカスタマイズされたサンプリング戦略を導出する。
論文 参考訳(メタデータ) (2023-06-08T18:10:37Z) - Adaptive Experimentation at Scale: A Computational Framework for
Flexible Batches [7.390918770007728]
結果がバッチで測定される少数の実測を含む実例によって動機付けられ,適応駆動型実験フレームワークを開発した。
我々の主な観察は、統計的推論において普遍的な正規近似は適応アルゴリズムの設計を導くことができることである。
論文 参考訳(メタデータ) (2023-03-21T04:17:03Z) - Synthetically Controlled Bandits [2.8292841621378844]
本稿では, 干渉などの問題により, 実験ユニットが粗い環境において, 実験設計のための新しい動的アプローチを提案する。
SCTS(Synthetically Controlled Thompson Smpling)と呼ばれる新しいデザインは、実験に伴う後悔を最小限に抑える。
論文 参考訳(メタデータ) (2022-02-14T22:58:13Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - Learning the Truth From Only One Side of the Story [58.65439277460011]
一般化線形モデルに焦点をあて、このサンプリングバイアスを調整しなければ、モデルは準最適に収束するか、あるいは最適解に収束しないかもしれないことを示す。
理論的保証を伴って適応的なアプローチを提案し、いくつかの既存手法を実証的に上回っていることを示す。
論文 参考訳(メタデータ) (2020-06-08T18:20:28Z) - Almost-Matching-Exactly for Treatment Effect Estimation under Network
Interference [73.23326654892963]
本研究では,観測ネットワーク上でユニットが接続されたランダム化実験から直接処理効果を回復するマッチング手法を提案する。
本手法は, 近傍グラフ内の一意部分グラフの個数にほぼ一致する。
論文 参考訳(メタデータ) (2020-03-02T15:21:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。