論文の概要: Synthetically Controlled Bandits
- arxiv url: http://arxiv.org/abs/2202.07079v1
- Date: Mon, 14 Feb 2022 22:58:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-16 13:52:41.791905
- Title: Synthetically Controlled Bandits
- Title(参考訳): 合成制御バンド
- Authors: Vivek Farias, Ciamac Moallemi, Tianyi Peng, Andrew Zheng
- Abstract要約: 本稿では, 干渉などの問題により, 実験ユニットが粗い環境において, 実験設計のための新しい動的アプローチを提案する。
SCTS(Synthetically Controlled Thompson Smpling)と呼ばれる新しいデザインは、実験に伴う後悔を最小限に抑える。
- 参考スコア(独自算出の注目度): 2.8292841621378844
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a new dynamic approach to experiment design in settings
where, due to interference or other concerns, experimental units are coarse.
`Region-split' experiments on online platforms are one example of such a
setting. The cost, or regret, of experimentation is a natural concern here. Our
new design, dubbed Synthetically Controlled Thompson Sampling (SCTS), minimizes
the regret associated with experimentation at no practically meaningful loss to
inferential ability. We provide theoretical guarantees characterizing the
near-optimal regret of our approach, and the error rates achieved by the
corresponding treatment effect estimator. Experiments on synthetic and real
world data highlight the merits of our approach relative to both fixed and
`switchback' designs common to such experimental settings.
- Abstract(参考訳): 本稿では, 干渉などの問題により, 実験ユニットが粗い環境において, 実験設計のための新しい動的アプローチを提案する。
オンラインプラットフォームにおける `region-split' 実験はその一例である。
実験のコスト、または後悔は、ここでは自然な懸念です。
人工的に制御されたトンプソンサンプリング(scts)と呼ばれるこの新デザインは、実験に伴う後悔を最小限に抑えています。
我々は, 治療効果推定器が達成した最善の後悔と誤差率を特徴付ける理論的保証を提供する。
合成データと実世界のデータに関する実験は、このような実験的な設定に共通する固定設計と「スイッチバック」設計の両方に対して、我々のアプローチのメリットを強調する。
関連論文リスト
- Adaptive Experimentation When You Can't Experiment [55.86593195947978]
本稿では,Emphcon founded the pure exploration transductive linear bandit (textttCPET-LB) problem。
オンラインサービスは、ユーザーを特定の治療にインセンティブを与える、適切にランダム化された励ましを利用することができる。
論文 参考訳(メタデータ) (2024-06-15T20:54:48Z) - Optimizing Adaptive Experiments: A Unified Approach to Regret Minimization and Best-Arm Identification [9.030753181146176]
実験内性能と実験後の成果を同時に考慮した統一モデルを提案する。
実験期間の大幅な短縮は、実験内および実験後の後悔の両方に最小限の影響を伴って達成できることが示されている。
論文 参考訳(メタデータ) (2024-02-16T11:27:48Z) - Adaptive Instrument Design for Indirect Experiments [48.815194906471405]
RCTとは異なり、間接的な実験は条件付き機器変数を利用して治療効果を推定する。
本稿では,データ収集ポリシーを適応的に設計することで,間接実験におけるサンプル効率の向上に向けた最初のステップについて述べる。
我々の主な貢献は、影響関数を利用して最適なデータ収集ポリシーを探索する実用的な計算手順である。
論文 参考訳(メタデータ) (2023-12-05T02:38:04Z) - ExPT: Synthetic Pretraining for Few-Shot Experimental Design [33.5918976228562]
実験事前変換器(Experiment Pretrained Transformers、ExPT)は、数発の実験設計の基礎モデルである。
ExPTは、合成事前学習と文脈内学習を組み合わせた新しい組み合わせを採用している。
挑戦領域における数ショットの実験設計におけるExPTの評価を行った。
論文 参考訳(メタデータ) (2023-10-30T19:25:43Z) - A Double Machine Learning Approach to Combining Experimental and Observational Data [59.29868677652324]
実験と観測を組み合わせた二重機械学習手法を提案する。
我々の枠組みは、より軽度の仮定の下で、外部の妥当性と無知の違反を検査する。
論文 参考訳(メタデータ) (2023-07-04T02:53:11Z) - Task-specific experimental design for treatment effect estimation [59.879567967089145]
因果推論の標準は大規模ランダム化試験(RCT)である。
近年の研究では、RCTのよりサンプル効率の良い代替案が提案されているが、これらは因果効果を求める下流の応用には適用できない。
実験的な設計のためのタスク固有のアプローチを開発し、特定の下流アプリケーションにカスタマイズされたサンプリング戦略を導出する。
論文 参考訳(メタデータ) (2023-06-08T18:10:37Z) - Improved Policy Evaluation for Randomized Trials of Algorithmic Resource
Allocation [54.72195809248172]
提案する新しい概念を応用した新しい推定器を提案する。
我々は,このような推定器が,サンプル手段に基づく一般的な推定器よりも精度が高いことを理論的に証明した。
論文 参考訳(メタデータ) (2023-02-06T05:17:22Z) - Synthetic Principal Component Design: Fast Covariate Balancing with
Synthetic Controls [16.449993388646277]
我々は,グローバル収束的で実用的な最適化アルゴリズムを開発した。
我々は,あるデータ生成プロセスから前処理データをサンプリングする場合に,実験設計のための最初のグローバルな最適性保証を確立する。
論文 参考訳(メタデータ) (2022-11-28T11:45:54Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Active Learning of Continuous-time Bayesian Networks through
Interventions [38.728001040001615]
最小限の実験資源下での時間軸データから連続時間ベイズネットワーク(CTBN)の学習構造とパラメータの問題を考察する。
予測情報ゲインの変動近似に基づく実験設計のための新しい基準を提案する。
論文 参考訳(メタデータ) (2021-05-31T07:13:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。