論文の概要: Stronger Neyman Regret Guarantees for Adaptive Experimental Design
- arxiv url: http://arxiv.org/abs/2502.17427v1
- Date: Mon, 24 Feb 2025 18:57:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:56:20.508962
- Title: Stronger Neyman Regret Guarantees for Adaptive Experimental Design
- Title(参考訳): 適応型実験設計のためのより強靭なニーマン規則保証
- Authors: Georgy Noarov, Riccardo Fogliato, Martin Bertran, Aaron Roth,
- Abstract要約: 本研究では,不偏平均処理効果推定のための適応的逐次実験の設計について検討する。
私たちのゴールは、準線形のNeyman後悔を提供する適応デザインを開発することです。
- 参考スコア(独自算出の注目度): 8.034196526730879
- License:
- Abstract: We study the design of adaptive, sequential experiments for unbiased average treatment effect (ATE) estimation in the design-based potential outcomes setting. Our goal is to develop adaptive designs offering sublinear Neyman regret, meaning their efficiency must approach that of the hindsight-optimal nonadaptive design. Recent work [Dai et al, 2023] introduced ClipOGD, the first method achieving $\widetilde{O}(\sqrt{T})$ expected Neyman regret under mild conditions. In this work, we propose adaptive designs with substantially stronger Neyman regret guarantees. In particular, we modify ClipOGD to obtain anytime $\widetilde{O}(\log T)$ Neyman regret under natural boundedness assumptions. Further, in the setting where experimental units have pre-treatment covariates, we introduce and study a class of contextual "multigroup" Neyman regret guarantees: Given any set of possibly overlapping groups based on the covariates, the adaptive design outperforms each group's best non-adaptive designs. In particular, we develop a contextual adaptive design with $\widetilde{O}(\sqrt{T})$ anytime multigroup Neyman regret. We empirically validate the proposed designs through an array of experiments.
- Abstract(参考訳): 設計に基づく潜在的結果設定における非バイアス平均処理効果(ATE)推定のための適応的逐次実験の設計について検討する。
我々のゴールは、準線形のネイマンの後悔を提供する適応設計を開発することであり、その効率は後向きの最適でない非適応設計に近づかなければならない。
最近の研究(Dai et al, 2023)ではClipOGDが導入された。
本研究では, ネイマンの後悔の保証を著しく強め, 適応設計を提案する。
特に、自然有界性仮定の下でいつでも$\widetilde{O}(\log T)$ Neyman regretを得るようにClipOGDを変更する。
さらに、実験単位が前処理共変数を持つような環境では、文脈的「多重群」のクラスを導入し、研究する: 共変数に基づく重複する可能性のある群の集合が与えられた場合、適応設計は各群の最高の非適応的設計よりも優れる。
特に、$\widetilde{O}(\sqrt{T})$ anytime multigroup Neyman regret を用いた文脈適応型設計を開発する。
提案した設計を実験によって実証的に検証する。
関連論文リスト
- Sequential Kalman Tuning of the $t$-preconditioned Crank-Nicolson algorithm: efficient, adaptive and gradient-free inference for Bayesian inverse problems [1.3654846342364308]
本稿では,EKI と Flow Annealed Kalman Inversion の適応的な実装を提案する。
EKIはガウス的目標測度と線形前方モデルにおいてのみ正確なものである。
標準SMCの適応に比べてコンバージェンス率が大きく改善した。
論文 参考訳(メタデータ) (2024-07-10T15:56:30Z) - Covariance-Adaptive Sequential Black-box Optimization for Diffusion Targeted Generation [60.41803046775034]
ユーザのブラックボックス目標スコアのみを用いた拡散モデルを用いて,ユーザ優先のターゲット生成を行う方法を示す。
数値実験問題と目標誘導型3次元分子生成タスクの両方の実験により,より優れた目標値を得る上で,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2024-06-02T17:26:27Z) - Noise-Adaptive Confidence Sets for Linear Bandits and Application to Bayesian Optimization [15.275864909088577]
事前の未知のノイズレベルに適応することは、シーケンシャルな意思決定において非常に重要であるが難しい問題である。
未知のガウスパラメータ $sigma_*2$ に半適応的な新しい信頼集合を提案する。
有界報酬に対しては,先行技術により数値性能が大幅に向上した新しい分散適応信頼セットを提案する。
論文 参考訳(メタデータ) (2024-02-12T00:19:09Z) - Variance-Dependent Regret Bounds for Linear Bandits and Reinforcement
Learning: Adaptivity and Computational Efficiency [90.40062452292091]
本稿では,不整合雑音を持つ線形帯域に対する計算効率のよい最初のアルゴリズムを提案する。
我々のアルゴリズムは未知のノイズの分散に適応し、$tildeO(d sqrtsum_k = 1K sigma_k2 + d)$ regretを達成する。
また、強化学習において、線形混合マルコフ決定過程(MDP)に対する分散適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-21T00:17:24Z) - Bandit Theory and Thompson Sampling-Guided Directed Evolution for
Sequence Optimization [38.547378870770956]
本稿では,シーケンス最適化のためのトンプソンサンプリング誘導指向進化(TS-DE)フレームワークを提案する。
TS-DE は、$tilde O(d2sqrtMT)$, $d$ is feature dimension, $M$ is population size, $T$ is number of rounds のベイズ的後悔を楽しむことを示す。
これはより一般的なシーケンス最適化と進化的アルゴリズムに影響を及ぼす可能性がある。
論文 参考訳(メタデータ) (2022-06-05T03:48:42Z) - Risk-averse Heteroscedastic Bayesian Optimization [45.12421486836736]
リスク回避型ヘテロセダスティックベイズ最適化アルゴリズム(RAHBO)を提案する。
RAHBOは、ハイリターンと低ノイズ分散の解を、ハエの騒音分布を学習しながら同定することを目的としている。
単一のソリューションのみを識別しなければならないアプリケーションに対して、最終的な決定ポイントを報告するための堅牢なルールを提供します。
論文 参考訳(メタデータ) (2021-11-05T17:38:34Z) - Adapting to Misspecification in Contextual Bandits [82.55565343668246]
我々は、$varepsilon$-misspecified contextual banditsに対して、新しいオラクル効率アルゴリズム群を導入する。
我々は、未知の不特定値に対して最適な$O(dsqrtT + varepsilonsqrtdT)$ regret boundを達成する最初のアルゴリズムを得る。
論文 参考訳(メタデータ) (2021-07-12T21:30:41Z) - High-Dimensional Experimental Design and Kernel Bandits [9.401375475860561]
最適な線形実験設計の手法を利用して、線形バンディットの最先端の結果を得ています。
G$-optimal designのような目的から返される設計は、実際に潜在的な測定ベクトルのプール上の確率分布である。
我々は、次元 $d$ に対する任意の依存から$n$ を解放する丸め手順を提案する。
論文 参考訳(メタデータ) (2021-05-12T17:10:56Z) - Regret-Optimal Filtering [57.51328978669528]
後悔最適化レンズによる線形状態空間モデルにおけるフィルタの問題を検討する。
我々は, 透視推定器の誤差エネルギー推定における後悔の概念に基づいて, フィルタ設計のための新しい基準を定式化する。
3つのリッキー方程式と1つのリャプノフ方程式を解くことで、後悔と最適推定が容易に実現できることを示す。
論文 参考訳(メタデータ) (2021-01-25T19:06:52Z) - Nearly Dimension-Independent Sparse Linear Bandit over Small Action
Spaces via Best Subset Selection [71.9765117768556]
本研究では,高次元線形モデルの下での文脈的帯域問題について考察する。
この設定は、パーソナライズされたレコメンデーション、オンライン広告、パーソナライズされた医療など、不可欠な応用を見出す。
本稿では,最適部分集合選択法を用いて2重成長エポックを推定する手法を提案する。
論文 参考訳(メタデータ) (2020-09-04T04:10:39Z) - On the Optimality of Randomization in Experimental Design: How to
Randomize for Minimax Variance and Design-Based Inference [58.442274475425144]
条件平均値が与えられたセットで異なる場合の2本腕制御実験のミニマックス最適設計について検討する。
最適設計はカラスの混合戦略最適設計(MSOD)であることが示されている。
そこで,このような制約を受けるすべての設計において,最小値が最適である推論制約MSODを提案する。
論文 参考訳(メタデータ) (2020-05-06T21:43:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。