論文の概要: Robust Sequential Experimental Design for A/B Testing
- arxiv url: http://arxiv.org/abs/2605.12899v1
- Date: Wed, 13 May 2026 02:24:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.761846
- Title: Robust Sequential Experimental Design for A/B Testing
- Title(参考訳): A/B試験におけるロバスト連続実験設計
- Authors: Qianglin Wen, Xiangkun Wu, Chengchun Shi, Ting Li, Niansheng Tang, Yingying Zhang, Hongtu Zhu,
- Abstract要約: 実験設計は、A/Bテストのサンプル効率を改善するための強力なアプローチとして現れている。
我々はコンテキスト的帯域幅と動的設定の両方をカバーする統一的なフレームワークを開発する。
我々の設計は、推定された処理効果の最悪の平均2乗誤差に縛られていることを証明している。
- 参考スコア(独自算出の注目度): 27.458519632567064
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Experimental design has emerged as a powerful approach for improving the sample efficiency of A/B testing, yet existing designs rely critically on correctly specified models. We study robust sequential experimental design under model misspecification and develop a unified framework that covers both contextual bandit and dynamic settings. Theoretically, we prove that our design bounds the worst-case mean squared error of the estimated treatment effect. Empirically, we demonstrate the effectiveness of the proposed approach using synthetic and real-world datasets from a leading technology company.
- Abstract(参考訳): 実験設計は、A/Bテストのサンプル効率を改善するための強力なアプローチとして登場したが、既存の設計は正確に指定されたモデルに依存している。
モデル不特定条件下での堅牢な逐次的実験設計について検討し、文脈的帯域幅と動的設定の両方をカバーする統一的なフレームワークを開発する。
理論的には、我々の設計は、推定された処理効果の最悪の平均2乗誤差に縛られていることを証明している。
先進技術企業による合成および実世界のデータセットを用いた提案手法の有効性を実証的に実証した。
関連論文リスト
- Observationally Informed Adaptive Causal Experimental Design [55.998153710215654]
本稿では,観測モデルを基礎的先行として活用する新たなパラダイムであるアクティブ残留学習を提案する。
このアプローチは、実験的な焦点を、目標因果量の学習から、観察バイアスの補正に必要な残差を効率的に推定するへとシフトさせる。
合成および半合成ベンチマークの実験は、R-Designがベースラインを大幅に上回ることを示した。
論文 参考訳(メタデータ) (2026-03-04T06:52:37Z) - Accelerated Bayesian Optimal Experimental Design via Conditional Density Estimation and Informative Data [0.4178382980763478]
実験設計 (Design of Experiments, DOEs) は、実験結果の妥当性、信頼性、効率を高めるための体系的な原則と技法を研究者に提供する基本的な科学的方法論である。
本研究では,ベイズ定理を用いてベイズフレームワーク内の最適実験設計を探索し,実用性期待を再構築する。
論文 参考訳(メタデータ) (2025-07-21T04:41:05Z) - Diffusion Model for Data-Driven Black-Box Optimization [54.25693582870226]
我々は、強力な生成AI技術である拡散モデルに注目し、ブラックボックス最適化の可能性について検討する。
本研究では,1)実数値報酬関数のノイズ測定と,2)対比較に基づく人間の嗜好の2種類のラベルについて検討する。
提案手法は,設計最適化問題を条件付きサンプリング問題に再構成し,拡散モデルのパワーを有効活用する。
論文 参考訳(メタデータ) (2024-03-20T00:41:12Z) - Enhanced Bayesian Optimization via Preferential Modeling of Abstract
Properties [49.351577714596544]
本研究では,非測定抽象特性に関する専門家の嗜好を代理モデルに組み込むための,人間とAIの協調型ベイズフレームワークを提案する。
優先判断において、誤った/誤解を招く専門家バイアスを処理できる効率的な戦略を提供する。
論文 参考訳(メタデータ) (2024-02-27T09:23:13Z) - Variational Sequential Optimal Experimental Design using Reinforcement Learning [0.0]
対OEDは、変分後部近似を用いた一点報酬の定式化を採用し、期待される情報ゲインに対する証明可能な低いバウンドを提供する。
我々は,既存の逐次実験設計アルゴリズムと比較して,サンプル効率が優れていることを示しながら,様々な工学・科学応用における vsOED の実証を行った。
論文 参考訳(メタデータ) (2023-06-17T21:47:19Z) - Task-specific experimental design for treatment effect estimation [59.879567967089145]
因果推論の標準は大規模ランダム化試験(RCT)である。
近年の研究では、RCTのよりサンプル効率の良い代替案が提案されているが、これらは因果効果を求める下流の応用には適用できない。
実験的な設計のためのタスク固有のアプローチを開発し、特定の下流アプリケーションにカスタマイズされたサンプリング戦略を導出する。
論文 参考訳(メタデータ) (2023-06-08T18:10:37Z) - Online simulator-based experimental design for cognitive model selection [74.76661199843284]
本稿では,抽出可能な確率を伴わない計算モデルを選択する実験設計手法BOSMOSを提案する。
シミュレーション実験では,提案手法により,既存のLFI手法に比べて最大2桁の精度でモデルを選択することができることを示した。
論文 参考訳(メタデータ) (2023-03-03T21:41:01Z) - Design Amortization for Bayesian Optimal Experimental Design [70.13948372218849]
予測情報ゲイン(EIG)のバウンダリに関してパラメータ化された変分モデルを最適化する。
実験者が1つの変分モデルを最適化し、潜在的に無限に多くの設計に対してEIGを推定できる新しいニューラルアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-10-07T02:12:34Z) - Implicit Deep Adaptive Design: Policy-Based Experimental Design without
Likelihoods [24.50829695870901]
暗黙のDeep Adaptive Design (iDAD) は暗黙のモデルでリアルタイムで適応実験を行う新しい手法である。
iDADは、設計ポリシーネットワークを事前学習することで、ベイズ最適設計(BOED)のコストを償却する。
論文 参考訳(メタデータ) (2021-11-03T16:24:05Z) - Robust multi-stage model-based design of optimal experiments for
nonlinear estimation [0.0]
本研究では,モデルに基づく実験の高次設計へのアプローチについて検討する。
マルチステージロバスト最適化に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-11-11T19:50:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。