論文の概要: Beyond Basic A/B testing: Improving Statistical Efficiency for Business Growth
- arxiv url: http://arxiv.org/abs/2505.08128v1
- Date: Tue, 13 May 2025 00:00:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-14 20:57:54.369577
- Title: Beyond Basic A/B testing: Improving Statistical Efficiency for Business Growth
- Title(参考訳): 基本的なA/Bテストを超えて: ビジネス成長のための統計的効率を改善する
- Authors: Changshuai Wei, Phuc Nguyen, Benjamin Zelditch, Joyce Chen,
- Abstract要約: 標準的なA/Bテストアプローチは、主に大規模産業アプリケーションにおけるt-testに基づいている。
しかしながら、これらの標準的なアプローチは、小さなサンプルサイズまたは非ガウス分布の性質のため、ビジネス環境での統計力の低下に悩まされている。
i) 適応回帰、一般化された推定方程式、マン・ホイットニーU、ゼロ・トリムU。
- 参考スコア(独自算出の注目度): 0.3106341010507045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The standard A/B testing approaches are mostly based on t-test in large scale industry applications. These standard approaches however suffers from low statistical power in business settings, due to nature of small sample-size or non-Gaussian distribution or return-on-investment (ROI) consideration. In this paper, we propose several approaches to addresses these challenges: (i) regression adjustment, generalized estimating equation, Man-Whitney U and Zero-Trimmed U that addresses each of these issues separately, and (ii) a novel doubly robust generalized U that handles ROI consideration, distribution robustness and small samples in one framework. We provide theoretical results on asymptotic normality and efficiency bounds, together with insights on the efficiency gain from theoretical analysis. We further conduct comprehensive simulation studies and apply the methods to multiple real A/B tests.
- Abstract(参考訳): 標準的なA/Bテストアプローチは、主に大規模産業アプリケーションにおけるt-testに基づいている。
しかしながら、これらの標準的なアプローチは、小さなサンプルサイズまたは非ガウス分布の性質やROI(Return-on-investment)を考慮したため、ビジネス環境での統計力の低下に悩まされている。
本稿では,これらの課題に対処するためのいくつかのアプローチを提案する。
(i)回帰調整、一般化された推定方程式、マン・ホイットニーUとゼロ・トリムUはこれらの問題をそれぞれ別々に扱い、
(II) ROI考慮、分布ロバスト性、および1つのフレームワークにおける小さなサンプルを扱う2倍強一般化U。
我々は、漸近正規性と効率境界に関する理論的結果と、理論解析による効率利得に関する洞察を提供する。
さらに、総合シミュレーション研究を行い、本手法を複数の実A/Bテストに適用する。
関連論文リスト
- Exogenous Matching: Learning Good Proposals for Tractable Counterfactual Estimation [1.9662978733004601]
本稿では, 抽出可能かつ効率的な対実表現推定のための重要サンプリング手法を提案する。
対物推定器の共通上限を最小化することにより、分散最小化問題を条件分布学習問題に変換する。
構造因果モデル (Structure Causal Models, SCM) の様々なタイプと設定による実験による理論的結果の検証と, 対実推定タスクにおける性能の実証を行った。
論文 参考訳(メタデータ) (2024-10-17T03:08:28Z) - Top-K Pairwise Ranking: Bridging the Gap Among Ranking-Based Measures for Multi-Label Classification [120.37051160567277]
本稿では,Top-K Pairwise Ranking(TKPR)という新しい尺度を提案する。
一連の分析により、TKPRは既存のランキングベースの尺度と互換性があることが示されている。
一方,データ依存縮約法という新しい手法に基づいて,提案手法の急激な一般化を確立する。
論文 参考訳(メタデータ) (2024-07-09T09:36:37Z) - Model-Based RL for Mean-Field Games is not Statistically Harder than Single-Agent RL [57.745700271150454]
モデルに基づく関数近似を用いた平均フィールドゲーム(MFG)における強化学習のサンプル複雑性について検討した。
本稿では、モデルクラスの複雑性を特徴付けるためのより効果的な概念である部分モデルベースエルダー次元(P-MBED)を紹介する。
論文 参考訳(メタデータ) (2024-02-08T14:54:47Z) - Task-specific experimental design for treatment effect estimation [59.879567967089145]
因果推論の標準は大規模ランダム化試験(RCT)である。
近年の研究では、RCTのよりサンプル効率の良い代替案が提案されているが、これらは因果効果を求める下流の応用には適用できない。
実験的な設計のためのタスク固有のアプローチを開発し、特定の下流アプリケーションにカスタマイズされたサンプリング戦略を導出する。
論文 参考訳(メタデータ) (2023-06-08T18:10:37Z) - A Unified Framework for Multi-distribution Density Ratio Estimation [101.67420298343512]
バイナリ密度比推定(DRE)は多くの最先端の機械学習アルゴリズムの基礎を提供する。
ブレグマン最小化の発散の観点から一般的な枠組みを開発する。
我々のフレームワークはバイナリDREでそれらのフレームワークを厳格に一般化する手法に導かれることを示す。
論文 参考訳(メタデータ) (2021-12-07T01:23:20Z) - Differential privacy and robust statistics in high dimensions [49.50869296871643]
高次元Propose-Test-Release (HPTR) は指数的メカニズム、頑健な統計、Propose-Test-Release メカニズムという3つの重要なコンポーネントの上に構築されている。
本論文では,HPTRが複数のシナリオで最適サンプル複雑性をほぼ達成していることを示す。
論文 参考訳(メタデータ) (2021-11-12T06:36:40Z) - TsmoBN: Interventional Generalization for Unseen Clients in Federated
Learning [23.519212374186232]
本研究では,分散学習パラダイムにおけるモデル一般化の課題を説明するために,学習構造因果モデル(SCM)を構築した。
FLモデルをテストクライアントに一般化するために,テスト固有および運動量追跡バッチ正規化(TsmoBN)を用いた簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2021-10-19T13:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。