Fugu-MT 論文翻訳(概要): Variance reduction combining pre-experiment and in-experiment data

論文の概要: Variance reduction combining pre-experiment and in-experiment data

arxiv url: http://arxiv.org/abs/2410.09027v1
Date: Fri, 11 Oct 2024 17:45:29 GMT
ステータス: 翻訳完了
システム内更新日: 2024-10-30 20:26:51.491544
Title: Variance reduction combining pre-experiment and in-experiment data
Title（参考訳）: 実験前データと実験内データを組み合わせた分散化
Authors: Zhexiao Lin, Pablo Crespo,
Abstract要約: オンライン制御実験(A/Bテスト)は、多くの企業にとって、データ駆動による意思決定に不可欠である。 CUPEDやCUPACのような既存の手法では、実験前のデータを使って分散を減らすが、その効果は実験前のデータと結果の相関に依存する。実験前データと実験内データを組み合わせて, CUPED や CUPAC よりも高分散化を実現する手法を提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Online controlled experiments (A/B testing) are essential in data-driven decision-making for many companies. Increasing the sensitivity of these experiments, particularly with a fixed sample size, relies on reducing the variance of the estimator for the average treatment effect (ATE). Existing methods like CUPED and CUPAC use pre-experiment data to reduce variance, but their effectiveness depends on the correlation between the pre-experiment data and the outcome. In contrast, in-experiment data is often more strongly correlated with the outcome and thus more informative. In this paper, we introduce a novel method that combines both pre-experiment and in-experiment data to achieve greater variance reduction than CUPED and CUPAC, without introducing bias or additional computation complexity. We also establish asymptotic theory and provide consistent variance estimators for our method. Applying this method to multiple online experiments at Etsy, we reach substantial variance reduction over CUPAC with the inclusion of only a few in-experiment covariates. These results highlight the potential of our approach to significantly improve experiment sensitivity and accelerate decision-making.
Abstract（参考訳）: オンライン制御実験(A/Bテスト)は、多くの企業にとって、データ駆動による意思決定に不可欠である。これらの実験の感度を高めることは、特に一定のサンプルサイズで、平均処理効果(ATE)に対する推定器の分散を減少させることに依存する。 CUPEDやCUPACのような既存の手法では、実験前のデータを使って分散を減らすが、その効果は実験前のデータと結果の相関に依存する。対照的に、実験中のデータは結果と強く相関し、情報的になることが多い。本稿では, CUPED や CUPAC よりも高分散化を実現するために, 実験前データと実験内データを組み合わせた新しい手法を提案する。また、漸近理論を確立し、本手法に対して一貫した分散推定器を提供する。この手法をEtsyにおける複数オンライン実験に適用することにより、実験中の共変量しか含まないCUPACに対して、相当なばらつきを低減できる。これらの結果は、実験感度を大幅に改善し、意思決定を加速するアプローチの可能性を強調している。

関連論文リスト

Cross-Validated Causal Inference: a Modern Method to Combine Experimental and Observational Data [48.72384067821617]
我々は、因果推論において実験データと観測データを統合するための新しい手法を開発した。実験と観測の損失の重み付けを最小化することにより、因果パラメータを含む完全なモデルを得る。実データおよび合成データを用いた実験により,本手法の有効性と信頼性が示された。
論文参考訳（メタデータ） (2025-11-01T22:24:16Z)
Practical Improvements of A/B Testing with Off-Policy Estimation [51.25970890274447]
従来の手法よりも分散度を低くする非バイアスのオフ・ポリティクス推定器のファミリーを導入する。提案手法の有効性と実用性を理論的に検証した。
論文参考訳（メタデータ） (2025-06-12T13:11:01Z)
A Sample Efficient Conditional Independence Test in the Presence of Discretization [54.047334792855345]
離散化されたデータに直接条件付き独立テスト(CI)は、誤った結論につながる可能性がある。最近の進歩は、観測データをバイナライズすることで、潜伏変数間の適切なCI関係を推測することを目指している。そこで本研究では,バイナライゼーションプロセスに依存しないサンプル効率のCIテストを提案する。
論文参考訳（メタデータ） (2025-06-10T12:41:26Z)
Prediction-Powered Causal Inferences [59.98498488132307]
予測型因果推論(PPCI)に焦点をあてるまず, 条件付きキャリブレーションにより, 人口レベルでの有効なPPCIが保証されることを示す。次に、実験間での十分な表現制約伝達の妥当性を導入する。
論文参考訳（メタデータ） (2025-02-10T10:52:17Z)
Constructing Confidence Intervals for Average Treatment Effects from Multiple Datasets [51.2467404472005]
本稿では、複数の観測データセットからATEを推定し、有効なCIを提供する新しい手法を提案する。本手法は観測データセットの仮定をほとんど行わず,医学的実践に広く応用できる。
論文参考訳（メタデータ） (2024-12-16T07:39:46Z)
Not All Samples Should Be Utilized Equally: Towards Understanding and Improving Dataset Distillation [57.6797306341115]
我々は,サンプル難易度の観点から,マッチングに基づくDD手法の理解に向けて最初の一歩を踏み出した。次に、データプルーニングのニューラルネットワークスケーリング法則をDDに拡張し、これらのマッチングベースの手法を理論的に説明する。 SDC(Sampple Difficulty Correction)アプローチを導入し、より簡単なサンプルを生成して、より高いデータセット品質を実現する。
論文参考訳（メタデータ） (2024-08-22T15:20:32Z)
STATE: A Robust ATE Estimator of Heavy-Tailed Metrics for Variance Reduction in Online Controlled Experiments [22.32661807469984]
我々は、学生のt分布と機械学習ツールを統合して、ヘビーテールのメトリクスに適合する新しいフレームワークを開発する。ログ類似度関数を最適化するために変分EM法を採用することにより、アウトリアの負の影響を大幅に排除するロバストな解を推測できる。 Meituan実験プラットフォーム上での合成データと長期実験結果のシミュレーションにより,本手法の有効性を実証した。
論文参考訳（メタデータ） (2024-07-23T09:35:59Z)
CKD: Contrastive Knowledge Distillation from A Sample-wise Perspective [48.99488315273868]
本研究では,試料内およびサンプル間制約によるサンプルワイドアライメント問題として定式化できる,対照的な知識蒸留手法を提案する。本手法は, 数値を考慮し, 同一試料中のロジット差を最小化する。 CIFAR-100, ImageNet-1K, MS COCOの3つのデータセットについて総合的な実験を行った。
論文参考訳（メタデータ） (2024-04-22T11:52:40Z)
Active Adaptive Experimental Design for Treatment Effect Estimation with Covariate Choices [7.21848268647674]
本研究では,平均治療効果(ATE)を効率的に推定するための適応実験を設計する。適応実験の各ラウンドでは、実験者が実験ユニットをサンプリングし、治療を割り当て、その結果を直ちに観察する。実験の最後に、実験者は収集されたサンプルを用いてATEを推定する。
論文参考訳（メタデータ） (2024-03-06T10:24:44Z)
Adaptive Instrument Design for Indirect Experiments [48.815194906471405]
RCTとは異なり、間接的な実験は条件付き機器変数を利用して治療効果を推定する。本稿では,データ収集ポリシーを適応的に設計することで,間接実験におけるサンプル効率の向上に向けた最初のステップについて述べる。我々の主な貢献は、影響関数を利用して最適なデータ収集ポリシーを探索する実用的な計算手順である。
論文参考訳（メタデータ） (2023-12-05T02:38:04Z)
Detecting Adversarial Data by Probing Multiple Perturbations Using Expected Perturbation Score [62.54911162109439]
逆方向検出は、自然分布と逆方向分布の差に基づいて、与えられたサンプルが逆方向であるかどうかを判定することを目的としている。本研究では,様々な摂動後の標本の予測スコアであるEPS(pre expected perturbation score)を提案する。 EPSに基づく最大平均誤差(MMD)を,試験試料と自然試料との差を測定する指標として開発する。
論文参考訳（メタデータ） (2023-05-25T13:14:58Z)
Variance Minimization in the Wasserstein Space for Invariant Causal Prediction [72.13445677280792]
そこで本研究では,ICPで行ったアプローチを,予測器数で線形にスケールする一連の非パラメトリックテストとして再検討する。これらのテストはそれぞれ、最適輸送理論の道具から導かれる新しい損失関数の最小化に依存している。我々は,本手法が同定可能な直接原因の集合を回復できるという軽微な仮定の下で証明し,他のベンチマーク因果探索アルゴリズムと競合することを示す。
論文参考訳（メタデータ） (2021-10-13T22:30:47Z)
What can the millions of random treatments in nonexperimental data reveal about causes? [0.0]
この記事ではこのようなモデルとベイズ的アプローチを紹介し、非経験的データで典型的に使用可能な 1(n2)$ のペアワイズ観測を組み合わせる。提案手法は, 一般のnswサンプル, 任意のサブポピュレーションおよび大容量スーパーサンプルにおいて, 因果効果を回復することを示す。
論文参考訳（メタデータ） (2021-05-03T20:13:34Z)
Efficient Causal Inference from Combined Observational and Interventional Data through Causal Reductions [68.6505592770171]
因果効果を推定する際の主な課題の1つである。そこで本研究では,任意の数の高次元潜入共創者を置き換える新たな因果還元法を提案する。パラメータ化縮小モデルを観測データと介入データから共同で推定する学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2021-03-08T14:29:07Z)
Compressing Large Sample Data for Discriminant Analysis [78.12073412066698]
判別分析フレームワーク内での大きなサンプルサイズに起因する計算問題を考察する。線形および二次判別分析のためのトレーニングサンプル数を削減するための新しい圧縮手法を提案する。
論文参考訳（メタデータ） (2020-05-08T05:09:08Z)
Estimating the number and effect sizes of non-null hypotheses [14.34147140416535]
効果の大きさの分布を知ることで、実験的な設計のパワー(タイプIIエラー)を計算することができる。我々の推定器は、将来の実験で与えられた実験設計を用いて行われる発見の数を保証するために使用できる。
論文参考訳（メタデータ） (2020-02-17T23:20:21Z)
Efficient Adaptive Experimental Design for Average Treatment Effect Estimation [18.027128141189355]
本研究では, 依存サンプルから構築した推定器を用いた効率的な実験法を提案する。提案手法を正当化するために,有限および無限サンプル解析を行う。
論文参考訳（メタデータ） (2020-02-13T02:04:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。