論文の概要: Subset Selection for Stratified Sampling in Online Controlled Experiments
- arxiv url: http://arxiv.org/abs/2509.15576v1
- Date: Fri, 19 Sep 2025 04:22:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:10.991498
- Title: Subset Selection for Stratified Sampling in Online Controlled Experiments
- Title(参考訳): オンライン制御実験における成層サンプリングのサブセット選択
- Authors: Haru Momozu, Yuki Uehara, Naoki Nishimura, Koya Ohashi, Deddy Jobson, Yilin Li, Phuong Dinh, Noriyoshi Sukegawa, Yuichi Takano,
- Abstract要約: 階層化サンプリングは, オンライン制御実験の感度を向上させるため, 分散低減のための手法である。
分散還元に有効な成層変数のサブセットを選択する問題に焦点をあてる。
我々は,一連の階層化サンプリングプロセスをシミュレートして,階層化変数を1つずつ選択する効率的なアルゴリズムを設計する。
- 参考スコア(独自算出の注目度): 3.0843410990863407
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online controlled experiments, also known as A/B testing, are the digital equivalent of randomized controlled trials for estimating the impact of marketing campaigns on website visitors. Stratified sampling is a traditional technique for variance reduction to improve the sensitivity (or statistical power) of controlled experiments; this technique first divides the population into strata (homogeneous subgroups) based on stratification variables and then draws samples from each stratum to avoid sampling bias. To enhance the estimation accuracy of stratified sampling, we focus on the problem of selecting a subset of stratification variables that are effective in variance reduction. We design an efficient algorithm that selects stratification variables one by one by simulating a series of stratified sampling processes. We also estimate the computational complexity of our subset selection algorithm. Computational experiments using synthetic and real-world datasets demonstrate that our method can outperform other variance reduction techniques especially when multiple variables have a certain correlation with the outcome variable. Our subset selection method for stratified sampling can improve the sensitivity of online controlled experiments, thus enabling more reliable marketing decisions.
- Abstract(参考訳): A/Bテスト(英: A/B testing)は、ウェブサイト訪問者に対するマーケティングキャンペーンの影響を推定するためのランダム化制御試験のデジタル版である。
成層サンプリングは、制御された実験の感度(または統計力)を改善するために分散低減のための伝統的な手法であり、まず、成層変数に基づいて集団を成層(均質な部分群)に分割し、各層からサンプルを引いてサンプリングバイアスを回避する。
層状化サンプリングの精度を高めるために,分散低減に有効な層状化変数のサブセットを選択する問題に焦点をあてる。
我々は,一連の階層化サンプリングプロセスをシミュレートして,階層化変数を1つずつ選択する効率的なアルゴリズムを設計する。
また,サブセット選択アルゴリズムの計算複雑性を推定する。
合成および実世界のデータセットを用いた計算実験により、本手法は、特に複数の変数が結果変数と一定の相関を持つ場合、他の分散低減手法よりも優れていることを示した。
階層化サンプリングのためのサブセット選択法は、オンライン制御実験の感度を向上し、より信頼性の高いマーケティング決定を可能にする。
関連論文リスト
- Neural Flow Samplers with Shortcut Models [19.81513273510523]
連続フローベースのニューラルサンプリングは、非正規化された密度からサンプルを生成するための有望なアプローチを提供する。
速度駆動型Sequential Monte Carlo法を用いて,これらの課題量に対する改良された推定器を提案する。
提案するニューラルフローショートカットサンプリングは,合成データセットと複雑なnボディシステムターゲットの両方において,既存のフローベースニューラルサンプリングよりも経験的に優れている。
論文 参考訳(メタデータ) (2025-02-11T07:55:41Z) - CCS: Controllable and Constrained Sampling with Diffusion Models via Initial Noise Perturbation [9.12693573953231]
生成出力の変化と初期雑音摂動のスケールの関係は拡散ODEサンプリングにより非常に線形である。
そこで我々は,新しい制御可能・制約付きサンプリング法 (CCS) と,所望の統計特性を持つ拡散モデルに対する新しい制御アルゴリズムを提案する。
その結果, CCS法は, 優れた試料品質と多様性を維持しつつ, より精密にサンプリングを制御できることが示唆された。
論文 参考訳(メタデータ) (2025-02-07T05:30:48Z) - Amortized Posterior Sampling with Diffusion Prior Distillation [55.03585818289934]
Amortized Posterior Smplingは、逆問題における効率的な後方サンプリングのための新しい変分推論手法である。
本手法は,拡散モデルにより暗黙的に定義された変動分布と後続分布とのばらつきを最小限に抑えるために条件付き流れモデルを訓練する。
既存の手法とは異なり、我々のアプローチは教師なしであり、ペア化されたトレーニングデータを必要としておらず、ユークリッドと非ユークリッドの両方のドメインに適用できる。
論文 参考訳(メタデータ) (2024-07-25T09:53:12Z) - Adaptive Instrument Design for Indirect Experiments [48.815194906471405]
RCTとは異なり、間接的な実験は条件付き機器変数を利用して治療効果を推定する。
本稿では,データ収集ポリシーを適応的に設計することで,間接実験におけるサンプル効率の向上に向けた最初のステップについて述べる。
我々の主な貢献は、影響関数を利用して最適なデータ収集ポリシーを探索する実用的な計算手順である。
論文 参考訳(メタデータ) (2023-12-05T02:38:04Z) - Sample Constrained Treatment Effect Estimation [28.156207324508706]
我々は,効率的なランダム化制御試験を設計することに集中し,治療の効果を正確に見積もる。
特に, サンプル制約による治療効果の推定について検討し, 実験を行うには, 集団から$s ll n$のサブセットを選択する必要がある。
論文 参考訳(メタデータ) (2022-10-12T21:13:47Z) - Towards Automated Imbalanced Learning with Deep Hierarchical
Reinforcement Learning [57.163525407022966]
不均衡学習はデータマイニングにおいて基本的な課題であり、各クラスにトレーニングサンプルの不均等な比率が存在する。
オーバーサンプリングは、少数民族のための合成サンプルを生成することによって、不均衡な学習に取り組む効果的な手法である。
我々は,異なるレベルの意思決定を共同で最適化できる自動オーバーサンプリングアルゴリズムであるAutoSMOTEを提案する。
論文 参考訳(メタデータ) (2022-08-26T04:28:01Z) - Statistical Inference After Adaptive Sampling for Longitudinal Data [9.468593929311867]
本研究では,Z推定による適応的なサンプルデータに対して,様々な統計的解析を行う新しい手法を開発した。
本研究は, 実験プロセスのための新しい理論ツールを開発し, 個別の関心を持つ可能性のある, 適応的にサンプル化された長手データについて述べる。
論文 参考訳(メタデータ) (2022-02-14T23:48:13Z) - Synthetic Design: An Optimization Approach to Experimental Design with
Synthetic Controls [5.3063411515511065]
本研究では,前処理結果データを用いた実験結果の最適設計について検討する。
平均処理効果は、処理単位の重み付き平均結果と制御単位との差として推定される。
重みと合わせて処理単位の集合を選択する方法をいくつか提案する。
論文 参考訳(メタデータ) (2021-12-01T05:05:26Z) - Rethinking Sampling Strategies for Unsupervised Person Re-identification [59.47536050785886]
我々は,同じフレームワーク下での各種サンプリング戦略と損失関数のパフォーマンス差の理由を解析した。
グループサンプリングを提案し、同じクラスのサンプルをグループに集める。
Market-1501、DukeMTMC-reID、MSMT17の実験は、グループサンプリングが最先端の手法に匹敵する性能を達成することを示した。
論文 参考訳(メタデータ) (2021-07-07T05:39:58Z) - Jo-SRC: A Contrastive Approach for Combating Noisy Labels [58.867237220886885]
Jo-SRC (Joint Sample Selection and Model Regularization based on Consistency) というノイズロバスト手法を提案する。
具体的には、対照的な学習方法でネットワークをトレーニングする。
各サンプルの2つの異なるビューからの予測は、クリーンまたは分布不足の「可能性」を推定するために使用されます。
論文 参考訳(メタデータ) (2021-03-24T07:26:07Z) - Optimal Off-Policy Evaluation from Multiple Logging Policies [77.62012545592233]
我々は,複数のロギングポリシからオフ政治評価を行い,それぞれが一定のサイズ,すなわち階層化サンプリングのデータセットを生成する。
複数ロガーのOPE推定器は,任意のインスタンス,すなわち効率のよいインスタンスに対して最小分散である。
論文 参考訳(メタデータ) (2020-10-21T13:43:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。