論文の概要: A/B/n Testing with Control in the Presence of Subpopulations
- arxiv url: http://arxiv.org/abs/2110.15573v1
- Date: Fri, 29 Oct 2021 06:36:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-01 14:22:18.953552
- Title: A/B/n Testing with Control in the Presence of Subpopulations
- Title(参考訳): サブポピュレーションの存在下で制御されたa/b/nテスト
- Authors: Yoan Russac (DI-ENS, CNRS, VALDA, PSL), Christina Katsimerou, Dennis
Bohle, Olivier Capp\'e (CNRS, VALDA, DI-ENS, PSL), Aur\'elien Garivier
(UMPA-ENSL, CNRS, ENS Lyon), Wouter Koolen (CWI)
- Abstract要約: A/B/nテストアプリケーション A/B/nテストアプリケーションによるモチベーション。
有限集合の分布(Empharms と呼ばれる)を考えるが、そのうちの 1 つはenmphcontrol として扱われる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivated by A/B/n testing applications, we consider a finite set of
distributions (called \emph{arms}), one of which is treated as a
\emph{control}. We assume that the population is stratified into homogeneous
subpopulations. At every time step, a subpopulation is sampled and an arm is
chosen: the resulting observation is an independent draw from the arm
conditioned on the subpopulation. The quality of each arm is assessed through a
weighted combination of its subpopulation means. We propose a strategy for
sequentially choosing one arm per time step so as to discover as fast as
possible which arms, if any, have higher weighted expectation than the control.
This strategy is shown to be asymptotically optimal in the following sense: if
$\tau_\delta$ is the first time when the strategy ensures that it is able to
output the correct answer with probability at least $1-\delta$, then
$\mathbb{E}[\tau_\delta]$ grows linearly with $\log(1/\delta)$ at the exact
optimal rate. This rate is identified in the paper in three different settings:
(1) when the experimenter does not observe the subpopulation information, (2)
when the subpopulation of each sample is observed but not chosen, and (3) when
the experimenter can select the subpopulation from which each response is
sampled. We illustrate the efficiency of the proposed strategy with numerical
simulations on synthetic and real data collected from an A/B/n experiment.
- Abstract(参考訳): A/B/n テストの応用によって動機づけられた分布の有限集合 (\emph{arms} と呼ばれる) を考えると、そのうちの1つは \emph{control} として扱われる。
人口は同質の亜集団に分類されていると仮定する。
時間ステップ毎にサブポピュレーションがサンプリングされ、アームが選択され、結果として得られる観察はサブポピュレーションに条件付けられたアームから独立したドローとなる。
各アームの品質は、そのサブポピュレーション手段の重み付け組み合わせにより評価される。
制御よりも重み付けされた期待値が高い腕をできるだけ早く発見するために,時間ステップ毎に1本の腕を順次選択する戦略を提案する。
この戦略が漸近的に最適であると示される: $\tau_\delta$ が、その戦略が少なくとも 1-\delta$ の確率で正しい解を出力できることを保証する最初のものであるなら、$\mathbb{E}[\tau_\delta]$ は $\log(1/\delta)$ の正確な最適速度で線形に成長する。
この割合は,(1)実験者がサブポピュレーション情報を観測しない場合,(2)各サンプルのサブポピュレーションが観測され,選択されない場合,(3)各応答がサンプリングされたサブポピュレーションを選択することができる場合の3つの設定で識別される。
a/b/n実験から収集した合成データと実データを用いた数値シミュレーションにより,提案手法の有効性を示す。
関連論文リスト
- Combinatorial Stochastic-Greedy Bandit [79.1700188160944]
我々は,選択した$n$のアームセットのジョイント報酬以外の余分な情報が観測されない場合に,マルチアームのバンディット問題に対する新規グリーディ・バンディット(SGB)アルゴリズムを提案する。
SGBは最適化された拡張型コミットアプローチを採用しており、ベースアームの大きなセットを持つシナリオ用に特別に設計されている。
論文 参考訳(メタデータ) (2023-12-13T11:08:25Z) - Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Allocating Divisible Resources on Arms with Unknown and Random Rewards [25.93048671326331]
我々は、各期間に複数の武器で再生可能資源の1単位を割り当てる意思決定者について検討する。
アームは未知でランダムな報酬であり、その手段は割り当てられたリソースに比例し、分散は割り当てられたリソースのオーダー$b$に比例する。
論文 参考訳(メタデータ) (2023-06-28T21:59:11Z) - Best Arm Identification with Fairness Constraints on Subpopulations [11.349636358427485]
サブポピュレーション(BAICS)におけるフェアネス制約によるベストアーム識別の問題を定式化し,解析し,解決する。
BAICSの問題は、選択された腕が全てのサブ集団に公平でなければならないことである。
我々は、閉形式表現を用いて、標本複雑性の最も達成可能な下界を証明した。
論文 参考訳(メタデータ) (2023-04-08T19:41:02Z) - Semidefinite programming on population clustering: a global analysis [0.6472434306724609]
サブガウス分布の混合から引き出された小さいデータサンプルを$n$で分割する問題を考察する。
私たちは、個々のフィーチャが平均的な$gamma$が低い場合に興味を持ち、サンプルを正しく分割するためにできるだけ少数の機能を使用したいと思っています。
論文 参考訳(メタデータ) (2023-01-01T04:52:25Z) - Finite-Time Regret of Thompson Sampling Algorithms for Exponential
Family Multi-Armed Bandits [88.21288104408556]
本研究では,指数関数族バンドイットに対するトンプソンサンプリング (TS) アルゴリズムの遺残について検討する。
最適な腕の過小評価を避けるために,新しいサンプリング分布を用いたトンプソンサンプリング(Expulli)を提案する。
論文 参考訳(メタデータ) (2022-06-07T18:08:21Z) - Sequential Community Mode Estimation [7.693649834261879]
本研究では,集団内最大の集団を個体の連続的無作為なサンプリングによって同定する問題について検討する。
この問題に対する新しいアルゴリズムを提案し,解析し,任意のアルゴリズムの下でエラーの確率に関する情報理論の下限を確立する。
論文 参考訳(メタデータ) (2021-11-16T15:05:40Z) - PAC Best Arm Identification Under a Deadline [101.10352416022559]
我々は、$(epsilon, delta)$-PACベストアーム識別について研究し、意思決定者は、アームプル(サンプル)の数を最小化しながら、少なくとも1 - delta$の確率で最適なアームを識別しなければならない。
この作業では、決定者はT$ラウンドの期限が与えられ、各ラウンドで、どのアームを引っ張るか、何回引っ張るかを適応的に選ぶことができる。
本稿では,この設定のための新しいアルゴリズムであるElastic Batch Racing (EBR)を提案する。
論文 参考訳(メタデータ) (2021-06-06T19:48:32Z) - Top-$k$ eXtreme Contextual Bandits with Arm Hierarchy [71.17938026619068]
我々は、腕の総数が膨大であることができるトップ$ k$極端な文脈的包帯問題を研究します。
まず,Inverse Gap Weighting戦略を用いて,非極端に実現可能な設定のアルゴリズムを提案する。
我々のアルゴリズムは、$O(ksqrt(A-k+1)T log (|mathcalF|T))$である。
論文 参考訳(メタデータ) (2021-02-15T19:10:52Z) - Conditional Uncorrelation and Efficient Non-approximate Subset Selection
in Sparse Regression [72.84177488527398]
相関性の観点からスパース回帰を考察し,条件付き非相関式を提案する。
提案手法により、計算複雑性は、スパース回帰における各候補部分集合に対して$O(frac16k3+mk2+mkd)$から$O(frac16k3+frac12mk2)$に削減される。
論文 参考訳(メタデータ) (2020-09-08T20:32:26Z) - Extrapolating the profile of a finite population [35.69057741775438]
経験的ベイズにおける原型的問題を考察する。すなわち、$k$の個体群は、それぞれ$k$の個体群である。
我々は、$m =omega(k/log k)$ の部分線型状態において、集団の自明な全変動を一貫して見積もることができることを示す。
論文 参考訳(メタデータ) (2020-05-21T10:39:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。