論文の概要: Clustering-based Imputation for Dropout Buyers in Large-scale Online
Experimentation
- arxiv url: http://arxiv.org/abs/2209.06125v3
- Date: Fri, 7 Apr 2023 15:21:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-10 15:11:59.659520
- Title: Clustering-based Imputation for Dropout Buyers in Large-scale Online
Experimentation
- Title(参考訳): 大規模オンライン実験における落札者に対するクラスタリングに基づく計算
- Authors: Sumin Shen, Huiying Mao, Zezhong Zhang, Zili Chen, Keyu Nie, Xinwei
Deng
- Abstract要約: オンライン実験では、適切な指標(例えば購入)が仮説を支持し、意思決定プロセスを強化する強力な証拠を提供する。
本研究では,ドロップアウト購入者の概念を導入し,不完全なメトリック値を持つユーザを,訪問者とドロップアウト購入者という2つのグループに分類する。
不完全なメトリクスを分析するために、$k$-nearest 隣人を用いたクラスタリングベースの計算法を提案する。
- 参考スコア(独自算出の注目度): 4.753069295451989
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In online experimentation, appropriate metrics (e.g., purchase) provide
strong evidence to support hypotheses and enhance the decision-making process.
However, incomplete metrics are frequently occurred in the online
experimentation, making the available data to be much fewer than the planned
online experiments (e.g., A/B testing). In this work, we introduce the concept
of dropout buyers and categorize users with incomplete metric values into two
groups: visitors and dropout buyers. For the analysis of incomplete metrics, we
propose a clustering-based imputation method using $k$-nearest neighbors. Our
proposed imputation method considers both the experiment-specific features and
users' activities along their shopping paths, allowing different imputation
values for different users. To facilitate efficient imputation of large-scale
data sets in online experimentation, the proposed method uses a combination of
stratification and clustering. The performance of the proposed method is
compared to several conventional methods in both simulation studies and a real
online experiment at eBay.
- Abstract(参考訳): オンライン実験では、適切な指標(例えば購入)が仮説を支持し、意思決定プロセスを強化する強力な証拠を提供する。
しかしながら、オンライン実験では不完全なメトリクスが頻繁に発生し、利用可能なデータは計画されたオンライン実験(例えばA/Bテスト)よりもはるかに少ない。
本研究では,ドロップアウトバイヤーの概念を紹介し,不完全なメトリック値を持つユーザを,訪問者とドロップアウトバイヤーの2つのグループに分類する。
不完全なメトリクスの分析には,$k$-nearest近傍を用いたクラスタリングに基づくインプテーション手法を提案する。
提案手法では,実験特有の特徴と買い物経路に沿ったユーザの活動の両方を考慮し,異なるユーザに対して異なるインプテーション値を付与する。
オンライン実験における大規模データセットの効率的なインプテーションを容易にするために,提案手法では階層化とクラスタリングの組み合わせを用いる。
提案手法の性能は,eBayにおけるシミュレーション研究と実オンライン実験の両方において,従来手法と比較される。
関連論文リスト
- Data Distribution Valuation [56.71023681599737]
既存のデータバリュエーションメソッドは、離散データセットの値を定義します。
多くのユースケースでは、ユーザはデータセットの値だけでなく、データセットがサンプリングされた分布の値にも興味を持っています。
本稿では,理論的原理と実行可能なポリシを実現するための,MMDに基づく評価手法を提案する。
論文 参考訳(メタデータ) (2024-10-06T07:56:53Z) - Powerful A/B-Testing Metrics and Where to Find Them [11.018341970786574]
A/Bテストは、現実世界のレコメンデーションシステム評価のパンとバターである。
ノーススター計量は、どの系の変種が優れているとみなすべきかを評価するために用いられる。
我々は,この情報を収集し,興味のある指標に対するタイプI,タイプII,タイプIIIエラーの定量化に活用することを提案する。
大規模なショートビデオプラットフォームであるShareChatとMojに対して,このパイプラインを大規模に構築する際の成果と洞察を提示する。
論文 参考訳(メタデータ) (2024-07-30T08:59:50Z) - Adaptive Experimentation When You Can't Experiment [55.86593195947978]
本稿では,Emphcon founded the pure exploration transductive linear bandit (textttCPET-LB) problem。
オンラインサービスは、ユーザーを特定の治療にインセンティブを与える、適切にランダム化された励ましを利用することができる。
論文 参考訳(メタデータ) (2024-06-15T20:54:48Z) - How to Leverage Diverse Demonstrations in Offline Imitation Learning [39.24627312800116]
不完全な実演を伴うオフライン模倣学習(IL)は、専門家データの不足により注目を集めている。
本稿では, 結果の状態に基づいて正の挙動を識別する, 単純で効果的なデータ選択手法を提案する。
次に、専門家と選択したデータを正しく活用できる軽量な行動クローニングアルゴリズムを考案する。
論文 参考訳(メタデータ) (2024-05-24T04:56:39Z) - Variance Reduction in Ratio Metrics for Efficient Online Experiments [12.036747050794135]
大規模なショートビデオプラットフォーム上での比率測定に分散低減手法を適用した: ShareChat。
その結果,77%の症例でA/Bテストの信頼性を向上できるか,データポイントを30%減らして同一の信頼性を維持することができることがわかった。
論文 参考訳(メタデータ) (2024-01-08T18:01:09Z) - Effect Size Estimation for Duration Recommendation in Online Experiments: Leveraging Hierarchical Models and Objective Utility Approaches [13.504353263032359]
仮定効果サイズ(AES)の選択は、実験の期間を決定的に決定し、その結果、その精度と効率が決定される。
伝統的に、実験者はドメイン知識に基づいてAESを決定するが、この方法は多数の実験を管理するオンライン実験サービスにとって実用的ではない。
オンライン実験サービスにおけるデータ駆動型AES選択のための2つのソリューションを提案する。
論文 参考訳(メタデータ) (2023-12-20T09:34:28Z) - Choosing a Proxy Metric from Past Experiments [54.338884612982405]
多くのランダム化実験では、長期的な計量の処理効果は測定が困難または不可能であることが多い。
一般的な方法は、いくつかの短期的プロキシメトリクスを計測して、長期的メトリックを綿密に追跡することである。
ランダム化実験の同種集団において最適なプロキシメトリックを定義し構築するための新しい統計フレームワークを導入する。
論文 参考訳(メタデータ) (2023-09-14T17:43:02Z) - Fair Effect Attribution in Parallel Online Experiments [57.13281584606437]
A/Bテストは、オンラインサービスで導入された変更の影響を確実に特定する目的で役立ちます。
オンラインプラットフォームでは,ユーザトラフィックをランダムに分割して多数の同時実験を行うのが一般的である。
異なるグループ間の完全なランダム化にもかかわらず、同時実験は互いに相互作用し、平均的な集団の結果に負の影響をもたらす。
論文 参考訳(メタデータ) (2022-10-15T17:15:51Z) - A Recommendation Approach based on Similarity-Popularity Models of
Complex Networks [1.385805101975528]
そこで本研究では,類似性傾向モデルにより生成された複雑なネットワークをベースとした新しい推薦手法を提案する。
まず、観測されたレーティングからユーザとアイテムをノードとして持つネットワークモデルを構築し、そのモデルを用いて未知のレーティングを予測する。
提案手法は, 各種ドメインの21データセットに対して, ベースラインと最先端のレコメンデーション手法に対して, 提案手法を実装, 実験的に比較した。
論文 参考訳(メタデータ) (2022-09-29T11:00:06Z) - Scalable Personalised Item Ranking through Parametric Density Estimation [53.44830012414444]
暗黙のフィードバックから学ぶことは、一流問題の難しい性質のために困難です。
ほとんどの従来の方法は、一級問題に対処するためにペアワイズランキングアプローチとネガティブサンプラーを使用します。
本論文では,ポイントワイズと同等の収束速度を実現する学習対ランクアプローチを提案する。
論文 参考訳(メタデータ) (2021-05-11T03:38:16Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。