論文の概要: Boosting Sensitivity of Large-scale Online Experimentation via Dropout
Buyer Imputation
- arxiv url: http://arxiv.org/abs/2209.06125v1
- Date: Fri, 9 Sep 2022 01:05:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-14 13:21:46.537636
- Title: Boosting Sensitivity of Large-scale Online Experimentation via Dropout
Buyer Imputation
- Title(参考訳): 落札者インプットによる大規模オンライン実験の感度向上
- Authors: Sumin Shen, Huiying Mao, Zezhong Zhang, Zili Chen, Keyu Nie, Xinwei
Deng
- Abstract要約: 本研究では,ドロップアウト購入者の概念を導入し,不完全なメトリック値を持つユーザを,訪問者とドロップアウト購入者という2つのグループに分類する。
不完全なメトリクスの解析のために、クラスタベースのk-アレスト近傍の計算法を提案する。
- 参考スコア(独自算出の注目度): 4.753069295451989
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Metrics provide strong evidence to support hypotheses in online
experimentation and hence reduce debates in the decision-making process. In
this work, we introduce the concept of dropout buyers and categorize users with
incomplete metric values into two groups: visitors and dropout buyers. For the
analysis of incomplete metrics, we propose a cluster-based k-nearest
neighbors-based imputation method. Our proposed imputation method considers
both the experiment-specific features and users' activities along their
shopping paths, allowing different imputation values for different users. To
facilitate efficient imputation in large-scale data sets in online
experimentation, the proposed method uses a combination of stratification and
clustering. The performance of the proposed method was compared to several
conventional methods in a past experiment at eBay.
- Abstract(参考訳): メトリクスはオンライン実験における仮説を支持する強力な証拠を提供するため、意思決定プロセスにおける議論を減らす。
本研究では,ドロップアウトバイヤーの概念を紹介し,不完全なメトリック値を持つユーザを,訪問者とドロップアウトバイヤーの2つのグループに分類する。
不完全なメトリクスの分析のために、クラスタベースのk-nearest近傍に基づくインプテーション法を提案する。
提案手法では,実験特有の特徴と買い物経路に沿ったユーザの活動の両方を考慮し,異なるユーザに対して異なるインプテーション値を付与する。
オンライン実験における大規模データセットの効率的なインプテーションを容易にするために,提案手法では階層化とクラスタリングの組み合わせを用いる。
提案手法の性能は,過去にeBayで行ったいくつかの従来手法と比較された。
関連論文リスト
- Variance Reduction in Ratio Metrics for Efficient Online Experiments [12.036747050794135]
大規模なショートビデオプラットフォーム上での比率測定に分散低減手法を適用した: ShareChat。
その結果,77%の症例でA/Bテストの信頼性を向上できるか,データポイントを30%減らして同一の信頼性を維持することができることがわかった。
論文 参考訳(メタデータ) (2024-01-08T18:01:09Z) - Effect Size Estimation for Duration Recommendation in Online
Experiments: Leveraging Hierarchical Models and Objective Utility Approaches [14.309426374206021]
仮定効果サイズ(AES)の選択は、実験の期間を決定的に決定し、その結果、その精度と効率が決定される。
伝統的に、実験者はドメイン知識に基づいてAESを決定するが、この方法は多数の実験を管理するオンライン実験サービスにとって実用的ではない。
オンライン実験サービスにおけるデータ駆動型AES選択のための2つのソリューションを提案する。
論文 参考訳(メタデータ) (2023-12-20T09:34:28Z) - Choosing a Proxy Metric from Past Experiments [57.578341848808385]
多くのランダム化実験では、長期的な計量の処理効果は測定が困難または不可能であることが多い。
一般的な方法は、いくつかの短期的プロキシメトリクスを計測して、長期的メトリックを綿密に追跡することである。
ランダム化実験の同種集団において最適なプロキシメトリックを定義し構築するための新しい統計フレームワークを導入する。
論文 参考訳(メタデータ) (2023-09-14T17:43:02Z) - Fair Effect Attribution in Parallel Online Experiments [57.13281584606437]
A/Bテストは、オンラインサービスで導入された変更の影響を確実に特定する目的で役立ちます。
オンラインプラットフォームでは,ユーザトラフィックをランダムに分割して多数の同時実験を行うのが一般的である。
異なるグループ間の完全なランダム化にもかかわらず、同時実験は互いに相互作用し、平均的な集団の結果に負の影響をもたらす。
論文 参考訳(メタデータ) (2022-10-15T17:15:51Z) - A Recommendation Approach based on Similarity-Popularity Models of
Complex Networks [1.385805101975528]
そこで本研究では,類似性傾向モデルにより生成された複雑なネットワークをベースとした新しい推薦手法を提案する。
まず、観測されたレーティングからユーザとアイテムをノードとして持つネットワークモデルを構築し、そのモデルを用いて未知のレーティングを予測する。
提案手法は, 各種ドメインの21データセットに対して, ベースラインと最先端のレコメンデーション手法に対して, 提案手法を実装, 実験的に比較した。
論文 参考訳(メタデータ) (2022-09-29T11:00:06Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Adaptive Experimentation with Delayed Binary Feedback [11.778924435036519]
本稿では,2値フィードバックの遅延目的に適した適応型実験法を提案する。
実際の目的を推定し、見積もりに基づいて変種を動的に割り当てる。
このソリューションは現在、JD.comのオンライン実験プラットフォームにデプロイされている。
論文 参考訳(メタデータ) (2022-02-02T01:47:10Z) - Scalable Personalised Item Ranking through Parametric Density Estimation [53.44830012414444]
暗黙のフィードバックから学ぶことは、一流問題の難しい性質のために困難です。
ほとんどの従来の方法は、一級問題に対処するためにペアワイズランキングアプローチとネガティブサンプラーを使用します。
本論文では,ポイントワイズと同等の収束速度を実現する学習対ランクアプローチを提案する。
論文 参考訳(メタデータ) (2021-05-11T03:38:16Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - PONE: A Novel Automatic Evaluation Metric for Open-Domain Generative
Dialogue Systems [48.99561874529323]
オープンドメイン生成対話システムの評価には3つの方法がある。
体系的な比較が欠如しているため、どの指標がより効果的であるかは明らかでない。
本稿では,人間の判断との相関性を大幅に改善できる,新しい,実現可能な学習基準を提案する。
論文 参考訳(メタデータ) (2020-04-06T04:36:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。