Fugu-MT 論文翻訳(概要): Boosting Sensitivity of Large-scale Online Experimentation via Dropout Buyer Imputation

論文の概要: Boosting Sensitivity of Large-scale Online Experimentation via Dropout Buyer Imputation

arxiv url: http://arxiv.org/abs/2209.06125v1
Date: Fri, 9 Sep 2022 01:05:53 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-14 13:21:46.537636
Title: Boosting Sensitivity of Large-scale Online Experimentation via Dropout Buyer Imputation
Title（参考訳）: 落札者インプットによる大規模オンライン実験の感度向上
Authors: Sumin Shen, Huiying Mao, Zezhong Zhang, Zili Chen, Keyu Nie, Xinwei Deng
Abstract要約: 本研究では,ドロップアウト購入者の概念を導入し,不完全なメトリック値を持つユーザを,訪問者とドロップアウト購入者という2つのグループに分類する。不完全なメトリクスの解析のために、クラスタベースのk-アレスト近傍の計算法を提案する。
参考スコア（独自算出の注目度）: 4.753069295451989
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Metrics provide strong evidence to support hypotheses in online experimentation and hence reduce debates in the decision-making process. In this work, we introduce the concept of dropout buyers and categorize users with incomplete metric values into two groups: visitors and dropout buyers. For the analysis of incomplete metrics, we propose a cluster-based k-nearest neighbors-based imputation method. Our proposed imputation method considers both the experiment-specific features and users' activities along their shopping paths, allowing different imputation values for different users. To facilitate efficient imputation in large-scale data sets in online experimentation, the proposed method uses a combination of stratification and clustering. The performance of the proposed method was compared to several conventional methods in a past experiment at eBay.
Abstract（参考訳）: メトリクスはオンライン実験における仮説を支持する強力な証拠を提供するため、意思決定プロセスにおける議論を減らす。本研究では,ドロップアウトバイヤーの概念を紹介し,不完全なメトリック値を持つユーザを,訪問者とドロップアウトバイヤーの2つのグループに分類する。不完全なメトリクスの分析のために、クラスタベースのk-nearest近傍に基づくインプテーション法を提案する。提案手法では,実験特有の特徴と買い物経路に沿ったユーザの活動の両方を考慮し,異なるユーザに対して異なるインプテーション値を付与する。オンライン実験における大規模データセットの効率的なインプテーションを容易にするために,提案手法では階層化とクラスタリングの組み合わせを用いる。提案手法の性能は,過去にeBayで行ったいくつかの従来手法と比較された。

関連論文リスト

Offline Clustering of Preference Learning with Active-data Augmentation [32.93090135413931]
現実世界の嗜好学習は、しばしば異なる嗜好を持つユーザーを巻き込む。この設定では、データを効果的に集約するユーザ間の類似性を識別し、不均衡なオフラインデータを扱うという、2つの主要な課題が提示される。学習者がオフラインデータにのみ依存する、純粋なオフライン設定のためのオフC$2$PLを提案する。我々は,本フレームワークを,学習者がテストユーザに対して限られた数のアクティブデータを選択することができるアクティブデータ拡張設定に拡張する。
論文参考訳（メタデータ） (2025-10-30T09:39:05Z)
Harnessing the Power of Interleaving and Counterfactual Evaluation for Airbnb Search Ranking [14.97060265751423]
評価は,検索・推薦システムにおけるランキングアルゴリズムの開発において重要な役割を担っている。オンライン環境は因果推論技術の適用に寄与する。効果的なA/Bテストでは、ビジネスはユニークな課題に直面します。
論文参考訳（メタデータ） (2025-08-01T16:28:18Z)
Data Distribution Valuation [56.71023681599737]
既存のデータバリュエーションメソッドは、離散データセットの値を定義します。多くのユースケースでは、ユーザはデータセットの値だけでなく、データセットがサンプリングされた分布の値にも興味を持っています。本稿では,理論的原理と実行可能なポリシを実現するための,MMDに基づく評価手法を提案する。
論文参考訳（メタデータ） (2024-10-06T07:56:53Z)
Powerful A/B-Testing Metrics and Where to Find Them [11.018341970786574]
A/Bテストは、現実世界のレコメンデーションシステム評価のパンとバターである。ノーススター計量は、どの系の変種が優れているとみなすべきかを評価するために用いられる。我々は,この情報を収集し,興味のある指標に対するタイプI,タイプII,タイプIIIエラーの定量化に活用することを提案する。大規模なショートビデオプラットフォームであるShareChatとMojに対して,このパイプラインを大規模に構築する際の成果と洞察を提示する。
論文参考訳（メタデータ） (2024-07-30T08:59:50Z)
Adaptive Experimentation When You Can't Experiment [55.86593195947978]
本稿では,Emphcon founded the pure exploration transductive linear bandit (textttCPET-LB) problem。オンラインサービスは、ユーザーを特定の治療にインセンティブを与える、適切にランダム化された励ましを利用することができる。
論文参考訳（メタデータ） (2024-06-15T20:54:48Z)
How to Leverage Diverse Demonstrations in Offline Imitation Learning [39.24627312800116]
不完全な実演を伴うオフライン模倣学習(IL)は、専門家データの不足により注目を集めている。本稿では, 結果の状態に基づいて正の挙動を識別する, 単純で効果的なデータ選択手法を提案する。次に、専門家と選択したデータを正しく活用できる軽量な行動クローニングアルゴリズムを考案する。
論文参考訳（メタデータ） (2024-05-24T04:56:39Z)
Variance Reduction in Ratio Metrics for Efficient Online Experiments [12.036747050794135]
大規模なショートビデオプラットフォーム上での比率測定に分散低減手法を適用した: ShareChat。その結果,77%の症例でA/Bテストの信頼性を向上できるか,データポイントを30%減らして同一の信頼性を維持することができることがわかった。
論文参考訳（メタデータ） (2024-01-08T18:01:09Z)
Effect Size Estimation for Duration Recommendation in Online Experiments: Leveraging Hierarchical Models and Objective Utility Approaches [13.504353263032359]
仮定効果サイズ(AES)の選択は、実験の期間を決定的に決定し、その結果、その精度と効率が決定される。伝統的に、実験者はドメイン知識に基づいてAESを決定するが、この方法は多数の実験を管理するオンライン実験サービスにとって実用的ではない。オンライン実験サービスにおけるデータ駆動型AES選択のための2つのソリューションを提案する。
論文参考訳（メタデータ） (2023-12-20T09:34:28Z)
Choosing a Proxy Metric from Past Experiments [54.338884612982405]
多くのランダム化実験では、長期的な計量の処理効果は測定が困難または不可能であることが多い。一般的な方法は、いくつかの短期的プロキシメトリクスを計測して、長期的メトリックを綿密に追跡することである。ランダム化実験の同種集団において最適なプロキシメトリックを定義し構築するための新しい統計フレームワークを導入する。
論文参考訳（メタデータ） (2023-09-14T17:43:02Z)
Fair Effect Attribution in Parallel Online Experiments [57.13281584606437]
A/Bテストは、オンラインサービスで導入された変更の影響を確実に特定する目的で役立ちます。オンラインプラットフォームでは,ユーザトラフィックをランダムに分割して多数の同時実験を行うのが一般的である。異なるグループ間の完全なランダム化にもかかわらず、同時実験は互いに相互作用し、平均的な集団の結果に負の影響をもたらす。
論文参考訳（メタデータ） (2022-10-15T17:15:51Z)
A Recommendation Approach based on Similarity-Popularity Models of Complex Networks [1.385805101975528]
そこで本研究では,類似性傾向モデルにより生成された複雑なネットワークをベースとした新しい推薦手法を提案する。まず、観測されたレーティングからユーザとアイテムをノードとして持つネットワークモデルを構築し、そのモデルを用いて未知のレーティングを予測する。提案手法は, 各種ドメインの21データセットに対して, ベースラインと最先端のレコメンデーション手法に対して, 提案手法を実装, 実験的に比較した。
論文参考訳（メタデータ） (2022-09-29T11:00:06Z)
Scalable Personalised Item Ranking through Parametric Density Estimation [53.44830012414444]
暗黙のフィードバックから学ぶことは、一流問題の難しい性質のために困難です。ほとんどの従来の方法は、一級問題に対処するためにペアワイズランキングアプローチとネガティブサンプラーを使用します。本論文では,ポイントワイズと同等の収束速度を実現する学習対ランクアプローチを提案する。
論文参考訳（メタデータ） (2021-05-11T03:38:16Z)
Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文参考訳（メタデータ） (2020-06-15T10:08:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。