論文の概要: Estimating Treatment Effects under Recommender Interference: A Structured Neural Networks Approach
- arxiv url: http://arxiv.org/abs/2406.14380v1
- Date: Thu, 20 Jun 2024 14:53:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-21 13:12:50.667126
- Title: Estimating Treatment Effects under Recommender Interference: A Structured Neural Networks Approach
- Title(参考訳): Recommender Interferenceによる治療効果の推定:構造化ニューラルネットワークによるアプローチ
- Authors: Ruohan Zhan, Shichao Han, Yuchen Hu, Zhenling Jiang,
- Abstract要約: 標準差分推定器は, 偏りのある処理効果を推定できることを示す。
このバイアスはレコメンデーターの干渉によって生じ、これは治療とコントロールのクリエーターが露出を競うときに発生する。
本稿では、コンテンツアイテムの扱いと制御の両方からなるプールの中から、アイテムをどのように選択するかをキャプチャする「レコメンダ選択モデル」を提案する。
- 参考スコア(独自算出の注目度): 13.208141830901845
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recommender systems are essential for content-sharing platforms by curating personalized content. To evaluate updates of recommender systems targeting content creators, platforms frequently engage in creator-side randomized experiments to estimate treatment effect, defined as the difference in outcomes when a new (vs. the status quo) algorithm is deployed on the platform. We show that the standard difference-in-means estimator can lead to a biased treatment effect estimate. This bias arises because of recommender interference, which occurs when treated and control creators compete for exposure through the recommender system. We propose a "recommender choice model" that captures how an item is chosen among a pool comprised of both treated and control content items. By combining a structural choice model with neural networks, the framework directly models the interference pathway in a microfounded way while accounting for rich viewer-content heterogeneity. Using the model, we construct a double/debiased estimator of the treatment effect that is consistent and asymptotically normal. We demonstrate its empirical performance with a field experiment on Weixin short-video platform: besides the standard creator-side experiment, we carry out a costly blocked double-sided randomization design to obtain a benchmark estimate without interference bias. We show that the proposed estimator significantly reduces the bias in treatment effect estimates compared to the standard difference-in-means estimator.
- Abstract(参考訳): レコメンダシステムは、パーソナライズされたコンテンツをキュレートすることによって、コンテンツ共有プラットフォームに不可欠である。
コンテンツクリエーターを対象としたレコメンデーターシステムの更新を評価するため、プラットフォームは、新しい(vs. the status quo)アルゴリズムがプラットフォームにデプロイされた場合の結果の差として定義される治療効果を推定するために、クリエーター側のランダム化実験に頻繁に従事する。
標準差分推定器は, 偏りのある処理効果を推定できることを示す。
このバイアスは、レコメンデーターの干渉によって生じ、これは、治療とコントロールのクリエーターがレコメンデーターシステムを通じて露出を競うときに発生する。
本稿では、コンテンツアイテムの扱いと制御の両方からなるプールの中から、アイテムをどのように選択するかをキャプチャする「レコメンダ選択モデル」を提案する。
構造選択モデルとニューラルネットワークを組み合わせることで、このフレームワークは、リッチなビューアー・コンテントの不均一性を考慮しつつ、マイクロファウンデーション方式で干渉経路を直接モデル化する。
このモデルを用いて、一貫した漸近的に正常な治療効果の二重偏差推定器を構築する。
Weixin短ビデオプラットフォーム上でのフィールド実験により実験性能を実証し、標準クリエータ側実験に加えて、コストのかかる2面ランダム化設計を行い、干渉バイアスを伴わないベンチマーク推定値を得る。
提案した推定器は,標準差分推定器と比較して処理効果推定のバイアスを著しく低減することを示した。
関連論文リスト
- Adaptive Experimentation When You Can't Experiment [55.86593195947978]
本稿では,Emphcon founded the pure exploration transductive linear bandit (textttCPET-LB) problem。
オンラインサービスは、ユーザーを特定の治療にインセンティブを与える、適切にランダム化された励ましを利用することができる。
論文 参考訳(メタデータ) (2024-06-15T20:54:48Z) - Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文 参考訳(メタデータ) (2024-05-09T12:52:22Z) - Exploring Popularity Bias in Session-based Recommendation [0.6798775532273751]
セッションベースの設定と適応確率計算に分析を拡張し、セッションベースのレコメンデーションタスクの独特な特性に適応する。
本研究では、異なるデータセット上での確率分布と異なる階層化手法について検討し、確率関連特性が実際にデータセット固有のものであることを見出した。
論文 参考訳(メタデータ) (2023-12-13T02:48:35Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Deep Causal Reasoning for Recommendations [47.83224399498504]
推薦システム研究の新たなトレンドは、共同創設者の影響を因果的観点から否定することである。
提案手法は多因性マルチアウトカム(MCMO)推論問題としてモデル化する。
MCMOモデリングは,高次元因果空間に付随する観測が不十分なため,高いばらつきをもたらす可能性があることを示す。
論文 参考訳(メタデータ) (2022-01-06T15:00:01Z) - Control Variates for Slate Off-Policy Evaluation [112.35528337130118]
多次元動作を伴うバッチ化されたコンテキスト帯域データから政治外評価の問題について検討する。
我々は, PIと自己正規化PIの双方に対して, リスク改善を保証した新しい推定器を得る。
論文 参考訳(メタデータ) (2021-06-15T06:59:53Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z) - Counterfactual Evaluation of Slate Recommendations with Sequential
Reward Interactions [18.90946044396516]
音楽ストリーミング、ビデオストリーミング、ニュースレコメンデーション、eコマースサービスは、しばしばシーケンシャルな方法でコンテンツを扱う。
したがって、適切なレコメンデーションのシーケンスの提供と評価は、これらのサービスにとって重要な問題である。
そこで本研究では,アナルアンバイアスの少ない報酬の逐次的相互作用が可能な新しい反事実推定器を提案する。
論文 参考訳(メタデータ) (2020-07-25T17:58:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。