論文の概要: Where to Explore: A Reach and Cost-Aware Approach for Unbiased Data Collection in Recommender Systems
- arxiv url: http://arxiv.org/abs/2512.14733v1
- Date: Thu, 11 Dec 2025 04:03:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-18 17:06:26.69831
- Title: Where to Explore: A Reach and Cost-Aware Approach for Unbiased Data Collection in Recommender Systems
- Title(参考訳): 調査する場所:Recommenderシステムにおける非バイアスデータ収集のためのリーチでコストを意識したアプローチ
- Authors: Qiang Chen, Venkatesh Ganapati Hegde,
- Abstract要約: 本稿では,到達度と機会コストに基づいた配置を最適化し,コンテンツレベルの探索を安全かつ効率的に提供するためのアプローチを提案する。
月間アクティブユーザ数が1億人を超える大規模ストリーミングプラットフォームにデプロイされた当社のアプローチでは,エンゲージメントの低いスクロール深度領域を識別する。
提案手法は,大規模に探索コンテンツを提示する,展開可能な行動情報機構を導入することで,既存のブラウザ内多様化と帯域幅に基づく探索手法を補完する。
- 参考スコア(独自算出の注目度): 4.013613514540094
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Exploration is essential to improve long-term recommendation quality, but it often degrades short-term business performance, especially in remote-first TV environments where users engage passively, expect instant relevance, and offer few chances for correction. This paper introduces an approach for delivering content-level exploration safely and efficiently by optimizing its placement based on reach and opportunity cost. Deployed on a large-scale streaming platform with over 100 million monthly active users, our approach identifies scroll-depth regions with lower engagement and strategically introduces a dedicated container, the "Something Completely Different" row containing randomized content. Rather than enforcing exploration uniformly across the user interface (UI), we condition its appearance on empirically low-cost, high-reach positions to ensure minimal tradeoff against platform-level watch time goals. Extensive A/B testing shows that this strategy preserves business metrics while collecting unbiased interaction data. Our method complements existing intra-row diversification and bandit-based exploration techniques by introducing a deployable, behaviorally informed mechanism for surfacing exploratory content at scale. Moreover, we demonstrate that the collected unbiased data, integrated into downstream candidate generation, significantly improves user engagement, validating its value for recommender systems.
- Abstract(参考訳): 長期レコメンデーションの品質向上には探索が不可欠であるが、特にリモートファーストのテレビ環境において、ユーザーが受動的にエンゲージメントし、即時関連を期待し、修正の機会が少ない場合において、短期的なビジネスパフォーマンスを低下させることが多い。
本稿では,到達度と機会コストに基づいた配置を最適化し,コンテンツレベルの探索を安全かつ効率的に提供するためのアプローチを提案する。
月間アクティブユーザ1億人を超える大規模ストリーミングプラットフォームにデプロイされた当社のアプローチでは,エンゲージメントの低いスクロール深度領域を特定し,ランダム化されたコンテンツを含む“Something Completely Different”行という専用コンテナを戦略的に導入する。
ユーザインターフェース(UI)を均一に探索する代わりに、プラットフォームレベルの監視時間の目標に対する最小限のトレードオフを確保するために、経験的に低コストで高い評価の立場にその外観を定めます。
大規模なA/Bテストは、この戦略が、偏りのないインタラクションデータを収集しながら、ビジネスメトリクスを保存することを示している。
提案手法は,大規模に探索コンテンツを提示する,展開可能な行動情報機構を導入することで,既存のブラウザ内多様化と帯域幅に基づく探索手法を補完する。
さらに、下流候補生成に組み込まれた非バイアスデータにより、ユーザのエンゲージメントが大幅に向上し、レコメンデーションシステムの価値が検証されることを示した。
関連論文リスト
- Retentive Relevance: Capturing Long-Term User Value in Recommendation Systems [29.596401271139797]
本稿では,新しいコンテンツレベル調査に基づくフィードバック尺度であるRetentive Relevanceを紹介する。
Retentive Relevanceは、ユーザーが同様のコンテンツのためにプラットフォームに戻る意図を直接評価する。
これらの結果から,Retentive Relevanceは,エンゲージメント信号および他の調査指標よりも,翌日のリテンションの予測に優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-10-08T23:38:57Z) - RecGPT Technical Report [57.84251629878726]
本稿では,レコメンデーションパイプラインの中心にユーザの意図を配置する次世代フレームワークRecGPTを提案する。
RecGPTは、大きな言語モデルをユーザ関心のマイニング、アイテム検索、説明生成のキーステージに統合する。
オンライン実験では、RecGPTが利害関係者間で一貫したパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-07-30T17:55:06Z) - Exploration on Demand: From Algorithmic Control to User Empowerment [0.0]
本稿では,映画レコメンデーションにおけるパーソナライズと多様性を効果的にバランスする,ユーザ制御探索を用いた適応クラスタリングフレームワークを提案する。
より少ないクラスタから戦略的にサンプリングすることで,推薦の多様性を制御できる新しい探索機構を提案する。
我々の大規模言語モデルに基づくA/Bテスト手法は、300人のシミュレーションユーザーによって実施され、72.7%の長期ユーザーが純粋に悪用されたものよりも探索的レコメンデーションを好むことが明らかとなった。
論文 参考訳(メタデータ) (2025-07-29T14:57:26Z) - Optimization of Epsilon-Greedy Exploration [35.9674180611893]
その結果,バッチサイズの変化が最適な探索戦略に大きく影響していることが判明した。
提案手法は,特定の問題設定に対する探索を自動調整し,各設定に最適なマッチングや性能を連続的に達成する。
論文 参考訳(メタデータ) (2025-06-03T19:14:53Z) - Item Level Exploration Traffic Allocation in Large-scale Recommendation Systems [7.207863744953401]
本稿では,大規模レコメンデーションシステムにおけるコールドスタート問題の解決に寄与する。
そこで本研究では,新鮮な商品に印象を効率的に割り当てるための探索システムを提案する。
論文 参考訳(メタデータ) (2025-05-14T00:05:04Z) - Unveiling User Satisfaction and Creator Productivity Trade-Offs in Recommendation Platforms [68.51708490104687]
調査力の低い純粋に関連性の高い政策は、短期的ユーザの満足度を高めるが、コンテンツプールの長期的豊かさを損なうことを示す。
調査の結果,プラットフォーム上でのユーザの即時満足度と全体のコンテンツ生産との間には,根本的なトレードオフがあることが判明した。
論文 参考訳(メタデータ) (2024-10-31T07:19:22Z) - Robust Recommender System: A Survey and Future Directions [58.87305602959857]
まず,悪質な攻撃や自然騒音に耐える現在の手法を整理するための分類法を提案する。
次に、不正検出、敵の訓練、悪意のある攻撃から守るための確実な堅牢な訓練など、各カテゴリにおける最先端の手法を検討する。
さまざまなレコメンデーションシナリオの堅牢性や,正確性や解釈可能性,プライバシ,公正性といった他の特性との相互作用について論じる。
論文 参考訳(メタデータ) (2023-09-05T08:58:46Z) - PIE: Personalized Interest Exploration for Large-Scale Recommender
Systems [0.0]
これらの課題に対処するために,大規模レコメンデータシステムにおける探索のためのフレームワークを提案する。
我々の方法論は、最小限の修正で既存の大規模レコメンデータシステムに容易に統合できる。
私たちの仕事は、何十億ものユーザーを対象とする人気のビデオ発見および共有プラットフォームであるFacebook Watchで運用されている。
論文 参考訳(メタデータ) (2023-04-13T22:25:09Z) - Personalizing Intervened Network for Long-tailed Sequential User
Behavior Modeling [66.02953670238647]
タイルユーザーは、共同トレーニング後のヘッドユーザーよりも大幅に品質の低いレコメンデーションに悩まされる。
テールユーザーで個別に訓練されたモデルは、限られたデータのために依然として劣った結果が得られる。
本稿では,テールユーザの推薦性能を大幅に向上させる新しい手法を提案する。
論文 参考訳(メタデータ) (2022-08-19T02:50:19Z) - Incentivizing Exploration in Linear Bandits under Information Gap [50.220743323750035]
線形バンディットにおけるミオピックユーザに対するインセンティブ探索の問題点について検討した。
長期報酬を最大化するために、システムは、ユーザに探索的な腕を引くインセンティブを与えるための補償を提供する。
論文 参考訳(メタデータ) (2021-04-08T16:01:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。