論文の概要: Bursting Filter Bubble: Enhancing Serendipity Recommendations with Aligned Large Language Models
- arxiv url: http://arxiv.org/abs/2502.13539v1
- Date: Wed, 19 Feb 2025 08:47:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-20 13:58:28.377197
- Title: Bursting Filter Bubble: Enhancing Serendipity Recommendations with Aligned Large Language Models
- Title(参考訳): バーストフィルタバブル: 適応型大言語モデルによるセレンディピティー勧告の強化
- Authors: Yunjia Xi, Muyan Weng, Wen Chen, Chao Yi, Dian Chen, Gaoyang Guo, Mao Zhang, Jian Wu, Yuning Jiang, Qingwen Liu, Yong Yu, Weinan Zhang,
- Abstract要約: 大規模言語モデル (LLM) は、その広範な世界知識と推論能力により、セレンディピティー予測の可能性を示している。
本稿では,認知プロファイル生成,セレンGPTアライメント,ニアライン適応の3段階からなるフレームワークSERALを提案する。
オンライン実験によると、SERALはセレンディピティクスアイテムの露出率(PVR)、クリック、トランザクションを5.7%、29.56%、27.6%改善し、全体的な収益に大きな影響を与えずにユーザーエクスペリエンスを向上させる。
- 参考スコア(独自算出の注目度): 42.13005951072714
- License:
- Abstract: Recommender systems (RSs) often suffer from the feedback loop phenomenon, e.g., RSs are trained on data biased by their recommendations. This leads to the filter bubble effect that reinforces homogeneous content and reduces user satisfaction. To this end, serendipity recommendations, which offer unexpected yet relevant items, are proposed. Recently, large language models (LLMs) have shown potential in serendipity prediction due to their extensive world knowledge and reasoning capabilities. However, they still face challenges in aligning serendipity judgments with human assessments, handling long user behavior sequences, and meeting the latency requirements of industrial RSs. To address these issues, we propose SERAL (Serendipity Recommendations with Aligned Large Language Models), a framework comprising three stages: (1) Cognition Profile Generation to compress user behavior into multi-level profiles; (2) SerenGPT Alignment to align serendipity judgments with human preferences using enriched training data; and (3) Nearline Adaptation to integrate SerenGPT into industrial RSs pipelines efficiently. Online experiments demonstrate that SERAL improves exposure ratio (PVR), clicks, and transactions of serendipitous items by 5.7%, 29.56%, and 27.6%, enhancing user experience without much impact on overall revenue. Now, it has been fully deployed in the "Guess What You Like" of the Taobao App homepage.
- Abstract(参考訳): リコメンダシステム(RS)はフィードバックループ現象に悩まされることが多く、例えば、RSはレコメンデーションによってバイアスされたデータに基づいて訓練される。
これにより、均一なコンテンツを強化し、ユーザの満足度を低下させるフィルターバブル効果がもたらされる。
この目的のために、予期しないが関連する項目を提供するセレンディピティーレコメンデーションが提案されている。
近年,大規模言語モデル (LLM) は,世界的知識と推論能力の広さからセレンディピティー予測の可能性を示している。
しかし、人間の評価とセレンディピティーの判断を一致させ、長いユーザー行動シーケンスを処理し、産業用RSのレイテンシ要件を満たすという課題に直面している。
これらの課題に対処するため,(1)多段階のプロファイルにユーザ動作を圧縮する認知プロファイル生成,(2)強化されたトレーニングデータを用いてセレンディピティ判断と人間の嗜好を一致させるセレンGPTアライメント,(3)産業用RSパイプラインにSerenGPTを効率的に統合するためのニアライン適応,の3段階からなるSERAL(Serendipity Recommendations with Aligned Large Language Models)を提案する。
オンライン実験によると、SERALはセレンディピティーのアイテムの露出率(PVR)、クリック、トランザクションを5.7%、29.56%、27.6%改善し、全体の収益に大きな影響を与えずにユーザー体験を向上させる。
現在、Taobao Appのホームページの"Guess What You Like"に完全にデプロイされている。
関連論文リスト
- Prompt Tuning as User Inherent Profile Inference Machine [53.78398656789463]
本稿では,ユーザプロファイルの推測にプロンプトチューニングを用いるUserIP-Tuningを提案する。
プロファイル量子化コードブックは、プロファイル埋め込みによるモダリティギャップを協調IDにブリッジする。
4つの公開データセットの実験では、UserIP-Tuningは最先端のレコメンデーションアルゴリズムを上回っている。
論文 参考訳(メタデータ) (2024-08-13T02:25:46Z) - Treatment Effect Estimation for User Interest Exploration on Recommender Systems [10.05609996672672]
本稿では,トップN推薦を処理最適化問題とみなすUpliftモデルに基づくRecommenderフレームワークを提案する。
UpliftRecは、観察ユーザフィードバックを用いて、異なるカテゴリの露出比で、クリックスルーレート(CTR)という治療効果を推定する。
UpliftRecはグループレベルの治療効果を計算し、高いCTR報酬でユーザの隠れた関心を発見する。
論文 参考訳(メタデータ) (2024-05-14T13:22:33Z) - FedRec+: Enhancing Privacy and Addressing Heterogeneity in Federated
Recommendation Systems [15.463595798992621]
FedRec+は、フェデレーションレコメンデーションシステムのためのアンサンブルフレームワークである。
プライバシーを強化し、エッジユーザの通信コストを低減します。
FedRec+の最先端性能を示す実験結果が得られた。
論文 参考訳(メタデータ) (2023-10-31T05:36:53Z) - BHEISR: Nudging from Bias to Balance -- Promoting Belief Harmony by
Eliminating Ideological Segregation in Knowledge-based Recommendations [5.795636579831129]
主な目的は,フィルタバブルによる有害な影響を最小限に抑えつつ,ユーザの信念バランスを打つことである。
BHEISRモデルは、民主的かつ透明な原則を支持しながら、ナッジ理論から原則を取り入れている。
論文 参考訳(メタデータ) (2023-07-06T06:12:37Z) - When Search Meets Recommendation: Learning Disentangled Search
Representation for Recommendation [56.98380787425388]
シークエンシャルレコメンデーション(SESRec)のための検索強化フレームワークを提案する。
SESRec は、S&R の振る舞いにおいて類似および異種表現を分離する。
産業用と公共用両方のデータセットの実験では、SESRecが最先端のモデルより一貫して優れていることが示されている。
論文 参考訳(メタデータ) (2023-05-18T09:04:50Z) - Generative Slate Recommendation with Reinforcement Learning [49.75985313698214]
強化学習アルゴリズムは、レコメンデータシステムのユーザエンゲージメントを最適化するために使用することができる。
しかし、RLアプローチはスレートレコメンデーションシナリオでは難解である。
この設定では、アクションはアイテムの組み合わせを含むことができるスレートに対応する。
本研究では,変分オートエンコーダによって学習された連続低次元ラテント空間におけるスレートの符号化を提案する。
我々は、(i)以前の作業で要求される仮定を緩和し、(ii)完全なスレートをモデル化することで、アクション選択の品質を向上させることができる。
論文 参考訳(メタデータ) (2023-01-20T15:28:09Z) - Generating Self-Serendipity Preference in Recommender Systems for
Addressing Cold Start Problems [9.281057513518498]
セレンディピティー指向のレコメンデーションシステムは,ユーザの自己セレンディピティー嗜好を生成し,レコメンデーション性能を高める。
モデルは、ユーザの興味や満足度を抽出し、仮想的だが信じがたい隣人の好みを自己から生成し、自己セレンディピティーの好みを達成する。
論文 参考訳(メタデータ) (2022-04-27T01:29:47Z) - Control Variates for Slate Off-Policy Evaluation [112.35528337130118]
多次元動作を伴うバッチ化されたコンテキスト帯域データから政治外評価の問題について検討する。
我々は, PIと自己正規化PIの双方に対して, リスク改善を保証した新しい推定器を得る。
論文 参考訳(メタデータ) (2021-06-15T06:59:53Z) - PURS: Personalized Unexpected Recommender System for Improving User
Satisfaction [76.98616102965023]
本稿では、予期せぬことを推奨プロセスに組み込んだ、新しいPersonalized Unexpected Recommender System(PURS)モデルについて述べる。
3つの実世界のデータセットに対する大規模なオフライン実験は、提案されたPURSモデルが最先端のベースラインアプローチを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2021-06-05T01:33:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。