論文の概要: Reinforcing User Interest Evolution in Multi-Scenario Learning for recommender systems
- arxiv url: http://arxiv.org/abs/2506.17682v1
- Date: Sat, 21 Jun 2025 11:27:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.538665
- Title: Reinforcing User Interest Evolution in Multi-Scenario Learning for recommender systems
- Title(参考訳): 推薦システムのためのマルチシナリオ学習におけるユーザ関心の進化の強化
- Authors: Zhijian Feng, Wenhao Zheng, Xuanji Xiao,
- Abstract要約: 現実世界のレコメンデーションシステムでは、ユーザーはホームページ、検索ページ、関連するレコメンデーションページなどの様々なシナリオに従事している。
ユーザの関心は、意思決定プロセスと嗜好表現の違いにより、さまざまなシナリオで矛盾する可能性がある。
本稿では,複数のシナリオにまたがるユーザ関心の進化をモデル化することにより,シナリオ間でのユーザの嗜好をモデル化する新しい強化学習手法を提案する。
- 参考スコア(独自算出の注目度): 0.7533573796315849
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In real-world recommendation systems, users would engage in variety scenarios, such as homepages, search pages, and related recommendation pages. Each of these scenarios would reflect different aspects users focus on. However, the user interests may be inconsistent in different scenarios, due to differences in decision-making processes and preference expression. This variability complicates unified modeling, making multi-scenario learning a significant challenge. To address this, we propose a novel reinforcement learning approach that models user preferences across scenarios by modeling user interest evolution across multiple scenarios. Our method employs Double Q-learning to enhance next-item prediction accuracy and optimizes contrastive learning loss using Q-value to make model performance better. Experimental results demonstrate that our approach surpasses state-of-the-art methods in multi-scenario recommendation tasks. Our work offers a fresh perspective on multi-scenario modeling and highlights promising directions for future research.
- Abstract(参考訳): 現実世界のレコメンデーションシステムでは、ユーザーはホームページ、検索ページ、関連するレコメンデーションページなどの様々なシナリオに従事している。
それぞれのシナリオは、ユーザがフォーカスするさまざまな側面を反映します。
しかし、意思決定プロセスと嗜好表現の違いにより、ユーザの関心は異なるシナリオで矛盾する可能性がある。
この可変性は統一モデリングを複雑にし、マルチシナリオ学習が大きな課題となる。
そこで本研究では,複数のシナリオにまたがるユーザ関心の進化をモデル化することにより,シナリオ間でのユーザ嗜好をモデル化する新しい強化学習手法を提案する。
提案手法では,次点予測精度を向上させるために二重Q学習を用い,Q値を用いた対照的な学習損失を最適化し,モデル性能を向上する。
実験の結果,本手法はマルチシナリオレコメンデーションタスクにおける最先端手法を上回ることがわかった。
我々の研究は、マルチシナリオモデリングに関する新たな視点を提供し、将来の研究への有望な方向性を強調します。
関連論文リスト
- Slow Thinking for Sequential Recommendation [88.46598279655575]
本稿では,STREAM-Recという新しいスローシンキングレコメンデーションモデルを提案する。
弊社のアプローチは、過去のユーザの振る舞いを分析し、多段階の熟考的推論プロセスを生成し、パーソナライズされたレコメンデーションを提供する。
具体的には,(1)レコメンデーションシステムにおける適切な推論パターンを特定すること,(2)従来のレコメンデーションシステムの推論能力を効果的に刺激する方法を検討すること,の2つの課題に焦点を当てる。
論文 参考訳(メタデータ) (2025-04-13T15:53:30Z) - Joint Modeling in Recommendations: A Survey [46.000357352884926]
共同モデリングアプローチは、さまざまなタスク、シナリオ、モダリティ、振る舞いをレコメンデーションプロセスに統合することによって、制限を克服する上で中心となる。
我々は,マルチタスク,マルチシナリオ,マルチモーダル,マルチビヘイビア・モデリングという,4つの異なる次元のジョイント・モデリングのスコープを定義する。
本研究は,提案する共同モデルにおける今後の研究の道のりについて紹介し,その結果を簡潔にまとめる。
論文 参考訳(メタデータ) (2025-02-28T16:14:00Z) - MDAP: A Multi-view Disentangled and Adaptive Preference Learning Framework for Cross-Domain Recommendation [63.27390451208503]
クロスドメインレコメンデーションシステムは、マルチドメインユーザインタラクションを活用してパフォーマンスを向上させる。
マルチビュー・ディスタングル・アダプティブ・プライスラーニング・フレームワークを提案する。
当社のフレームワークはマルチビューエンコーダを使用して,多様なユーザの好みをキャプチャする。
論文 参考訳(メタデータ) (2024-10-08T10:06:45Z) - Supervised Fine-Tuning as Inverse Reinforcement Learning [8.044033685073003]
LLM(Large Language Models)の整合性に対する一般的なアプローチは、一般的に人間やAIのフィードバックに依存します。
本研究では,このようなデータセットの有効性に疑問を呈し,専門家による実演との整合性がより現実的であることを証明した様々なシナリオを探索する。
論文 参考訳(メタデータ) (2024-03-18T17:52:57Z) - UMSE: Unified Multi-scenario Summarization Evaluation [52.60867881867428]
要約品質評価は、テキスト要約における非自明なタスクである。
統一多シナリオ要約評価モデル(UMSE)を提案する。
UMSEは3つの評価シナリオで使用できる能力に係わる最初の統合要約評価フレームワークである。
論文 参考訳(メタデータ) (2023-05-26T12:54:44Z) - An Information-Theoretic Approach for Estimating Scenario Generalization
in Crowd Motion Prediction [27.10815774845461]
本稿では,ソース・クラウド・シナリオに基づいて学習したモデルの一般化を特徴付ける新しいスコアリング手法を提案する。
インタラクションコンポーネントはシナリオドメインの難易度を特徴付けることを目的としており、シナリオドメインの多様性はダイバーシティスコアで取得される。
提案手法の有効性をシミュレーションおよび実世界(ソース,ターゲット)の一般化タスクで検証した。
論文 参考訳(メタデータ) (2022-11-02T01:39:30Z) - Scenario-Adaptive and Self-Supervised Model for Multi-Scenario
Personalized Recommendation [35.4495536683099]
シナリオ適応型自己監督型(SASS)モデルを提案し,上記の3つの課題を解決する。
このモデルは、ユーザ側とアイテム側の両方で対称に生成され、異なるシナリオにおけるアイテムの表現を区別することができる。
このモデルは、オンラインA/Bテストにおける平均視聴時間に対して8.0%以上の改善も達成している。
論文 参考訳(メタデータ) (2022-08-24T11:44:00Z) - Scenario-aware and Mutual-based approach for Multi-scenario
Recommendation in E-Commerce [12.794276204716642]
不均質な電子商取引のシナリオでユーザーのための正確な推奨を行う方法は、まだ継続的な研究トピックです。
本稿では,複数のシナリオの違いと類似性を活用するScenario-aware Mutual Learning (SAML) という新しい推奨モデルを提案する。
論文 参考訳(メタデータ) (2020-12-16T13:52:14Z) - Trajectory-wise Multiple Choice Learning for Dynamics Generalization in
Reinforcement Learning [137.39196753245105]
本稿では,動的一般化のためのマルチヘッドダイナミックスモデルを学習するモデルベース強化学習アルゴリズムを提案する。
文脈学習は,過去の経験から得られる動的情報からコンテキスト潜在ベクトルにエンコードする。
提案手法は,最先端のRL法と比較して,様々な制御タスクにおいて優れたゼロショット一般化性能を示す。
論文 参考訳(メタデータ) (2020-10-26T03:20:42Z) - Explainable Recommender Systems via Resolving Learning Representations [57.24565012731325]
説明はユーザー体験を改善し、システムの欠陥を発見するのに役立つ。
本稿では,表現学習プロセスの透明性を向上させることによって,説明可能な新しい推薦モデルを提案する。
論文 参考訳(メタデータ) (2020-08-21T05:30:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。