論文の概要: RCLRec: Reverse Curriculum Learning for Modeling Sparse Conversions in Generative Recommendation
- arxiv url: http://arxiv.org/abs/2603.28124v1
- Date: Mon, 30 Mar 2026 07:41:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.28194
- Title: RCLRec: Reverse Curriculum Learning for Modeling Sparse Conversions in Generative Recommendation
- Title(参考訳): RCLRec:ジェネレーティブレコメンデーションにおけるスパース変換のモデリングのための逆カリキュラム学習
- Authors: Yulei Huang, Hao Deng, Haibo Xing, Jinxin Hu, Chuanfei Xu, Zulong Chen, Yu Zhang, Xiaoyi Zeng,
- Abstract要約: スパース変換管理のための学習ベースGRフレームワークであるRCLRecを提案する。
RCLRecは、変換関連項目のサブシーケンスを履歴から逆の形で選択することで、短いカリキュラムを構築する。
オフラインデータセットの実験とオンラインA/Bテストは、RCLRecが優れたパフォーマンスを実現していることを示している。
- 参考スコア(独自算出の注目度): 13.773822552103335
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conversion objectives in large-scale recommender systems are sparse, making them difficult to optimize. Generative recommendation (GR) partially alleviates data sparsity by organizing multi-type behaviors into a unified token sequence with shared representations, but conversion signals remain insufficiently modeled. While recent behavior-aware GR models encode behavior types and employ behavior-aware attention to highlight decision-related intermediate behaviors, they still rely on standard attention over the full history and provide no additional supervision for conversions, leaving conversion sparsity largely unresolved. To address these challenges, we propose RCLRec, a reverse curriculum learning-based GR framework for sparse conversion supervision. For each conversion target, RCLRec constructs a short curriculum by selecting a subsequence of conversion-related items from the history in reverse. Their semantic tokens are fed to the decoder as a prefix, together with the target conversion tokens, under a joint generation objective. This design provides additional instance-specific intermediate supervision, alleviating conversion sparsity and focusing the model on the user's critical decision process. We further introduce a curriculum quality-aware loss to ensure that the selected curricula are informative for conversion prediction. Experiments on offline datasets and an online A/B test show that RCLRec achieves superior performance, with +2.09% advertising revenue and +1.86% orders in online deployment.
- Abstract(参考訳): 大規模レコメンデータシステムにおける変換対象は少ないため、最適化が困難である。
生成的レコメンデーション(GR)は、複数のタイプの振る舞いを共有表現を持つ統一トークンシーケンスにまとめることで、データの疎結合を部分的に緩和するが、変換信号は十分にモデル化されていない。
最近の行動認識モデルGRは、行動タイプを符号化し、行動認識の注意を駆使して決定に関連する中間行動を強調するが、それでも完全な歴史に対する標準的な注意を頼りにせず、変換の監督も行わず、変換の空間性はほとんど未解決のままである。
これらの課題に対処するため、スパース変換管理のためのリバースカリキュラムラーニングベースのGRフレームワークであるRCLRecを提案する。
各変換対象に対して、RCLRecは、変換関連項目のサブシーケンスを、その履歴から逆に選択することで、短いカリキュラムを構築する。
それらの意味トークンは、共同生成目標の下で、ターゲット変換トークンとともにプレフィックスとしてデコーダに供給される。
この設計は、追加のインスタンス固有の中間監視を提供し、変換空間を緩和し、モデルのユーザの決定プロセスにフォーカスする。
さらに,カリキュラムの品質を意識した損失を導入して,選択したカリキュラムが変換予測に有用であることを確かめる。
オフラインデータセットの実験とオンラインのA/Bテストによると、RCLRecは広告収入+2.09%、オンラインデプロイメント+1.86%という優れたパフォーマンスを実現している。
関連論文リスト
- Bringing Model Editing to Generative Recommendation in Cold-Start Scenarios [9.969683280942098]
生成レコメンデーション(GR)は、エンドツーエンド生成パラダイムにおいて、シーケンシャルなレコメンデーションの強い可能性を示している。
既存のGRモデルは深刻なコールドスタート崩壊に悩まされており、コールドスタートアイテムに対する推奨精度はゼロに近い程度に低下する可能性がある。
我々は生成的推薦に適したモデル編集フレームワークであるGenRecEditを提案する。
論文 参考訳(メタデータ) (2026-03-15T07:31:28Z) - Can Recommender Systems Teach Themselves? A Recursive Self-Improving Framework with Fidelity Control [82.30868101940068]
本稿では,外部データや教師モデルに依存することなく,モデルが自身のパフォーマンスをブートストラップするパラダイムを提案する。
我々の理論的分析は、RSIRがデータ駆動型暗黙正則化器として機能し、最適化景観を円滑にしていることを示している。
より小さなモデルであっても利点があり、弱いモデルはより強力なモデルに対して効果的なトレーニングカリキュラムを生成することができることを示す。
論文 参考訳(メタデータ) (2026-02-17T15:31:32Z) - CIR-CoT: Towards Interpretable Composed Image Retrieval via End-to-End Chain-of-Thought Reasoning [93.05917922306196]
Composed Image Retrieval (CIR) は、参照画像と修正テキストから対象画像を見つけることを目的としている。
CIR-CoTは、明示的なChain-of-Thought (CoT)推論を統合するために設計された最初のエンドツーエンド検索指向MLLMである。
論文 参考訳(メタデータ) (2025-10-09T09:41:45Z) - Generating Query-Relevant Document Summaries via Reinforcement Learning [5.651096645934245]
ReLSumは、検索関連性に最適化された製品記述のクエリ関連要約を生成するために設計された強化学習フレームワークである。
このフレームワークは、トレーニング可能な大言語モデル(LLM)を使用して要約を生成し、その後、クロスエンコーダランキングモデルの入力として使用される。
実験の結果、オンラインユーザエンゲージメント指標と同様に、リコールやNDCGを含むオフラインメトリクスの大幅な改善が示されている。
論文 参考訳(メタデータ) (2025-08-11T18:52:28Z) - Embed Progressive Implicit Preference in Unified Space for Deep Collaborative Filtering [13.24227546548424]
GNOLR(Generalized Neural Ordinal Logistic Regression)は、ユーザエンゲージメントの構造的進行を捉えるために提案されている。
GNOLRは予測精度を高め、ユーザのエンゲージメントの進行を捉え、検索プロセスを単純化する。
10の実世界のデータセットでの実験では、GNOLRは効率と適応性において最先端の手法を大幅に上回っている。
論文 参考訳(メタデータ) (2025-05-27T08:43:35Z) - Lightweight and Direct Document Relevance Optimization for Generative Information Retrieval [49.669503570350166]
生成情報検索(GenIR)は、文書識別子(ドシデント)生成タスクとして文書検索を定式化する有望なニューラル検索パラダイムである。
既存のGenIRモデルはトークンレベルのミスアライメントに悩まされており、次のトークンを予測するためにトレーニングされたモデルは、ドキュメントレベルの関連性を効果的にキャプチャできないことが多い。
本稿では,トークンレベルのドシデント生成と文書レベルのドシデンス推定をペアのランク付けによる直接最適化により整合するダイレクトドキュメントレバレンス最適化(DDRO)を提案する。
論文 参考訳(メタデータ) (2025-04-07T15:27:37Z) - PseudoNeg-MAE: Self-Supervised Point Cloud Learning using Conditional Pseudo-Negative Embeddings [55.55445978692678]
PseudoNeg-MAEは、ポイントクラウドマスマスキングオートエンコーダのグローバルな特徴表現を強化する。
本研究では,ネットワークが識別的表現を保ちながら,よりリッチな変換キューをキャプチャできる新たな損失を提案する。
論文 参考訳(メタデータ) (2024-09-24T07:57:21Z) - Contrastive Self-supervised Sequential Recommendation with Robust
Augmentation [101.25762166231904]
Sequential Recommendation Describes a set of technique to model dynamic user behavior to order to predict future interaction in sequence user data。
データスパーシリティやノイズの多いデータなど、古くて新しい問題はまだ残っている。
逐次レコメンデーション(CoSeRec)のためのコントラスト型自己監督学習を提案する。
論文 参考訳(メタデータ) (2021-08-14T07:15:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。