論文の概要: RecGPT Technical Report
- arxiv url: http://arxiv.org/abs/2507.22879v2
- Date: Thu, 31 Jul 2025 16:54:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 13:02:07.733235
- Title: RecGPT Technical Report
- Title(参考訳): RecGPT技術報告
- Authors: Chao Yi, Dian Chen, Gaoyang Guo, Jiakai Tang, Jian Wu, Jing Yu, Mao Zhang, Sunhao Dai, Wen Chen, Wenjun Yang, Yuning Jiang, Zhujin Gao, Bo Zheng, Chi Li, Dimin Wang, Dixuan Wang, Fan Li, Fan Zhang, Haibin Chen, Haozhuang Liu, Jialin Zhu, Jiamang Wang, Jiawei Wu, Jin Cui, Ju Huang, Kai Zhang, Kan Liu, Lang Tian, Liang Rao, Longbin Li, Lulu Zhao, Na He, Peiyang Wang, Qiqi Huang, Tao Luo, Wenbo Su, Xiaoxiao He, Xin Tong, Xu Chen, Xunke Xi, Yang Li, Yaxuan Wu, Yeqiu Yang, Yi Hu, Yinnan Song, Yuchen Li, Yujie Luo, Yujin Yuan, Yuliang Yan, Zhengyang Wang, Zhibo Xiao, Zhixin Ma, Zile Zhou, Ziqi Zhang,
- Abstract要約: 本稿では,レコメンデーションパイプラインの中心にユーザの意図を配置する次世代フレームワークRecGPTを提案する。
RecGPTは、大きな言語モデルをユーザ関心のマイニング、アイテム検索、説明生成のキーステージに統合する。
オンライン実験では、RecGPTが利害関係者間で一貫したパフォーマンス向上を実現している。
- 参考スコア(独自算出の注目度): 57.84251629878726
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recommender systems are among the most impactful applications of artificial intelligence, serving as critical infrastructure connecting users, merchants, and platforms. However, most current industrial systems remain heavily reliant on historical co-occurrence patterns and log-fitting objectives, i.e., optimizing for past user interactions without explicitly modeling user intent. This log-fitting approach often leads to overfitting to narrow historical preferences, failing to capture users' evolving and latent interests. As a result, it reinforces filter bubbles and long-tail phenomena, ultimately harming user experience and threatening the sustainability of the whole recommendation ecosystem. To address these challenges, we rethink the overall design paradigm of recommender systems and propose RecGPT, a next-generation framework that places user intent at the center of the recommendation pipeline. By integrating large language models (LLMs) into key stages of user interest mining, item retrieval, and explanation generation, RecGPT transforms log-fitting recommendation into an intent-centric process. To effectively align general-purpose LLMs to the above domain-specific recommendation tasks at scale, RecGPT incorporates a multi-stage training paradigm, which integrates reasoning-enhanced pre-alignment and self-training evolution, guided by a Human-LLM cooperative judge system. Currently, RecGPT has been fully deployed on the Taobao App. Online experiments demonstrate that RecGPT achieves consistent performance gains across stakeholders: users benefit from increased content diversity and satisfaction, merchants and the platform gain greater exposure and conversions. These comprehensive improvement results across all stakeholders validates that LLM-driven, intent-centric design can foster a more sustainable and mutually beneficial recommendation ecosystem.
- Abstract(参考訳): リコメンダシステムは人工知能の最も影響力のある応用の一つであり、ユーザー、商人、プラットフォームを繋ぐ重要なインフラとして機能する。
しかし、現在の産業システムの多くは、歴史的共起パターンやログ適合の目的、すなわち、ユーザ意図を明示的にモデル化することなく、過去のユーザインタラクションを最適化することに大きく依存している。
このログ適合アプローチは、しばしば、ユーザの進化と潜伏する関心を捉えるのに失敗した、狭い歴史的嗜好に過度に適合する。
その結果、フィルターバブルとロングテール現象を強化し、最終的にはユーザエクスペリエンスを害し、レコメンデーションエコシステム全体の持続性を脅かす。
これらの課題に対処するため、リコメンデータシステムの全体的な設計パラダイムを再考し、リコメンデーションパイプラインの中心にユーザの意図を配置する次世代フレームワークであるRecGPTを提案する。
大規模言語モデル(LLM)をユーザ関心のマイニング、アイテム検索、説明生成のキーステージに統合することにより、RecGPTはログ適合推奨をインテント中心のプロセスに変換する。
RecGPTは、これらのドメイン固有の推奨タスクを大規模に効果的に整合させるため、人間とLLMの協力的判断システムによって導かれる、推論の強化された事前調整と自己学習の進化を統合する多段階トレーニングパラダイムを取り入れている。
現在、RecGPTはTaobao Appに完全にデプロイされている。
オンライン実験は、RecGPTが利害関係者間で一貫したパフォーマンス向上を実現していることを示している。
これらの全利害関係者にわたる包括的な改善結果は、LCM駆動の意図中心の設計が、より持続的で相互に有益なレコメンデーションエコシステムを育むことができることを検証します。
関連論文リスト
- Expectation Confirmation Preference Optimization for Multi-Turn Conversational Recommendation Agent [24.134616865308985]
本稿では,新しいマルチターン優先最適化パラダイムECPOを提案する。
我々は,ECPOがCRAの相互作用能力を大幅に向上させ,既存のMTPO法よりも効率と有効性を両立させることを示す。
論文 参考訳(メタデータ) (2025-06-17T08:29:04Z) - Multi-agents based User Values Mining for Recommendation [52.26100802380767]
効率的なユーザ値抽出のためのゼロショットマルチLLM協調フレームワークを提案する。
本研究は,本質的な意味を保ちながら,項目内容のコンデンスにテキスト要約手法を適用した。
幻覚を緩和するために,評価役と監督役の2つの特殊エージェントの役割を導入する。
論文 参考訳(メタデータ) (2025-05-02T04:01:31Z) - Large Language Model Empowered Recommendation Meets All-domain Continual Pre-Training [60.38082979765664]
CPRecは、レコメンデーションのための全ドメイン連続事前トレーニングフレームワークである。
LLMを連続的な事前学習パラダイムを通じて、普遍的なユーザ行動と整合させる。
2つの異なるプラットフォームから5つの実世界のデータセットを実験する。
論文 参考訳(メタデータ) (2025-04-11T20:01:25Z) - Reason4Rec: Large Language Models for Recommendation with Deliberative User Preference Alignment [69.11529841118671]
本稿では,ユーザの嗜好に関する明確な推論を新たなアライメント目標として組み込んだ,新たなDeliberative Recommendationタスクを提案する。
次にReasoningを利用したRecommenderフレームワークを導入する。
論文 参考訳(メタデータ) (2025-02-04T07:17:54Z) - PRECISE: Pre-training Sequential Recommenders with Collaborative and Semantic Information [12.033363057768137]
現実世界のレコメンデーションシステムは、ユーザーが対話するための多様なコンテンツシナリオを提供するのが一般的である。
すべてのシナリオの要件を満たすために単一の統一されたレコメンデーションモデルを使用することは不可能である。
そこで本研究では,PreCISEと呼ばれる,シーケンシャルレコメンデーションのための新しい事前学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-09T08:55:48Z) - RosePO: Aligning LLM-based Recommenders with Human Values [38.029251417802044]
我々は、パーソナライズされた選好最適化(RosePO)を円滑にするための一般的なフレームワークを提案する。
RosePOは、トレーニング後の段階において、カスタマイズされた人的価値との整合性が向上する。
実世界の3つのデータセットの評価は,本手法の有効性を示す。
論文 参考訳(メタデータ) (2024-10-16T12:54:34Z) - LLMEmb: Large Language Model Can Be a Good Embedding Generator for Sequential Recommendation [57.49045064294086]
大きな言語モデル(LLM)は、その人気とは無関係に、アイテム間の意味的関係をキャプチャする能力を持つ。
LLMEmb(LLMEmb)は、LCMを利用してアイテム埋め込みを生成し、逐次レコメンダシステム(SRS)の性能を向上させる手法である。
論文 参考訳(メタデータ) (2024-09-30T03:59:06Z) - Leveraging LLMs for Influence Path Planning in Proactive Recommendation [34.5820082133773]
プロアクティブなレコメンデーターシステムは ユーザーの興味を 徐々に 歴史的な関心を超えて ターゲットアイテムとして 導くことを目的としています
IRSは、影響経路計画のためのシーケンシャルモデルを設計するが、対象項目の包摂性や経路コヒーレンスに欠ける問題に直面している。
協調的かつ効果的な影響経路を生成するLLM-IPP法を提案する。
論文 参考訳(メタデータ) (2024-09-07T13:41:37Z) - Influential Recommender System [12.765277278599541]
Influential Recommender System (IRS) は,ユーザが対象アイテムを好むように積極的に導くことを目的とした,新しいレコメンデーションパラダイムである。
IRSは、ユーザに慎重に選択された項目(影響経路と呼ばれる)のシーケンスを徐々に推奨する。
IRNはベースラインレコメンデータよりも優れており,ユーザの興味に影響を及ぼす能力を示している。
論文 参考訳(メタデータ) (2022-11-18T03:04:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。