論文の概要: A Large Language Model Enhanced Sequential Recommender for Joint Video and Comment Recommendation
- arxiv url: http://arxiv.org/abs/2403.13574v1
- Date: Wed, 20 Mar 2024 13:14:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-21 16:47:59.810005
- Title: A Large Language Model Enhanced Sequential Recommender for Joint Video and Comment Recommendation
- Title(参考訳): 共同ビデオとコメントレコメンデーションのための大規模言語モデル拡張シーケンスレコメンデーション
- Authors: Bowen Zheng, Zihan Lin, Enze Liu, Chen Yang, Enyang Bai, Cheng Ling, Wayne Xin Zhao, Ji-Rong Wen,
- Abstract要約: 我々は、パーソナライズされたビデオとコメントのレコメンデーションを共同で行うLSVCRと呼ばれる新しいレコメンデーション手法を提案する。
提案手法は,逐次レコメンデーション(SR)モデルと補足型大規模言語モデル(LLM)レコメンデーションという2つの重要なコンポーネントから構成される。
特に、コメント視聴時間の4.13%が大幅に向上した。
- 参考スコア(独自算出の注目度): 77.42486522565295
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In online video platforms, reading or writing comments on interesting videos has become an essential part of the video watching experience. However, existing video recommender systems mainly model users' interaction behaviors with videos, lacking consideration of comments in user behavior modeling. In this paper, we propose a novel recommendation approach called LSVCR by leveraging user interaction histories with both videos and comments, so as to jointly conduct personalized video and comment recommendation. Specifically, our approach consists of two key components, namely sequential recommendation (SR) model and supplemental large language model (LLM) recommender. The SR model serves as the primary recommendation backbone (retained in deployment) of our approach, allowing for efficient user preference modeling. Meanwhile, we leverage the LLM recommender as a supplemental component (discarded in deployment) to better capture underlying user preferences from heterogeneous interaction behaviors. In order to integrate the merits of the SR model and the supplemental LLM recommender, we design a twostage training paradigm. The first stage is personalized preference alignment, which aims to align the preference representations from both components, thereby enhancing the semantics of the SR model. The second stage is recommendation-oriented fine-tuning, in which the alignment-enhanced SR model is fine-tuned according to specific objectives. Extensive experiments in both video and comment recommendation tasks demonstrate the effectiveness of LSVCR. Additionally, online A/B testing on the KuaiShou platform verifies the actual benefits brought by our approach. In particular, we achieve a significant overall gain of 4.13% in comment watch time.
- Abstract(参考訳): オンラインビデオプラットフォームでは、面白いビデオに対するコメントの読み書きが、ビデオ視聴体験の重要な部分となっている。
しかし、既存のビデオレコメンデータシステムは、主にユーザの動画とのインタラクション動作をモデル化し、ユーザの振る舞いモデリングにおけるコメントの考慮を欠いている。
本稿では,ビデオとコメントの両方でユーザインタラクション履歴を活用することで,パーソナライズされたビデオとコメントのレコメンデーションを共同で行う,LSVCRと呼ばれる新しいレコメンデーション手法を提案する。
具体的には、逐次レコメンデーション(SR)モデルと補足型大言語モデル(LLM)レコメンデーションという2つの重要なコンポーネントから構成される。
SRモデルは、私たちのアプローチの主要なレコメンデーションバックボーン(デプロイメントに保持されている)として機能し、効率的なユーザ嗜好モデリングを可能にします。
一方、LLMレコメンデータを補足的なコンポーネントとして利用し(デプロイで捨てられた)、不均一なインタラクションの振る舞いから基礎となるユーザの好みをよりよく捉えます。
SRモデルと補足型LLMレコメンデータの利点を統合するために,我々は2段階のトレーニングパラダイムを設計する。
最初の段階はパーソナライズされた好みのアライメントであり、これは両方のコンポーネントから好みの表現を調整し、SRモデルのセマンティクスを強化することを目的としている。
第2段階はレコメンデーション指向の微調整であり、アライメント強化SRモデルは特定の目的に応じて微調整される。
ビデオとコメントのレコメンデーションタスクにおける大規模な実験は、LSVCRの有効性を実証している。
さらに、KuaiShouプラットフォーム上でのオンラインA/Bテストは、我々のアプローチによる実際のメリットを検証する。
特に、コメント視聴時間の4.13%が大幅に向上した。
関連論文リスト
- Direct Preference Optimization of Video Large Multimodal Models from Language Model Reward [118.65089648651308]
本稿では,映像コンテンツのプロキシとして詳細な動画キャプションを利用する新しいフレームワークを提案する。
本稿では,DPOによる報酬の調整により,ビデオ質問応答(QA)タスクにおけるビデオLMMの性能が著しく向上することを示す。
論文 参考訳(メタデータ) (2024-04-01T17:28:16Z) - On Generative Agents in Recommendation [58.42840923200071]
Agent4Recは、Large Language Modelsに基づいたレコメンデーションのユーザーシミュレータである。
各エージェントは、ページ単位でパーソナライズされた推奨モデルと対話する。
論文 参考訳(メタデータ) (2023-10-16T06:41:16Z) - VideolandGPT: A User Study on a Conversational Recommender System [0.14495144578817493]
本稿では,ビデオ・オン・デマンド(VOD)プラットフォームのレコメンデーションシステムであるVideolandGPTを紹介する。
評価指標,ユーザエクスペリエンス,リコメンデーションの公平性を評価し,個人化バージョンと非個人化バージョンを比較した。
論文 参考訳(メタデータ) (2023-09-07T11:24:47Z) - Latent User Intent Modeling for Sequential Recommenders [92.66888409973495]
逐次リコメンデータモデルは、プラットフォーム上での氏のインタラクション履歴に基づいて、ユーザが次に対話する可能性のあるアイテムを予測することを学習する。
しかし、ほとんどのシーケンシャルなレコメンデータは、ユーザの意図に対する高いレベルの理解を欠いている。
したがって、インテントモデリングはユーザー理解と長期ユーザーエクスペリエンスの最適化に不可欠である。
論文 参考訳(メタデータ) (2022-11-17T19:00:24Z) - Constrained Reinforcement Learning for Short Video Recommendation [18.492477839791274]
ソーシャルメディアプラットフォーム上のショートビデオは、レコメンデーターシステムの最適化に新たな課題をもたらす。
アクター・クリティカルな枠組みに基づく2段階強化学習手法を提案する。
当社のアプローチは,ユーザエクスペリエンスを最適化するために,運用システムで完全にローンチされています。
論文 参考訳(メタデータ) (2022-05-26T09:36:20Z) - Fast Multi-Step Critiquing for VAE-based Recommender Systems [27.207067974031805]
M&Ms-VAEは、提案と説明のための新しい変分オートエンコーダです。
モデルを弱い監督スキームでトレーニングし、完全および部分的に観察された変数をシミュレートします。
次に、訓練されたM&Ms-VAEモデルの一般化能力を利用して、ユーザの好みと批判を個別に埋め込む。
論文 参考訳(メタデータ) (2021-05-03T12:26:09Z) - Self-Supervised Reinforcement Learning for Recommender Systems [77.38665506495553]
逐次リコメンデーションタスクのための自己指導型強化学習を提案する。
提案手法は,2つの出力層を持つ標準レコメンデーションモデルを強化する。
このようなアプローチに基づいて、自己監督型Q-ラーニング(SQN)と自己監督型アクター・クライブ(SAC)という2つのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T11:18:57Z) - MetaSelector: Meta-Learning for Recommendation with User-Level Adaptive
Model Selection [110.87712780017819]
推薦システムにおけるユーザレベルの適応モデル選択を容易にするメタラーニングフレームワークを提案する。
2つのパブリックデータセットと実世界のプロダクションデータセットで実験を行います。
論文 参考訳(メタデータ) (2020-01-22T16:05:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。