論文の概要: Self-Supervised Representation Learning with ID-Content Modality Alignment for Sequential Recommendation
- arxiv url: http://arxiv.org/abs/2510.10556v1
- Date: Sun, 12 Oct 2025 11:42:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.006078
- Title: Self-Supervised Representation Learning with ID-Content Modality Alignment for Sequential Recommendation
- Title(参考訳): ID-Content Modality Alignment を用いたSequential Recommendationのための自己教師付き表現学習
- Authors: Donglin Zhou, Weike Pan, Zhong Ming,
- Abstract要約: SICSRec というID-Content モダリティアライメントを用いた自己教師型表現学習モデルを提案する。
本稿では,ID-モダリティシーケンスエンコーダがユーザの行動嗜好を捉え,コンテンツ-モダリティシーケンスエンコーダがユーザのコンテンツ嗜好を学習し,ミックス-モダリティシーケンスデコーダがこれらの2種類の嗜好の本質的な関係を把握できる,トランスフォーマーベースのシーケンシャルモデルを設計する。
- 参考スコア(独自算出の注目度): 12.356634584441254
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sequential recommendation (SR) models often capture user preferences based on the historically interacted item IDs, which usually obtain sub-optimal performance when the interaction history is limited. Content-based sequential recommendation has recently emerged as a promising direction that exploits items' textual and visual features to enhance preference learning. However, there are still three key challenges: (i) how to reduce the semantic gap between different content modality representations; (ii) how to jointly model user behavior preferences and content preferences; and (iii) how to design an effective training strategy to align ID representations and content representations. To address these challenges, we propose a novel model, self-supervised representation learning with ID-Content modality alignment, named SICSRec. Firstly, we propose a LLM-driven sample construction method and develop a supervised fine-tuning approach to align item-level modality representations. Secondly, we design a novel Transformer-based sequential model, where an ID-modality sequence encoder captures user behavior preferences, a content-modality sequence encoder learns user content preferences, and a mix-modality sequence decoder grasps the intrinsic relationship between these two types of preferences. Thirdly, we propose a two-step training strategy with a content-aware contrastive learning task to align modality representations and ID representations, which decouples the training process of content modality dependency and item collaborative dependency. Extensive experiments conducted on four public video streaming datasets demonstrate our SICSRec outperforms the state-of-the-art ID-modality sequential recommenders and content-modality sequential recommenders by 8.04% on NDCG@5 and 6.62% on NDCD@10 on average, respectively.
- Abstract(参考訳): 逐次レコメンデーション(SR)モデルは、歴史的に相互作用したアイテムIDに基づいてユーザの好みをキャプチャすることが多い。
コンテンツベースのシーケンシャルレコメンデーションは、アイテムのテキストおよび視覚的特徴を利用して嗜好学習を強化する、有望な方向として最近登場した。
しかし、大きな課題は3つあります。
(i)異なる内容のモダリティ表現間の意味的ギャップを減らす方法
二 ユーザの行動嗜好とコンテンツ嗜好を協調的にモデル化する方法、及び
三)ID表現とコンテンツ表現を整合させる効果的なトレーニング戦略を設計する方法。
これらの課題に対処するために,SICSRecというID-Contentモダリティアライメントを用いた自己教師型表現学習モデルを提案する。
まず, LLMを用いたサンプル構築手法を提案し, アイテムレベルのモダリティ表現を調整するための教師付き微調整手法を開発した。
第2に、ID-モダリティシーケンスエンコーダがユーザの行動嗜好を捉え、コンテンツ-モダリティシーケンスエンコーダがユーザのコンテンツ嗜好を学習し、ミックス-モダリティシーケンスデコーダがこれらの2種類の嗜好の本質的な関係を把握できるトランスフォーマーベースのシーケンシャルモデルを設計する。
第3に,コンテント対応のコントラスト学習タスクを用いた2段階学習手法を提案し,コンテンツモダリティ依存とアイテム協調依存のトレーニングプロセスを分離する。
4つの公開ビデオストリーミングデータセットで実施された大規模な実験は、私たちのSICSRecが、最先端のID-モダリティシーケンシャルレコメンデータとコンテンツ-モダリティシーケンシャルレコメンデータを平均8.04%、NDCD@10では6.62%で上回っていることを示している。
関連論文リスト
- Progressive Semantic Residual Quantization for Multimodal-Joint Interest Modeling in Music Recommendation [6.790539226766362]
本稿では,2段階の新たなマルチモーダルレコメンデーションフレームワークを提案する。
最初の段階では、モーダル固有およびモーダルジョイントのセマンティックIDを生成する。
第2段階では、ユーザのマルチモーダルな関心をモデル化するために、マルチコードブックのクロスアテンションネットワークが設計されている。
論文 参考訳(メタデータ) (2025-08-28T02:16:57Z) - Multi-modal Relational Item Representation Learning for Inferring Substitutable and Complementary Items [10.98931494075836]
本稿では,代替品や補完品を推論するための,自己教師型マルチモーダル・リレーショナル・アイテム表現学習フレームワークを提案する。
MMSCは,(1)マルチモーダルな基本モデルを活用して項目メタデータから学習するマルチモーダルな項目表現学習モジュール,(2)ユーザ行動データから学習する自己教師型行動ベース表現学習モジュール,(3)セマンティックおよびタスクレベルで項目表現を統合する階層型表現集約機構の3つの主要コンポーネントから構成される。
論文 参考訳(メタデータ) (2025-07-29T22:38:39Z) - Unleash LLMs Potential for Recommendation by Coordinating Twin-Tower Dynamic Semantic Token Generator [60.07198935747619]
動的セマンティック・インデックス・パラダイムを採用した最初の生成型RSであるTTDS(Twin-Tower Dynamic Semantic Recommender)を提案する。
より具体的には、ツイン・トワー・セマンティック・トークン・ジェネレータをLLMベースのレコメンデータに統合する動的知識融合フレームワークを初めて提案する。
提案したTTDSレコメンデータは,平均19.41%のヒットレート,20.84%のNDCG測定値を実現している。
論文 参考訳(メタデータ) (2024-09-14T01:45:04Z) - EAGER: Two-Stream Generative Recommender with Behavior-Semantic Collaboration [63.112790050749695]
本稿では,行動情報と意味情報の両方をシームレスに統合する新しい生成推薦フレームワークであるEAGERを紹介する。
EAGERの有効性を4つの公開ベンチマークで検証し,既存手法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2024-06-20T06:21:56Z) - MISSRec: Pre-training and Transferring Multi-modal Interest-aware
Sequence Representation for Recommendation [61.45986275328629]
逐次レコメンデーションのためのマルチモーダル事前学習・転送学習フレームワークであるMISSRecを提案する。
ユーザ側ではトランスフォーマーベースのエンコーダデコーダモデルを設計し、コンテキストエンコーダがシーケンスレベルのマルチモーダルユーザ興味を捉えることを学習する。
候補項目側では,ユーザ適応項目表現を生成するために動的融合モジュールを採用する。
論文 参考訳(メタデータ) (2023-08-22T04:06:56Z) - Feature Decoupling-Recycling Network for Fast Interactive Segmentation [79.22497777645806]
近年のインタラクティブセグメンテーション手法では,入力としてソースイメージ,ユーザガイダンス,従来予測されていたマスクを反復的に取り込んでいる。
本稿では,本質的な相違点に基づいてモデリングコンポーネントを分離するFDRN(Feature Decoupling-Recycling Network)を提案する。
論文 参考訳(メタデータ) (2023-08-07T12:26:34Z) - Contrastive Self-supervised Sequential Recommendation with Robust
Augmentation [101.25762166231904]
Sequential Recommendation Describes a set of technique to model dynamic user behavior to order to predict future interaction in sequence user data。
データスパーシリティやノイズの多いデータなど、古くて新しい問題はまだ残っている。
逐次レコメンデーション(CoSeRec)のためのコントラスト型自己監督学習を提案する。
論文 参考訳(メタデータ) (2021-08-14T07:15:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。