論文の概要: Multimodal Generative Recommendation for Fusing Semantic and Collaborative Signals
- arxiv url: http://arxiv.org/abs/2602.03713v1
- Date: Tue, 03 Feb 2026 16:39:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.58054
- Title: Multimodal Generative Recommendation for Fusing Semantic and Collaborative Signals
- Title(参考訳): 意味的信号と協調的信号の融合のためのマルチモーダル生成レコメンデーション
- Authors: Moritz Vandenhirtz, Kaveh Hassani, Shervin Ghasemlou, Shuai Shao, Hamid Eghbalzadeh, Fuchun Peng, Jun Liu, Michael Louis Iuzzolino,
- Abstract要約: 逐次リコメンデータシステムは、ユーザのインタラクション履歴をモデル化し、結果のユーザ表現とストアドアイテムの埋め込みの間の内部積を計算することで、関連する項目をランク付けする。
大きなアイテムを格納する際のメモリオーバーヘッドを大幅に回避するため、生成推奨パラダイムは、各アイテムを独立したセマンティックコードとしてモデル化する。
これらのメソッドは、大きなアイテムセットの伝統的なシーケンシャルなレコメンデータを超えておらず、それらが対処するように設計されたシナリオでの採用を制限する。
マルチモーダル・セマンティック・コラボレーション・ジェネレーティブ・レコメンダであるMSCGRecを提案する。
- 参考スコア(独自算出の注目度): 17.608491612845306
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sequential recommender systems rank relevant items by modeling a user's interaction history and computing the inner product between the resulting user representation and stored item embeddings. To avoid the significant memory overhead of storing large item sets, the generative recommendation paradigm instead models each item as a series of discrete semantic codes. Here, the next item is predicted by an autoregressive model that generates the code sequence corresponding to the predicted item. However, despite promising ranking capabilities on small datasets, these methods have yet to surpass traditional sequential recommenders on large item sets, limiting their adoption in the very scenarios they were designed to address. To resolve this, we propose MSCGRec, a Multimodal Semantic and Collaborative Generative Recommender. MSCGRec incorporates multiple semantic modalities and introduces a novel self-supervised quantization learning approach for images based on the DINO framework. Additionally, MSCGRec fuses collaborative and semantic signals by extracting collaborative features from sequential recommenders and treating them as a separate modality. Finally, we propose constrained sequence learning that restricts the large output space during training to the set of permissible tokens. We empirically demonstrate on three large real-world datasets that MSCGRec outperforms both sequential and generative recommendation baselines and provide an extensive ablation study to validate the impact of each component.
- Abstract(参考訳): 逐次リコメンデータシステムは、ユーザのインタラクション履歴をモデル化し、結果のユーザ表現とストアドアイテムの埋め込みの間の内部積を計算することで、関連する項目をランク付けする。
大きなアイテムセットを格納する際のメモリオーバーヘッドを大幅に回避するため、生成推奨パラダイムは、各アイテムを一連の個別のセマンティックコードとしてモデル化する。
ここで、次の項目は、予測された項目に対応するコードシーケンスを生成する自己回帰モデルにより予測される。
しかしながら、小さなデータセットでの有望なランキング機能にもかかわらず、これらのメソッドは大きなアイテムセットにおける従来のシーケンシャルなレコメンデータを超えておらず、それらが対処するように設計されたシナリオへの採用を制限している。
そこで本研究では,マルチモーダル・セマンティック・コラボレーション・ジェネレーティブ・レコメンダであるMSCGRecを提案する。
MSCGRecには複数のセマンティックモダリティが組み込まれており、DINOフレームワークに基づいた画像に対する新しい自己教師付き量子化学習アプローチが導入されている。
さらに、MSCGRecは、シーケンシャルレコメンデータから協調的な特徴を抽出し、それらを別のモダリティとして扱うことで、協調的および意味的なシグナルを融合させる。
最後に、トレーニング中の大きな出力空間を許容トークンの集合に制限する制約付きシーケンス学習を提案する。
我々は,MSCGRecが逐次的および生成的推奨ベースラインよりも優れている3つの大規模な実世界のデータセットを実証的に実証し,各コンポーネントの影響を検証するための広範囲なアブレーション研究を提供する。
関連論文リスト
- Multi-Aspect Cross-modal Quantization for Generative Recommendation [27.92632297542123]
生成レコメンデーション(MACRec)のための多視点クロスモーダル量子化を提案する。
まず、ID学習過程において、競合率を効果的に低減するクロスモーダル量子化を導入する。
また、暗黙のアライメントや明示的なアライメントを含むマルチアスペクトのクロスモーダルアライメントも組み込んでいます。
論文 参考訳(メタデータ) (2025-11-19T04:55:14Z) - Generative Sequential Recommendation via Hierarchical Behavior Modeling [20.156854767000475]
本稿では,デコーダのみのバックボーン上に構築された新しい生成フレームワークGAMERを提案する。
GAMERは、振る舞い間の階層的な依存関係をキャプチャする、クロスレベルなインタラクション層を導入している。
ShortVideoADは、メインストリームのショートビデオプラットフォームからの大規模マルチビヘイビアデータセットである。
論文 参考訳(メタデータ) (2025-11-05T03:27:01Z) - HyMiRec: A Hybrid Multi-interest Learning Framework for LLM-based Sequential Recommendation [24.720767926024433]
HyMiRecは、大規模言語モデルのためのハイブリッドシーケンシャルレコメンデーションフレームワークである。
長いユーザシーケンスから粗い関心埋め込みを抽出し、洗練された関心埋め込みをキャプチャするためのLLMベースのレコメンデータを抽出する。
ユーザの多様な嗜好をモデル化するために,不整合型多目的学習モジュールを設計する。
論文 参考訳(メタデータ) (2025-10-15T16:45:59Z) - Universal Item Tokenization for Transferable Generative Recommendation [89.42584009980676]
本稿では、転送可能な生成レコメンデーションのためのユニバーサルアイテムトークン化手法であるUTGRecを提案する。
木構造コードブックを考案することにより、コンテンツ表現をアイテムトークン化のための対応するコードに識別する。
生のコンテンツ再構成には、アイテムテキストとイメージを離散表現から再構成するために、デュアルライトウェイトデコーダを用いる。
協調的知識統合においては,共起的アイテムが類似していると仮定し,共起的アライメントと再構築を通じて協調的信号を統合する。
論文 参考訳(メタデータ) (2025-04-06T08:07:49Z) - Learning Multi-Aspect Item Palette: A Semantic Tokenization Framework for Generative Recommendation [55.99632509895994]
マルチアスペクトセマンティックトークン化のための新しいアプローチであるLAMIAを紹介する。
単一の埋め込みを使用するRQ-VAEとは異なり、LAMIAは独立的でセマンティックな並列な埋め込みの集合である「アイテムパレット」を学習する。
その結果,提案手法よりも提案手法の精度が大幅に向上した。
論文 参考訳(メタデータ) (2024-09-11T13:49:48Z) - MMGRec: Multimodal Generative Recommendation with Transformer Model [81.61896141495144]
MMGRecは、マルチモーダルレコメンデーションに生成パラダイムを導入することを目指している。
まず,階層的な量子化手法であるGraph CF-RQVAEを考案し,各項目にRec-IDを割り当てる。
次に、Transformerベースのレコメンデータをトレーニングし、過去のインタラクションシーケンスに基づいて、ユーザが推奨するアイテムのRec-IDを生成する。
論文 参考訳(メタデータ) (2024-04-25T12:11:27Z) - MISSRec: Pre-training and Transferring Multi-modal Interest-aware
Sequence Representation for Recommendation [61.45986275328629]
逐次レコメンデーションのためのマルチモーダル事前学習・転送学習フレームワークであるMISSRecを提案する。
ユーザ側ではトランスフォーマーベースのエンコーダデコーダモデルを設計し、コンテキストエンコーダがシーケンスレベルのマルチモーダルユーザ興味を捉えることを学習する。
候補項目側では,ユーザ適応項目表現を生成するために動的融合モジュールを採用する。
論文 参考訳(メタデータ) (2023-08-22T04:06:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。