論文の概要: User-Aware Conditional Generative Total Correlation Learning for Multi-Modal Recommendation
- arxiv url: http://arxiv.org/abs/2604.03014v1
- Date: Fri, 03 Apr 2026 12:56:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.474288
- Title: User-Aware Conditional Generative Total Correlation Learning for Multi-Modal Recommendation
- Title(参考訳): マルチモーダルレコメンデーションのためのユーザ対応条件付き全相関学習
- Authors: Jing Du, Zesheng Ye, Congbo Ma, Feng Liu, Flora. D. Salim,
- Abstract要約: 本稿では,条件付き生成的トータル相関学習フレームワークであるGTCを紹介する。
我々は,対話誘導拡散モデルを用いて,ユーザ認識型コンテンツ特徴フィルタリングを行う。
標準的なMMRベンチマークの実験では、GCCは最先端よりも一貫して優れていた。
- 参考スコア(独自算出の注目度): 21.30527831237202
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-modal recommendation (MMR) enriches item representations by introducing item content, e.g., visual and textual descriptions, to improve upon interaction-only recommenders. The success of MMR hinges on aligning these content modalities with user preferences derived from interaction data, yet dominant practices based on disentangling modality-invariant preference-driving signals from modality-specific preference-irrelevant noises are flawed. First, they assume a one-size-fits-all relevance of item content to user preferences for all users, which contradicts the user-conditional fact of preferences. Second, they optimize pairwise contrastive losses separately toward cross-modal alignment, systematically ignoring higher-order dependencies inherent when multiple content modalities jointly influence user choices. In this paper, we introduce GTC, a conditional Generative Total Correlation learning framework. We employ an interaction-guided diffusion model to perform user-aware content feature filtering, preserving only personalized features relevant to each individual user. Furthermore, to capture complete cross-modal dependencies, we optimize a tractable lower bound of the total correlation of item representations across all modalities. Experiments on standard MMR benchmarks show GTC consistently outperforms state-of-the-art, with gains of up to 28.30% in NDCG@5. Ablation studies validate both conditional preference-driven feature filtering and total correlation optimization, confirming the ability of GTC to model user-conditional relationships in MMR tasks. The code is available at: https://github.com/jingdu-cs/GTC.
- Abstract(参考訳): マルチモーダルレコメンデーション(MMR)は、アイテムコンテンツ(例えば、視覚的およびテキスト的記述)を導入してアイテム表現を強化し、インタラクションのみのレコメンデーションを改善する。
MMRの成功は、これらのコンテンツモダリティと、インタラクションデータから導かれるユーザの嗜好とを整合させることに重点を置いている。
まず、すべてのユーザの好みに一律に合ったアイテムコンテンツが関係していると仮定し、ユーザの条件による嗜好の事実と矛盾する。
第二に、複数のコンテンツモダリティがユーザ選択に共同で影響を与える場合に固有の高次依存関係を体系的に無視する。
本稿では,条件付き生成的トータル相関学習フレームワークであるGTCを紹介する。
我々は,対話誘導拡散モデルを用いて,個々のユーザに関連するパーソナライズされた機能のみを保存し,ユーザを意識したコンテンツ特徴フィルタリングを行う。
さらに,すべてのモダリティにおける項目表現の総相関関係のトラクタブルな下界を最適化する。
標準的なMMRベンチマークの実験では、GCCは最新技術より一貫して優れており、NDCG@5では最大28.30%向上している。
アブレーション研究は,条件条件付き特徴フィルタリングと総相関最適化の両方を検証し,MMRタスクにおけるユーザ-条件関係をモデル化するGTCの能力を確認する。
コードは、https://github.com/jingdu-cs/GTCで入手できる。
関連論文リスト
- Towards Multi-Behavior Multi-Task Recommendation via Behavior-informed Graph Embedding Learning [13.503641677199857]
マルチビヘイビアレコメンデーション(MBR)は、補助行動(例えば、クリック、お気に入り)を活用することにより、目標行動(購入)の性能を向上させることを目的としている。
現実のシナリオでは、レコメンデーションメソッドは、しばしば異なるタイプの振る舞いを処理し、各タスク(例えば、各行動タイプ)に対してパーソナライズされたリストを生成する必要がある。
論文 参考訳(メタデータ) (2026-01-12T08:04:08Z) - VI-MMRec: Similarity-Aware Training Cost-free Virtual User-Item Interactions for Multimodal Recommendation [14.611185073990582]
疎密なユーザ・イテムインタラクションを充実させるモデルに依存しない,コストフリーなフレームワークであるVI-MMRecを提案する。
これらの仮想インタラクションは、ユーザインタラクションアイテムのモダリティ固有の特徴類似性に基づいて構築される。
VI-MMRecはプラグイン・アンド・プレイのフレームワークであり、既存のモデルとシームレスに統合し、コアアーキテクチャを変更することなくパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2025-12-09T15:18:51Z) - MLLMRec: Exploring the Potential of Multimodal Large Language Models in Recommender Systems [8.744074431975019]
本稿では,MLLM方式のマルチモーダル・レコメンデーション・フレームワークを提案する。
MLLMRecは、最高のベースラインよりも平均38.53%改善して最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-08-21T06:50:00Z) - End-to-End Personalization: Unifying Recommender Systems with Large Language Models [0.0]
グラフ注意ネットワーク(GAT)と大言語モデル(LLM)を組み合わせた新しいハイブリッドレコメンデーションフレームワークを提案する。
LLMは、タイトル、ジャンル、概要などのメタデータに基づいて意味的に意味のあるプロファイルを生成することによって、ユーザーとアイテムの表現を豊かにするために最初に使用される。
MovieLens 100kと1Mを含むベンチマークデータセットでモデルを評価し、強いベースラインを一貫して上回ります。
論文 参考訳(メタデータ) (2025-08-02T22:46:50Z) - Learning Item Representations Directly from Multimodal Features for Effective Recommendation [51.49251689107541]
マルチモーダルレコメンデータシステムは、主にベイズパーソナライズされたランク付け(BPR)最適化を利用してアイテム表現を学習する。
本稿では,マルチモーダルな特徴からアイテム表現を直接学習し,推薦性能を向上する新しいモデル(LIRDRec)を提案する。
論文 参考訳(メタデータ) (2025-05-08T05:42:22Z) - Beyond the Binary: Capturing Diverse Preferences With Reward Regularization [15.518838657050173]
この二項選択への依存は、現実のタスクにおいて対象ユーザのより広範囲で集約的な嗜好を捉えるものではない、と我々は主張する。
本稿では、既存の二分選好データセットを合成選好判断で拡張し、潜在的なユーザ不一致を推定する、シンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-12-05T02:35:46Z) - GaVaMoE: Gaussian-Variational Gated Mixture of Experts for Explainable Recommendation [55.937636188796475]
GaVaMoEは、説明可能なレコメンデーションのための新しいフレームワークである。
特定のユーザータイプや好みのカスタマイズされた説明を生成する。
疎いユーザ-イテムインタラクションのシナリオでは、堅牢なパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-10-15T17:59:30Z) - Aligning LLMs with Individual Preferences via Interaction [51.72200436159636]
調整可能な大きな言語モデル(LLM)をトレーニングします。
木構造における3K以上の多ターン会話を含む多ターン嗜好データセットを開発した。
評価のために、慎重に選択された100のサンプルと、会話中にカスタマイズされたアライメント性能を測定するために適切に設計されたメトリクスからなるALOEベンチマークを確立する。
論文 参考訳(メタデータ) (2024-10-04T17:48:29Z) - Set2setRank: Collaborative Set to Set Ranking for Implicit Feedback
based Recommendation [59.183016033308014]
本稿では,暗黙的フィードバックの特徴を探究し,推奨するSet2setRankフレームワークを提案する。
提案するフレームワークはモデルに依存しず,ほとんどの推奨手法に容易に適用できる。
論文 参考訳(メタデータ) (2021-05-16T08:06:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。