論文の概要: SynGR: Unleashing the Potential of Cross-Modal Synergy for Generative Recommendation
- arxiv url: http://arxiv.org/abs/2605.18920v1
- Date: Mon, 18 May 2026 09:03:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:08.88061
- Title: SynGR: Unleashing the Potential of Cross-Modal Synergy for Generative Recommendation
- Title(参考訳): SynGR: ジェネレーティブレコメンデーションのためのクロスモーダルシナジーの可能性
- Authors: Wei Chen, Xingyu Guo, Shuang Li, Fuwei Zhang, Meng Yuan, Jing Fan, Zhao Zhang, Deqing Wang, Fuzhen Zhuang,
- Abstract要約: Generative Recommendation (GR) は、アイテム識別子上のシーケンス・ツー・シーケンス生成タスクとしてアイテムレコメンデーションを定式化することによって、有望なパラダイムとして登場した。
生成中の相互依存の活用を明示的に促進する相乗的生成推薦フレームワークである textbfSynGR を提案する。
- 参考スコア(独自算出の注目度): 38.65251304330463
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative Recommendation (GR) has emerged as a promising paradigm by formulating item recommendation as a sequence-to-sequence generation task over item identifiers. Recent studies have incorporated multimodal signals to provide richer token-level evidence for generation. However, existing approaches largely rely on alignment-centric fusion and underexplore synergistic information across modalities. In practice, synergistic information plays a critical role in capturing emergent item properties that cannot be inferred from any single modality alone. Such properties encode intrinsic item semantics and guide user preferences, enabling models to move beyond surface-level feature matching. To address this limitation, we propose \textbf{SynGR}, a synergistic generative recommendation framework that explicitly encourages the exploitation of cross-modal dependencies during generation. By constraining overreliance on dominant modalities, SynGR enables the model to capture emergent item semantics beyond shared or modality-specific signals. Extensive experiments across three benchmark datasets demonstrate that SynGR achieves superior performance.
- Abstract(参考訳): Generative Recommendation (GR) は、アイテム識別子上のシーケンス・ツー・シーケンス生成タスクとしてアイテムレコメンデーションを定式化することによって、有望なパラダイムとして登場した。
近年の研究では、よりリッチなトークンレベルの生成証拠を提供するために、マルチモーダル信号が組み込まれている。
しかし、既存のアプローチは、アライメント中心の融合と、モダリティ全体にわたる相乗的情報の不足に大きく依存している。
実際には、シナジスティックな情報は、単一のモダリティだけでは推論できない創発的アイテム特性を捕捉する上で重要な役割を果たす。
このようなプロパティは、固有のアイテムセマンティクスをエンコードし、ユーザの好みをガイドする。
この制限に対処するために、生成中の相互依存の活用を明示的に促進する相乗的生成推薦フレームワークである「textbf{SynGR}」を提案する。
支配的なモダリティへの過度な依存を制限することにより、SynGRは、共有またはモダリティ固有の信号を越えて、創発的なアイテムセマンティクスをキャプチャすることを可能にする。
3つのベンチマークデータセットにわたる大規模な実験は、SynGRが優れたパフォーマンスを達成することを示す。
関連論文リスト
- Robust Multimodal Recommendation via Graph Retrieval-Enhanced Modality Completion [71.20734649881258]
実世界のマルチモーダルデータセットは、センサーの故障、アノテーションの不足、プライバシーの制約によって、しばしばモダリティの不完全性に悩まされる。
効果的な解決策の1つはモダリティ補完であり、下流タスクのためのモダリティ完全グラフを提供するために欠落した特徴を再構成する。
本稿では,これらの制限を克服するグラフ検索拡張モード補完フレームワークであるGRE-MCを提案する。
論文 参考訳(メタデータ) (2026-05-01T13:50:52Z) - Beyond the Flat Sequence: Hierarchical and Preference-Aware Generative Recommendations [35.58864660038236]
我々はHPGR(Hierarchical and Preference-aware Generative Recommender)という新しいフレームワークを提案する。
まず、構造化を意識した事前学習段階において、セッションベースのMasked Item Modelingの目的を用いて、階層的にインフォームドされ、セマンティックにリッチなアイテム表現空間を学ぶ。
第二に、プライオリティ対応の微調整ステージは、これらの強力な表現を活用して、Preference-Guided Sparse Attentionメカニズムを実装する。
論文 参考訳(メタデータ) (2026-03-01T08:15:34Z) - Turning Semantics into Topology: LLM-Driven Attribute Augmentation for Collaborative Filtering [27.20519975467197]
Topology-Augmented Graph Collaborative Filtering (TAGCF)は、意味的知識をトポロジ接続に変換する新しいフレームワークである。
この拡張構造における異種関係を効果的にモデル化するために、適応的関係重み付きグラフ畳み込みを提案する。
論文 参考訳(メタデータ) (2026-02-24T17:01:47Z) - Orthogonalized Multimodal Contrastive Learning with Asymmetric Masking for Structured Representations [4.67724003380452]
マルチモーダル学習は異種情報源からの情報を統合することを目的としており、そこでは信号はモダリティ間で共有され、個々のモダリティに特有であり、相互作用を通してのみ現れる。
自己教師型マルチモーダルコントラスト学習は目覚ましい進歩を遂げてきたが、既存の手法のほとんどは冗長なクロスモーダル信号を捉え、しばしばモダリティ固有の(一意的な)情報や相互作用駆動の(シネルジスティックな)情報を無視している。
最近の拡張は、この視点を広げるが、それらは相乗的相互作用を明示的にモデル化したり、異なる情報コンポーネントを絡み合った方法で学習することに失敗し、不完全な表現と潜在的な情報漏洩につながる。
基本的枠組みである textbfCOrAL を導入する。
論文 参考訳(メタデータ) (2026-02-16T18:06:53Z) - Multimodal Generative Recommendation for Fusing Semantic and Collaborative Signals [17.608491612845306]
逐次リコメンデータシステムは、ユーザのインタラクション履歴をモデル化し、結果のユーザ表現とストアドアイテムの埋め込みの間の内部積を計算することで、関連する項目をランク付けする。
大きなアイテムを格納する際のメモリオーバーヘッドを大幅に回避するため、生成推奨パラダイムは、各アイテムを独立したセマンティックコードとしてモデル化する。
これらのメソッドは、大きなアイテムセットの伝統的なシーケンシャルなレコメンデータを超えておらず、それらが対処するように設計されたシナリオでの採用を制限する。
マルチモーダル・セマンティック・コラボレーション・ジェネレーティブ・レコメンダであるMSCGRecを提案する。
論文 参考訳(メタデータ) (2026-02-03T16:39:35Z) - Generative Reasoning Recommendation via LLMs [48.45009951684554]
大規模言語モデル(LLM)は、生成的推論レコメンデーションモデル(GRRM)として機能する上で、根本的な課題に直面している。
本研究は,レコメンデーションタスクに対する統一的な理解・推論・予測方法を実現する,事前学習されたLLMを適用してGRRMを構築する方法について検討する。
本稿では,協調的セマンティックアライメント(Collaborative-Semantic Alignment),Reasoning Curriculum Activation(Reasoning Curriculum Activation),Sparse-Regularized Group Policy Optimization(Sparse-Regularized Group Policy Optimization)の3つのコンポーネントを統合するエンドツーエンドフレームワークであるGREAMを提案する。
論文 参考訳(メタデータ) (2025-10-23T17:59:31Z) - NExT-OMNI: Towards Any-to-Any Omnimodal Foundation Models with Discrete Flow Matching [64.10695425442164]
NExT-OMNI(英語版)は、離散フローパラダイムによる統一モデリングを実現するオープンソース・オムニモーダル・ファンデーション・モデルである。
NExT-OMNIは、大規模なインターリーブ付きテキスト、画像、ビデオ、オーディオデータに基づいて訓練され、マルチモーダル生成および理解ベンチマーク上で競合するパフォーマンスを提供する。
さらなる研究を進めるために、トレーニングの詳細、データプロトコル、およびコードとモデルチェックポイントの両方をオープンソース化する。
論文 参考訳(メタデータ) (2025-10-15T16:25:18Z) - Dynamic Generation of Multi-LLM Agents Communication Topologies with Graph Diffusion Models [99.85131798240808]
我々はtextitGuided Topology Diffusion (GTD) と呼ばれる新しい生成フレームワークを導入する。
条件付き離散グラフ拡散モデルにインスパイアされたGTD式は、反復的な構成過程としてトポロジー合成を行う。
各ステップで生成は、多目的報酬を予測する軽量プロキシモデルによって制御される。
実験により、GTDは高いタスク適応性、スパース、効率的な通信トポロジを生成できることが示されている。
論文 参考訳(メタデータ) (2025-10-09T05:28:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。