論文の概要: Robust Multimodal Recommendation via Graph Retrieval-Enhanced Modality Completion
- arxiv url: http://arxiv.org/abs/2605.00670v1
- Date: Fri, 01 May 2026 13:50:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.976337
- Title: Robust Multimodal Recommendation via Graph Retrieval-Enhanced Modality Completion
- Title(参考訳): グラフ検索強化モード補完によるロバストなマルチモーダルレコメンデーション
- Authors: Yuan Li, Jun Hu, Jiaxin Jiang, Bryan Hooi, Bingsheng He,
- Abstract要約: 実世界のマルチモーダルデータセットは、センサーの故障、アノテーションの不足、プライバシーの制約によって、しばしばモダリティの不完全性に悩まされる。
効果的な解決策の1つはモダリティ補完であり、下流タスクのためのモダリティ完全グラフを提供するために欠落した特徴を再構成する。
本稿では,これらの制限を克服するグラフ検索拡張モード補完フレームワークであるGRE-MCを提案する。
- 参考スコア(独自算出の注目度): 71.20734649881258
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal data plays a critical role in web-based recommendation systems, where information from diverse modalities such as vision and text enhances representation learning. However, real-world multimodal datasets often suffer from modality incompleteness due to sensor failures, annotation scarcity, or privacy constraints, which substantially degrade model performance and reliability. One effective solution to address this issue is modality completion, which reconstructs missing features to provide modality-complete graphs for downstream tasks. Given a query node with missing multimodal features, existing modality completion methods typically infer information from the node itself or its neighbors to reconstruct the missing modality. However, these methods may overlook semantically relevant context in the graph, which contains valuable cues that are non-trivial to capture through simple methods like neighborhood aggregation. In this work, we propose GRE-MC, a Graph Retrieval-Enhanced Modality Completion framework, to overcome these limitations. By introducing a modality-aware subgraph retrieval mechanism, GRE-MC selects semantically relevant subgraphs from the entire graph, providing richer contextual information for completing missing modalities. Subsequently, a graph transformer jointly encodes the query node and the retrieved subgraph via global attention to complete the missing features, while a learnable sparse-routing codebook regularizes latent embeddings into compact bases for improved robustness. Extensive experiments on multimodal recommendation benchmarks demonstrate that GRE-MC consistently outperforms state-of-the-art methods, validating the effectiveness of subgraph retrieval and joint-encoding graph transformer for robust modality completion.
- Abstract(参考訳): マルチモーダルデータはWebベースのレコメンデーションシステムにおいて重要な役割を担い、視覚やテキストなどの様々なモダリティからの情報によって表現学習が促進される。
しかし、実世界のマルチモーダルデータセットは、センサーの故障、アノテーションの不足、あるいはプライバシの制約によるモダリティの不完全性に悩まされることが多く、モデルの性能と信頼性は著しく低下する。
この問題に対処する効果的な解決策の1つは、下流タスクのためのモダリティ完全グラフを提供するために欠落した特徴を再構築するモダリティ完備化である。
マルチモーダルな特徴が欠けているクエリノードが与えられた場合、既存のモダリティ補完手法は一般にノード自身やその隣人から情報を推測して、欠落したモダリティを再構築する。
しかし、これらの手法はグラフにおいて意味論的に関連づけられた文脈を見落としてしまう可能性がある。
本稿では,これらの制限を克服するグラフ検索拡張モード補完フレームワークであるGRE-MCを提案する。
モダリティ対応のサブグラフ検索機構を導入することで、GRE-MCはグラフ全体から意味論的に関連するサブグラフを選択し、欠落したモダリティを完了するためのよりリッチなコンテキスト情報を提供する。
その後、グラフトランスフォーマーは、クエリノードと検索したサブグラフを共同で符号化して、欠落した特徴を完遂する一方、学習可能なスパースルーティングコードブックは、遅延埋め込みをコンパクトなベースに正規化し、ロバスト性を向上させる。
マルチモーダルレコメンデーションベンチマークの大規模な実験により、GRE-MCは一貫して最先端の手法を上回り、グラフ検索と共同符号化グラフ変換器の有効性を検証した。
関連論文リスト
- OWLEYE: Zero-Shot Learner for Cross-Domain Graph Data Anomaly Detection [48.77471686671269]
OWLEYEは、複数のグラフから正常な振る舞いの伝達可能なパターンを学習する新しいフレームワークである。
OWLEYEは最先端のベースラインに比べて性能と一般化性が優れていることを示す。
論文 参考訳(メタデータ) (2026-01-27T02:08:18Z) - IGDMRec: Behavior Conditioned Item Graph Diffusion for Multimodal Recommendation [21.87097387902408]
マルチモーダルレコメンデーションシステム(MRS)は、様々なオンラインプラットフォームにおいて重要であり、マルチモーダル情報を取り入れたより正確なパーソナライズレコメンデーションを提供する。
本稿では, セマンティックな項目グラフを識別するために, 分類不要なガイダンス付き拡散モデルを利用する新しい手法IGDMRecを提案する。
4つの実世界のデータセットに対する大規模な実験は、IGDMRecが競合ベースラインよりも優れていることを示している。
論文 参考訳(メタデータ) (2025-12-23T02:13:01Z) - Leveraging Spreading Activation for Improved Document Retrieval in Knowledge-Graph-Based RAG Systems [0.0]
Retrieval-augmented Generation (RAG) システムは、複雑な推論タスクに必要な多段階の証拠を確実に回収し、接続するのに苦労する。
標準的なRAGフレームワークのほとんどは、検索された全ての情報を、大きなテキストコーパスの様々な信頼性と相互接続性を見越して、等しく信頼できるものとみなしている。
自動構築された知識グラフによって相互接続された文書のコーパスから情報を取得するために,拡散活性化アルゴリズムを用いた新しいRAGフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-17T19:38:35Z) - Generalized Contrastive Learning for Universal Multimodal Retrieval [53.70202081784898]
クロスモーダル検索モデル(例えばCLIP)は、融合した画像テキストのモダリティからなるキーを検索することで、劣化したパフォーマンスを示す。
本稿では,新たなデータセットキュレーションを必要とせずに,マルチモーダル検索性能を向上させる新しい損失定式化である汎用コントラスト学習(GCL)を提案する。
論文 参考訳(メタデータ) (2025-09-30T01:25:04Z) - Refining Contrastive Learning and Homography Relations for Multi-Modal Recommendation [19.01114538768217]
我々は,textbfRtextbfEfining multi-modtextbfAl conttextbfRastive learning and hotextbfMography relationsを提案する。
実世界の3つのデータセットに対する実験は、REARMの様々な最先端ベースラインに対する優位性を実証している。
論文 参考訳(メタデータ) (2025-08-19T11:35:48Z) - Gated Multimodal Graph Learning for Personalized Recommendation [9.466822984141086]
マルチモーダルレコメンデーションは、協調フィルタリングにおけるコールドスタートとスパーシリティの問題を軽減するための有望なソリューションとして登場した。
グラフベースユーザモデリングと適応型マルチモーダルアイテムエンコーディングを組み合わせた軽量かつモジュール化されたレコメンデーションフレームワーク RLMultimodalRec を提案する。
論文 参考訳(メタデータ) (2025-05-30T16:57:17Z) - Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。
革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。
属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。
階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文 参考訳(メタデータ) (2025-05-20T06:44:34Z) - Reliable Multi-Modal Object Re-Identification via Modality-Aware Graph Reasoning [20.242422751083588]
我々は、MGRNet(Modality-aware Graph Reasoning Network)と呼ばれる新しいグラフ推論モデルを活用することを提案する。
まず、微粒な局所的詳細の抽出を強化するために、モダリティ対応グラフを構築する。
次に、選択グラフノードスワップ演算を用いて、低品質な局所的特徴の悪影響を軽減する。
論文 参考訳(メタデータ) (2025-04-21T03:58:40Z) - RGL: A Graph-Centric, Modular Framework for Efficient Retrieval-Augmented Generation on Graphs [58.10503898336799]
完全なRAGパイプラインをシームレスに統合するモジュラーフレームワークであるRAG-on-Graphs Library(RGL)を紹介した。
RGLは、さまざまなグラフフォーマットをサポートし、必須コンポーネントの最適化実装を統合することで、重要な課題に対処する。
評価の結果,RGLはプロトタイピングプロセスの高速化だけでなく,グラフベースRAGシステムの性能や適用性の向上も図っている。
論文 参考訳(メタデータ) (2025-03-25T03:21:48Z) - NativE: Multi-modal Knowledge Graph Completion in the Wild [51.80447197290866]
本研究では,MMKGCを実現するための包括的フレームワークNativEを提案する。
NativEは、任意のモダリティに対して適応的な融合を可能にするリレーショナル誘導デュアルアダプティブフュージョンモジュールを提案する。
提案手法を評価するために,5つのデータセットを用いたWildKGCという新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2024-03-28T03:04:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。