論文の概要: Knowledge-aware Diffusion-Enhanced Multimedia Recommendation
- arxiv url: http://arxiv.org/abs/2507.16396v1
- Date: Tue, 22 Jul 2025 09:47:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-24 14:06:49.773181
- Title: Knowledge-aware Diffusion-Enhanced Multimedia Recommendation
- Title(参考訳): 知識を意識した拡散強化マルチメディアレコメンデーション
- Authors: Xian Mo, Fei Liu, Rui Tang, Jintao, Gao, Hao Liu,
- Abstract要約: マルチメディアレコメンデーションのためのコントラスト学習パラダイム(KDiffE)を用いた知識認識拡散拡張アーキテクチャを提案する。
まず最初に、本来のユーザアイコングラフを使用して、注目を意識した行列をグラフニューラルネットワークに組み込む。
そこで,本研究では,知識を意識したコントラッシブな視点を構築するために,ノイズの少ないタスク関連知識グラフを生成するための誘導拡散モデルを提案する。
- 参考スコア(独自算出の注目度): 9.12236232752614
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimedia recommendations aim to use rich multimedia content to enhance historical user-item interaction information, which can not only indicate the content relatedness among items but also reveal finer-grained preferences of users. In this paper, we propose a Knowledge-aware Diffusion-Enhanced architecture using contrastive learning paradigms (KDiffE) for multimedia recommendations. Specifically, we first utilize original user-item graphs to build an attention-aware matrix into graph neural networks, which can learn the importance between users and items for main view construction. The attention-aware matrix is constructed by adopting a random walk with a restart strategy, which can preserve the importance between users and items to generate aggregation of attention-aware node features. Then, we propose a guided diffusion model to generate strongly task-relevant knowledge graphs with less noise for constructing a knowledge-aware contrastive view, which utilizes user embeddings with an edge connected to an item to guide the generation of strongly task-relevant knowledge graphs for enhancing the item's semantic information. We perform comprehensive experiments on three multimedia datasets that reveal the effectiveness of our KDiffE and its components on various state-of-the-art methods. Our source codes are available https://github.com/1453216158/KDiffE.
- Abstract(参考訳): マルチメディアレコメンデーションは、リッチなマルチメディアコンテンツを使用して、歴史的ユーザとイテムのインタラクション情報を強化することを目的としている。
本稿では,マルチメディアレコメンデーションのためのコントラスト学習パラダイム(KDiffE)を用いた知識認識拡散拡張アーキテクチャを提案する。
具体的には、まず最初に、ユーザとアイテム間の重要度を学習し、メインビュー構築のための注目度を意識した行列をグラフニューラルネットワークに組み込む。
本発明の注目対応行列は、ユーザとアイテム間の重要度を保存し、注意対応ノードの特徴の集約を生成する、再起動戦略を備えたランダムウォークを採用することで構成される。
そこで,本論文では,アイテムに連結したエッジにユーザ埋め込みを組み込むことで,アイテムの意味情報を高めるために,強いタスク関連知識グラフの生成をガイドする,知識対応のコントラストビューを構築するためのノイズの少ない,強いタスク関連知識グラフを生成するためのガイド付き拡散モデルを提案する。
我々は、KDiffEとそのコンポーネントの様々な最先端手法における有効性を明らかにする3つのマルチメディアデータセットに関する総合的な実験を行った。
ソースコードはhttps://github.com/1453216158/KDiffE.comで入手できる。
関連論文リスト
- Less is More: Information Bottleneck Denoised Multimedia Recommendation [43.66791467993419]
我々は、Information Bottleneck principle (IB) を用いて、認知マルチメディアレコメンデーションパラダイムを提案する。
IBMRecは機能面と項目面の両方からタスク非関連の機能を取り除いている。
マルチメディア表現とレコメンデーションタスクの相互情報を最大化する。
論文 参考訳(メタデータ) (2025-01-21T14:33:07Z) - Enhancing Graph Contrastive Learning with Reliable and Informative Augmentation for Recommendation [84.45144851024257]
離散コードによるより強力な協調情報を用いて、コントラスト的なビューを構築することにより、グラフのコントラスト学習を強化することを目的とした、新しいフレームワークを提案する。
中心となる考え方は、ユーザとアイテムを協調情報に富んだ離散コードにマッピングし、信頼性と情報に富んだコントラッシブなビュー生成を可能にすることである。
論文 参考訳(メタデータ) (2024-09-09T14:04:17Z) - Augmented Commonsense Knowledge for Remote Object Grounding [67.30864498454805]
エージェントナビゲーションを改善するための時間的知識グラフとして,コモンセンス情報を活用するための拡張コモンセンス知識モデル(ACK)を提案する。
ACKは知識グラフ対応のクロスモーダルとコンセプトアグリゲーションモジュールで構成され、視覚的表現と視覚的テキストデータアライメントを強化する。
我々は、より正確な局所的な行動予測につながるコモンセンスに基づく意思決定プロセスのための新しいパイプラインを追加します。
論文 参考訳(メタデータ) (2024-06-03T12:12:33Z) - Tokenization, Fusion, and Augmentation: Towards Fine-grained Multi-modal Entity Representation [51.80447197290866]
マルチモーダル知識グラフ補完(MMKGC)は、与えられた知識グラフから観測されていない知識を発見することを目的としている。
既存のMMKGCメソッドは通常、事前訓練されたモデルでマルチモーダルな特徴を抽出する。
エンティティの微細なマルチモーダル表現をトークン化し、融合し、拡張する新しいフレームワークであるMyGOを紹介します。
論文 参考訳(メタデータ) (2024-04-15T05:40:41Z) - Intent-aware Multi-source Contrastive Alignment for Tag-enhanced
Recommendation [46.04494053005958]
我々は,情報ソースをまたいだ自己教師型学習を通じて,軽量で効果的な代替フレームワークを模索する。
我々は、ユーザと以前対話したアイテムに関連する補助情報とをペアリングするために、セルフスーパービジョン信号を使用する。
また,本手法はトレーニング時間を短縮しつつ,より優れた性能を実現することができることを示す。
論文 参考訳(メタデータ) (2022-11-11T17:43:19Z) - Conditional Attention Networks for Distilling Knowledge Graphs in
Recommendation [74.14009444678031]
本稿では,知識グラフをレコメンデーションシステムに組み込むために,知識対応コンディショナルアテンションネットワーク(KCAN)を提案する。
本研究では,まず,ユーザ・イテムネットワークとナレッジグラフのグローバルな意味的類似性を捉えるノード表現を得る。
そして,そのサブグラフに条件付きアテンションアグリゲーションを適用することで,その知識グラフを改良し,目標固有ノード表現を得る。
論文 参考訳(メタデータ) (2021-11-03T09:40:43Z) - Latent Structures Mining with Contrastive Modality Fusion for Multimedia
Recommendation [22.701371886522494]
マルチモーダルコンテンツに基づく潜在意味的項目-項目構造は,より優れた項目表現を学習する上で有益である,と我々は主張する。
モータリティを意識した構造学習モジュールを考案し,各モータリティの項目間関係を学習する。
論文 参考訳(メタデータ) (2021-11-01T03:37:02Z) - Deep Contrastive Learning for Multi-View Network Embedding [20.035449838566503]
マルチビューネットワーク埋め込みは、ネットワーク内のノードを低次元ベクトルに投影することを目的としている。
ほとんどの対照的な学習ベースの手法は、主に高品質なグラフ埋め込みに依存している。
マルチビューネットワーク埋め込み(CREME)のための新しいノード間コントラスト学習フレームワークを設計する。
論文 参考訳(メタデータ) (2021-08-16T06:29:18Z) - Mining Latent Structures for Multimedia Recommendation [46.70109406399858]
本稿では,マルチモーダル再圧縮のためのLATent sTructureマイニング手法を提案する。
各モダリティの項目構造を学び、複数のモダリティを集約して潜在アイテムグラフを得る。
学習した潜在グラフに基づいてグラフ畳み込みを行い、アイテム表現に高次項目親和性を明示的に注入する。
論文 参考訳(メタデータ) (2021-04-19T03:50:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。