論文の概要: Beyond Graph Convolution: Multimodal Recommendation with Topology-aware MLPs
- arxiv url: http://arxiv.org/abs/2412.11747v1
- Date: Mon, 16 Dec 2024 13:05:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-17 13:53:55.111351
- Title: Beyond Graph Convolution: Multimodal Recommendation with Topology-aware MLPs
- Title(参考訳): グラフの畳み込みを超えて - トポロジを意識したマルチモーダルレコメンデーション
- Authors: Junjie Huang, Jiarui Qin, Yong Yu, Weinan Zhang,
- Abstract要約: マルチモーダルレコメンデータシステムは、ユーザとイテムの相互作用を超えた、よりリッチなセマンティック情報を利用する必要がある。
最近の研究は、グラフ畳み込みネットワーク(GCN)を利用して、マルチモーダルアイテム-イテム関係を明示的にモデル化することで、パフォーマンスを著しく向上させることを強調している。
本稿では,アイテム・イテム関係のモデル化においてGCNをバイパスする手法を提案する。
- 参考スコア(独自算出の注目度): 36.17461150347698
- License:
- Abstract: Given the large volume of side information from different modalities, multimodal recommender systems have become increasingly vital, as they exploit richer semantic information beyond user-item interactions. Recent works highlight that leveraging Graph Convolutional Networks (GCNs) to explicitly model multimodal item-item relations can significantly enhance recommendation performance. However, due to the inherent over-smoothing issue of GCNs, existing models benefit only from shallow GCNs with limited representation power. This drawback is especially pronounced when facing complex and high-dimensional patterns such as multimodal data, as it requires large-capacity models to accommodate complicated correlations. To this end, in this paper, we investigate bypassing GCNs when modeling multimodal item-item relationship. More specifically, we propose a Topology-aware Multi-Layer Perceptron (TMLP), which uses MLPs instead of GCNs to model the relationships between items. TMLP enhances MLPs with topological pruning to denoise item-item relations and intra (inter)-modality learning to integrate higher-order modality correlations. Extensive experiments on three real-world datasets verify TMLP's superiority over nine baselines. We also find that by discarding the internal message passing in GCNs, which is sensitive to node connections, TMLP achieves significant improvements in both training efficiency and robustness against existing models.
- Abstract(参考訳): 様々なモダリティから大量の副次情報が得られれば、ユーザとイテムの相互作用を超えてよりリッチなセマンティック情報を利用するため、マルチモーダルレコメンデータシステムはますます重要になっている。
最近の研究は、グラフ畳み込みネットワーク(GCN)を利用して、マルチモーダルアイテム-イテム関係を明示的にモデル化することで、推奨性能を大幅に向上させることを強調している。
しかし、GCNの過度に平滑な問題のため、既存のモデルは表現力に制限のある浅いGCNからしか恩恵を受けない。
この欠点は、複雑な相関に対応するために大容量モデルを必要とするため、マルチモーダルデータのような複雑で高次元のパターンに直面するときに特に顕著である。
そこで本稿では,マルチモーダルアイテム-イテム関係のモデル化におけるGCNのバイパスについて検討する。
より具体的には、GCNの代わりにMLPを用いてアイテム間の関係をモデル化する、トポロジー対応マルチ層パーセプトロン(TMLP)を提案する。
TMLPは、トポロジカルプルーニングによりアイテム・イテム関係を軽視し、高次モダリティ相関を統合するためのイントラ・モダリティ学習を強化する。
3つの実世界のデータセットに対する大規模な実験は、TMLPが9つのベースラインよりも優れていることを検証している。
また、ノード接続に敏感なGCNの内部メッセージパッシングを破棄することで、TMLPは既存のモデルに対するトレーニング効率とロバスト性の両方において、大幅な改善を実現する。
関連論文リスト
- Topology-Aware Popularity Debiasing via Simplicial Complexes [19.378410889819165]
TSP(Test-time Simplicial Propagation)は、グラフニューラルネットワーク(GNN)の表現性を高めるために、simplicial Complex(SC)を組み込んだ。
提案手法は, SCを用いて複数順序関係を捕捉し, ユーザとイテムのインタラクションをより包括的に表現する。
提案手法はより均一なアイテム表現分布を生成し,より公平で正確なレコメンデーションを実現する。
論文 参考訳(メタデータ) (2024-11-21T07:12:47Z) - Multimodal Graph Neural Network for Recommendation with Dynamic De-redundancy and Modality-Guided Feature De-noisy [8.799657717956343]
動的デ冗長性とモダリティ誘導型特徴デノイズを用いたマルチモーダルグラフニューラルネットワーク(MGNM)を提案する。
実験により,MGNMは冗長情報の復調・除去を行うマルチモーダル情報に対して優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-11-03T13:23:07Z) - Optimal Transport Guided Correlation Assignment for Multimodal Entity Linking [20.60198596317328]
マルチモーダルエンティティリンクは、マルチモーダルなコンテキストにおける曖昧な言及をマルチモーダルな知識グラフ内のエンティティにリンクすることを目的としている。
既存の手法は、自動的に学習された注意重みに大きく依存して、いくつかの局所的な相関機構を試行する。
本稿では,OT-MELを用いた新しいMELフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-04T03:35:25Z) - Multimodal Learning Without Labeled Multimodal Data: Guarantees and Applications [90.6849884683226]
ラベル付き単調データのみを用いた半教師付き環境における相互作用定量化の課題について検討する。
相互作用の正確な情報理論的定義を用いて、我々の重要な貢献は下界と上界の導出である。
本稿では、これらの理論結果を用いてマルチモーダルモデルの性能を推定し、データ収集をガイドし、様々なタスクに対して適切なマルチモーダルモデルを選択する方法について述べる。
論文 参考訳(メタデータ) (2023-06-07T15:44:53Z) - Correlation Information Bottleneck: Towards Adapting Pretrained
Multimodal Models for Robust Visual Question Answering [63.87200781247364]
相関情報ボトルネック (CIB) は圧縮と表現の冗長性のトレードオフを求める。
マルチモーダル入力と表現の相互情報に対して,理論上界を厳密に導出する。
論文 参考訳(メタデータ) (2022-09-14T22:04:10Z) - GraphCFC: A Directed Graph Based Cross-Modal Feature Complementation
Approach for Multimodal Conversational Emotion Recognition [37.12407597998884]
Emotion Recognition in Conversation (ERC) は人間とコンピュータのインタラクション(HCI)システムにおいて重要な役割を果たす。
マルチモーダルERCでは、グラフニューラルネットワーク(GNN)は、長距離コンテキスト情報とモーダル間インタラクティブ情報の両方を抽出することができる。
我々は,文脈情報や対話的情報を効率的にモデル化できるグラフベースのクロスモーダル特徴補完(GraphCFC)モジュールを提案する。
論文 参考訳(メタデータ) (2022-07-06T13:56:48Z) - Deep Architecture Connectivity Matters for Its Convergence: A
Fine-Grained Analysis [94.64007376939735]
我々は、勾配降下訓練におけるディープニューラルネットワーク(DNN)の収束に対する接続パターンの影響を理論的に特徴づける。
接続パターンの単純なフィルタリングによって、評価対象のモデルの数を削減できることが示される。
論文 参考訳(メタデータ) (2022-05-11T17:43:54Z) - Multi-Scale Semantics-Guided Neural Networks for Efficient
Skeleton-Based Human Action Recognition [140.18376685167857]
スケルトンに基づく行動認識には,単純なマルチスケールセマンティクス誘導ニューラルネットワークが提案されている。
MS-SGNは、NTU60、NTU120、SYSUデータセットの最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-11-07T03:50:50Z) - Mining Latent Structures for Multimedia Recommendation [46.70109406399858]
本稿では,マルチモーダル再圧縮のためのLATent sTructureマイニング手法を提案する。
各モダリティの項目構造を学び、複数のモダリティを集約して潜在アイテムグラフを得る。
学習した潜在グラフに基づいてグラフ畳み込みを行い、アイテム表現に高次項目親和性を明示的に注入する。
論文 参考訳(メタデータ) (2021-04-19T03:50:24Z) - Lightweight, Dynamic Graph Convolutional Networks for AMR-to-Text
Generation [56.73834525802723]
軽量な動的グラフ畳み込みネットワーク (LDGCN) を提案する。
LDGCNは入力グラフから高次情報を合成することにより、よりリッチな非局所的な相互作用をキャプチャする。
我々は,グループグラフの畳み込みと重み付き畳み込みに基づく2つの新しいパラメータ保存戦略を開発し,メモリ使用量とモデル複雑性を低減する。
論文 参考訳(メタデータ) (2020-10-09T06:03:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。