論文の概要: RoleMAG: Learning Neighbor Roles in Multimodal Graphs
- arxiv url: http://arxiv.org/abs/2604.12271v1
- Date: Tue, 14 Apr 2026 04:35:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.237265
- Title: RoleMAG: Learning Neighbor Roles in Multimodal Graphs
- Title(参考訳): RoleMAG: マルチモーダルグラフにおける隣役の学習
- Authors: Yilong Zuo, Xunkai Li, Zhihan Zhang, Ronghua Li, Guoren Wang,
- Abstract要約: マルチモーダル属性グラフ(MAG)は、マルチモーダルノード属性と構造化された関係を結合する。
既存のメソッドは通常、単一のグラフ上で共有メッセージパッシングを実行する。
RoleMAGは、隣人がどのように伝播に参加するべきかを学ぶためのフレームワークである。
- 参考スコア(独自算出の注目度): 38.53928986942021
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal attributed graphs (MAGs) combine multimodal node attributes with structured relations. However, existing methods usually perform shared message passing on a single graph and implicitly assume that the same neighbors are equally useful for all modalities. In practice, neighbors that benefit one modality may interfere with another, blurring modality-specific signals under shared propagation. To address this issue, we propose RoleMAG, a multimodal graph framework that learns how different neighbors should participate in propagation. Concretely, RoleMAG distinguishes whether a neighbor should provide shared, complementary, or heterophilous signals, and routes them through separate propagation channels. This enables cross-modal completion from complementary neighbors while keeping heterophilous ones out of shared smoothing. Extensive experiments on three graph-centric MAG benchmarks show that RoleMAG achieves the best results on RedditS and Bili\_Dance, while remaining competitive on Toys. Ablation, robustness, and efficiency analyses further support the effectiveness of the proposed role-aware propagation design. Our code is available at https://anonymous.4open.science/r/RoleMAG-7EE0/
- Abstract(参考訳): マルチモーダル属性グラフ(MAG)は、マルチモーダルノード属性と構造化された関係を結合する。
しかしながら、既存のメソッドは通常、単一のグラフ上で共有メッセージパッシングを実行し、同じ隣人がすべてのモダリティに等しく有用であると暗黙的に仮定する。
実際には、1つのモダリティの恩恵を受ける隣人は別のモダリティに干渉し、共有伝播の下でモダリティ固有の信号がぼやけてしまうことがある。
この問題に対処するために,複数の隣人がどのように伝播に参加するべきかを学習するマルチモーダルグラフフレームワークであるRoleMAGを提案する。
具体的には、RoleMAGは、隣人が共有、相補的、または異性的な信号を提供するべきかどうかを区別し、それらを別々の伝播チャネルにルーティングする。
これにより、相補的な隣人からのクロスモーダルコンプリートが可能であり、異種体を共有平滑化から遠ざけることができる。
3つのグラフ中心のMAGベンチマークに関する大規模な実験は、RoleMAGがRedditSとBili\_Danceで最高の結果を得る一方で、Toysでは競争力を維持していることを示している。
アブレーション,ロバスト性,効率解析は,提案した役割認識伝搬設計の有効性をさらに裏付ける。
私たちのコードはhttps://anonymous.4open.science/r/RoleMAG-7EE0/で利用可能です。
関連論文リスト
- Toward Effective Multimodal Graph Foundation Model: A Divide-and-Conquer Based Approach [42.970648490410504]
MGFM(Multimodal Graph Foundation Models)は、Multimodal-Attributed Graphs(MAG)におけるリッチなマルチモーダル情報の活用を可能にする。
本稿では,異なる粒度にまたがるモダリティの相互作用とアライメントを分離するために,Divide-and-Conquer戦略を用いた新しいフレームワークPLANETを提案する。
PLANETは,様々なグラフ中心およびマルチモーダル生成タスクにおいて,最先端のベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2026-02-04T01:05:12Z) - OptiMAG: Structure-Semantic Alignment via Unbalanced Optimal Transport [37.640303159988015]
マルチモーダル分散グラフ(MAG)は、テキストや画像などのマルチモーダル情報をノード上で統合することにより、複雑なシステムのモデリングに広く採用されている。
異なるモダリティ埋め込みによって誘導される暗黙的な意味構造と明示的なグラフ構造との相違を同定する。
既存のメソッドは通常、固定された明示的なグラフ構造上でメッセージパッシングを実行するため、それらは必然的に異なる特徴を集約する。
我々は,不均衡な最適輸送に基づく正規化フレームワークOptiMAGを提案する。
論文 参考訳(メタデータ) (2026-01-30T11:29:03Z) - Divide and Refine: Enhancing Multimodal Representation and Explainability for Emotion Recognition in Conversation [2.5884126726585777]
会話におけるマルチモーダル感情認識には、複数のモーダルからの信号を統合する表現が必要である。
対照的な学習と拡張に基づく手法の進歩は進歩してきたが、これらのコンポーネントの保存におけるデータ準備の役割を見落としていることが多い。
2相フレームワークemphtextbfDivideとtextbfRefine(textbfDnR)を提案する。
これらの結果は、感情認識を促進するための原則的戦略として、マルチモーダル表現を明示的に分割、精製、再結合する効果を強調した。
論文 参考訳(メタデータ) (2026-01-10T07:30:20Z) - Refining Contrastive Learning and Homography Relations for Multi-Modal Recommendation [19.01114538768217]
我々は,textbfRtextbfEfining multi-modtextbfAl conttextbfRastive learning and hotextbfMography relationsを提案する。
実世界の3つのデータセットに対する実験は、REARMの様々な最先端ベースラインに対する優位性を実証している。
論文 参考訳(メタデータ) (2025-08-19T11:35:48Z) - Disentangling Homophily and Heterophily in Multimodal Graph Clustering [7.565710850295745]
マルチモーダルグラフは非構造的異種データと構造的相互接続を統合する。
Disentangled Multimodal Graph Clustering (DMGC)は、ハイブリッドグラフを2つの相補的なビューに分解する。
DMGCは最先端のパフォーマンスを実現し、さまざまな設定におけるその有効性と一般化性を強調している。
論文 参考訳(メタデータ) (2025-07-21T05:29:53Z) - Bi-directional Self-Registration for Misaligned Infrared-Visible Image Fusion [53.60977801655896]
高品質なマルチモーダル画像融合を実現するためには,高精度なマルチモーダル画像ペアの取得が不可欠である。
我々は、新しい自己教師型 textbfBi-directional textbfSelf-textbfRegistration framework (textbfB-SR) を提案する。
論文 参考訳(メタデータ) (2025-05-11T09:36:25Z) - The Heterophilic Snowflake Hypothesis: Training and Empowering GNNs for Heterophilic Graphs [59.03660013787925]
ヘテロフィリー・スノーフレーク仮説を導入し、ヘテロ親和性グラフの研究をガイドし、促進するための効果的なソリューションを提供する。
観察の結果,我々のフレームワークは多種多様なタスクのための多目的演算子として機能することがわかった。
さまざまなGNNフレームワークに統合することができ、パフォーマンスを詳細に向上し、最適なネットワーク深さを選択するための説明可能なアプローチを提供する。
論文 参考訳(メタデータ) (2024-06-18T12:16:00Z) - Discovering the Representation Bottleneck of Graph Neural Networks from
Multi-order Interactions [51.597480162777074]
グラフニューラルネットワーク(GNN)は、ノード機能を伝搬し、インタラクションを構築するためにメッセージパッシングパラダイムに依存している。
最近の研究は、異なるグラフ学習タスクはノード間の異なる範囲の相互作用を必要とすることを指摘している。
科学領域における2つの共通グラフ構築法、すなわち、emphK-nearest neighbor(KNN)グラフとemphfully-connected(FC)グラフについて検討する。
論文 参考訳(メタデータ) (2022-05-15T11:38:14Z) - Jointly Cross- and Self-Modal Graph Attention Network for Query-Based
Moment Localization [77.21951145754065]
本稿では,共同グラフを渡る反復的メッセージのプロセスとして,このタスクをリキャストするクロスモーダルグラフ注意ネットワーク(CSMGAN)を提案する。
CSMGANは2つのモード間の高次相互作用を効果的に捉えることができ、より正確な局所化を可能にします。
論文 参考訳(メタデータ) (2020-08-04T08:25:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。