Fugu-MT 論文翻訳(概要): Beyond the Aggregation Dilemma: Prior-Retaining Decoupled Learning for Multimodal Graphs

論文の概要: Beyond the Aggregation Dilemma: Prior-Retaining Decoupled Learning for Multimodal Graphs

arxiv url: http://arxiv.org/abs/2605.24684v1
Date: Sat, 23 May 2026 17:42:25 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-26 19:50:18.311725
Title: Beyond the Aggregation Dilemma: Prior-Retaining Decoupled Learning for Multimodal Graphs
Title（参考訳）: 集合ジレンマを超えて:マルチモーダルグラフのための事前保持型分離学習
Authors: Hao Yan, Xuanru Wang, Jun Yin, Shirui Pan, Senzhang Wang, Chengqi Zhang,
Abstract要約: MultimodalAttributed Graph Learning (MAGL)はグラフアグリゲーションを通じてノード属性と構造トポロジーを統合する。事前訓練されたエンコーダがLarge Foundation Models (LFM) へと進化するにつれて、MAGLのランドスケープは根本的に変化していく。高信頼のLFM先行の下では、強制集約は、識別シグナルを圧倒するトポロジカル固有のノイズを導入する。本稿では、分離されたデュアルパスパラダイムであるSUPRA(Shared-Unique Prior-Retaining Architecture)を提案する。 SUPRAは、トポロジ・アグノシクスによるモーダリティ特異的な特徴を処理し、軽量共有GNNを介して構造相乗効果を捉え、補助的な深層監視対策の勾配飢餓を発生させる。
参考スコア（独自算出の注目度）: 69.56407708794845
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Multimodal Attributed Graph Learning (MAGL) integrates intrinsic node attributes with structural topology via graph aggregation. However, as pretrained encoders evolve into Large Foundation Models (LFMs), the landscape of MAGL fundamentally shifts: under high-confidence LFM priors, mandatory aggregation introduces topological noise that overwhelms discriminative signals, triggering a counter-intuitive performance inversion where sophisticated MAGL architectures underperform simple topology-agnostic MLPs. Through systematic empirical and theoretical analysis, we identify that this inversion stems from a fundamental aggregation dilemma characterized by two concurrent pathologies: (1) Representational Pathology (SNR Degradation) - mandatory aggregation dilutes robust intrinsic features with topological noise, causing the noise penalty to outweigh its collaborative benefit; and (2) Optimization Pathology (Gradient Starvation) - topological aggregation attenuates gradient flow, while a shared task loss causes dominant modalities to prematurely suppress weaker ones. To resolve this dilemma, we propose SUPRA (Shared-Unique Prior-Retaining Architecture), a decoupled dual-pathway paradigm. SUPRA processes modality-specific features through topology-agnostic MLPs while capturing structural synergy via a lightweight shared GNN, with auxiliary deep supervision counteracting gradient starvation. Extensive evaluations demonstrate that SUPRA achieves state-of-the-art performance while requiring 3.5x lower peak GPU memory and up to 4.4x faster training time than Multimodal Graph Transformers.
Abstract（参考訳）: Multimodal Attributed Graph Learning (MAGL)は、固有のノード属性とグラフアグリゲーションによる構造的トポロジーを統合する。しかし、事前訓練されたエンコーダがLFM(Large Foundation Models)へと進化するにつれて、MAGLのランドスケープは根本的に変化していく: 高信頼のLFM事前の下で、強制集約は、識別シグナルを圧倒するトポロジカルノイズを導入し、洗練されたMAGLアーキテクチャが単純なトポロジに依存しないMPPを過小評価する反直感的な性能逆転を引き起こす。系統的な経験的および理論的分析により,この逆転は,(1)表象性障害(SNR劣化) - 強制的集約は,強直性内在性特徴を位相的雑音により希釈し,その協調的利益を上回り,(2)最適化的障害(グラディエント飢餓) - 局所的凝集は勾配流を減衰させ,一方,共有的タスク損失は早期に弱いノイズを抑制させる,という2つの同時的病態を特徴とする基本的集合ジレンマに由来することが判明した。このジレンマを解決するために、分離されたデュアルパスパラダイムであるSUPRA(Shared-Unique Prior-Retaining Architecture)を提案する。 SUPRAは、トポロジーに依存しないMDPを通して、軽量共有GNNを介して構造シナジーを捕捉し、補助的な深層監視対策の勾配飢餓を伴って、モダリティ特異的な特徴を処理している。大規模な評価では、SUPRAは最先端のパフォーマンスを実現し、最大3.5倍のピークGPUメモリと最大4.4倍のトレーニング時間を要した。

関連論文リスト

Signal-SGN++: Topology-Enhanced Time-Frequency Spiking Graph Network for Skeleton-Based Action Recognition [0.23332469289621785]
スパイキングニューラルネットワーク(SNN)はエネルギー効率を提供するが、人間の動きの時間的・時間的・位相的依存関係を捉えるには限界がある。本稿では、適応性と時間周波数スパイキングダイナミクスを統合するトポロジ対応スパイキンググラフフレームワークであるSignal-SGN++を提案する。
論文参考訳（メタデータ） (2025-12-22T09:16:04Z)
Scalable Quantum Walk-Based Heuristics for the Minimum Vertex Cover Problem [0.0]
連続時間量子ウォーク(CTQW)に基づく最小頂点被覆(MVC)問題に対する新しい量子アルゴリズムを提案する。この枠組みでは、グラフ上の量子ウォーカーのコヒーレントな伝播は、その構造特性を状態振幅に符号化する。我々は,CTQWに基づくアルゴリズムが優れた近似比を一貫して達成し,ネットワークトポロジに関して顕著な堅牢性を示すことを示す。
論文参考訳（メタデータ） (2025-12-02T17:04:57Z)
Decoupling and Damping: Structurally-Regularized Gradient Matching for Multimodal Graph Condensation [3.2987327415317895]
マルチモーダルグラフに適した新しい凝縮フレームワークSR-GMを提案する。 SR-GMは、ベースライン法と比較して精度を大幅に向上し、収束を加速する。本研究は,資源制約環境下でのマルチモーダルグラフに基づく学習のためのスケーラブルな方法論を提供する。
論文参考訳（メタデータ） (2025-11-25T11:50:34Z)
Moving Beyond Diffusion: Hierarchy-to-Hierarchy Autoregression for fMRI-to-Image Reconstruction [65.67001243986981]
我々は,スケールワイド自己回帰モデルに基づく粗大なfMRI画像再構成フレームワークであるMindHierを提案する。 MindHierは、拡散ベースのベースラインよりも優れたセマンティック忠実さ、4.67倍高速な推論、より決定論的結果を達成する。
論文参考訳（メタデータ） (2025-10-25T15:40:07Z)
Learning Efficient and Generalizable Graph Retriever for Knowledge-Graph Question Answering [75.12322966980003]
大規模言語モデル(LLM)は、様々な領域にわたって強い帰納的推論能力を示している。既存のRAGパイプラインのほとんどは非構造化テキストに依存しており、解釈可能性と構造化推論を制限する。近年,知識グラフ解答のための知識グラフとLLMの統合について検討している。 KGQAにおける効率的なグラフ検索のための新しいフレームワークであるRAPLを提案する。
論文参考訳（メタデータ） (2025-06-11T12:03:52Z)
Towards Anomaly-Aware Pre-Training and Fine-Tuning for Graph Anomaly Detection [59.042018542376596]
グラフ異常検出(GAD)は近年注目度が高まりつつあるが、2つの重要な要因があるため、依然として困難である。 Anomaly-Aware Pre-Training and Fine-Tuning (APF)は、GADの課題を軽減するためのフレームワークである。 10のベンチマークデータセットに関する総合的な実験は、最先端のベースラインと比較してAPFの優れたパフォーマンスを検証する。
論文参考訳（メタデータ） (2025-04-19T09:57:35Z)
Perturbation Ontology based Graph Attention Networks [26.95077612390953]
Ontology-based Graph Attention Networks (POGAT) は、オントロジーのサブグラフと高度な自己教師付き学習パラダイムを組み合わせて、深い文脈理解を実現する新しい方法論である。 POGATは最先端のベースラインを大幅に上回り、リンク予測のクリティカルタスクはF1スコアで10.78%、ノード分類のクリティカルタスクはMicro-F1で12.01%という画期的な改善を実現している。
論文参考訳（メタデータ） (2024-11-27T17:12:14Z)
DA-Flow: Dual Attention Normalizing Flow for Skeleton-based Video Anomaly Detection [52.74152717667157]
本稿では,DAM(Dual Attention Module)と呼ばれる軽量モジュールを提案する。フレームアテンション機構を使用して、最も重要なフレームを識別し、スケルトンアテンション機構を使用して、最小パラメータとフロップで固定されたパーティション間の広範な関係をキャプチャする。
論文参考訳（メタデータ） (2024-06-05T06:18:03Z)
GA-HQS: MRI reconstruction via a generically accelerated unfolding approach [14.988694941405575]
画素レベルでの入力の微妙な融合のための2階勾配情報とピラミッドアテンションモジュールを組み込んだGA-HQSアルゴリズムを提案する。本手法は, 単コイルMRI加速度タスクにおいて, 従来よりも優れている。
論文参考訳（メタデータ） (2023-04-06T06:21:18Z)
Counterfactual Intervention Feature Transfer for Visible-Infrared Person Re-identification [69.45543438974963]
視覚赤外人物再識別タスク(VI-ReID)におけるグラフベースの手法は,2つの問題により,悪い一般化に悩まされている。十分に訓練された入力特徴は、グラフトポロジーの学習を弱め、推論過程において十分に一般化されない。本稿では,これらの問題に対処するためのCIFT法を提案する。
論文参考訳（メタデータ） (2022-08-01T16:15:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。