論文の概要: Structure-Aware Fusion with Progressive Injection for Multimodal Molecular Representation Learning
- arxiv url: http://arxiv.org/abs/2510.23640v1
- Date: Fri, 24 Oct 2025 17:27:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:36.308156
- Title: Structure-Aware Fusion with Progressive Injection for Multimodal Molecular Representation Learning
- Title(参考訳): 多モード分子表現学習のためのプログレッシブインジェクションによる構造認識融合
- Authors: Zihao Jing, Yan Sun, Yan Yi Li, Sugitha Janarthanan, Alana Deng, Pingzhao Hu,
- Abstract要約: マルチモーダル分子モデルは、しばしば3次元コンホメータの不信頼性とモダリティの崩壊に悩まされ、その堅牢性と一般化が制限される。
2つの主要な戦略を通じてこれらの課題に対処する構造化マルチモーダル融合フレームワークである MuMo を提案する。
状態空間のバックボーン上に構築されたMuMoは、長距離依存性モデリングと堅牢な情報伝達をサポートする。
- 参考スコア(独自算出の注目度): 5.909755629383169
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal molecular models often suffer from 3D conformer unreliability and modality collapse, limiting their robustness and generalization. We propose MuMo, a structured multimodal fusion framework that addresses these challenges in molecular representation through two key strategies. To reduce the instability of conformer-dependent fusion, we design a Structured Fusion Pipeline (SFP) that combines 2D topology and 3D geometry into a unified and stable structural prior. To mitigate modality collapse caused by naive fusion, we introduce a Progressive Injection (PI) mechanism that asymmetrically integrates this prior into the sequence stream, preserving modality-specific modeling while enabling cross-modal enrichment. Built on a state space backbone, MuMo supports long-range dependency modeling and robust information propagation. Across 29 benchmark tasks from Therapeutics Data Commons (TDC) and MoleculeNet, MuMo achieves an average improvement of 2.7% over the best-performing baseline on each task, ranking first on 22 of them, including a 27% improvement on the LD50 task. These results validate its robustness to 3D conformer noise and the effectiveness of multimodal fusion in molecular representation. The code is available at: github.com/selmiss/MuMo.
- Abstract(参考訳): マルチモーダル分子モデルは、しばしば3次元コンホメータの不信頼性とモダリティの崩壊に悩まされ、その堅牢性と一般化が制限される。
2つの重要な戦略を通じて分子表現におけるこれらの課題に対処する構造的マルチモーダル融合フレームワークである MuMo を提案する。
コンバータ依存核融合の不安定性を低減するため, 2次元トポロジーと3次元幾何学を結合した構造的融合パイプライン (SFP) を設計した。
非対称に前処理をシークエンスストリームに統合し、モダリティ特異的なモデリングを保ちながら、クロスモーダルエンリッチメントを実現させる、プログレッシブインジェクション(PI)機構を導入する。
状態空間のバックボーン上に構築されたMuMoは、長距離依存性モデリングと堅牢な情報伝達をサポートする。
Therapeutics Data Commons (TDC) と MoleculeNet の29のベンチマークタスクのうち、MuMo は各タスクにおける最高のパフォーマンスベースラインよりも平均2.7%向上し、LD50タスクの27%改善を含む22のタスクでランクインした。
これらの結果は3次元コンフォメータノイズに対するロバスト性および分子表現におけるマルチモーダル融合の有効性を検証した。
コードは、github.com/selmiss/MuMoで入手できる。
関連論文リスト
- FindRec: Stein-Guided Entropic Flow for Multi-Modal Sequential Recommendation [57.577843653775]
textbfFindRec (textbfFlexible unified textbfinformation textbfdisentanglement for multi-modal sequence textbfRecommendation)を提案する。
Stein kernel-based Integrated Information Coordination Module (IICM) は理論上、マルチモーダル特徴とIDストリーム間の分散一貫性を保証する。
マルチモーダル特徴を文脈的関連性に基づいて適応的にフィルタリング・結合するクロスモーダル・エキスパート・ルーティング機構。
論文 参考訳(メタデータ) (2025-07-07T04:09:45Z) - Improving Progressive Generation with Decomposable Flow Matching [50.63174319509629]
Decomposable Flow Matching (DFM)は、ビジュアルメディアのプログレッシブな生成のためのシンプルで効果的なフレームワークである。
Imagenet-1k 512pxでは、DFMはベースアーキテクチャよりも35.2%改善され、ベースラインは26.4%向上した。
論文 参考訳(メタデータ) (2025-06-24T17:58:02Z) - RMMSS: Towards Advanced Robust Multi-Modal Semantic Segmentation with Hybrid Prototype Distillation and Feature Selection [9.418241223504252]
RMMSSは、モダリティの欠如した条件下でモデルロバスト性を高めるために設計された2段階のフレームワークである。
これは2つの重要なコンポーネントで構成されている。ハイブリッドプロトタイプ蒸留モジュール (HPDM) と特徴選択モジュール (FSM) である。
3つのデータセットに対する実験により,本手法は,それぞれ2.80%,3.89%,0.89%のモダリティ性能を向上することを示した。
論文 参考訳(メタデータ) (2025-05-19T08:46:03Z) - Towards Unified and Lossless Latent Space for 3D Molecular Latent Diffusion Modeling [90.23688195918432]
3次元分子生成は、薬物発見と物質科学に不可欠である。
既存のアプローチは、典型的には不変かつ同変なモジュラリティに対して別々のラテント空間を保持する。
我々は,3次元分子を潜在空間から潜在配列に圧縮するマルチモーダルVAEである textbfUAE-3D を提案する。
論文 参考訳(メタデータ) (2025-03-19T08:56:13Z) - Coupled Mamba: Enhanced Multi-modal Fusion with Coupled State Space Model [18.19558762805031]
本稿では,複数モードの状態チェーンを結合し,モード内状態プロセスの独立性を維持した結合型SSMモデルを提案する。
CMU-EI,CH-SIMS,CH-SIMSV2のマルチドメイン入力による実験により,本モデルの有効性が検証された。
その結果, 結合マンバモデルではマルチモーダル核融合が可能であることがわかった。
論文 参考訳(メタデータ) (2024-05-28T09:57:03Z) - MolCRAFT: Structure-Based Drug Design in Continuous Parameter Space [31.53831043892904]
MolCRAFTは連続パラメータ空間で作動する最初の構造に基づく医薬品設計モデルである。
より安定な3次元構造との結合親和性において、一貫して優れた性能を達成する。
論文 参考訳(メタデータ) (2024-04-18T12:43:39Z) - Bi-Bimodal Modality Fusion for Correlation-Controlled Multimodal
Sentiment Analysis [96.46952672172021]
Bi-Bimodal Fusion Network (BBFN) は、2対のモダリティ表現で融合を行う新しいエンドツーエンドネットワークである。
モデルは、モダリティ間の既知の情報不均衡により、2つのバイモーダルペアを入力として取る。
論文 参考訳(メタデータ) (2021-07-28T23:33:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。