論文の概要: LongMoE: Longitudinal Multimodal Learning via Trajectory-Aware Mixture-of-Experts
- arxiv url: http://arxiv.org/abs/2606.09907v1
- Date: Sat, 06 Jun 2026 07:50:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.035624
- Title: LongMoE: Longitudinal Multimodal Learning via Trajectory-Aware Mixture-of-Experts
- Title(参考訳): LongMoE: トラジェクトリ・アウェア・ミックス・オブ・エキスパートによる縦型マルチモーダル学習
- Authors: Maxx Richard Rahman, Prakhar Kumar, Wolfgang Maass,
- Abstract要約: マルチモーダルな臨床学習は、画像、テキスト、パーソナライズされた健康記録を含む多様な患者データを統合するためにますます重要になっている。
モダリティの欠如(モダリティの任意の部分集合が患者訪問時に利用できない)、縦方向のダイナミクス(観察の診断上の意義は患者の進行する疾患の軌跡に依存する)の2つの根本的な課題に直面する。
両課題に共同で対処するための統合フレームワークであるLongMoE(Longitudinal Mixture-of-Experts)を提案する。
- 参考スコア(独自算出の注目度): 2.537429062537451
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal clinical learning is increasingly important for integrating diverse patient data, including imaging, text, and personalised health records. However, it faces two fundamental challenges: i) modality missingness, where arbitrary subsets of modalities are unavailable at a given patient visit, ii) longitudinal dynamics, where the diagnostic significance of an observation depends on the patient's evolving disease trajectory over time. Existing methods address these challenges in isolation: missing-modality frameworks treat each visit as an independent static snapshot and discard temporal context, while longitudinal models often assume complete modality availability and degrade under systematic modality incompleteness. We propose LongMoE (Longitudinal Mixture-of-Experts), the unified framework to jointly address both challenges. LongMoE combines a context-aware imputation module with an attentional tokenization module that captures frequency-domain temporal patterns across irregular visit sequences, a trajectory-aware encoder for modeling disease progression, and context-conditioned Sparse MoE routing for patient-specific expert selection. Experiments on ADNI, OASIS-3, and MIMIC-IV show that LongMoE improves robustness under missing or weak contemporaneous modalities and remains competitive in full-modality settings, establishing a strong foundation for longitudinally-aware multimodal clinical learning.
- Abstract(参考訳): マルチモーダルな臨床学習は、画像、テキスト、パーソナライズされた健康記録を含む多様な患者データを統合するためにますます重要になっている。
しかし、それは2つの根本的な課題に直面している。
一 特定の患者訪問において、任意のモダリティのサブセットが使用できないモダリティの欠如
二 観察の診断上の意義が経過とともに進行する疾患の軌跡に依存する縦波力学
既存のメソッドは、これらの課題に分離して対処する: 欠落したモダリティフレームワークは、各訪問を独立した静的スナップショットとして扱い、時間的コンテキストを捨てる。
両課題に共同で対処するための統合フレームワークであるLongMoE(Longitudinal Mixture-of-Experts)を提案する。
LongMoEは、コンテキスト対応インプットモジュールと、不規則な訪問シーケンスにわたる周波数領域の時間パターンをキャプチャする注意トークン化モジュールと、疾患の進行をモデル化するための軌跡対応エンコーダと、患者固有の専門家選択のためのコンテキスト条件付きスパースMoEルーティングを組み合わせる。
ADNI, OASIS-3, MIMIC-IVを用いた実験では,LongMoEは同時性の欠如や弱さの下で頑健さを向上し, 完全なモダリティ環境での競争力を維持し, 縦断的マルチモーダル臨床学習の強力な基盤を確立している。
関連論文リスト
- MedMamba: Multi-View State Space Models with Adaptive Graph Learning for Medical Time Series Classification [60.41879345743941]
状態空間モデルとドメイン固有の帰納バイアスを統合するエンドツーエンドアーキテクチャであるMedMambaを提案する。
MedMambaは線形計算複雑性を維持しながら最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-05-24T09:23:39Z) - Handling and Interpreting Missing Modalities in Patient Clinical Trajectories via Autoregressive Sequence Modeling [24.896312231457653]
我々は、安全で透明な臨床AIの標準的デシプラタムに対処しながら、欠落したモダリティをプロファイルし、対処するためのフレームワークを開発する。
変換器ベースアーキテクチャを用いた自己回帰シーケンスモデリングはMIMIC-IVおよびeICUファインチューニングベンチマークのベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2026-04-20T18:55:56Z) - Learning Patient-Specific Disease Dynamics with Latent Flow Matching for Longitudinal Imaging Generation [17.33607122354623]
疾患の進行を理解することは、早期診断とパーソナライズされた治療に影響を及ぼす中心的な臨床課題である。
本稿では,この病気の動態を速度場として扱い,フローマッチング(FM)を活用して患者の時間的変化を一致させることを提案する。
患者固有の潜伏進行をフローマッチングでモデル化するためのフレームワークである$-LFMを提示する。
論文 参考訳(メタデータ) (2025-12-09T23:13:54Z) - TARDis: Time Attenuated Representation Disentanglement for Incomplete Multi-Modal Tumor Segmentation and Classification [10.329406702659123]
造影CT(Contrat-enhanced Computed Tomography)における腫瘍の分画と診断は,造影剤の生理的動態に大きく依存している。
既存のディープラーニングアプローチは、欠落した相を欠落した独立したチャネルとして扱い、血行動態の本質的な時間的連続性を無視している。
本稿では,連続時間短縮曲線の欠落点として欠落点を再定義する新しい物理認識フレームワークであるTime Attenuated Representation Disentanglement (TARDis)を提案する。
論文 参考訳(メタデータ) (2025-12-04T08:44:50Z) - MIRROR: Multi-Modal Pathological Self-Supervised Representation Learning via Modality Alignment and Retention [57.044719143401664]
病理組織学と転写学は、腫瘍学の基本的なモダリティであり、疾患の形態学的および分子的側面を包含している。
モーダルアライメントと保持を両立させる新しいマルチモーダル表現学習法であるMIRRORを提案する。
がんの亜型化と生存分析のためのTCGAコホートに関する広範囲な評価は,MIRRORの優れた性能を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-03-01T07:02:30Z) - HC-LLM: Historical-Constrained Large Language Models for Radiology Report Generation [89.3260120072177]
本稿では,放射線学レポート生成のための歴史制約付き大規模言語モデル (HC-LLM) フレームワークを提案する。
胸部X線写真から経時的特徴と経時的特徴を抽出し,疾患の進行を捉える診断報告を行った。
特に,本手法は,テスト中の履歴データなしでも良好に動作し,他のマルチモーダル大規模モデルにも容易に適用可能である。
論文 参考訳(メタデータ) (2024-12-15T06:04:16Z) - CTPD: Cross-Modal Temporal Pattern Discovery for Enhanced Multimodal Electronic Health Records Analysis [50.56875995511431]
マルチモーダルEHRデータから有意な時間的パターンを効率的に抽出するために,CTPD(Cross-Modal Temporal Pattern Discovery)フレームワークを導入する。
提案手法では,時間的セマンティックな埋め込みを生成するためにスロットアテンションを用いて改良された時間的パターン表現を提案する。
論文 参考訳(メタデータ) (2024-11-01T15:54:07Z) - Global Contrastive Training for Multimodal Electronic Health Records with Language Supervision [1.6245786035158123]
本稿では,医療時系列と臨床ノートに着目した,新しいマルチモーダルコントラスト学習フレームワークを提案する。
このフレームワークは、時間的クロスアテンション変換器と動的埋め込みおよびトークン化スキームを統合し、マルチモーダルな特徴表現を学習する。
実世界のERHデータセットを用いて実験したところ, 術後合併症9例の発症予測において, 我々のフレームワークは最先端のアプローチよりも優れていた。
論文 参考訳(メタデータ) (2024-04-10T04:19:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。