論文の概要: MedM2T: A MultiModal Framework for Time-Aware Modeling with Electronic Health Record and Electrocardiogram Data
- arxiv url: http://arxiv.org/abs/2510.27321v1
- Date: Fri, 31 Oct 2025 09:47:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-03 17:52:16.055017
- Title: MedM2T: A MultiModal Framework for Time-Aware Modeling with Electronic Health Record and Electrocardiogram Data
- Title(参考訳): MedM2T:電子健康記録と心電図データを用いた時間認識モデリングのためのマルチモーダルフレームワーク
- Authors: Yu-Chen Kuo, Yi-Ju Tseng,
- Abstract要約: MedM2Tは、医療データモデリングの課題に対処するために設計された、タイムアウェアなマルチモーダルフレームワークである。
MedM2TをMIMIC-IVおよびMIMIC-IV-ECGデータセット上で評価した。
これらの結果は、MedM2Tの堅牢性と広範囲な適用性を強調し、臨床予測において有望なツールとして位置づけている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The inherent multimodality and heterogeneous temporal structures of medical data pose significant challenges for modeling. We propose MedM2T, a time-aware multimodal framework designed to address these complexities. MedM2T integrates: (i) Sparse Time Series Encoder to flexibly handle irregular and sparse time series, (ii) Hierarchical Time-Aware Fusion to capture both micro- and macro-temporal patterns from multiple dense time series, such as ECGs, and (iii) Bi-Modal Attention to extract cross-modal interactions, which can be extended to any number of modalities. To mitigate granularity gaps between modalities, MedM2T uses modality-specific pre-trained encoders and aligns resulting features within a shared encoder. We evaluated MedM2T on MIMIC-IV and MIMIC-IV-ECG datasets for three tasks that encompass chronic and acute disease dynamics: 90-day cardiovascular disease (CVD) prediction, in-hospital mortality prediction, and ICU length-of-stay (LOS) regression. MedM2T outperformed state-of-the-art multimodal learning frameworks and existing time series models, achieving an AUROC of 0.947 and an AUPRC of 0.706 for CVD prediction; an AUROC of 0.901 and an AUPRC of 0.558 for mortality prediction; and Mean Absolute Error (MAE) of 2.31 for LOS regression. These results highlight the robustness and broad applicability of MedM2T, positioning it as a promising tool in clinical prediction. We provide the implementation of MedM2T at https://github.com/DHLab-TSENG/MedM2T.
- Abstract(参考訳): 医用データの固有多モード性と異種時間構造は、モデリングに重大な課題を生じさせる。
MedM2Tは、これらの複雑さに対処するために設計された、タイムアウェアなマルチモーダルフレームワークである。
MedM2T の統合
(i)不規則でスパースな時系列を柔軟に扱うスパース時系列エンコーダ
(II)心電図などの複数の高密度時系列から微小・マクロ時間パターンを捕捉する階層的時間認識融合
三 相互モーダルな相互作用を抽出するためのバイモーダルな注意を、任意の数のモーダルに拡張することができる。
モダリティ間の粒度のギャップを軽減するため、MedM2Tはモダリティ固有の事前訓練エンコーダを使用し、結果として得られる特徴を共有エンコーダ内で調整する。
MedM2TをMIMIC-IVおよびMIMIC-IV-ECGデータセットで評価し,慢性および急性疾患の3つの課題について検討した。
MedM2Tは最先端のマルチモーダル学習フレームワークと既存の時系列モデルより優れており、AUROCは0.947、AUPRCは0.706、AUROCは0.901、AUPRCは0.558、Mean Absolute Error(MAE)は2.31である。
これらの結果は、MedM2Tの堅牢性と広範囲な適用性を強調し、臨床予測において有望なツールとして位置づけている。
We provide the implementation of MedM2T at https://github.com/DHLab-TSENG/MedM2T。
関連論文リスト
- Multimodal Disease Progression Modeling via Spatiotemporal Disentanglement and Multiscale Alignment [16.824692012617334]
$textttDiPro$は、リージョン対応のアンタングルメントとマルチタイムアライメントによる課題に対処する新しいフレームワークである。
MIMICデータセットの実験では、$textttDiPro$が時間的臨床的ダイナミクスを効果的に抽出できることが示されている。
論文 参考訳(メタデータ) (2025-10-13T08:02:36Z) - Multimodal Health Risk Prediction System for Chronic Diseases via Vision-Language Fusion and Large Language Models [6.169451756799087]
個人の健康リスクを積極的に予測できる統合マルチモーダルAIフレームワークは、緊急に必要である。
VL-RiskFormerは,言語モデル (LLM) の推論ヘッドを最上層に埋め込んだ階層型階層型視覚言語マルチモーダルトランスである。
論文 参考訳(メタデータ) (2025-09-22T05:26:59Z) - MedSeqFT: Sequential Fine-tuning Foundation Models for 3D Medical Image Segmentation [55.37355146924576]
MedSeqFTは、医用画像解析のためのシーケンシャルな微調整フレームワークである。
事前訓練されたモデルを新しいタスクに適応させ、表現能力を改善する。
最先端の微調整戦略を一貫して上回ります。
論文 参考訳(メタデータ) (2025-09-07T15:22:53Z) - MedNet-PVS: A MedNeXt-Based Deep Learning Model for Automated Segmentation of Perivascular Spaces [7.639673588124668]
脳小血管疾患、アルツハイマー病、脳卒中、老化関連神経変性のバイオマーカーとして認識されている。
我々は、トランスフォーマーにインスパイアされた3Dエンコーダ・デコーダ畳み込みネットワークであるMedNeXt-L-k5を自動PSVセグメンテーションに適用した。
論文 参考訳(メタデータ) (2025-08-27T20:24:12Z) - impuTMAE: Multi-modal Transformer with Masked Pre-training for Missing Modalities Imputation in Cancer Survival Prediction [75.43342771863837]
我々は,効率的なマルチモーダル事前学習戦略を備えた新しいトランスフォーマーに基づくエンドツーエンドアプローチである impuTMAE を紹介する。
マスクされたパッチを再構築することで、モダリティの欠如を同時に示唆しながら、モダリティ間の相互作用とモダリティ内相互作用を学習する。
本モデルは,TGA-GBM/LGGとBraTSデータセットを用いたグリオーマ生存予測のために,異種不完全データに基づいて事前訓練を行った。
論文 参考訳(メタデータ) (2025-08-08T10:01:16Z) - Explainable Spatio-Temporal GCNNs for Irregular Multivariate Time Series: Architecture and Application to ICU Patient Data [7.433698348783128]
XST-CNN(eXG-Temporal Graph Conal Neural Network)は、不均一で不規則なマルチ時系列(MTS)データを処理するための新しいアーキテクチャである。
提案手法は,GCNNパイプラインを利用して時間的・時間的統合パイプライン内での時間的特徴を捉える。
ICU患者のマルチドラッグ抵抗(MDR)を予測するために,実世界の電子健康記録データを用いてXST-CNNを評価した。
論文 参考訳(メタデータ) (2024-11-01T22:53:17Z) - CTPD: Cross-Modal Temporal Pattern Discovery for Enhanced Multimodal Electronic Health Records Analysis [46.56667527672019]
マルチモーダルEHRデータから有意な時間的パターンを効率的に抽出するために,CTPD(Cross-Modal Temporal Pattern Discovery)フレームワークを導入する。
提案手法では,時間的セマンティックな埋め込みを生成するためにスロットアテンションを用いて改良された時間的パターン表現を提案する。
論文 参考訳(メタデータ) (2024-11-01T15:54:07Z) - PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文 参考訳(メタデータ) (2024-09-08T15:02:25Z) - Comprehensive Multimodal Deep Learning Survival Prediction Enabled by a Transformer Architecture: A Multicenter Study in Glioblastoma [4.578027879885667]
本研究は,変圧器を用いた深層学習モデルにMR画像,臨床および分子病理学的データを統合することにより,グリオーマの生存率予測を改善することを目的とする。
このモデルは、自己教師付き学習技術を用いて、高次元MRI入力を効果的に符号化し、クロスアテンションを用いた非画像データと統合する。
論文 参考訳(メタデータ) (2024-05-21T17:44:48Z) - M2Net: Multi-modal Multi-channel Network for Overall Survival Time
Prediction of Brain Tumor Patients [151.4352001822956]
生存時間(OS)の早期かつ正確な予測は、脳腫瘍患者に対するより良い治療計画を得るのに役立つ。
既存の予測手法は、磁気共鳴(MR)ボリュームの局所的な病変領域における放射能特性に依存している。
我々は,マルチモーダルマルチチャネルネットワーク(M2Net)のエンドツーエンドOS時間予測モデルを提案する。
論文 参考訳(メタデータ) (2020-06-01T05:21:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。