論文の概要: Information-theoretic Multimodal Representation Learning for Electrocardiogram Signals
- arxiv url: http://arxiv.org/abs/2605.27583v1
- Date: Tue, 26 May 2026 18:52:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.468308
- Title: Information-theoretic Multimodal Representation Learning for Electrocardiogram Signals
- Title(参考訳): 心電図信号に対する情報理論的マルチモーダル表現学習
- Authors: Phu X. Nguyen, Konstantinos Kontras, Wei Dai, Huy Phan, Christos Chatzichristos, Paul Pu Liang, Bert Vandenberk, Maarten De Vos,
- Abstract要約: 心電図(ECG)は、心臓活動の非侵襲的測定として広く用いられ、臨床診断において中心的な役割を果たす。
近年,心電図の信号と診断的意味論を取り入れた臨床報告とが一致しているが,臨床報告は心電図波形の豊富な生理的構造を保たないことが多い。
我々は、情報理論の観点からECG表現学習を定式化し、信号構造を共同で保存し、臨床的意味論を統合する、抽出可能な目的を導出する。
- 参考スコア(独自算出の注目度): 34.28801923123035
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electrocardiograms (ECGs) are widely used non-invasive measurements of cardiac activity and play a central role in clinical diagnosis. Recent multimodal approaches align ECG signals with clinical reports to incorporate diagnostic semantics, but clinical reports often fail to preserve the rich physiological structure of ECG waveforms, particularly across multiple levels of abstraction ranging from coarse diagnostic categories to fine-grained morphology. To address this limitation, we formulate ECG representation learning from an information-theoretic perspective and derive a tractable objective that jointly preserves signal structure and integrates clinical semantics. Based on this principle, we propose \textbf{MERIT} (Multimodal ECG Representation via Information Theory), a dual-branch pretraining framework combining masked ECG modeling with ECG--text contrastive alignment. Extensive experiments on PTB-XL and additional benchmarks demonstrate consistent improvements over prior methods, including gains exceeding $3%$ F1 on PTB-XL All and $5%$ F1 on SubClass classification. In zero-shot evaluation, MERIT further improves performance by up to $ +2.66\%$ AUC and $ +2.11\%$ F1 on PTB-XL SubClass, while also demonstrating robustness under multiple distribution-shift settings. Moreover, leveraging the learned ECG representations for ECG-conditioned clinical text generation with large language models improves text quality across several metrics, including ROUGE and METEOR. Together, these results demonstrate that MERIT learns more informative and clinically meaningful ECG representations, particularly for fine-grained clinical applications.
- Abstract(参考訳): 心電図(ECG)は、心臓活動の非侵襲的測定として広く用いられ、臨床診断において中心的な役割を果たす。
近年のマルチモーダルアプローチは、心電図信号と臨床報告を結びつけて診断意味論を取り入れているが、臨床報告は心電図波形の豊富な生理的構造を保たないことが多い。
この制限に対処するため、情報理論の観点からECG表現学習を定式化し、信号構造を共同で保存し、臨床的意味論を統合するための抽出可能な目的を導出する。
この原理に基づいて、マスク付きECGモデリングとECGテキストコントラストアライメントを組み合わせた二重分岐事前学習フレームワークである「textbf{MERIT} (Multimodal ECG Representation via Information Theory)」を提案する。
PTB-XLおよび追加ベンチマークに関する大規模な実験では、PTB-XLで3%ドルF1以上、SubClass分類で5%ドルF1以上のゲインを含む、以前の手法よりも一貫した改善が示されている。
ゼロショット評価では、MERITは最大$ +2.66\%$ AUC と$ +2.11\%$ F1 を PTB-XL SubClass で改善し、また複数の分散シフト設定で堅牢性を示す。
さらに、学習したECG表現を、大きな言語モデルによるECG条件の臨床テキスト生成に活用することにより、ROUGEやMETEORなど、複数のメトリクスにわたるテキスト品質が改善される。
これらの結果から、MERITはより情報的かつ臨床的に意味のある心電図表現を学習し、特に微細な臨床応用に役立てることが示されている。
関連論文リスト
- Echo2ECG: Enhancing ECG Representations with Cardiac Morphology from Multi-View Echos [53.368813255127115]
既存の自己教師型手法は、ECGをシングルビューエコーに整列させることで、表現ミスマッチに悩まされる。
本稿では,心電図表現を多視点エコーで捉えることで,心電図表現を充実させるマルチモーダル自己教師型学習フレームワークであるEcho2ECGを提案する。
臨床的に関係のある2つの課題に対して,Echo2ECGをECG特徴抽出器として評価した。
論文 参考訳(メタデータ) (2026-03-09T15:39:57Z) - Simulator and Experience Enhanced Diffusion Model for Comprehensive ECG Generation [52.19347532840774]
本稿では,心電図生成のための新しい生理シミュレータSE-Diffを提案する。
SE-Diffは、軽量常微分方程式(ODE)ベースのECGシミュレータをビートデコーダを介して拡散過程に統合する。
実世界のECGデータセットに対する大規模な実験により、SE-Diffは信号の忠実度とテキスト-ECGセマンティックアライメントの両方を改善している。
論文 参考訳(メタデータ) (2025-11-13T02:57:10Z) - From Token to Rhythm: A Multi-Scale Approach for ECG-Language Pretraining [22.214252217020174]
本稿では,マルチスケールECG-Language Pretraining(MELP)モデルを紹介する。
我々は、ゼロショットECG分類、線形探索、転送学習を含む、複数のタスクにわたる3つのパブリックECGデータセット上でMELPを評価する。
論文 参考訳(メタデータ) (2025-06-11T07:22:17Z) - Heartcare Suite: Multi-dimensional Understanding of ECG with Raw Multi-lead Signal Modeling [50.58126509704037]
医療スイート(Heartcare Suite)は、微細心電図(ECG)の理解のためのフレームワークである。
Heartcare-220Kは高品質で構造化され、包括的なマルチモーダルECGデータセットである。
Heartcare-Benchは、ECGシナリオにおける医療マルチモーダル大言語モデル(Med-MLLM)の最適化を導くためのベンチマークである。
論文 参考訳(メタデータ) (2025-06-06T07:56:41Z) - MEIT: Multimodal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation [28.35107188450758]
心電図(Electrocardiogram、ECG)は、心臓の状態をモニタリングするための主要な非侵襲的診断ツールである。
最近の研究は心電図データを用いた心臓状態の分類に集中しているが、心電図レポートの生成は見落としている。
LLMとマルチモーダル命令を用いてECGレポート生成に取り組む最初の試みであるMultimodal ECG Instruction Tuning (MEIT) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-07T23:20:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。