論文の概要: From Token to Rhythm: A Multi-Scale Approach for ECG-Language Pretraining
- arxiv url: http://arxiv.org/abs/2506.21803v1
- Date: Wed, 11 Jun 2025 07:22:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-07 02:47:44.326095
- Title: From Token to Rhythm: A Multi-Scale Approach for ECG-Language Pretraining
- Title(参考訳): トークンからリズムへ:ECG-Language Pretrainingのためのマルチスケールアプローチ
- Authors: Fuying Wang, Jiacheng Xu, Lequan Yu,
- Abstract要約: 本稿では,マルチスケールECG-Language Pretraining(MELP)モデルを紹介する。
我々は、ゼロショットECG分類、線形探索、転送学習を含む、複数のタスクにわたる3つのパブリックECGデータセット上でMELPを評価する。
- 参考スコア(独自算出の注目度): 22.214252217020174
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Electrocardiograms (ECGs) play a vital role in monitoring cardiac health and diagnosing heart diseases. However, traditional deep learning approaches for ECG analysis rely heavily on large-scale manual annotations, which are both time-consuming and resource-intensive to obtain. To overcome this limitation, self-supervised learning (SSL) has emerged as a promising alternative, enabling the extraction of robust ECG representations that can be efficiently transferred to various downstream tasks. While previous studies have explored SSL for ECG pretraining and multi-modal ECG-language alignment, they often fail to capture the multi-scale nature of ECG signals. As a result, these methods struggle to learn generalized representations due to their inability to model the hierarchical structure of ECG data. To address this gap, we introduce MELP, a novel Multi-scale ECG-Language Pretraining (MELP) model that fully leverages hierarchical supervision from ECG-text pairs. MELP first pretrains a cardiology-specific language model to enhance its understanding of clinical text. It then applies three levels of cross-modal supervision-at the token, beat, and rhythm levels-to align ECG signals with textual reports, capturing structured information across different time scales. We evaluate MELP on three public ECG datasets across multiple tasks, including zero-shot ECG classification, linear probing, and transfer learning. Experimental results demonstrate that MELP outperforms existing SSL methods, underscoring its effectiveness and adaptability across diverse clinical applications. Our code is available at https://github.com/HKU-MedAI/MELP.
- Abstract(参考訳): 心電図(ECG)は、心臓の健康状態を監視し、心臓疾患を診断する上で重要な役割を担っている。
しかし、従来のECG分析のためのディープラーニングアプローチは、大規模な手動アノテーションに大きく依存している。
この制限を克服するために、セルフ教師付き学習(SSL)が有望な代替手段として登場し、様々な下流タスクに効率的に転送可能な堅牢なECG表現の抽出を可能にした。
以前の研究では、ECGプリトレーニングとマルチモーダルなECG言語アライメントのためのSSLを探索しているが、ECG信号のマルチスケールな性質を捉えることができないことが多い。
結果として、これらの手法は、ECGデータの階層構造をモデル化できないため、一般化された表現を学ぶのに苦労する。
このギャップに対処するために、我々は、ECG-textペアからの階層的監視を完全に活用する、新しいマルチスケールECG-Language Pretraining (MELP)モデルであるMELPを紹介する。
MELPは、まず、臨床テキストの理解を高めるために、心臓科固有の言語モデルを事前訓練する。
次に、トークン、ビート、リズムのレベルに3段階の相互監視を施し、ECG信号をテキストのレポートと整合させ、異なるタイムスケールで構造化された情報をキャプチャする。
我々は、ゼロショットECG分類、線形探索、転送学習を含む、複数のタスクにわたる3つのパブリックECGデータセット上でMELPを評価する。
実験の結果、MELPは既存のSSLメソッドよりも優れており、様々な臨床応用においてその有効性と適応性が評価されている。
私たちのコードはhttps://github.com/HKU-MedAI/MELPで利用可能です。
関連論文リスト
- Heartcare Suite: Multi-dimensional Understanding of ECG with Raw Multi-lead Signal Modeling [50.58126509704037]
医療スイート(Heartcare Suite)は、微細心電図(ECG)の理解のためのフレームワークである。
Heartcare-220Kは高品質で構造化され、包括的なマルチモーダルECGデータセットである。
Heartcare-Benchは、ECGシナリオにおける医療マルチモーダル大言語モデル(Med-MLLM)の最適化を導くためのベンチマークである。
論文 参考訳(メタデータ) (2025-06-06T07:56:41Z) - GEM: Empowering MLLM for Grounded ECG Understanding with Time Series and Images [43.65650710265957]
GEMは,第1回MLLM統合ECG時系列,第12回リードECG画像,地上および臨床のECG解釈のためのテキストである。
GEMは、3つのコアイノベーションを通じて機能的解析、エビデンス駆動推論、および臨床医のような診断プロセスを可能にする。
基礎心電図理解におけるMLLMの能力を評価するために,臨床動機付けのベンチマークであるグラウンドドECGタスクを提案する。
論文 参考訳(メタデータ) (2025-03-08T05:48:53Z) - ECG Semantic Integrator (ESI): A Foundation ECG Model Pretrained with LLM-Enhanced Cardiological Text [14.06147507373525]
本研究は,12誘導ECG信号の学習表現の品質とロバスト性の向上を目的とした,新しいマルチモーダルコントラスト保持フレームワークを提案する。
私たちのフレームワークは、Cardio Query Assistant(CQA)とECG Semantics Integrator(ESI)の2つの重要なコンポーネントで構成されています。
論文 参考訳(メタデータ) (2024-05-26T06:45:39Z) - MEIT: Multi-Modal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation [41.324530807795256]
心電図(Electrocardiogram、ECG)は、心臓の状態をモニタリングするための主要な非侵襲的診断ツールである。
最近の研究は心電図データを用いた心臓状態の分類に集中しているが、心電図レポートの生成は見落としている。
LLMとマルチモーダル命令を用いてECGレポート生成に取り組む最初の試みであるMultimodal ECG Instruction Tuning (MEIT) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-07T23:20:56Z) - ECG-SL: Electrocardiogram(ECG) Segment Learning, a deep learning method
for ECG signal [19.885905393439014]
本稿では,ECG信号の周期的性質をモデル化する新しいECG-Segment Based Learning (ECG-SL) フレームワークを提案する。
この構造的特徴に基づき, 時間的モデルを用いて, 各種臨床業務の時間的情報学習を行う。
提案手法はベースラインモデルより優れ,3つの臨床応用におけるタスク固有手法と比較して競争性能が向上する。
論文 参考訳(メタデータ) (2023-10-01T23:17:55Z) - Frozen Language Model Helps ECG Zero-Shot Learning [12.974685769614062]
マルチモーダルECG-Text Self-supervised pre-training (METS)を提案する。
トレーニング可能なECGエンコーダと凍結言語モデルを用いて,ペアのECGを組込み,個別に自動で臨床報告を行う。
下流の分類タスクでは、METSは注釈付きデータを使わずに、約10%のパフォーマンス改善を実現している。
論文 参考訳(メタデータ) (2023-03-22T05:01:14Z) - ECG-DelNet: Delineation of Ambulatory Electrocardiograms with Mixed
Quality Labeling Using Neural Networks [69.25956542388653]
ディープラーニング(DL)アルゴリズムは、学術的、産業的にも重くなっている。
セグメンテーションフレームワークにECGの検出とデライン化を組み込むことにより、低解釈タスクにDLをうまく適用できることを実証する。
このモデルは、PhyloNetのQTデータベースを使用して、105個の増幅ECG記録から訓練された。
論文 参考訳(メタデータ) (2020-05-11T16:29:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。