論文の概要: From Token to Rhythm: A Multi-Scale Approach for ECG-Language Pretraining
- arxiv url: http://arxiv.org/abs/2506.21803v1
- Date: Wed, 11 Jun 2025 07:22:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-07 02:47:44.326095
- Title: From Token to Rhythm: A Multi-Scale Approach for ECG-Language Pretraining
- Title(参考訳): トークンからリズムへ:ECG-Language Pretrainingのためのマルチスケールアプローチ
- Authors: Fuying Wang, Jiacheng Xu, Lequan Yu,
- Abstract要約: 本稿では,マルチスケールECG-Language Pretraining(MELP)モデルを紹介する。
我々は、ゼロショットECG分類、線形探索、転送学習を含む、複数のタスクにわたる3つのパブリックECGデータセット上でMELPを評価する。
- 参考スコア(独自算出の注目度): 22.214252217020174
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Electrocardiograms (ECGs) play a vital role in monitoring cardiac health and diagnosing heart diseases. However, traditional deep learning approaches for ECG analysis rely heavily on large-scale manual annotations, which are both time-consuming and resource-intensive to obtain. To overcome this limitation, self-supervised learning (SSL) has emerged as a promising alternative, enabling the extraction of robust ECG representations that can be efficiently transferred to various downstream tasks. While previous studies have explored SSL for ECG pretraining and multi-modal ECG-language alignment, they often fail to capture the multi-scale nature of ECG signals. As a result, these methods struggle to learn generalized representations due to their inability to model the hierarchical structure of ECG data. To address this gap, we introduce MELP, a novel Multi-scale ECG-Language Pretraining (MELP) model that fully leverages hierarchical supervision from ECG-text pairs. MELP first pretrains a cardiology-specific language model to enhance its understanding of clinical text. It then applies three levels of cross-modal supervision-at the token, beat, and rhythm levels-to align ECG signals with textual reports, capturing structured information across different time scales. We evaluate MELP on three public ECG datasets across multiple tasks, including zero-shot ECG classification, linear probing, and transfer learning. Experimental results demonstrate that MELP outperforms existing SSL methods, underscoring its effectiveness and adaptability across diverse clinical applications. Our code is available at https://github.com/HKU-MedAI/MELP.
- Abstract(参考訳): 心電図(ECG)は、心臓の健康状態を監視し、心臓疾患を診断する上で重要な役割を担っている。
しかし、従来のECG分析のためのディープラーニングアプローチは、大規模な手動アノテーションに大きく依存している。
この制限を克服するために、セルフ教師付き学習(SSL)が有望な代替手段として登場し、様々な下流タスクに効率的に転送可能な堅牢なECG表現の抽出を可能にした。
以前の研究では、ECGプリトレーニングとマルチモーダルなECG言語アライメントのためのSSLを探索しているが、ECG信号のマルチスケールな性質を捉えることができないことが多い。
結果として、これらの手法は、ECGデータの階層構造をモデル化できないため、一般化された表現を学ぶのに苦労する。
このギャップに対処するために、我々は、ECG-textペアからの階層的監視を完全に活用する、新しいマルチスケールECG-Language Pretraining (MELP)モデルであるMELPを紹介する。
MELPは、まず、臨床テキストの理解を高めるために、心臓科固有の言語モデルを事前訓練する。
次に、トークン、ビート、リズムのレベルに3段階の相互監視を施し、ECG信号をテキストのレポートと整合させ、異なるタイムスケールで構造化された情報をキャプチャする。
我々は、ゼロショットECG分類、線形探索、転送学習を含む、複数のタスクにわたる3つのパブリックECGデータセット上でMELPを評価する。
実験の結果、MELPは既存のSSLメソッドよりも優れており、様々な臨床応用においてその有効性と適応性が評価されている。
私たちのコードはhttps://github.com/HKU-MedAI/MELPで利用可能です。
関連論文リスト
- Global and Local Contrastive Learning for Joint Representations from Cardiac MRI and ECG [40.407824759778784]
PTACL(Patient and Temporal Alignment Contrastive Learning)は、CMRからの時間情報を統合することで、ECG表現を強化するマルチモーダルコントラスト学習フレームワークである。
英国バイオバンクの被験者27,951名を対象に,ペア心電図-CMRデータを用いたPTACLの評価を行った。
心電図を用いた非侵襲的心臓診断におけるPTACLの有用性について検討した。
論文 参考訳(メタデータ) (2025-06-24T17:19:39Z) - Heartcare Suite: Multi-dimensional Understanding of ECG with Raw Multi-lead Signal Modeling [50.58126509704037]
医療スイート(Heartcare Suite)は、微細心電図(ECG)の理解のためのフレームワークである。
Heartcare-220Kは高品質で構造化され、包括的なマルチモーダルECGデータセットである。
Heartcare-Benchは、ECGシナリオにおける医療マルチモーダル大言語モデル(Med-MLLM)の最適化を導くためのベンチマークである。
論文 参考訳(メタデータ) (2025-06-06T07:56:41Z) - GEM: Empowering MLLM for Grounded ECG Understanding with Time Series and Images [43.65650710265957]
GEMは,第1回MLLM統合ECG時系列,第12回リードECG画像,地上および臨床のECG解釈のためのテキストである。
GEMは、3つのコアイノベーションを通じて機能的解析、エビデンス駆動推論、および臨床医のような診断プロセスを可能にする。
基礎心電図理解におけるMLLMの能力を評価するために,臨床動機付けのベンチマークであるグラウンドドECGタスクを提案する。
論文 参考訳(メタデータ) (2025-03-08T05:48:53Z) - Reading Your Heart: Learning ECG Words and Sentences via Pre-training ECG Language Model [25.131870247201636]
我々は心電図信号の新たな視点を導入し、心拍を単語として扱い、リズムを文として扱う。
次に、ECG言語処理のための新しい自己教師型学習フレームワークHeartLangを提案する。
これまでで最大の心拍ベースの心電図語彙を構築し、心電図言語処理の開発をさらに進める。
論文 参考訳(メタデータ) (2025-02-15T07:40:57Z) - ECG Semantic Integrator (ESI): A Foundation ECG Model Pretrained with LLM-Enhanced Cardiological Text [14.06147507373525]
本研究は,12誘導ECG信号の学習表現の品質とロバスト性の向上を目的とした,新しいマルチモーダルコントラスト保持フレームワークを提案する。
私たちのフレームワークは、Cardio Query Assistant(CQA)とECG Semantics Integrator(ESI)の2つの重要なコンポーネントで構成されています。
論文 参考訳(メタデータ) (2024-05-26T06:45:39Z) - MEIT: Multi-Modal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation [41.324530807795256]
心電図(Electrocardiogram、ECG)は、心臓の状態をモニタリングするための主要な非侵襲的診断ツールである。
最近の研究は心電図データを用いた心臓状態の分類に集中しているが、心電図レポートの生成は見落としている。
LLMとマルチモーダル命令を用いてECGレポート生成に取り組む最初の試みであるMultimodal ECG Instruction Tuning (MEIT) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-07T23:20:56Z) - ECG-SL: Electrocardiogram(ECG) Segment Learning, a deep learning method
for ECG signal [19.885905393439014]
本稿では,ECG信号の周期的性質をモデル化する新しいECG-Segment Based Learning (ECG-SL) フレームワークを提案する。
この構造的特徴に基づき, 時間的モデルを用いて, 各種臨床業務の時間的情報学習を行う。
提案手法はベースラインモデルより優れ,3つの臨床応用におけるタスク固有手法と比較して競争性能が向上する。
論文 参考訳(メタデータ) (2023-10-01T23:17:55Z) - ETP: Learning Transferable ECG Representations via ECG-Text Pre-training [10.856365645831728]
ECG-Text Pre-training (ETP)は、ECG信号とテキストレポートをリンクするクロスモーダル表現を学習するために設計された革新的なフレームワークである。
ETPはECGエンコーダと事前訓練された言語モデルを使用して、ECG信号を対応するテキストレポートと整合させる。
論文 参考訳(メタデータ) (2023-09-06T19:19:26Z) - PulseNet: Deep Learning ECG-signal classification using random
augmentation policy and continous wavelet transform for canines [46.09869227806991]
犬心電図(ECG)の評価には熟練した獣医が必要である。
心電図の解釈と診断支援のための獣医師の現在の利用状況は限られている。
犬の心電図配列を正常または異常と分類するためのディープ畳み込みニューラルネットワーク(CNN)アプローチを実装した。
論文 参考訳(メタデータ) (2023-05-17T09:06:39Z) - Frozen Language Model Helps ECG Zero-Shot Learning [12.974685769614062]
マルチモーダルECG-Text Self-supervised pre-training (METS)を提案する。
トレーニング可能なECGエンコーダと凍結言語モデルを用いて,ペアのECGを組込み,個別に自動で臨床報告を行う。
下流の分類タスクでは、METSは注釈付きデータを使わずに、約10%のパフォーマンス改善を実現している。
論文 参考訳(メタデータ) (2023-03-22T05:01:14Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - ECG-DelNet: Delineation of Ambulatory Electrocardiograms with Mixed
Quality Labeling Using Neural Networks [69.25956542388653]
ディープラーニング(DL)アルゴリズムは、学術的、産業的にも重くなっている。
セグメンテーションフレームワークにECGの検出とデライン化を組み込むことにより、低解釈タスクにDLをうまく適用できることを実証する。
このモデルは、PhyloNetのQTデータベースを使用して、105個の増幅ECG記録から訓練された。
論文 参考訳(メタデータ) (2020-05-11T16:29:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。