論文の概要: Learning ECG Image Representations via Dual Physiological-Aware Alignments
- arxiv url: http://arxiv.org/abs/2604.01526v1
- Date: Thu, 02 Apr 2026 01:52:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.188648
- Title: Learning ECG Image Representations via Dual Physiological-Aware Alignments
- Title(参考訳): デュアル生理的アライメントによる心電図画像表現の学習
- Authors: Hung Manh Pham, Jialu Tang, Aaqib Saeed, Dong Ma, Bin Zhu, Pan Zhou,
- Abstract要約: 心電図(ECGs)は、心血管疾患の診断ツールとして最も広く用いられている。
既存のECG分析手法の多くは生信号記録へのアクセスに依存している。
本稿では,心電図画像から臨床一般化表現を学習するための自己教師型フレームワークECG-Scanを提案する。
- 参考スコア(独自算出の注目度): 33.03253601947226
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Electrocardiograms (ECGs) are among the most widely used diagnostic tools for cardiovascular diseases, and a large amount of ECG data worldwide appears only in image form. However, most existing automated ECG analysis methods rely on access to raw signal recordings, limiting their applicability in real-world and resource-constrained settings. In this paper, we present ECG-Scan, a self-supervised framework for learning clinically generalized representations from ECG images through dual physiological-aware alignments: 1) Our approach optimizes image representation learning using multimodal contrastive alignment between image and gold-standard signal-text modalities. 2) We further integrate domain knowledge via soft-lead constraints, regularizing the reconstruction process and improving signal lead inter-consistency. Extensive benchmarking across multiple datasets and downstream tasks demonstrates that our image-based model achieves superior performance compared to existing image baselines and notably narrows the gap between ECG image and signal analysis. These results highlight the potential of self-supervised image modeling to unlock large-scale legacy ECG data and broaden access to automated cardiovascular diagnostics.
- Abstract(参考訳): 心電図(ECG)は心血管疾患の診断ツールとして最も広く用いられており、世界中の心電図データが画像形式でのみ表示される。
しかし、既存のECG分析手法の多くは生の信号記録へのアクセスに依存しており、実環境やリソース制約のある環境での適用性を制限している。
本稿では,心電図画像から2つの生理的・意識的なアライメントを通して,臨床的に一般化された表現を学習するための自己指導型フレームワークECG-Scanを提案する。
1)本手法は,画像と金標準信号テキストのマルチモーダルコントラストアライメントを用いた画像表現学習を最適化する。
2)ソフトリード制約によるドメイン知識のさらなる統合,再構築プロセスの正規化,信号リードの整合性の向上などを行う。
複数のデータセットと下流タスクにわたる大規模なベンチマークにより、画像ベースモデルが既存の画像ベースラインよりも優れたパフォーマンスを達成し、ECGイメージと信号分析のギャップを特に狭めることを示す。
これらの結果は、大規模なレガシー心電図データをアンロックし、自動心血管診断へのアクセスを拡大する自己教師画像モデリングの可能性を強調している。
関連論文リスト
- Demographic-Aware Self-Supervised Anomaly Detection Pretraining for Equitable Rare Cardiac Diagnosis [45.00216485193071]
心電図による心臓の異常は, 長期分布により検出が困難である。
我々は、自己教師付き異常検出と人口動態認識型表現学習を統合したAI支援二段階ECGフレームワークを開発した。
本手法は,まれな異常に対して94.7%のAUROCを達成し,コモン・レア性能のギャップを73%削減する。
論文 参考訳(メタデータ) (2026-03-20T07:04:00Z) - Echo2ECG: Enhancing ECG Representations with Cardiac Morphology from Multi-View Echos [53.368813255127115]
既存の自己教師型手法は、ECGをシングルビューエコーに整列させることで、表現ミスマッチに悩まされる。
本稿では,心電図表現を多視点エコーで捉えることで,心電図表現を充実させるマルチモーダル自己教師型学習フレームワークであるEcho2ECGを提案する。
臨床的に関係のある2つの課題に対して,Echo2ECGをECG特徴抽出器として評価した。
論文 参考訳(メタデータ) (2026-03-09T15:39:57Z) - Simulator and Experience Enhanced Diffusion Model for Comprehensive ECG Generation [52.19347532840774]
本稿では,心電図生成のための新しい生理シミュレータSE-Diffを提案する。
SE-Diffは、軽量常微分方程式(ODE)ベースのECGシミュレータをビートデコーダを介して拡散過程に統合する。
実世界のECGデータセットに対する大規模な実験により、SE-Diffは信号の忠実度とテキスト-ECGセマンティックアライメントの両方を改善している。
論文 参考訳(メタデータ) (2025-11-13T02:57:10Z) - MEETI: A Multimodal ECG Dataset from MIMIC-IV-ECG with Signals, Images, Features and Interpretations [12.00096975933262]
心電図(ECG)は、非侵襲的不整脈、心筋虚血、伝導障害の診断を可能にする、現代の心血管ケアにおける基礎的な役割を担っている。
既存のECGデータセットの多くは、単一のモダリティデータのみを提供するか、あるいは少なくとも2つのモダリティを提供するため、さまざまなECG情報を現実世界の設定で理解し統合することのできるモデルを構築するのが難しくなる。
我々は、原波形データ、高解像度プロット画像、および大規模言語モデルによって生成された詳細なテキスト解釈を同期する最初の大規模ECGデータセットであるMEETIを紹介する。
論文 参考訳(メタデータ) (2025-07-21T05:32:44Z) - GEM: Empowering MLLM for Grounded ECG Understanding with Time Series and Images [44.50428701650495]
GEMは,第1回MLLM統合ECG時系列,第12回リードECG画像,地上および臨床のECG解釈のためのテキストである。
GEMは、3つのコアイノベーションを通じて機能的解析、エビデンス駆動推論、および臨床医のような診断プロセスを可能にする。
基礎心電図理解におけるMLLMの能力を評価するために,臨床動機付けのベンチマークであるグラウンドドECGタスクを提案する。
論文 参考訳(メタデータ) (2025-03-08T05:48:53Z) - Comparing Deep Neural Network for Multi-Label ECG Diagnosis From Scanned ECG [1.2499537119440243]
我々は、スキャンされたECGデータセット上で、AlexNet、VGG、ResNet、Vision Transformerを含む複数のディープニューラルネットワークアーキテクチャの性能を評価する。
比較分析では, モデル精度, 画像アーチファクトの堅牢性, 各種ECG条件における一般化可能性について検討した。
この結果は各アーキテクチャの長所と短所を強調し、画像ベースの心電図診断の実現可能性に関する洞察を提供する。
論文 参考訳(メタデータ) (2025-02-19T02:56:27Z) - CognitionCapturer: Decoding Visual Stimuli From Human EEG Signal With Multimodal Information [61.1904164368732]
脳波信号の表現にマルチモーダルデータを完全に活用する統合フレームワークであるCognitionCapturerを提案する。
具体的には、CognitionCapturerは、各モダリティに対してモダリティエキスパートを訓練し、EEGモダリティからモダリティ情報を抽出する。
このフレームワークは生成モデルの微調整を一切必要とせず、より多くのモダリティを組み込むように拡張することができる。
論文 参考訳(メタデータ) (2024-12-13T16:27:54Z) - VizECGNet: Visual ECG Image Network for Cardiovascular Diseases Classification with Multi-Modal Training and Knowledge Distillation [0.7405975743268344]
実際には、ECGデータはデジタル化された信号または印刷された画像として格納される。
本稿では,複数の心血管疾患の予後を決定するために,心電図のみを用いたVizECGNetを提案する。
論文 参考訳(メタデータ) (2024-08-06T01:34:43Z) - Automated Cardiovascular Record Retrieval by Multimodal Learning between
Electrocardiogram and Clinical Report [28.608260758775316]
本稿では,Large Language Models (LLM) と Vision-Transformer (ViT) モデルにおける最近のブレークスルーを活用し,ECGの解釈に新たなアプローチを導入する。
入力ECGデータに基づいて,最も類似した症例を自動的に同定する手法を提案する。
本研究は,未開発地域において診断サービスを提供する上で重要な資源となる可能性がある。
論文 参考訳(メタデータ) (2023-04-13T06:32:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。