論文の概要: CG-DMER: Hybrid Contrastive-Generative Framework for Disentangled Multimodal ECG Representation Learning
- arxiv url: http://arxiv.org/abs/2602.21154v1
- Date: Tue, 24 Feb 2026 17:59:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.873482
- Title: CG-DMER: Hybrid Contrastive-Generative Framework for Disentangled Multimodal ECG Representation Learning
- Title(参考訳): CG-DMER:分散多モードECG表現学習のためのハイブリッドコントラスト生成フレームワーク
- Authors: Ziwei Niu, Hao Sun, Shujun Bian, Xihong Yang, Lanfen Lin, Yuxin Liu, Yueming Jin,
- Abstract要約: 本稿では,多モードECG表現学習のためのコントラスト生成フレームワークであるCG-DMERを提案する。
表現のゆがみとアライメント戦略は、不要なノイズとモダリティ固有のバイアスを軽減するために設計されている。
3つの公開データセットの実験は、CG-DMERが様々な下流タスクで最先端のパフォーマンスを達成することを示した。
- 参考スコア(独自算出の注目度): 29.83120239597889
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate interpretation of electrocardiogram (ECG) signals is crucial for diagnosing cardiovascular diseases. Recent multimodal approaches that integrate ECGs with accompanying clinical reports show strong potential, but they still face two main concerns from a modality perspective: (1) intra-modality: existing models process ECGs in a lead-agnostic manner, overlooking spatial-temporal dependencies across leads, which restricts their effectiveness in modeling fine-grained diagnostic patterns; (2) inter-modality: existing methods directly align ECG signals with clinical reports, introducing modality-specific biases due to the free-text nature of the reports. In light of these two issues, we propose CG-DMER, a contrastive-generative framework for disentangled multimodal ECG representation learning, powered by two key designs: (1) Spatial-temporal masked modeling is designed to better capture fine-grained temporal dynamics and inter-lead spatial dependencies by applying masking across both spatial and temporal dimensions and reconstructing the missing information. (2) A representation disentanglement and alignment strategy is designed to mitigate unnecessary noise and modality-specific biases by introducing modality-specific and modality-shared encoders, ensuring a clearer separation between modality-invariant and modality-specific representations. Experiments on three public datasets demonstrate that CG-DMER achieves state-of-the-art performance across diverse downstream tasks.
- Abstract(参考訳): 心電図信号の正確な解釈は心血管疾患の診断に不可欠である。
近年のECGと臨床報告を併用するマルチモーダルなアプローチは、大きな可能性を秘めているが、モダリティの観点からは、(1)既存のモデルではリード非依存の方法でECGを処理し、鉛間の空間的依存関係を見越し、細粒度診断パターンのモデリングにおけるそれらの有効性を制限する。
これら2つの課題を踏まえ, CG-DMER は, 空間的・時間的両方の次元にマスキングを適用し, 行方不明情報を再構成することにより, 微粒な時間的ダイナミックスと階層間依存性をよりよく捉えるために, 1) 空間的時間的マスキングモデリングを設計した2つの重要な設計を取り入れた, マルチモーダルECG表現学習のためのコントラッシブ・ジェネレーション・フレームワークを提案する。
2) 表現の不整合及びアライメント戦略は, モダリティ固有およびモダリティ共有エンコーダを導入し, モダリティ不変表現とモダリティ固有表現との明確な分離を確保することで, 不必要なノイズやモダリティ固有バイアスを軽減するように設計されている。
3つの公開データセットの実験は、CG-DMERが様々な下流タスクで最先端のパフォーマンスを達成することを示した。
関連論文リスト
- Leveraging Foundational Models and Simple Fusion for Multi-modal Physiological Signal Analysis [0.0]
我々はCBraModエンコーダを大規模自己監督型ECGプリトレーニングに適用する。
我々は、事前訓練されたCBraModエンコーダをEEGに利用し、対称ECGエンコーダを事前訓練する。
提案手法は, 簡単な融合であっても, 慎重に設計された生理的エンコーダが下流性能を大幅に向上することを示した。
論文 参考訳(メタデータ) (2025-12-17T09:49:06Z) - A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis [56.373297358647655]
Retrieval-Augmented Diagnosis (RAD)は、下流タスクで直接マルチモーダルモデルに外部知識を注入する新しいフレームワークである。
RADは、複数の医療ソースからの疾患中心の知識の検索と改善、ガイドライン強化コントラスト損失トランスフォーマー、デュアルデコーダの3つの主要なメカニズムで機能する。
論文 参考訳(メタデータ) (2025-09-24T10:36:14Z) - S2M2ECG: Spatio-temporal bi-directional State Space Model Enabled Multi-branch Mamba for ECG [7.306716869083474]
本研究では,3レベル融合機構を備えたSSMアーキテクチャであるS2M2ECGを提案する。
S2M2ECGは、リズム、形態、臨床シナリオにおいて優れた性能を発揮する。
論文 参考訳(メタデータ) (2025-09-03T06:52:50Z) - MEETI: A Multimodal ECG Dataset from MIMIC-IV-ECG with Signals, Images, Features and Interpretations [12.00096975933262]
心電図(ECG)は、非侵襲的不整脈、心筋虚血、伝導障害の診断を可能にする、現代の心血管ケアにおける基礎的な役割を担っている。
既存のECGデータセットの多くは、単一のモダリティデータのみを提供するか、あるいは少なくとも2つのモダリティを提供するため、さまざまなECG情報を現実世界の設定で理解し統合することのできるモデルを構築するのが難しくなる。
我々は、原波形データ、高解像度プロット画像、および大規模言語モデルによって生成された詳細なテキスト解釈を同期する最初の大規模ECGデータセットであるMEETIを紹介する。
論文 参考訳(メタデータ) (2025-07-21T05:32:44Z) - Heartcare Suite: Multi-dimensional Understanding of ECG with Raw Multi-lead Signal Modeling [50.58126509704037]
医療スイート(Heartcare Suite)は、微細心電図(ECG)の理解のためのフレームワークである。
Heartcare-220Kは高品質で構造化され、包括的なマルチモーダルECGデータセットである。
Heartcare-Benchは、ECGシナリオにおける医療マルチモーダル大言語モデル(Med-MLLM)の最適化を導くためのベンチマークである。
論文 参考訳(メタデータ) (2025-06-06T07:56:41Z) - Boosting Masked ECG-Text Auto-Encoders as Discriminative Learners [10.088785685439134]
本稿では,コントラッシブマスクを用いた自動エンコーダアーキテクチャを用いて,ECGとテキストデータを事前学習するフレームワークD-BETAを提案する。
D-BETAは、生成性の強さと差別能力の強化を一意に組み合わせて、堅牢なクロスモーダル表現を実現する。
論文 参考訳(メタデータ) (2024-10-03T01:24:09Z) - Factored Attention and Embedding for Unstructured-view Topic-related
Ultrasound Report Generation [70.7778938191405]
本研究では,非構造的トピック関連超音波レポート生成のための新しい因子的注意・埋め込みモデル(FAE-Gen)を提案する。
提案したFAE-Genは主に2つのモジュール、すなわちビュー誘導因子の注意とトピック指向因子の埋め込みから構成されており、異なるビューで均質および不均一な形態的特徴を捉えている。
論文 参考訳(メタデータ) (2022-03-12T15:24:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。