論文の概要: C-MELT: Contrastive Enhanced Masked Auto-Encoders for ECG-Language Pre-Training
- arxiv url: http://arxiv.org/abs/2410.02131v2
- Date: Fri, 4 Oct 2024 11:05:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-04 08:35:44.732285
- Title: C-MELT: Contrastive Enhanced Masked Auto-Encoders for ECG-Language Pre-Training
- Title(参考訳): C-MELT:ECG-Language事前学習のためのコントラスト強化マスク付きオートエンコーダ
- Authors: Manh Pham, Aaqib Saeed, Dong Ma,
- Abstract要約: 本稿では,コントラッシブマスクを用いた自動エンコーダアーキテクチャを用いて,ECGとテキストデータを事前学習するフレームワークであるC-MELTを提案する。
C-MELTは、生成性の強さと識別能力の強化を一意に組み合わせて、堅牢なクロスモーダル表現を実現する。
- 参考スコア(独自算出の注目度): 10.088785685439134
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate interpretation of Electrocardiogram (ECG) signals is pivotal for diagnosing cardiovascular diseases. Integrating ECG signals with their accompanying textual reports holds immense potential to enhance clinical diagnostics through the combination of physiological data and qualitative insights. However, this integration faces significant challenges due to inherent modality disparities and the scarcity of labeled data for robust cross-modal learning. To address these obstacles, we propose C-MELT, a novel framework that pre-trains ECG and text data using a contrastive masked auto-encoder architecture. C-MELT uniquely combines the strengths of generative with enhanced discriminative capabilities to achieve robust cross-modal representations. This is accomplished through masked modality modeling, specialized loss functions, and an improved negative sampling strategy tailored for cross-modal alignment. Extensive experiments on five public datasets across diverse downstream tasks demonstrate that C-MELT significantly outperforms existing methods, achieving 15% and 2% increases in linear probing and zero-shot performance over state-of-the-art models, respectively. These results highlight the effectiveness of C-MELT, underscoring its potential to advance automated clinical diagnostics through multi-modal representations.
- Abstract(参考訳): 心電図(ECG)信号の正確な解釈は心血管疾患の診断に重要である。
ECG信号と付随するテキストレポートを統合することは、生理学的データと質的な洞察を組み合わせることで臨床診断を強化する大きな可能性を秘めている。
しかし、この統合は、固有のモダリティの相違と、堅牢なクロスモーダル学習のためのラベル付きデータの不足により、大きな課題に直面している。
これらの障害に対処するために,コントラッシブマスク付きオートエンコーダアーキテクチャを用いて,ECGとテキストデータを事前学習する新しいフレームワークであるC-MELTを提案する。
C-MELTは、生成性の強さと識別能力の強化を一意に組み合わせて、堅牢なクロスモーダル表現を実現する。
これは、マスク付きモダリティモデリング、特殊損失関数、およびクロスモーダルアライメントに適した改善されたネガティブサンプリング戦略によって達成される。
さまざまなダウンストリームタスクにわたる5つの公開データセットに対する大規模な実験により、C-MELTは既存の手法よりも大幅に優れており、それぞれ、最先端モデルよりも線形プローブとゼロショットのパフォーマンスが15%、2%向上していることが示された。
これらの結果はC-MELTの有効性を浮き彫りにしており, マルチモーダル表現による臨床診断の進歩の可能性を示している。
関連論文リスト
- ICH-SCNet: Intracerebral Hemorrhage Segmentation and Prognosis Classification Network Using CLIP-guided SAM mechanism [12.469269425813607]
脳内出血 (ICH) は脳卒中で最も致命的なサブタイプであり, 障害の発生頻度が高いことが特徴である。
既存のアプローチでは、これらの2つのタスクを独立して処理し、主にデータのみにフォーカスする。
本稿では,ICHセグメンテーションと予後分類の両方のために設計されたマルチタスクネットワークICH-SCNetを提案する。
論文 参考訳(メタデータ) (2024-11-07T12:34:25Z) - PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文 参考訳(メタデータ) (2024-09-08T15:02:25Z) - MEDBind: Unifying Language and Multimodal Medical Data Embeddings [18.954939735299963]
我々は,CXR,ECG,医療用テキストにまたがる共同埋め込みを学習するMEDBind(Medical Electronic patient recorD)を提案する。
テキストデータを中央アンカーとして使用すると、MEDBindはトリモダリティバインディングを備え、トップK検索、ゼロショット、少数ショットベンチマークで競合的なパフォーマンスを提供する。
論文 参考訳(メタデータ) (2024-03-19T16:46:29Z) - MM-SurvNet: Deep Learning-Based Survival Risk Stratification in Breast
Cancer Through Multimodal Data Fusion [18.395418853966266]
乳がん生存リスク階層化のための新しい深層学習手法を提案する。
画像特徴抽出には視覚変換器、特にMaxViTモデルを使用し、患者レベルでの複雑な画像関係のキャプチャには自己注意を用いる。
二重クロスアテンション機構はこれらの特徴を遺伝データと融合させ、臨床データを最終層に組み込んで予測精度を高める。
論文 参考訳(メタデータ) (2024-02-19T02:31:36Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - Semi-Supervised Learning for Multi-Label Cardiovascular Diseases
Prediction:A Multi-Dataset Study [17.84069222975825]
現在の心電図に基づく診断システムは,ディープラーニング技術の急速な発展により,有望な性能を示す。
ラベル不足、複数のCVDの共起、目に見えないデータセットのパフォーマンスの低下は、ディープラーニングベースのモデルの普及を妨げる。
本稿では,複数のCVDを同時に認識するマルチラベル半教師付きモデル(ECGMatch)を提案する。
論文 参考訳(メタデータ) (2023-06-18T07:46:19Z) - A Dual-scale Lead-seperated Transformer With Lead-orthogonal Attention
And Meta-information For Ecg Classification [26.07181634056045]
本研究は、鉛直交注意とメタ情報(DLTM-ECG)を併用したデュアルスケールリード分離変圧器を提案する。
ECGセグメントは独立パッチとして解釈され、縮小次元信号と共に二重スケールの表現を形成する。
我々の研究は、同様の多チャンネル生体電気信号処理や生理的多モードタスクの可能性を秘めている。
論文 参考訳(メタデータ) (2022-11-23T08:45:34Z) - Dual-Consistency Semi-Supervised Learning with Uncertainty
Quantification for COVID-19 Lesion Segmentation from CT Images [49.1861463923357]
CT画像を用いた半監視型COVID-19病変分割のための不確実性誘導型二重一貫性学習ネットワーク(UDC-Net)を提案する。
提案した UDC-Net は,Dice の完全教師方式を 6.3% 向上させ,他の競合的半監督方式を有意なマージンで上回っている。
論文 参考訳(メタデータ) (2021-04-07T16:23:35Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - COVI-AgentSim: an Agent-based Model for Evaluating Methods of Digital
Contact Tracing [68.68882022019272]
COVI-AgentSimは、ウイルス学、病気の進行、社会的接触ネットワーク、移動パターンに基づくエージェントベースのコンパートメンタルシミュレータである。
1)バイナリテスト結果に基づいてバイナリレコメンデーションを割り当てる標準バイナリコンタクトトレース (BCT) と,2) 多様な特徴に基づいてグレードレベルのレコメンデーションを割り当てる特徴ベースコンタクトトレース (FCT) のルールベースの手法である。
論文 参考訳(メタデータ) (2020-10-30T00:47:01Z) - ECG-DelNet: Delineation of Ambulatory Electrocardiograms with Mixed
Quality Labeling Using Neural Networks [69.25956542388653]
ディープラーニング(DL)アルゴリズムは、学術的、産業的にも重くなっている。
セグメンテーションフレームワークにECGの検出とデライン化を組み込むことにより、低解釈タスクにDLをうまく適用できることを実証する。
このモデルは、PhyloNetのQTデータベースを使用して、105個の増幅ECG記録から訓練された。
論文 参考訳(メタデータ) (2020-05-11T16:29:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。