論文の概要: Contrastive Learning for Multi Label ECG Classification with Jaccard Score Based Sigmoid Loss
- arxiv url: http://arxiv.org/abs/2602.10553v1
- Date: Wed, 11 Feb 2026 05:58:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.503412
- Title: Contrastive Learning for Multi Label ECG Classification with Jaccard Score Based Sigmoid Loss
- Title(参考訳): ジャカードスコアに基づくシグモイド損失を用いたマルチラベルECG分類のコントラスト学習
- Authors: Junichiro Takahashi, Masataka Sato, Satoshi Kodeta, Norihiko Takeda,
- Abstract要約: 我々は,実世界の病院データを用いたマルチモーダルプレトレーニングのための堅牢なECGエンコーダの構築に重点を置いている。
マルチラベル予測が可能なシグモイドに基づく損失関数を持つCLIPモデルであるSigLIPを用いる。
実験により、言語モデルに医療知識を取り入れ、修正された損失を適用したことにより、マルチラベルECG分類が大幅に改善された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in large language models (LLMs) have enabled the development of multimodal medical AI. While models such as MedGemini achieve high accuracy on VQA tasks like USMLE MM, their performance on ECG based tasks remains limited, and some models, such as MedGemma, do not support ECG data at all. Interpreting ECGs is inherently challenging, and diagnostic accuracy can vary depending on the interpreter's experience. Although echocardiography provides rich diagnostic information, it requires specialized equipment and personnel, limiting its availability. In this study, we focus on constructing a robust ECG encoder for multimodal pretraining using real world hospital data. We employ SigLIP, a CLIP based model with a sigmoid based loss function enabling multi label prediction, and introduce a modified loss function tailored to the multi label nature of ECG data. Experiments demonstrate that incorporating medical knowledge in the language model and applying the modified loss significantly improve multi label ECG classification. To further enhance performance, we increase the embedding dimensionality and apply random cropping to mitigate data drift. Finally, per label analysis reveals which ECG findings are easier or harder to predict. Our study provides a foundational framework for developing medical models that utilize ECG data.
- Abstract(参考訳): 大規模言語モデル(LLM)の最近の進歩は、マルチモーダル医療AIの開発を可能にしている。
MedGeminiのようなモデルはUSMLE MMのようなVQAタスクで高い精度を達成するが、ECGベースのタスクでの性能は限定的であり、MedGemmaのような一部のモデルはECGデータを完全にサポートしていない。
ECGの解釈は本質的に困難であり、診断精度はインタプリタの経験によって異なる可能性がある。
心エコー検査は豊富な診断情報を提供するが、専門の機器と要員が必要であり、利用できる範囲は限られている。
本研究では,実世界の病院データを用いたマルチモーダルプレトレーニングのための堅牢なECGエンコーダの構築に焦点をあてる。
マルチラベル予測が可能なシグモイドに基づく損失関数を持つCLIPベースのモデルであるSigLIPを採用し、ECGデータのマルチラベル特性に合わせた改良された損失関数を導入する。
実験により、言語モデルに医療知識を取り入れ、修正された損失を適用したことにより、マルチラベルECG分類が大幅に改善された。
さらなる性能向上のために,埋め込み次元を向上し,データのドリフトを緩和するためにランダムトリミングを適用した。
最後に、ラベル分析によって、どの心電図の発見がより容易か、あるいは予測が難しいかが明らかになる。
本研究は,心電図データを利用した医療モデル開発のための基礎的枠組みを提供する。
関連論文リスト
- EfficientECG: Cross-Attention with Feature Fusion for Efficient Electrocardiogram Classification [7.5367987995144565]
本稿では,ECGデータを効果的に管理・分析するための新しいディープラーニング技術について検討する。
私たちのディープラーニングアプローチは、エンドツーエンドのトレーニングを通じて、ECGデータの特徴を自動的に抽出することができます。
ECGデータセットの評価は、高精度、多機能融合、軽量化の観点から、最先端の作業に対して我々のモデルを検証している。
論文 参考訳(メタデータ) (2025-12-03T13:54:33Z) - EnECG: Efficient Ensemble Learning for Electrocardiogram Multi-task Foundation Model [46.84040404474695]
EnECGは、複数の特別な基礎モデルを統合するアンサンブルベースのフレームワークであり、それぞれECG解釈の異なる側面で優れている。
本稿では,基礎モデルの強力な表現力を維持しつつ,計算・メモリコストの削減に寄与することを示す。
このフレームワークは特徴抽出と予測性能を向上するだけでなく、実際の臨床応用に実用的な効率性も確保する。
論文 参考訳(メタデータ) (2025-11-28T07:22:33Z) - Simulator and Experience Enhanced Diffusion Model for Comprehensive ECG Generation [52.19347532840774]
本稿では,心電図生成のための新しい生理シミュレータSE-Diffを提案する。
SE-Diffは、軽量常微分方程式(ODE)ベースのECGシミュレータをビートデコーダを介して拡散過程に統合する。
実世界のECGデータセットに対する大規模な実験により、SE-Diffは信号の忠実度とテキスト-ECGセマンティックアライメントの両方を改善している。
論文 参考訳(メタデータ) (2025-11-13T02:57:10Z) - Heartcare Suite: Multi-dimensional Understanding of ECG with Raw Multi-lead Signal Modeling [50.58126509704037]
医療スイート(Heartcare Suite)は、微細心電図(ECG)の理解のためのフレームワークである。
Heartcare-220Kは高品質で構造化され、包括的なマルチモーダルECGデータセットである。
Heartcare-Benchは、ECGシナリオにおける医療マルチモーダル大言語モデル(Med-MLLM)の最適化を導くためのベンチマークである。
論文 参考訳(メタデータ) (2025-06-06T07:56:41Z) - An Electrocardiogram Foundation Model Built on over 10 Million Recordings with External Evaluation across Multiple Domains [17.809094003643523]
ECG Foundation Model (ECGFounder)は、Harvard-Emory ECG Databaseから150のラベルカテゴリを持つ1000万以上のECGをトレーニングしている。
ECGFounderは内部検証セットのエキスパートレベルのパフォーマンスを達成し、AUROCは80の診断で0.95を超えている。
微調整されたECGFounderは、人口統計分析、臨床イベント検出、心拍数横断診断においてベースラインモデルを上回っている。
論文 参考訳(メタデータ) (2024-10-05T12:12:02Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - ECG-DelNet: Delineation of Ambulatory Electrocardiograms with Mixed
Quality Labeling Using Neural Networks [69.25956542388653]
ディープラーニング(DL)アルゴリズムは、学術的、産業的にも重くなっている。
セグメンテーションフレームワークにECGの検出とデライン化を組み込むことにより、低解釈タスクにDLをうまく適用できることを実証する。
このモデルは、PhyloNetのQTデータベースを使用して、105個の増幅ECG記録から訓練された。
論文 参考訳(メタデータ) (2020-05-11T16:29:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。