論文の概要: SS-DPPN: A self-supervised dual-path foundation model for the generalizable cardiac audio representation
- arxiv url: http://arxiv.org/abs/2510.10719v1
- Date: Sun, 12 Oct 2025 17:43:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 20:23:38.94243
- Title: SS-DPPN: A self-supervised dual-path foundation model for the generalizable cardiac audio representation
- Title(参考訳): SS-DPPN:一般化可能な心臓オーディオ表現のための自己教師型デュアルパス基盤モデル
- Authors: Ummy Maria Muna, Md Mehedi Hasan Shawon, Md Jobayer, Sumaiya Akter, Md Rakibul Hasan, Md. Golam Rabiul Alam,
- Abstract要約: Self-Supervised Dual-Path Prototypeal Network (SS-DPPN)は、心臓のオーディオ表現とラベルなしデータからの分類のための基礎モデルである。
SS-DPPNは4つの心臓オーディオベンチマークで最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 2.013977297550879
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The automated analysis of phonocardiograms is vital for the early diagnosis of cardiovascular disease, yet supervised deep learning is often constrained by the scarcity of expert-annotated data. In this paper, we propose the Self-Supervised Dual-Path Prototypical Network (SS-DPPN), a foundation model for cardiac audio representation and classification from unlabeled data. The framework introduces a dual-path contrastive learning based architecture that simultaneously processes 1D waveforms and 2D spectrograms using a novel hybrid loss. For the downstream task, a metric-learning approach using a Prototypical Network was used that enhances sensitivity and produces well-calibrated and trustworthy predictions. SS-DPPN achieves state-of-the-art performance on four cardiac audio benchmarks. The framework demonstrates exceptional data efficiency with a fully supervised model on three-fold reduction in labeled data. Finally, the learned representations generalize successfully across lung sound classification and heart rate estimation. Our experiments and findings validate SS-DPPN as a robust, reliable, and scalable foundation model for physiological signals.
- Abstract(参考訳): 心血管疾患の早期診断には, 心電図の自動解析が不可欠であるが, 専門家注記データの不足により, 教師付き深層学習が制限されることが多い。
本稿では、心臓のオーディオ表現とラベルなしデータからの分類の基礎モデルであるセルフ・スーパービジョン・デュアルパス・プロトタイプネットワーク(SS-DPPN)を提案する。
このフレームワークは、新しいハイブリッドロスを用いて1次元波形と2次元分光図を同時に処理する、デュアルパスのコントラスト学習に基づくアーキテクチャを導入している。
下流タスクでは、感度を高め、よく校正され信頼に値する予測を生成するプロトタイプネットワークを用いた計量学習手法が用いられた。
SS-DPPNは4つの心臓オーディオベンチマークで最先端のパフォーマンスを達成する。
このフレームワークは、ラベル付きデータの3倍の削減に関する完全な教師付きモデルによって、例外的なデータ効率を示す。
最終的に、学習された表現は、肺の音の分類と心拍数推定に成功している。
実験および実験により, SS-DPPNは生理学的信号の堅牢で信頼性が高く, スケーラブルな基礎モデルとして検証された。
関連論文リスト
- Synthetic Time Series Data Generation for Healthcare Applications: A PCG Case Study [43.28613210217385]
我々は、PCGデータを生成するために、最先端の3つの生成モデルを採用し、比較する。
その結果,生成したPCGデータは元のデータセットによく似ていることがわかった。
今後の研究では、この手法をデータ拡張パイプラインに組み込んで、異常なPCG信号を心臓の大腿骨で合成する予定である。
論文 参考訳(メタデータ) (2024-12-17T18:07:40Z) - HeartBERT: A Self-Supervised ECG Embedding Model for Efficient and Effective Medical Signal Analysis [0.0]
HeartBertは自然言語処理におけるBERT(Bidirectional Representations from Transformers)にインスパイアされ、自己教師型学習アプローチで強化されている。
提案モデルの汎用性,一般化性,効率性を示すために,睡眠ステージ検出と心拍分類という2つの重要な下流課題が選択された。
HeartBERTの優位性と進歩を示すための一連の実験が実施されている。
論文 参考訳(メタデータ) (2024-11-08T14:25:00Z) - CTPD: Cross-Modal Temporal Pattern Discovery for Enhanced Multimodal Electronic Health Records Analysis [46.56667527672019]
マルチモーダルEHRデータから有意な時間的パターンを効率的に抽出するために,CTPD(Cross-Modal Temporal Pattern Discovery)フレームワークを導入する。
提案手法では,時間的セマンティックな埋め込みを生成するためにスロットアテンションを用いて改良された時間的パターン表現を提案する。
論文 参考訳(メタデータ) (2024-11-01T15:54:07Z) - Improving Diffusion Models for ECG Imputation with an Augmented Template
Prior [43.6099225257178]
ノイズと品質の悪い録音は、モバイルヘルスシステムを使って収集された信号にとって大きな問題である。
近年の研究では、確率的時系列モデルによるECGの欠落値の計算が検討されている。
本稿では,様々な健康状態の事前情報として,テンプレート誘導型拡散確率モデル(DDPM)PulseDiffを提案する。
論文 参考訳(メタデータ) (2023-10-24T11:34:15Z) - Extraction of volumetric indices from echocardiography: which deep
learning solution for clinical use? [6.144041824426555]
提案した3D nnU-Netは,2D法と繰り返しセグメンテーション法よりも優れていることを示す。
実験の結果、十分なトレーニングデータがあれば、3D nnU-Netは日常的な臨床機器の基準を満たす最初の自動化ツールとなる可能性が示唆された。
論文 参考訳(メタデータ) (2023-05-03T09:38:52Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - Multi-Lead ECG Classification via an Information-Based Attention
Convolutional Neural Network [1.1720399305661802]
1次元畳み込みニューラルネットワーク(CNN)は、広範に分類されるタスクに有効であることが証明されている。
残差接続を実装し,入力特徴マップ内の異なるチャネルに含まれる情報から重みを学習できる構造を設計する。
分類タスクにおいて、特定のモデルセグメントのパフォーマンスを監視するために平均平方偏差という指標を導入する。
論文 参考訳(メタデータ) (2020-03-25T02:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。