論文の概要: High-Fidelity Synthetic ECG Generation via Mel-Spectrogram Informed Diffusion Training
- arxiv url: http://arxiv.org/abs/2510.05492v2
- Date: Thu, 09 Oct 2025 00:47:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 12:56:53.564075
- Title: High-Fidelity Synthetic ECG Generation via Mel-Spectrogram Informed Diffusion Training
- Title(参考訳): メルスペクトログラムインフォームド拡散訓練による高忠実合成心電図生成
- Authors: Zhuoyi Huang, Nutan Sahoo, Anamika Kumari, Girish Kumar, Kexuan Cai, Shixing Cao, Yue Kang, Tian Xia, Somya Chatterjee, Nicholas Hausman, Aidan Jay, Eric S. Rosenthal, Soundar Srinivasan, Sadid Hasan, Alex Fedorov, Sulaiman Vesal,
- Abstract要約: リアル患者心電図(ECG)データの共有に関するプライバシー制限により、心臓ケアのための機械学習の開発が妨げられる。
本研究は、現在の生成ECG法における2つの大きな欠点に対処する。
条件付き拡散に基づく構造化状態空間モデル (Structured State Space Model, SSSD-ECG) を2つの原則により構築する。
- 参考スコア(独自算出の注目度): 3.864395218585964
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The development of machine learning for cardiac care is severely hampered by privacy restrictions on sharing real patient electrocardiogram (ECG) data. Although generative AI offers a promising solution, the real-world use of existing model-synthesized ECGs is limited by persistent gaps in trustworthiness and clinical utility. In this work, we address two major shortcomings of current generative ECG methods: insufficient morphological fidelity and the inability to generate personalized, patient-specific physiological signals. To address these gaps, we build on a conditional diffusion-based Structured State Space Model (SSSD-ECG) with two principled innovations: (1) MIDT-ECG (Mel-Spectrogram Informed Diffusion Training), a novel training paradigm with time-frequency domain supervision to enforce physiological structural realism, and (2) multi-modal demographic conditioning to enable patient-specific synthesis. We comprehensively evaluate our approach on the PTB-XL dataset, assessing the synthesized ECG signals on fidelity, clinical coherence, privacy preservation, and downstream task utility. MIDT-ECG achieves substantial gains: it improves morphological coherence, preserves strong privacy guarantees with all metrics evaluated exceeding the baseline by 4-8%, and notably reduces the interlead correlation error by an average of 74%, while demographic conditioning enhances signal-to-noise ratio and personalization. In critical low-data regimes, a classifier trained on datasets supplemented with our synthetic ECGs achieves performance comparable to a classifier trained solely on real data. Together, we demonstrate that ECG synthesizers, trained with the proposed time-frequency structural regularization scheme, can serve as personalized, high-fidelity, privacy-preserving surrogates when real data are scarce, advancing the responsible use of generative AI in healthcare.
- Abstract(参考訳): 心電図(ECG)データ共有のプライバシー制限により, 心臓ケアのための機械学習の開発が著しく妨げられている。
生成AIは有望なソリューションを提供するが、既存のモデル合成ECGの実際の使用は、信頼性と臨床ユーティリティの持続的なギャップによって制限される。
本研究は, 現生心電図法の主な欠点として, 形態的忠実性の欠如と, パーソナライズされた患者固有の生理的シグナルを生成できないことを挙げる。
これらのギャップに対処するために,(1)MIDT-ECG(Mel-Spectrogram Informed Diffusion Training),2)生理的構造的リアリズムを強制するための時間周波数領域監督を備えた新しい訓練パラダイム,(2)患者固有の合成を可能にするマルチモーダルな人口動態条件の2つの原則により,条件付き拡散に基づく構造化状態空間モデル(SSSD-ECG)を構築した。
PTB-XLデータセットに対する我々のアプローチを包括的に評価し、合成ECG信号の忠実度、臨床コヒーレンス、プライバシー保護、下流タスクユーティリティについて評価した。
MIDT-ECGは、形態的コヒーレンスを改善し、ベースラインを超えて評価されたすべての指標で強力なプライバシー保証を維持し、特にインターリード相関誤差を平均74%削減し、人口動態条件は信号と雑音の比率とパーソナライズを高める。
クリティカルな低データレシエーションにおいて、我々の合成ECGで補足されたデータセットに基づいて訓練された分類器は、実際のデータにのみ訓練された分類器に匹敵する性能を達成する。
共に、提案した時間周波数構造規則化スキームでトレーニングされたECGシンセサイザーが、実際のデータが不足している場合にパーソナライズされ、高忠実でプライバシー保護されたサロゲートとして機能し、医療における生成AIの責任を負うことを実証する。
関連論文リスト
- Domain Knowledge is Power: Leveraging Physiological Priors for Self Supervised Representation Learning in Electrocardiography [3.1670118965354934]
本稿では,生理学を意識したコントラスト学習フレームワークであるPhysiology-aware Contrastive Learning Representation for ECGを紹介する。
プレトレーニング中、PhyloCLRは、同様の臨床的に関係のある特徴を共有するサンプルの埋め込みをまとめることを学ぶ。
マルチラベルECG診断のための2つのパブリックECGデータセットであるChapmanとGeorgian上でPhyloCLRを評価した。
論文 参考訳(メタデータ) (2025-09-09T19:44:50Z) - Improving Myocardial Infarction Detection via Synthetic ECG Pretraining [0.0]
心筋梗塞は世界中で大きな死因であり,心電図(ECG)からの正確な早期診断が臨床上の優先事項である。
ディープラーニングモデルはECGの自動解釈を約束しているが、大量のラベル付きデータを必要とする。
本研究では,12個の心電図を調整可能なMI形態と現実的な雑音で合成する生理的認識パイプラインを提案する。
論文 参考訳(メタデータ) (2025-06-29T14:29:55Z) - DiffuSETS: 12-lead ECG Generation Conditioned on Clinical Text Reports and Patient-Specific Information [13.680337221159506]
心臓病は人間の健康にとって重大な脅威である。
プライバシー上の懸念と限られた医療資源によって駆動される高品質なECGデータの空洞化は、効果的なECG信号生成の押し付けの必要性を生み出します。
セマンティックアライメントと忠実度の高いECG信号を生成可能な新しいフレームワークであるDiffuSETSを提案する。
論文 参考訳(メタデータ) (2025-01-10T12:55:34Z) - Synthetic Time Series Data Generation for Healthcare Applications: A PCG Case Study [43.28613210217385]
我々は、PCGデータを生成するために、最先端の3つの生成モデルを採用し、比較する。
その結果,生成したPCGデータは元のデータセットによく似ていることがわかった。
今後の研究では、この手法をデータ拡張パイプラインに組み込んで、異常なPCG信号を心臓の大腿骨で合成する予定である。
論文 参考訳(メタデータ) (2024-12-17T18:07:40Z) - SSSD-ECG-nle: New Label Embeddings with Structured State-Space Models for ECG generation [0.0]
拡散モデルは近年大きく進歩し、実際のモデルに匹敵するデータを合成する可能性を生み出している。
本稿では,SSSD-ECGに基づくSSSD-ECG-nleアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-07-15T16:31:25Z) - MEIT: Multimodal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation [28.35107188450758]
心電図(Electrocardiogram、ECG)は、心臓の状態をモニタリングするための主要な非侵襲的診断ツールである。
最近の研究は心電図データを用いた心臓状態の分類に集中しているが、心電図レポートの生成は見落としている。
LLMとマルチモーダル命令を用いてECGレポート生成に取り組む最初の試みであるMultimodal ECG Instruction Tuning (MEIT) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-07T23:20:56Z) - Improving Diffusion Models for ECG Imputation with an Augmented Template
Prior [43.6099225257178]
ノイズと品質の悪い録音は、モバイルヘルスシステムを使って収集された信号にとって大きな問題である。
近年の研究では、確率的時系列モデルによるECGの欠落値の計算が検討されている。
本稿では,様々な健康状態の事前情報として,テンプレート誘導型拡散確率モデル(DDPM)PulseDiffを提案する。
論文 参考訳(メタデータ) (2023-10-24T11:34:15Z) - ECGAN: Self-supervised generative adversarial network for
electrocardiography [11.460692362624533]
高品質な合成データは、バイオメディカルタスクのための効果的な予測モデルの開発を支援することができる。
これらの制限は、例えば不整脈に関する心電図データセットへのオープンアクセスに悪影響を及ぼす。
本研究は, 人工心電図時系列生成における自己監督的アプローチを導入する。
論文 参考訳(メタデータ) (2023-01-23T15:48:02Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - ECG-DelNet: Delineation of Ambulatory Electrocardiograms with Mixed
Quality Labeling Using Neural Networks [69.25956542388653]
ディープラーニング(DL)アルゴリズムは、学術的、産業的にも重くなっている。
セグメンテーションフレームワークにECGの検出とデライン化を組み込むことにより、低解釈タスクにDLをうまく適用できることを実証する。
このモデルは、PhyloNetのQTデータベースを使用して、105個の増幅ECG記録から訓練された。
論文 参考訳(メタデータ) (2020-05-11T16:29:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。