論文の概要: H-LDM: Hierarchical Latent Diffusion Models for Controllable and Interpretable PCG Synthesis from Clinical Metadata
- arxiv url: http://arxiv.org/abs/2511.14312v1
- Date: Tue, 18 Nov 2025 10:16:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:53.045808
- Title: H-LDM: Hierarchical Latent Diffusion Models for Controllable and Interpretable PCG Synthesis from Clinical Metadata
- Title(参考訳): H-LDM:臨床メタデータから制御可能なPCG合成のための階層的潜在拡散モデル
- Authors: Chenyang Xu, Siming Li, Hao Wang,
- Abstract要約: H-LDMは、構造化メタデータから臨床的に正確で制御可能なPCG信号を生成する階層的潜在拡散モデルである。
我々のアプローチは、生理的に異なる潜伏空間を学習し、リズム、心臓音、大腿骨を分離するマルチスケールのVAEを特徴とする。
PhysioNet CirCorデータセットの実験では、Fréchet Audio Distance 9.7、92%の属性不整合スコア、87.1%の臨床的妥当性が確認された。
- 参考スコア(独自算出の注目度): 7.158541967057649
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Phonocardiogram (PCG) analysis is vital for cardiovascular disease diagnosis, yet the scarcity of labeled pathological data hinders the capability of AI systems. To bridge this, we introduce H-LDM, a Hierarchical Latent Diffusion Model for generating clinically accurate and controllable PCG signals from structured metadata. Our approach features: (1) a multi-scale VAE that learns a physiologically-disentangled latent space, separating rhythm, heart sounds, and murmurs; (2) a hierarchical text-to-biosignal pipeline that leverages rich clinical metadata for fine-grained control over 17 distinct conditions; and (3) an interpretable diffusion process guided by a novel Medical Attention module. Experiments on the PhysioNet CirCor dataset demonstrate state-of-the-art performance, achieving a Fréchet Audio Distance of 9.7, a 92% attribute disentanglement score, and 87.1% clinical validity confirmed by cardiologists. Augmenting diagnostic models with our synthetic data improves the accuracy of rare disease classification by 11.3\%. H-LDM establishes a new direction for data augmentation in cardiac diagnostics, bridging data scarcity with interpretable clinical insights.
- Abstract(参考訳): Phonocardiogram (PCG) 解析は心血管疾患の診断に不可欠であるが、ラベル付き病理データの不足はAIシステムの能力を妨げる。
そこで我々は,H-LDMという階層的潜在拡散モデルを導入し,構造化メタデータから臨床的に正確かつ制御可能なPCG信号を生成する。
提案手法は, 生理的に異なる潜伏空間を学習し, リズム, 心臓音, 大腿骨を分離するマルチスケールVAE, リッチな臨床メタデータを活用して17の異なる条件をきめ細かい制御を行う階層型テキスト・バイオサインパイプライン, 新規なメディカルアテンションモジュールによって誘導される解釈可能な拡散過程を特徴とする。
PhysioNet CirCorデータセットの実験では、Fréchet Audio Distance 9.7、92%の属性不整合スコア、87.1%の臨床的妥当性が確認された。
生合成データを用いた診断モデルの強化により, 稀な疾患分類の精度が11.3\%向上する。
H-LDMは、心臓診断におけるデータ増強のための新しい方向を確立し、解釈可能な臨床的洞察でデータの不足を埋める。
関連論文リスト
- Lightweight Classifier for Detecting Intracranial Hemorrhage in Ultrasound Data [0.5461938536945722]
外傷性脳損傷(TBI)に続発する頭蓋内出血(ICH)は重要な診断課題である。
CT(Computed Tomography)やMRI(Magnetic Resonance Imaging)などの診断には、大きな限界がある。
超音波ティッシュパルサチリティイメージング(TPI)を用いた自動ICH検出のための機械学習手法の検討
論文 参考訳(メタデータ) (2025-10-22T09:04:42Z) - Automated Labeling of Intracranial Arteries with Uncertainty Quantification Using Deep Learning [2.6279333406008476]
3D Time-of-light Magnetic Resonance Angiography (3D ToF-MRA) を用いたディープラーニングによる自動動脈ラベル作成フレームワークを提案する。
我々のフレームワークは、自動脳血管ラベリングのためのスケーラブルで正確で不確実なソリューションを提供し、下流血行動態解析をサポートし、臨床統合を容易にする。
論文 参考訳(メタデータ) (2025-09-22T12:57:21Z) - LGE-Guided Cross-Modality Contrastive Learning for Gadolinium-Free Cardiomyopathy Screening in Cine CMR [51.11296719862485]
CMRを用いたガドリニウムフリー心筋症スクリーニングのためのコントラシブラーニングおよびクロスモーダルアライメントフレームワークを提案する。
CMRとLate Gadolinium Enhancement (LGE) 配列の潜伏空間を整列させることにより, 本モデルでは線維症特異的な病理組織をCMR埋め込みにエンコードする。
論文 参考訳(メタデータ) (2025-08-23T07:21:23Z) - Acoustic Index: A Novel AI-Driven Parameter for Cardiac Disease Risk Stratification Using Echocardiography [0.0]
本稿では,標準的な超音波画像から心機能障害の定量化を目的とした,新しいAI誘発心エコーパラメータであるAudiotic Indexを紹介する。
このモデルは、クープマン作用素理論に基づく拡張動的モード分解(EDMD)と、臨床メタデータを組み込んだハイブリッドニューラルネットワークを組み合わせる。
様々な心疾患と正常なコントロールを含む736人の前向きコホートにおいて、AUCは独立したテストセットで0.89の曲線(AUC)の領域を達成した。
5回にまたがるクロスバリデーションによりモデルの堅牢性が確認され, 感度と特異性は, 独立データで0.8以上であった。
論文 参考訳(メタデータ) (2025-07-17T21:27:28Z) - Explainable Parallel CNN-LSTM Model for Differentiating Ventricular Tachycardia from Supraventricular Tachycardia with Aberrancy in 12-Lead ECGs [4.263117296632119]
本稿では,診断精度を向上させるための計算効率のよいディープラーニングソリューションを提案し,臨床展開のためのモデル解釈性を提供する。
各パイプラインは2つの1D-CNNブロックを使用して各ECGリードを処理し、局所的な特徴を抽出する。
このモデルは、95%$ CI:93.07-98.19%$、感度=95.10%$、特異性=96.06%$、F1-score=95.12%$を達成した。
論文 参考訳(メタデータ) (2025-07-14T12:12:34Z) - Finetuning and Quantization of EEG-Based Foundational BioSignal Models on ECG and PPG Data for Blood Pressure Estimation [46.36100528165335]
光胸腺撮影と心電図は、連続血圧モニタリング(BP)を可能にする可能性がある。
しかし、データ品質と患者固有の要因の変化のため、正確で堅牢な機械学習(ML)モデルは依然として困難である。
本研究では,1つのモータリティで事前学習したモデルを効果的に利用して,異なる信号タイプの精度を向上させる方法について検討する。
本手法は, 拡張期BPの最先端精度を約1.5倍に向上し, 拡張期BPの精度を1.5倍に向上させる。
論文 参考訳(メタデータ) (2025-02-10T13:33:12Z) - AXIAL: Attention-based eXplainability for Interpretable Alzheimer's Localized Diagnosis using 2D CNNs on 3D MRI brain scans [43.06293430764841]
本研究では,3次元MRIを用いたアルツハイマー病診断の革新的手法を提案する。
提案手法では,2次元CNNがボリューム表現を抽出できるソフトアテンション機構を採用している。
ボクセルレベルの精度では、どの領域に注意が払われているかを同定し、これらの支配的な脳領域を同定する。
論文 参考訳(メタデータ) (2024-07-02T16:44:00Z) - Respiratory Disease Classification and Biometric Analysis Using Biosignals from Digital Stethoscopes [3.2458203725405976]
本研究は, 自動呼吸器疾患分類とバイオメトリックス解析にデジタル聴診器技術を活用した新しいアプローチを提案する。
各種呼吸状態の分類に機械学習モデルを訓練する。
本研究は,2値分類の精度(健康と疾患のバランス精度89%)と多値分類の精度(72%)を実現している。
論文 参考訳(メタデータ) (2023-09-12T23:54:00Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Identification of Ischemic Heart Disease by using machine learning
technique based on parameters measuring Heart Rate Variability [50.591267188664666]
本研究は,243名の非侵襲的特徴(年齢,性別,左室容積率,HRV15)を用いて,一連のANNの訓練と評価を行った。
最高の結果は、7つの入力パラメータと7つの隠れノードを使用して、トレーニングと検証データセットに対して98.9%と82%の精度で得られた。
論文 参考訳(メタデータ) (2020-10-29T19:14:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。