論文の概要: TPA: Temporal Prompt Alignment for Fetal Congenital Heart Defect Classification
- arxiv url: http://arxiv.org/abs/2508.15298v3
- Date: Wed, 27 Aug 2025 10:27:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-28 12:43:57.465487
- Title: TPA: Temporal Prompt Alignment for Fetal Congenital Heart Defect Classification
- Title(参考訳): TPA : 胎児先天性心不全分類のための時間的プロンプトアライメント
- Authors: Darya Taratynova, Alya Almsouti, Beknur Kalmakhanbet, Numan Saeed, Mohammad Yaqub,
- Abstract要約: 超音波ビデオにおける先天性心不全(CHD)の検出は、画像ノイズとプローブ位置決めのばらつきによって妨げられる。
本稿では,基礎画像テキストモデルとプロンプト認識型コントラスト学習を利用したテンポラル・プロンプトアライメント(TPA)を提案する。
TPAは、画像エンコーダを使用してビデオサブクリップの各フレームから特徴を抽出し、訓練可能な時間抽出器でそれらを集約し、ビデオ表現をクラス固有のテキストプロンプトと整合させる。
- 参考スコア(独自算出の注目度): 2.3974223785103166
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Congenital heart defect (CHD) detection in ultrasound videos is hindered by image noise and probe positioning variability. While automated methods can reduce operator dependence, current machine learning approaches often neglect temporal information, limit themselves to binary classification, and do not account for prediction calibration. We propose Temporal Prompt Alignment (TPA), a method leveraging foundation image-text model and prompt-aware contrastive learning to classify fetal CHD on cardiac ultrasound videos. TPA extracts features from each frame of video subclips using an image encoder, aggregates them with a trainable temporal extractor to capture heart motion, and aligns the video representation with class-specific text prompts via a margin-hinge contrastive loss. To enhance calibration for clinical reliability, we introduce a Conditional Variational Autoencoder Style Modulation (CVAESM) module, which learns a latent style vector to modulate embeddings and quantifies classification uncertainty. Evaluated on a private dataset for CHD detection and on a large public dataset, EchoNet-Dynamic, for systolic dysfunction, TPA achieves state-of-the-art macro F1 scores of 85.40% for CHD diagnosis, while also reducing expected calibration error by 5.38% and adaptive ECE by 6.8%. On EchoNet-Dynamic's three-class task, it boosts macro F1 by 4.73% (from 53.89% to 58.62%). Temporal Prompt Alignment (TPA) is a framework for fetal congenital heart defect (CHD) classification in ultrasound videos that integrates temporal modeling, prompt-aware contrastive learning, and uncertainty quantification.
- Abstract(参考訳): 超音波ビデオにおける先天性心不全(CHD)の検出は、画像ノイズとプローブ位置決めのばらつきによって妨げられる。
自動化された手法は演算子の依存を減らすことができるが、現在の機械学習アプローチは時間的情報を無視し、それらを二分分類に制限し、予測校正を考慮しない。
心エコービデオにおける胎児のCHDを分類するために,基礎画像テキストモデルと即時コントラスト学習を利用した時間的プロンプトアライメント(TPA)を提案する。
TPAは、画像エンコーダを用いて、ビデオサブクリップの各フレームから特徴を抽出し、トレーニング可能な時間的抽出器でそれらを集約して心臓の動きを捉え、その映像表現とクラス固有のテキストプロンプトとをマージン・ヒンジのコントラッシブ・ロスで整合させる。
臨床信頼性を高めるために,条件付き変分オートエンコーダスタイル変調(CVAESM)モジュールを導入し,埋め込みを変調し,分類の不確かさを定量化する潜伏型ベクトルを学習した。
CHD検出のためのプライベートデータセットと、シストリック障害のための大規模なパブリックデータセットであるEchoNet-Dynamicに基づいて評価され、TPAはCHD診断のための最先端マクロF1スコア85.40%を達成し、予測キャリブレーション誤差を5.38%、適応ECEを6.8%削減した。
EchoNet-Dynamicの3クラスタスクでは、マクロF1を4.73%向上させる(53.89%から58.62%に)。
TPA(Temporal Prompt Alignment)は、超音波ビデオにおける胎児先天性心不全(CHD)分類のためのフレームワークである。
関連論文リスト
- ECG Latent Feature Extraction with Autoencoders for Downstream Prediction Tasks [2.2616169634370076]
心電図(Electrocardiogram、ECG)は、安価で広く用いられる心臓評価用ツールである。
標準化されたフォーマットと小さなファイルサイズにもかかわらず、ECG信号の複雑さと個人間変動は、ディープラーニングモデルでの使用を困難にしている。
本研究は,代表的ビート心電図から特徴生成手法を探索することにより,これらの課題に対処する。
本稿では,3つの新しい変分自動エンコーダ(VAE)-Stochastic Autoencoder (SAE), Annealed beta-VAE (A beta-VAE), Cyclical beta VAE (C beta-VAE)を導入し,それらの維持効果を比較した。
論文 参考訳(メタデータ) (2025-07-31T19:37:05Z) - UltraAD: Fine-Grained Ultrasound Anomaly Classification via Few-Shot CLIP Adaptation [39.48115172323913]
視覚言語モデル(VLM)に基づく,異常な局所化ときめ細かい分類のためのアプローチであるUltraADを提案する。
UltraADは乳房の3つのデータセットで広く評価されており、病変のデータセットと微細な医学的分類の両方において最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2025-06-24T15:00:38Z) - Reliable Multi-View Learning with Conformal Prediction for Aortic Stenosis Classification in Echocardiography [6.540741143328299]
得られた画像は、しばしば3次元解剖学の2次元断面であり、重要な解剖学的詳細を欠いている可能性がある。
トレーニングセット内の弱い情報入力に不確実性を導入するデータ中心の手法であるRe-Training for Uncertainty (RT4U)を提案する。
共形予測技術と組み合わせると、RT4Uは、基底真理クラスを含むことが保証される適応的な大きさの予測セットを高精度に得ることができる。
論文 参考訳(メタデータ) (2024-09-15T10:06:06Z) - Interpretable cancer cell detection with phonon microscopy using multi-task conditional neural networks for inter-batch calibration [39.759100498329275]
本稿では,バッチ間キャリブレーションを同時に実現する条件付きニューラルネットワークフレームワークを提案する。
異なる実験バッチをトレーニングし、検証することで、我々のアプローチを検証する。
このモデルを拡張して, 診断信号の再構成を行い, 疾患状態を示す有能な特徴の物理的解釈を可能にした。
論文 参考訳(メタデータ) (2024-03-26T12:20:10Z) - Automated interpretation of congenital heart disease from multi-view
echocardiograms [10.238433789459624]
先天性心疾患(CHD)は、中国で最も多い出生障害であり、新生児死亡の原因となっている。
本研究では,多視点心エコー図を実用的エンドツーエンドのフレームワークで自動解析する手法を提案する。
論文 参考訳(メタデータ) (2023-11-30T18:37:21Z) - Improving Diffusion Models for ECG Imputation with an Augmented Template
Prior [43.6099225257178]
ノイズと品質の悪い録音は、モバイルヘルスシステムを使って収集された信号にとって大きな問題である。
近年の研究では、確率的時系列モデルによるECGの欠落値の計算が検討されている。
本稿では,様々な健康状態の事前情報として,テンプレート誘導型拡散確率モデル(DDPM)PulseDiffを提案する。
論文 参考訳(メタデータ) (2023-10-24T11:34:15Z) - Unsupervised sequence-to-sequence learning for automatic signal quality
assessment in multi-channel electrical impedance-based hemodynamic monitoring [0.6875312133832077]
本研究では,血行動態モニタリングにおける心臓容積信号(CVS)の運動誘発信頼性を自動的に評価する,教師なしシーケンス・ツー・シーケンス学習手法を提案する。
エンコーダ・デコーダモデルは、CVSの入力シーケンスを自己複製するだけでなく、並列的に未来を推定するために訓練される。
トレーニングセット上の親指の2シグマ規則から決定されるカットオフ値で入力シーケンスとその神経表現間の残差に基づいて、低品質の動作影響CVSを検出する。
論文 参考訳(メタデータ) (2023-05-16T11:52:06Z) - DopUS-Net: Quality-Aware Robotic Ultrasound Imaging based on Doppler
Signal [48.97719097435527]
DopUS-Netはドップラー画像とBモード画像を組み合わせることで、小血管のセグメンテーション精度と堅牢性を高める。
動脈再同定モジュールは、リアルタイムセグメンテーション結果を質的に評価し、拡張ドップラー画像に対するプローブポーズを自動的に最適化する。
論文 参考訳(メタデータ) (2023-05-15T18:19:29Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。