論文の概要: CDPM-Align: Multi-Scale Guidance-Aligned Diffusion Pretraining for Robust Few-Shot Anatomical Landmark Detection
- arxiv url: http://arxiv.org/abs/2606.04898v1
- Date: Wed, 03 Jun 2026 13:59:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.799744
- Title: CDPM-Align: Multi-Scale Guidance-Aligned Diffusion Pretraining for Robust Few-Shot Anatomical Landmark Detection
- Title(参考訳): CDPM-Align:ロバストなFew-Shot 解剖学的ランドマーク検出のための多段階誘導型拡散準備訓練
- Authors: Roberto Di Via, Irina Voiculescu, Francesca Odone, Vito Paolo Pastore,
- Abstract要約: CDPMアライン(CDPM-align)は、解剖学的ランドマーク検出のためのマルチスケール誘導整合条件拡散事前トレーニングである。
我々は,条件付き生成事前学習による表現学習のために,多種多様な小型ベンチマークデータセットを3つ採用している。
その結果,生成前学習により,モデルが頑健な表現を学習できることが確認された。
- 参考スコア(独自算出の注目度): 7.205733158614911
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anatomical landmark detection is a fundamental task in medical image analysis supporting a wide range of diagnostic and interventional workflows. Although recent methods have achieved sub-millimetric localisation, accuracy alone is not sufficient for clinical deployment, requiring reliability and robustness in prediction. Despite its clinical relevance, the impact of representation learning in this context is still underexplored. In this work, we introduce CDPM-align, a multi-scale guidance-aligned conditional diffusion pre-training for anatomical landmark detection. Our experimental setup focuses on a few images and a few annotation regimes. Specifically, we employ three popular heterogeneous small-scale benchmark datasets for representation learning via conditional generative pre-training. Furthermore, we consider low-annotation scenarios for the downstream task of landmark detection, with 10 and 25 annotated images, reflecting realistic trade-offs between clinical effort and resource constraints for annotations. Our results confirm that generative pre-training enables the model to learn a robust representation. This improves both accuracy and uncertainty on the downstream tasks, advancing towards safe and efficient clinical deployment.
- Abstract(参考訳): 解剖学的ランドマーク検出は、幅広い診断および介入ワークフローをサポートする医療画像解析の基本的な課題である。
近年の方法ではサブミリメートルの局所化が達成されているが、精度だけでは臨床展開には不十分であり、予測には信頼性と堅牢性が必要である。
臨床的な関連性にもかかわらず、この文脈における表現学習の影響はいまだ過小評価されている。
本稿では,解剖学的ランドマーク検出のためのマルチスケール誘導整合条件拡散事前学習であるCDPM-alignを紹介する。
実験的なセットアップでは、いくつかのイメージといくつかのアノテーションレギュレーションに重点を置いています。
具体的には,条件付き生成事前学習による表現学習のために,多種多様な小型ベンチマークデータセットを3つ採用する。
さらに,10と25のアノテート画像を持つランドマーク検出の下流課題に対する低アノテーションシナリオについて考察し,臨床努力とアノテーションのリソース制約との現実的なトレードオフを反映した。
その結果,生成前学習により,モデルが頑健な表現を学習できることが確認された。
これにより、下流のタスクの正確性と不確実性の両方を改善し、安全で効率的な臨床展開に向けて前進する。
関連論文リスト
- Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding [72.18719355481052]
MRG(Messical Report Grounding)と呼ばれる新しい課題について紹介する。
MRGは医療報告から診断フレーズとその対応する接地箱を直接エンドツーエンドで識別することを目的としている。
マルチモーダルな大規模言語モデルを用いて診断フレーズを予測する,堅牢で信頼性の高いフレームワークである uMedGround を提案する。
論文 参考訳(メタデータ) (2024-04-10T07:41:35Z) - Deployment of Image Analysis Algorithms under Prevalence Shifts [6.373765910269204]
領域ギャップは、医療画像解析のための機械学習(ML)ベースのソリューションの臨床的翻訳において、最も関連する障害の一つである。
そこで本研究では,トレーニング済みの分類器を新しい環境に適応させるために,推定したデプロイメントの頻度を利用して精度の高い画像分類を行うワークフローを提案する。
論文 参考訳(メタデータ) (2023-03-22T13:16:37Z) - Real-time landmark detection for precise endoscopic submucosal
dissection via shape-aware relation network [51.44506007844284]
内視鏡下粘膜下郭清術における高精度かつリアルタイムなランドマーク検出のための形状認識型関係ネットワークを提案する。
まず,ランドマーク間の空間的関係に関する先行知識を直感的に表現する関係キーポイント・ヒートマップを自動生成するアルゴリズムを考案する。
次に、事前知識を学習プロセスに段階的に組み込むために、2つの補完的な正規化手法を開発する。
論文 参考訳(メタデータ) (2021-11-08T07:57:30Z) - A Deep Learning Approach to Predicting Collateral Flow in Stroke
Patients Using Radiomic Features from Perfusion Images [58.17507437526425]
側方循環は、血流を妥協した領域に酸素を供給する特殊な無酸素流路から生じる。
実際のグレーティングは主に、取得した画像の手動検査によって行われる。
MR灌流データから抽出した放射線学的特徴に基づいて,脳卒中患者の側方血流低下を予測するための深層学習手法を提案する。
論文 参考訳(メタデータ) (2021-10-24T18:58:40Z) - On the Practicality of Deterministic Epistemic Uncertainty [106.06571981780591]
決定論的不確実性法(DUM)は,分布外データの検出において高い性能を達成する。
DUMが十分に校正されており、現実のアプリケーションにシームレスにスケールできるかどうかは不明だ。
論文 参考訳(メタデータ) (2021-07-01T17:59:07Z) - Learn Fine-grained Adaptive Loss for Multiple Anatomical Landmark
Detection in Medical Images [15.7026400415269]
本稿ではランドマーク検出のための新しい学習学習フレームワークを提案する。
提案手法は汎用的であり,解剖学的ランドマーク検出の効率向上の可能性を示す。
論文 参考訳(メタデータ) (2021-05-19T13:39:18Z) - Cascaded Robust Learning at Imperfect Labels for Chest X-ray
Segmentation [61.09321488002978]
不完全アノテーションを用いた胸部X線分割のための新しいカスケードロバスト学習フレームワークを提案する。
モデルは3つの独立したネットワークから成り,ピアネットワークから有用な情報を効果的に学習できる。
提案手法は,従来の手法と比較して,セグメント化タスクの精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-04-05T15:50:16Z) - Cross-Task Representation Learning for Anatomical Landmark Detection [20.079451546446712]
本稿では,クロスタスク表現学習を通じて,ソースとターゲットタスク間の知識伝達を規則化することを提案する。
本手法は胎児アルコール症候群の診断を容易にする顔の解剖学的特徴を抽出するためのものである。
本稿では,目的モデル上の最終モデルの特徴と中間モデルの特徴を制約することにより,表現学習のための2つのアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-28T21:22:49Z) - Localization of Critical Findings in Chest X-Ray without Local
Annotations Using Multi-Instance Learning [0.0]
ディープラーニングモデルは説明責任の欠如に苦しむことが多い。
ディープラーニングモデルは、ピクセルレベルラベルやバウンディングボックス座標のような、局所的なアノテートされたトレーニングデータを必要とする。
本研究では,マルチインスタンス学習に基づく解釈可能なDLアルゴリズムを用いて,これらの欠点に対処する。
論文 参考訳(メタデータ) (2020-01-23T21:29:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。