論文の概要: DNP-Guided Contrastive Reconstruction with a Reverse Distillation Transformer for Medical Anomaly Detection
- arxiv url: http://arxiv.org/abs/2508.19573v1
- Date: Wed, 27 Aug 2025 05:12:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-28 19:07:41.498369
- Title: DNP-Guided Contrastive Reconstruction with a Reverse Distillation Transformer for Medical Anomaly Detection
- Title(参考訳): DNP-Guided Contrastive Reconstruction with a Reverse Distillation Transformer for Medical Anomaly Detection (特集:DNP-Guided Contrastive Reconstruction)
- Authors: Luhu Li, Bowen Lin, Mukhtiar Khan, Shujun Fu,
- Abstract要約: 医用画像の異常検出は、アノテーションが限られており、自然な画像に比べてドメインギャップが小さいため困難である。
既存の再構成手法は、しばしば凍結した事前訓練されたエンコーダに依存し、ドメイン固有の特徴への適応を制限する。
本稿では,訓練可能なエンコーダとプロトタイプ誘導型再構成を組み合わせた統一的なフレームワークと,ダイバーシティ・アウェア・アライメント・ロス(Diversity-Aware Alignment Loss)を提案する。
- 参考スコア(独自算出の注目度): 1.0924595442390774
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anomaly detection in medical images is challenging due to limited annotations and a domain gap compared to natural images. Existing reconstruction methods often rely on frozen pre-trained encoders, which limits adaptation to domain-specific features and reduces localization accuracy. Prototype-based learning offers interpretability and clustering benefits but suffers from prototype collapse, where few prototypes dominate training, harming diversity and generalization. To address this, we propose a unified framework combining a trainable encoder with prototype-guided reconstruction and a novel Diversity-Aware Alignment Loss. The trainable encoder, enhanced by a momentum branch, enables stable domain-adaptive feature learning. A lightweight Prototype Extractor mines informative normal prototypes to guide the decoder via attention for precise reconstruction. Our loss enforces balanced prototype use through diversity constraints and per-prototype normalization, effectively preventing collapse. Experiments on multiple medical imaging benchmarks show significant improvements in representation quality and anomaly localization, outperforming prior methods. Visualizations and prototype assignment analyses further validate the effectiveness of our anti-collapse mechanism and enhanced interpretability.
- Abstract(参考訳): 医用画像の異常検出は、アノテーションが限られており、自然な画像に比べてドメインギャップが小さいため困難である。
既存の再構成手法は、しばしば凍結した事前訓練されたエンコーダに依存し、ドメイン固有の特徴への適応を制限し、ローカライゼーションの精度を低下させる。
プロトタイプベースの学習は、解釈可能性とクラスタリングの利点を提供するが、プロトタイプの崩壊に苦しむ。
そこで本研究では,トレーニング可能なエンコーダとプロトタイプ誘導型再構成と,新たなダイバーシティ・アウェア・アライメント・ロスを組み合わせた統合フレームワークを提案する。
トレーニング可能なエンコーダは運動量分岐によって強化され、安定したドメイン適応型特徴学習を可能にする。
軽量のプロトタイプ・エクストラクターは、正確な復元のためにデコーダを注意して誘導するために、情報的な通常のプロトタイプをマイニングする。
我々の損失は、多様性の制約と原型ごとの正規化を通じて、バランスの取れたプロトタイプの使用を強制し、事実上崩壊を防ぎます。
複数の医用画像ベンチマークの実験では、表現品質と異常な局所化が大幅に改善され、先行手法よりも優れていた。
可視化とプロトタイプの割り当て分析により, 抗崩壊機構の有効性がさらに検証され, 解釈可能性も向上した。
関連論文リスト
- Pro-AD: Learning Comprehensive Prototypes with Prototype-based Constraint for Multi-class Unsupervised Anomaly Detection [8.358250148845572]
教師なし異常検出のためのプロトタイプベースの再構成手法は、学習可能なプロトタイプの限られたセットを利用する。
本稿では,これらの問題に対処するPro-ADを提案し,そのプロトタイプを完全活用して異常検出性能を向上する。
当社のPro-ADは,マルチクラス非教師付き異常検出タスクにおいて,優れたロバスト性および実用性を示し,最先端性能を実現している。
論文 参考訳(メタデータ) (2025-06-16T05:04:12Z) - Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection [58.87142367781417]
航法的に訓練された検出器は、限定的で単調な偽のパターンに過度に適合する傾向にあり、特徴空間は高度に制約され、低ランクになる。
潜在的な治療法の1つは、ビジョンファウンデーションモデルに事前訓練された知識を取り入れて、機能領域を広げることである。
主要なコンポーネントを凍結し、残ったコンポーネントのみを適用することで、フェイクパターンを学習しながら、トレーニング済みの知識を保存します。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - ReContrast: Domain-Specific Anomaly Detection via Contrastive
Reconstruction [29.370142078092375]
殆どの高度な教師なし異常検出(UAD)手法は、大規模データセットで事前訓練された冷凍エンコーダネットワークの特徴表現をモデル化することに依存している。
本稿では,事前学習した画像領域に対するバイアスを低減するために,ネットワーク全体を最適化する新しい疫学的UAD手法であるReContrastを提案する。
2つの一般的な産業欠陥検出ベンチマークと3つの医用画像UADタスクで実験を行い、現在の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-05T05:21:15Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。