論文の概要: HiMatch-AD: DINOv3-driven Hierarchical Matching for Training-free Medical Anomaly Detection
- arxiv url: http://arxiv.org/abs/2606.22556v1
- Date: Sun, 21 Jun 2026 15:26:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 21:36:21.098853
- Title: HiMatch-AD: DINOv3-driven Hierarchical Matching for Training-free Medical Anomaly Detection
- Title(参考訳): HiMatch-AD:DINOv3による非トレーニング型医療異常検出のための階層的マッチング
- Authors: Jiayu Huo, Jingyuan Hong, Meng Zhou, Liyun Chen, Le Zhang,
- Abstract要約: HiMatch-ADは、DINOv3によるトレーニングフリーな医療異常検出のための階層的マッチングフレームワークである。
信頼性に応じて地図を適応的に重み付けする統一的不確実性に基づく融合機構を導入する。
脳MRI、肝CT、網膜OCTデータセットを含むBMADベンチマークの実験は、HiMatch-ADがトレーニングベースとDINOベースの最先端の手法の両方を一貫して上回っていることを示した。
- 参考スコア(独自算出の注目度): 6.789086317935452
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Anomaly detection is essential for medical image analysis, where pathological regions often appear as rare deviations from normal anatomical structures. While training-based methods have achieved promising performance, they require task-specific optimization and extensive normal data, which limits scalability across modalities and institutions. Training-free approaches offer greater flexibility by leveraging pretrained visual representations, yet existing methods typically rely on simple nearest-neighbor retrieval and naive aggregation strategies, which may fail to capture hierarchical semantics and ignore the reliability of multiple anomaly responses. In this work, we propose HiMatch-AD, a DINOv3-driven hierarchical matching framework for training-free medical anomaly detection. Our method first retrieves semantically relevant normal references via dual-branch matching that jointly considers global CLS-token similarity and patch-level representations. Hierarchical anomaly maps are then generated across multiple transformer stages by comparing clustered normal features with query representations. To robustly aggregate anomaly responses, we introduce a unified uncertainty-based fusion mechanism that adaptively weights maps according to their reliability. The entire framework operates without any task-specific training. Extensive experiments on the BMAD benchmark, including brain MRI, liver CT, and retinal OCT datasets, demonstrate that HiMatch-AD consistently outperforms both training-based and DINO-based state-of-the-art methods, which highlights the effectiveness of multi-level matching and uncertainty-aware fusion for scalable medical anomaly detection.
- Abstract(参考訳): 画像診断には異常検出が不可欠であり, 病理領域は正常な解剖学的構造から希少な偏差として現れることが多い。
トレーニングベースの手法は有望なパフォーマンスを達成したが、それらはタスク固有の最適化と広範な正規データを必要とし、モダリティや機関間のスケーラビリティを制限している。
トレーニングなしのアプローチは、事前訓練された視覚的表現を活用することで、より柔軟性を提供するが、既存の手法は、通常、単純な最寄りの検索と、階層的なセマンティクスをキャプチャできず、複数の異常応答の信頼性を無視する、ナイーブな集約戦略に依存している。
本研究では,DINOv3による非トレーニング型医療異常検出のための階層的マッチングフレームワークであるHiMatch-ADを提案する。
提案手法はまず,グローバルなCLS-token類似性やパッチレベルの表現を共同で検討するデュアルブランチマッチングを用いて,意味論的に関係のある正規参照を検索する。
階層的異常写像は、クラスタ化された正規特徴とクエリ表現を比較することで、複数のトランスフォーマーステージにまたがって生成される。
異常応答を頑健に集約するために,信頼性に応じてマップを適応的に重み付けする統一的不確実性に基づく融合機構を導入する。
フレームワーク全体がタスク固有のトレーニングなしで動作します。
脳MRI、肝CT、網膜CTデータセットを含むBMADベンチマークの大規模な実験は、HiMatch-ADがトレーニングベースとDINOベースの最先端の手法の両方を一貫して上回ることを示した。
関連論文リスト
- Resilient Vision-Tabular Multimodal Learning under Modality Missingness [1.696842238811138]
マルチモーダルディープラーニングは医療応用において大きな可能性を秘めている。
既存のアプローチの多くは、完全にモダリティの可用性を暗黙的に仮定している。
共同視覚・タブラリ学習のためのマルチモーダルトランスフォーマーフレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-12T12:14:13Z) - SPEGC: Continual Test-Time Adaptation via Semantic-Prompt-Enhanced Graph Clustering for Medical Image Segmentation [12.0982298854338]
Continual Test-Time Adaptation (CTTA)は、トレーニング済みのモデルが、ラベルなしドメインの継続的な変更に適応できるようにすることを目的としている。
医用画像セグメンテーションのためのセマンティック・プロンプト拡張グラフクラスタリング(SPEGC)によるCTTAを提案する。
論文 参考訳(メタデータ) (2026-03-12T03:22:43Z) - AnyAD: Unified Any-Modality Anomaly Detection in Incomplete Multi-Sequence MRI [16.227149608640477]
本稿では,任意のMRIモダリティ・アベイラビリティの下で,ロバストな異常検出と局所化を行う,Any-Modality 異常検出フレームワークを提案する。
Intrinsic Normal Prototypes (INPs) extractorとINP-guided Decoderを導入し、正常な解剖学的パターンのみを再構成し、異常な偏差を自然に増幅する。
我々のアプローチは、7つのモダリティの組み合わせにまたがって、最先端の産業と医療のADベースラインを一貫して超越し、より優れた一般化を実現している。
論文 参考訳(メタデータ) (2025-12-24T16:16:09Z) - A Large Scale Benchmark for Test Time Adaptation Methods in Medical Image Segmentation [18.147151439410383]
テスト時間適応は、医用画像セグメンテーションにおける領域シフトを軽減するための有望なアプローチである。
MedSeg-TTAは7つの画像モダリティにまたがる20の適応手法を網羅したベンチマークである。
論文 参考訳(メタデータ) (2025-12-02T07:40:42Z) - Unified Unsupervised Anomaly Detection via Matching Cost Filtering [113.43366521994396]
教師なし異常検出(UAD)は、通常のトレーニングデータのみを用いて画像レベルの異常と画素レベルの異常を識別することを目的としている。
UADモデルの異常コスト量を補正するための汎用的なポストホック精錬フレームワークであるUnified Cost Filtering (UCF) を提案する。
論文 参考訳(メタデータ) (2025-10-03T03:28:18Z) - OCSVM-Guided Representation Learning for Unsupervised Anomaly Detection [1.0190194769786831]
Unsupervised Anomaly Detection (UAD) は、ラベル付きデータなしで異常を検出することを目的としている。
解析的に解ける一級SVMを用いて表現学習を緊密に結合する新しい手法を提案する。
このモデルは、MNIST-Cに基づく新しいベンチマークと、挑戦的な脳MRI微妙な病変検出タスクの2つのタスクで評価されている。
論文 参考訳(メタデータ) (2025-07-25T13:00:40Z) - CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection [49.11819337853632]
異常検出は、異常の定義の曖昧さ、異常型の多様性、トレーニングデータの不足による複雑な問題である。
識別的基盤モデルと生成的基礎モデルの両方を活用するCLIPfusionを提案する。
本手法は, 異常検出の多面的課題に対処する上で, マルチモーダル・マルチモデル融合の有効性を裏付けるものである。
論文 参考訳(メタデータ) (2025-06-13T13:30:15Z) - Cross-Attention is Not Enough: Incongruity-Aware Dynamic Hierarchical
Fusion for Multimodal Affect Recognition [69.32305810128994]
モダリティ間の同調性は、特に認知に影響を及ぼすマルチモーダル融合の課題となる。
本稿では,動的モダリティゲーティング(HCT-DMG)を用いた階層型クロスモーダルトランスを提案する。
HCT-DMG: 1) 従来のマルチモーダルモデルを約0.8Mパラメータで上回り、2) 不整合が認識に影響を及ぼすハードサンプルを認識し、3) 潜在レベルの非整合性をクロスモーダルアテンションで緩和する。
論文 参考訳(メタデータ) (2023-05-23T01:24:15Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。