論文の概要: MadCLIP: Few-shot Medical Anomaly Detection with CLIP
- arxiv url: http://arxiv.org/abs/2506.23810v1
- Date: Mon, 30 Jun 2025 12:56:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:54.062555
- Title: MadCLIP: Few-shot Medical Anomaly Detection with CLIP
- Title(参考訳): MadCLIP:CLIPによる数発の医用異常検出
- Authors: Mahshid Shiri, Cigdem Beyan, Vittorio Murino,
- Abstract要約: 医療データに事前訓練されたCLIPモデルを活用する,革新的な数発の異常検出手法を提案する。
学習可能なアダプタを用いて,正常な特徴と異常な特徴を別々に捉えるために,デュアルブランチ設計を提案する。
セマンティックアライメントを改善するために、学習可能なテキストプロンプトを使用して視覚的特徴をリンクする。
- 参考スコア(独自算出の注目度): 14.023527193608142
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: An innovative few-shot anomaly detection approach is presented, leveraging the pre-trained CLIP model for medical data, and adapting it for both image-level anomaly classification (AC) and pixel-level anomaly segmentation (AS). A dual-branch design is proposed to separately capture normal and abnormal features through learnable adapters in the CLIP vision encoder. To improve semantic alignment, learnable text prompts are employed to link visual features. Furthermore, SigLIP loss is applied to effectively handle the many-to-one relationship between images and unpaired text prompts, showcasing its adaptation in the medical field for the first time. Our approach is validated on multiple modalities, demonstrating superior performance over existing methods for AC and AS, in both same-dataset and cross-dataset evaluations. Unlike prior work, it does not rely on synthetic data or memory banks, and an ablation study confirms the contribution of each component. The code is available at https://github.com/mahshid1998/MadCLIP.
- Abstract(参考訳): 画像レベルの異常分類(AC)と画素レベルの異常セグメンテーション(AS)の両方に適応し,事前訓練したCLIPモデルを医療データに活用する,革新的な数発の異常検出手法を提案する。
CLIPビジョンエンコーダの学習可能なアダプタを用いて,正常な特徴と異常な特徴を別々にキャプチャする二分岐設計を提案する。
セマンティックアライメントを改善するために、学習可能なテキストプロンプトを使用して視覚的特徴をリンクする。
さらに、SigLIP損失を適用し、画像と未ペアテキストプロンプトの多対一関係を効果的に処理し、その医療分野への適応を初めて示す。
提案手法は複数モードで検証され,ACとASの既存手法よりも高い性能を示す。
以前の研究とは異なり、合成データやメモリバンクに依存しておらず、アブレーション研究では各コンポーネントの寄与を確認している。
コードはhttps://github.com/mahshid1998/MadCLIPで入手できる。
関連論文リスト
- AdaptCLIP: Adapting CLIP for Universal Visual Anomaly Detection [39.72202031440292]
普遍的な視覚異常検出は、新しい視覚領域や見えない視覚領域からの異常を、追加の微調整なしで識別することを目的としている。
近年の研究では、CLIPのような事前学習された視覚言語モデルは、ゼロまたは少数の正常な画像で強力な一般化を示すことが示されている。
本稿では2つの重要な洞察に基づいて,AdaptCLIPと呼ばれるシンプルで効果的な手法を提案する。
論文 参考訳(メタデータ) (2025-05-15T03:24:28Z) - Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections [50.343419243749054]
異常検出(AD)は、通常のデータ分布から逸脱を識別する。
本稿では,視覚エンコーダから抽出した画像コンテキストに基づいて,テキストエンコーダのプロンプトを条件付ける手法を提案する。
提案手法は,14のデータセットにおいて,各メトリクスに対して2%から29%の性能向上を実現している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - CLIP-FSAC++: Few-Shot Anomaly Classification with Anomaly Descriptor Based on CLIP [22.850815902535988]
筆者らは,CLIP-FSAC++と呼ばれる一段階の訓練を施した効果的な数ショット異常分類フレームワークを提案する。
異常記述子では、画像からテキストへのクロスアテンションモジュールを使用して、画像固有のテキスト埋め込みを得る。
その結果,VisAおよびMVTEC-ADを1, 2, 4, 8ショット設定で非正規ショット異常分類し,本手法の総合的な評価実験を行った。
論文 参考訳(メタデータ) (2024-12-05T02:44:45Z) - C2P-CLIP: Injecting Category Common Prompt in CLIP to Enhance Generalization in Deepfake Detection [98.34703790782254]
本稿では、カテゴリ共通プロンプトCLIPを紹介し、カテゴリ共通プロンプトをテキストエンコーダに統合し、カテゴリ関連概念をイメージエンコーダに注入する。
提案手法は,テスト中に追加パラメータを導入することなく,元のCLIPと比較して検出精度が12.41%向上した。
論文 参考訳(メタデータ) (2024-08-19T02:14:25Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - VadCLIP: Adapting Vision-Language Models for Weakly Supervised Video
Anomaly Detection [58.47940430618352]
弱教師付きビデオ異常検出(WSVAD)のための新しいパラダイムであるVadCLIPを提案する。
VadCLIPは、CLIPの強度に関する視覚と言語の間のきめ細かい関連をフル活用している。
本稿では,VadCLIPが粗粒度および細粒度 WSVAD の両面において最高の性能を発揮することを示す。
論文 参考訳(メタデータ) (2023-08-22T14:58:36Z) - AMAE: Adaptation of Pre-Trained Masked Autoencoder for Dual-Distribution
Anomaly Detection in Chest X-Rays [17.91123470181453]
我々は、事前訓練されたマスク付きオートエンコーダ(MAE)の適応のための2段階アルゴリズムであるAMAEを提案する。
AMAEは、競合する自己監督型および二重分布異常検出法よりも一貫した性能向上をもたらす。
論文 参考訳(メタデータ) (2023-07-24T12:03:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。