論文の概要: SubspaceAD: Training-Free Few-Shot Anomaly Detection via Subspace Modeling
- arxiv url: http://arxiv.org/abs/2602.23013v1
- Date: Thu, 26 Feb 2026 13:52:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.710149
- Title: SubspaceAD: Training-Free Few-Shot Anomaly Detection via Subspace Modeling
- Title(参考訳): SubspaceAD:サブスペースモデリングによるトレーニング不要なFew-Shot異常検出
- Authors: Camile Lendering, Erkut Akdag, Egor Bondarev,
- Abstract要約: SubspaceADは、産業画像の視覚異常を検出するトレーニング不要の方法である。
トレーニング、即時チューニング、メモリバンクなしでワンショット、数ショットの設定で動作します。
MVTec-ADデータセットで98.0%、97.6%、VisAデータセットで93.3%、98.3%の画像レベルとピクセルレベルのAUROCを実現している。
- 参考スコア(独自算出の注目度): 6.476948781728136
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting visual anomalies in industrial inspection often requires training with only a few normal images per category. Recent few-shot methods achieve strong results employing foundation-model features, but typically rely on memory banks, auxiliary datasets, or multi-modal tuning of vision-language models. We therefore question whether such complexity is necessary given the feature representations of vision foundation models. To answer this question, we introduce SubspaceAD, a training-free method, that operates in two simple stages. First, patch-level features are extracted from a small set of normal images by a frozen DINOv2 backbone. Second, a Principal Component Analysis (PCA) model is fit to these features to estimate the low-dimensional subspace of normal variations. At inference, anomalies are detected via the reconstruction residual with respect to this subspace, producing interpretable and statistically grounded anomaly scores. Despite its simplicity, SubspaceAD achieves state-of-the-art performance across one-shot and few-shot settings without training, prompt tuning, or memory banks. In the one-shot anomaly detection setting, SubspaceAD achieves image-level and pixel-level AUROC of 98.0% and 97.6% on the MVTec-AD dataset, and 93.3% and 98.3% on the VisA dataset, respectively, surpassing prior state-of-the-art results. Code and demo are available at https://github.com/CLendering/SubspaceAD.
- Abstract(参考訳): 産業検査における視覚異常の検出には,各カテゴリごとの正常な画像のみをトレーニングする必要がある場合が多い。
最近の数ショット法は、基礎モデルの特徴を用いた強力な結果が得られるが、一般的にはメモリバンク、補助データセット、視覚言語モデルのマルチモーダルチューニングに依存している。
したがって、視覚基盤モデルの特徴表現を考えると、そのような複雑さが必要とされるかどうかを問う。
この問題に対処するために,2つの簡単な段階で動作するトレーニングフリーな方法であるSubspaceADを紹介した。
まず、パッチレベルの特徴は、凍結したDINOv2バックボーンによって、小さな通常の画像から抽出される。
第2に、主成分分析(PCA)モデルがこれらの特徴に適合し、正規変動の低次元部分空間を推定する。
推測では、この部分空間に対する再構成残差によって異常が検出され、解釈可能で統計的に根拠付けられた異常スコアが生成される。
その単純さにもかかわらず、SubspaceADはトレーニング、即時チューニング、メモリバンクなしで、ワンショットおよび数ショット設定で最先端のパフォーマンスを達成する。
ワンショット異常検出設定において、SubspaceADはMVTec-ADデータセットで98.0%、97.6%、VisAデータセットで93.3%、98.3%の画像レベルAUROCを達成した。
コードとデモはhttps://github.com/CLendering/SubspaceAD.comで公開されている。
関連論文リスト
- Training Free Zero-Shot Visual Anomaly Localization via Diffusion Inversion [15.486565360380203]
Zero-Shot Image Anomaly Detection (ZSAD)は、ターゲットデータの通常のトレーニングサンプルにアクセスすることなく、異常を検出し、ローカライズすることを目的としている。
最近のアプローチでは、局所化のためのきめ細かいプロンプトを生成するために、言語のような追加のモダリティを活用している。
我々は、きめ細かいプロンプトの必要性を回避するために、トレーニングフリーなビジョンオンリーのZSADフレームワークを導入する。
論文 参考訳(メタデータ) (2026-01-12T21:55:31Z) - Few-Shot Pattern Detection via Template Matching and Regression [52.79291493477272]
本稿では,テンプレートマッチングと回帰に基づく簡易かつ効果的な検出器TMRを提案する。
凍結したバックボーンの上に少数の学習可能な畳み込み層や投射層を持つ最小限の構造を通して、経験者の空間的レイアウトを効果的に保存し、活用する。
提案手法は, RPINE, FSCD-147, FSCD-LVISの3つのベンチマークにおける最先端手法よりも優れ, クロスデータセット評価において強い一般化を示す。
論文 参考訳(メタデータ) (2025-08-25T03:52:42Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - CRADL: Contrastive Representations for Unsupervised Anomaly Detection
and Localization [2.8659934481869715]
医用画像における教師なし異常検出は、訓練中に異常データを必要とせず、任意の異常を検出し、位置決めすることを目的としている。
現在の最先端の手法のほとんどは、画像上で直接動作する潜在変数生成モデルを使用している。
コントラストプレテクストタスクで訓練されたエンコーダの低次元表現空間において,正規サンプルの分布を直接モデル化するCRADLを提案する。
論文 参考訳(メタデータ) (2023-01-05T16:07:49Z) - Y-GAN: Learning Dual Data Representations for Efficient Anomaly
Detection [0.0]
本稿では,Y-GANと呼ばれる新しい再構成モデルを提案する。
モデルはY字型のオートエンコーダで構成され、2つの別々の潜在空間の画像を表現している。
論文 参考訳(メタデータ) (2021-09-28T20:17:04Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z) - CutPaste: Self-Supervised Learning for Anomaly Detection and
Localization [59.719925639875036]
通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。
まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。
MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。
論文 参考訳(メタデータ) (2021-04-08T19:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。