論文の概要: Self-Navigated Residual Mamba for Universal Industrial Anomaly Detection
- arxiv url: http://arxiv.org/abs/2508.01591v1
- Date: Sun, 03 Aug 2025 05:07:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:21.957252
- Title: Self-Navigated Residual Mamba for Universal Industrial Anomaly Detection
- Title(参考訳): ユニバーサル産業異常検出のための自己誘導型残留マンバ
- Authors: Hanxi Li, Jingqi Wu, Lin Yuanbo Wu, Mingliang Li, Deyin Liu, Jialie Shen, Chunhua Shen,
- Abstract要約: SNARM (Self-Navigated Residual Mamba) は,産業用アノマリー検出のための新しいフレームワークである。
SNARMは、テストパッチを適応的に選択された画像内参照と比較することにより、異常検出を反復的に洗練する。
MVTec AD、MVTec 3D、VisAベンチマークの実験では、SNARMがSOTA(State-of-the-art)のパフォーマンスを達成した。
- 参考スコア(独自算出の注目度): 42.42739543127113
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we propose Self-Navigated Residual Mamba (SNARM), a novel framework for universal industrial anomaly detection that leverages ``self-referential learning'' within test images to enhance anomaly discrimination. Unlike conventional methods that depend solely on pre-trained features from normal training data, SNARM dynamically refines anomaly detection by iteratively comparing test patches against adaptively selected in-image references. Specifically, we first compute the ``inter-residuals'' features by contrasting test image patches with the training feature bank. Patches exhibiting small-norm residuals (indicating high normality) are then utilized as self-generated reference patches to compute ``intra-residuals'', amplifying discriminative signals. These inter- and intra-residual features are concatenated and fed into a novel Mamba module with multiple heads, which are dynamically navigated by residual properties to focus on anomalous regions. Finally, AD results are obtained by aggregating the outputs of a self-navigated Mamba in an ensemble learning paradigm. Extensive experiments on MVTec AD, MVTec 3D, and VisA benchmarks demonstrate that SNARM achieves state-of-the-art (SOTA) performance, with notable improvements in all metrics, including Image-AUROC, Pixel-AURC, PRO, and AP.
- Abstract(参考訳): 本稿では,テスト画像中の「自己参照学習」を活用して異常識別を強化する,ユニバーサルな産業異常検出のための新しいフレームワークであるSNARMを提案する。
通常のトレーニングデータから事前訓練された特徴にのみ依存する従来の方法とは異なり、SNARMは、適応的に選択された画像内参照に対してテストパッチを反復的に比較することにより、異常検出を動的に洗練する。
具体的には、まず、テストイメージパッチとトレーニング機能バンクを対比して ``inter-residuals'' 機能を計算します。
その後、低ノルム残差を示すパッチ(高正規度を示す)を自己生成参照パッチとして使用して `intra-residuals'' を計算し、識別シグナルを増幅する。
これらの内部および内部の特徴は連結され、複数の頭部を持つ新しいマンバモジュールに供給され、異常領域に焦点を合わせるために残留特性によって動的にナビゲートされる。
最後に、自己ナビゲートされたマンバの出力をアンサンブル学習パラダイムで集約してAD結果を得る。
MVTec AD、MVTec 3D、VisAベンチマークに関する大規模な実験では、SNARMが最新技術(SOTA)のパフォーマンスを達成しており、Image-AUROC、Pixel-AURC、PRO、APを含むすべてのメトリクスが顕著に改善されている。
関連論文リスト
- INP-Former++: Advancing Universal Anomaly Detection via Intrinsic Normal Prototypes and Residual Learning [4.40689369060115]
異常検出は産業検査や診断に不可欠である。
既存のメソッドは通常、トレーニングセットからの通常の参照と比較する'テストイメージに依存します。
Intrinsic Normal Prototypes(INP)を直接抽出する新しい手法であるINP-Formerを提案する。
論文 参考訳(メタデータ) (2025-06-04T07:49:11Z) - DPU: Dynamic Prototype Updating for Multimodal Out-of-Distribution Detection [10.834698906236405]
機械学習モデルの堅牢性を保証するためには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
マルチモーダルモデルの最近の進歩は、検出性能を高めるために複数のモダリティを活用する可能性を示している。
マルチモーダルOOD検出のための新しいプラグイン・アンド・プレイフレームワークであるDynamic Prototype Updating (DPU)を提案する。
論文 参考訳(メタデータ) (2024-11-12T22:43:16Z) - PseudoNeg-MAE: Self-Supervised Point Cloud Learning using Conditional Pseudo-Negative Embeddings [55.55445978692678]
PseudoNeg-MAEは、ポイントクラウドマスマスキングオートエンコーダのグローバルな特徴表現を強化する。
本研究では,ネットワークが識別的表現を保ちながら,よりリッチな変換キューをキャプチャできる新たな損失を提案する。
論文 参考訳(メタデータ) (2024-09-24T07:57:21Z) - AUPIMO: Redefining Visual Anomaly Detection Benchmarks with High Speed and Low Tolerance [0.562479170374811]
Per-IMage Overlap(PIMO)は、AUROCとAUPROの欠点に対処する新しいメトリクスである。
画像ごとのリコールの測定は、計算を単純化し、ノイズの多いアノテーションに対してより堅牢である。
実験の結果,PIMOは実用的優位性があり,性能の見識に乏しいことがわかった。
論文 参考訳(メタデータ) (2024-01-03T21:24:44Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Generalizable Industrial Visual Anomaly Detection with Self-Induction
Vision Transformer [5.116033262865781]
産業用視覚異常検出・局所化のための自己誘導型視覚変換器(SIVT)を提案する。
提案したSIVTは、まず、事前学習したCNNからプロパティ記述子として識別特徴を抽出し、抽出した特徴を自己監督的に再構成する。
その結果,AUROCでは2.8-6.3,APでは3.3-7.6の改善により,最先端検出性能を向上できることがわかった。
論文 参考訳(メタデータ) (2022-11-22T14:56:12Z) - Self-Supervised Masked Convolutional Transformer Block for Anomaly
Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。
本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文 参考訳(メタデータ) (2022-09-25T04:56:10Z) - PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and
Localization [64.39761523935613]
本稿では,画像中の異常を同時検出・ローカライズするPatch Distribution Modeling, PaDiMを提案する。
PaDiMは、パッチの埋め込みに事前訓練された畳み込みニューラルネットワーク(CNN)を使用している。
また、CNNの異なるセマンティックレベル間の相関を利用して、異常のローカライズも改善している。
論文 参考訳(メタデータ) (2020-11-17T17:29:18Z) - Improved Slice-wise Tumour Detection in Brain MRIs by Computing
Dissimilarities between Latent Representations [68.8204255655161]
磁気共鳴画像(MRI)の異常検出は教師なし手法で行うことができる。
本研究では,変分オートエンコーダの潜伏空間における相似関数の計算に基づいて,腫瘍検出のためのスライスワイズ半教師法を提案する。
本研究では,高解像度画像上でのモデルをトレーニングし,再現の質を向上させることにより,異なるベースラインに匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2020-07-24T14:02:09Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。