論文の概要: MuSc: Zero-Shot Industrial Anomaly Classification and Segmentation with
Mutual Scoring of the Unlabeled Images
- arxiv url: http://arxiv.org/abs/2401.16753v1
- Date: Tue, 30 Jan 2024 05:16:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-31 16:07:00.169536
- Title: MuSc: Zero-Shot Industrial Anomaly Classification and Segmentation with
Mutual Scoring of the Unlabeled Images
- Title(参考訳): MuSc:無ラベル画像の相互表示によるゼロショット産業異常分類とセグメンテーション
- Authors: Xurui Li, Ziming Huang, Feng Xue, Yu Zhou
- Abstract要約: 産業ビジョンにおけるゼロショット異常分類(AC)とセグメンテーション(AS)について検討した。
我々は、識別特性を利用して、ラベルなし画像のMutual Scoring (MuSc) による新しいゼロショットAC/AS法を設計する。
本稿では,画像レベルの異常分類のためのRe-scoring with Constrained Image-level Neighborhood (RsCIN)という最適化手法を提案する。
- 参考スコア(独自算出の注目度): 12.48347948647802
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper studies zero-shot anomaly classification (AC) and segmentation
(AS) in industrial vision. We reveal that the abundant normal and abnormal cues
implicit in unlabeled test images can be exploited for anomaly determination,
which is ignored by prior methods. Our key observation is that for the
industrial product images, the normal image patches could find a relatively
large number of similar patches in other unlabeled images, while the abnormal
ones only have a few similar patches. We leverage such a discriminative
characteristic to design a novel zero-shot AC/AS method by Mutual Scoring
(MuSc) of the unlabeled images, which does not need any training or prompts.
Specifically, we perform Local Neighborhood Aggregation with Multiple Degrees
(LNAMD) to obtain the patch features that are capable of representing anomalies
in varying sizes. Then we propose the Mutual Scoring Mechanism (MSM) to
leverage the unlabeled test images to assign the anomaly score to each other.
Furthermore, we present an optimization approach named Re-scoring with
Constrained Image-level Neighborhood (RsCIN) for image-level anomaly
classification to suppress the false positives caused by noises in normal
images. The superior performance on the challenging MVTec AD and VisA datasets
demonstrates the effectiveness of our approach. Compared with the
state-of-the-art zero-shot approaches, MuSc achieves a $\textbf{21.1%}$ PRO
absolute gain (from 72.7% to 93.8%) on MVTec AD, a $\textbf{19.4%}$ pixel-AP
gain and a $\textbf{14.7%}$ pixel-AUROC gain on VisA. In addition, our
zero-shot approach outperforms most of the few-shot approaches and is
comparable to some one-class methods. Code is available at
https://github.com/xrli-U/MuSc.
- Abstract(参考訳): 本稿では,産業ビジョンにおけるゼロショット異常分類(AC)とセグメンテーション(AS)について検討する。
ラベルのないテスト画像に暗黙的に現れる異常な手がかりと異常な手がかりを,事前の手法では無視される異常判定に活用できることが判明した。
産業用製品のイメージでは、通常のイメージパッチは、他のラベルのないイメージに比較的多くの類似のパッチを見つけるが、異常なイメージは、いくつかの類似のパッチしか持たない。
このような識別特性を利用して、トレーニングやプロンプトを必要とせず、無ラベル画像の相互スコーリング(MuSc)による新しいゼロショットAC/AS法を設計する。
具体的には,様々な大きさの異常を表現できるパッチ特徴を得るために,多重度 (lnamd) の局所近傍アグリゲーションを行う。
次に,ラベルのないテスト画像を利用して互いに異常スコアを割り当てる相互得点機構(msm)を提案する。
さらに,画像レベルの異常分類のためのRe-scoring with Constrained Image-level Neighborhood (RsCIN)という最適化手法を提案する。
挑戦的なMVTec ADとVisAデータセットの優れたパフォーマンスは、我々のアプローチの有効性を示している。
最先端のゼロショットアプローチと比較して、MuScはMVTec AD上の$\textbf{21.1%}$ PRO絶対ゲイン(72.7%から93.8%)、$\textbf{19.4%}$ピクセルAPゲイン、$\textbf{14.7%}$ピクセルAUROCゲインを達成する。
さらに、ゼロショットアプローチは、いくつかのショットアプローチよりも優れており、いくつかのワンクラスのメソッドに匹敵する。
コードはhttps://github.com/xrli-U/MuSc.comで入手できる。
関連論文リスト
- FADE: Few-shot/zero-shot Anomaly Detection Engine using Large Vision-Language Model [0.9226774742769024]
製造業界における品質検査には,少ないショット・ゼロショット異常検出が重要である。
視覚言語CLIPモデルを利用したFew-shot/zero-shot Anomaly Engine Detection (FADE)を提案する。
FADEは、ゼロショットで89.6%(91.5%)、ノーマルショットで95.4%(97.5%)の異常セグメンテーションにおいて、他の最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2024-08-31T23:05:56Z) - Few-Shot Anomaly Detection via Category-Agnostic Registration Learning [65.64252994254268]
既存のほとんどの異常検出方法は、各カテゴリに専用のモデルを必要とする。
この記事では、新しい数ショットAD(FSAD)フレームワークを提案する。
これは新しいカテゴリーのモデル微調整を必要としない最初のFSAD法である。
論文 参考訳(メタデータ) (2024-06-13T05:01:13Z) - Learning to Rank Patches for Unbiased Image Redundancy Reduction [80.93989115541966]
画像は、隣接する領域の画素が空間的に相関しているため、空間的冗長性に悩まされる。
既存のアプローチでは、意味の少ない画像領域を減らし、この制限を克服しようとしている。
本稿では,Learning to Rank Patchesと呼ばれる画像冗長性低減のための自己教師型フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-31T13:12:41Z) - Rethinking Image Forgery Detection via Contrastive Learning and
Unsupervised Clustering [26.923409536155166]
画像偽造検出のためのFOCAL(FOrensic ContrAstive cLustering)法を提案する。
FOCALは対照的な学習と教師なしクラスタリングに基づいている。
その結果、FOCALは最先端の競合アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2023-08-18T05:05:30Z) - AMAE: Adaptation of Pre-Trained Masked Autoencoder for Dual-Distribution
Anomaly Detection in Chest X-Rays [17.91123470181453]
我々は、事前訓練されたマスク付きオートエンコーダ(MAE)の適応のための2段階アルゴリズムであるAMAEを提案する。
AMAEは、競合する自己監督型および二重分布異常検出法よりも一貫した性能向上をもたらす。
論文 参考訳(メタデータ) (2023-07-24T12:03:50Z) - Optimal transport meets noisy label robust loss and MixUp regularization
for domain adaptation [13.080485957000462]
ソーストレーニングセットでトレーニングされたディープニューラルネットワークは、トレーニングドメインに属さないターゲットイメージに対して不十分に動作します。
これらの性能を改善するための1つの戦略は、最適なトランスポート(OT)を使用して、埋め込み空間におけるソースとターゲットの画像分布を調整することである。
我々は、MixUp正規化のcitepzhang 2018mixupを、ドメイン適応性能を改善するために、ノイズの多いラベルに対して堅牢な損失と組み合わせることを提案する。
論文 参考訳(メタデータ) (2022-06-22T15:40:52Z) - Exposing Outlier Exposure: What Can Be Learned From Few, One, and Zero
Outlier Images [26.283734474660484]
専門的なAD学習手法は、実際には多量かつ膨大なデータのコーパスであることを示す。
我々は,この現象を調査し,一級法がトレーニングアウトリージの特定の選択に対してより堅牢であることを明らかにする。
論文 参考訳(メタデータ) (2022-05-23T17:23:15Z) - mc-BEiT: Multi-choice Discretization for Image BERT Pre-training [52.04866462439979]
Image BERT pre-training with masked image modeling (MIM)は、自己教師付き表現学習に対処する一般的な実践である。
改良されたBERTスタイルの画像事前学習手法であるmc-BEiTを導入する。
論文 参考訳(メタデータ) (2022-03-29T09:08:18Z) - Mixed Supervision Learning for Whole Slide Image Classification [88.31842052998319]
超高解像度画像のための混合監視学習フレームワークを提案する。
パッチトレーニングの段階では、このフレームワークは、粗いイメージレベルのラベルを使用して、自己教師付き学習を洗練することができる。
画素レベルの偽陽性と偽陰性を抑制するための包括的な戦略が提案されている。
論文 参考訳(メタデータ) (2021-07-02T09:46:06Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z) - Permuted AdaIN: Reducing the Bias Towards Global Statistics in Image
Classification [97.81205777897043]
近年の研究では、畳み込みニューラルネットワーク分類器は形状を犠牲にしてテクスチャを過度に依存していることが示されている。
一方、形状と局所像の区別は類似しているが異なるが、一方、グローバル画像統計は異なる。
提案手法は,pAdaIN (Permuted Adaptive Instance Normalization) と呼ばれ,画像分類器の隠蔽層におけるグローバル統計の表現を減少させる。
論文 参考訳(メタデータ) (2020-10-09T16:38:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。