論文の概要: Hierarchical Vector Quantized Transformer for Multi-class Unsupervised
Anomaly Detection
- arxiv url: http://arxiv.org/abs/2310.14228v1
- Date: Sun, 22 Oct 2023 08:20:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 01:05:21.213945
- Title: Hierarchical Vector Quantized Transformer for Multi-class Unsupervised
Anomaly Detection
- Title(参考訳): 多種非教師付き異常検出のための階層型ベクトル量子化トランス
- Authors: Ruiying Lu, YuJie Wu, Long Tian, Dongsheng Wang, Bo Chen, Xiyang Liu,
Ruimin Hu
- Abstract要約: 教師なし画像異常検出(UAD)は、正常サンプルの堅牢かつ識別的な表現を学習することを目的としている。
本稿では,複数のクラスに統一されたフレームワークを構築することに焦点を当てる。
- 参考スコア(独自算出の注目度): 24.11900895337062
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised image Anomaly Detection (UAD) aims to learn robust and
discriminative representations of normal samples. While separate solutions per
class endow expensive computation and limited generalizability, this paper
focuses on building a unified framework for multiple classes. Under such a
challenging setting, popular reconstruction-based networks with continuous
latent representation assumption always suffer from the "identical shortcut"
issue, where both normal and abnormal samples can be well recovered and
difficult to distinguish. To address this pivotal issue, we propose a
hierarchical vector quantized prototype-oriented Transformer under a
probabilistic framework. First, instead of learning the continuous
representations, we preserve the typical normal patterns as discrete iconic
prototypes, and confirm the importance of Vector Quantization in preventing the
model from falling into the shortcut. The vector quantized iconic prototype is
integrated into the Transformer for reconstruction, such that the abnormal data
point is flipped to a normal data point.Second, we investigate an exquisite
hierarchical framework to relieve the codebook collapse issue and replenish
frail normal patterns. Third, a prototype-oriented optimal transport method is
proposed to better regulate the prototypes and hierarchically evaluate the
abnormal score. By evaluating on MVTec-AD and VisA datasets, our model
surpasses the state-of-the-art alternatives and possesses good
interpretability. The code is available at
https://github.com/RuiyingLu/HVQ-Trans.
- Abstract(参考訳): 教師なし画像異常検出(UAD)は、正常サンプルの堅牢かつ識別的な表現を学習することを目的としている。
クラスごとに異なるソリューションは、高価な計算と限定的な汎用性をもたらすが、本論文では、複数のクラスのための統一フレームワークの構築に焦点を当てる。
このような困難な状況下では、連続的な遅延表現仮定を持つ一般的な再構成ベースのネットワークは、通常と異常の両方のサンプルがよく回収され、区別が難しい「識別的ショートカット」問題に常に悩まされる。
そこで本研究では,階層型ベクトル量子化プロトタイプ指向トランスを確率的枠組みで提案する。
まず、連続表現を学ぶ代わりに、典型的な正規パターンを離散的な象徴的なプロトタイプとして保存し、モデルが近道に落ちるのを防ぐためにベクトル量子化の重要性を確認する。
ベクトル量子化された象徴的プロトタイプは、異常なデータポイントが通常のデータポイントに反転するようにトランスフォーマーに統合され、第2に、コードブックの崩壊問題を緩和し、フライル正規パターンを補足するための、必要な階層的フレームワークについて検討する。
第3に,プロトタイプを制御し,異常スコアを階層的に評価するために,プロトタイプ指向の最適輸送法を提案する。
MVTec-ADおよびVisAデータセットに基づいて評価することにより、我々のモデルは最先端の代替品を超え、良好な解釈性を有する。
コードはhttps://github.com/ruiyinglu/hvq-transで入手できる。
関連論文リスト
- MLAD: A Unified Model for Multi-system Log Anomaly Detection [35.68387377240593]
複数のシステムにまたがる意味的関係推論を組み込んだ新しい異常検出モデルMLADを提案する。
具体的には、Sentence-bertを用いてログシーケンス間の類似性を捉え、それらを高次元の学習可能な意味ベクトルに変換する。
我々は,各キーワードのシーケンスにおける意義を識別し,マルチシステムデータセットの全体分布をモデル化するために,アテンション層の公式を改訂する。
論文 参考訳(メタデータ) (2024-01-15T12:51:13Z) - Spatial-Temporal Enhanced Transformer Towards Multi-Frame 3D Object
Detection [59.03596380773798]
我々は、DETRのようなパラダイムに基づいた、多フレーム3Dオブジェクト検出のための新しいエンドツーエンドフレームワークであるSTEMDを提案する。
具体的には、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
我々は,計算オーバーヘッドをわずかに加えるだけで,難解なシナリオに対処する手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-07-01T13:53:14Z) - U-Flow: A U-shaped Normalizing Flow for Anomaly Detection with
Unsupervised Threshold [0.2578242050187029]
画像中の異常検出とセグメンテーションのための非競合手法を提案する。
現代の機械学習アプローチと、より古典的な統計的検出理論の恩恵を受けている。
どちらの指標に対しても、提案手法は最先端の結果を生成する。
論文 参考訳(メタデータ) (2022-11-22T15:43:19Z) - Transformers meet Stochastic Block Models: Attention with Data-Adaptive
Sparsity and Cost [53.746169882193456]
最近の研究は、自己注意の二次的コストを克服するために、様々なスパークアテンションモジュールを提案している。
本稿では,それぞれの注意を混合メンバーシップブロックモデルで表現することで,両方の問題を解決するモデルを提案する。
我々のモデルは、以前の効率的な変種とオリジナルのトランスフォーマーより優れており、十分に注目されています。
論文 参考訳(メタデータ) (2022-10-27T15:30:52Z) - Dynamic Prototype Mask for Occluded Person Re-Identification [88.7782299372656]
既存の手法では、目に見える部分を識別するために、余分なネットワークによって提供される身体の手がかりを利用することで、この問題に対処している。
2つの自己明快な事前知識に基づく新しい動的プロトタイプマスク(DPM)を提案する。
この条件下では、隠蔽された表現は、選択された部分空間において自然にうまく整列することができる。
論文 参考訳(メタデータ) (2022-07-19T03:31:13Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [55.52743265122446]
ディープオートエンコーダは視覚領域における異常検出のタスクに使われてきた。
我々は、訓練中に識別情報を使用することが可能な自己指導型学習体制を適用することで、この問題に対処する。
MVTec ADデータセットを用いた実験では,高い検出性能と局所化性能を示した。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Rethinking Semantic Segmentation: A Prototype View [126.59244185849838]
学習不可能なプロトタイプをベースとした非パラメトリックセマンティックセマンティックセマンティクスモデルを提案する。
我々のフレームワークは、いくつかのデータセットに対して魅力的な結果をもたらす。
この作業が、現在のデファクトセマンティックセグメンテーションモデル設計を再考することを期待しています。
論文 参考訳(メタデータ) (2022-03-28T21:15:32Z) - Entropy optimized semi-supervised decomposed vector-quantized
variational autoencoder model based on transfer learning for multiclass text
classification and generation [3.9318191265352196]
多クラステキスト分類とテキスト生成のための半教師付き離散潜在変数モデルを提案する。
提案モデルは,量子化変圧器モデルの学習に伝達学習の概念を用いる。
実験結果から,提案モデルが最先端モデルを大幅に上回ったことが示唆された。
論文 参考訳(メタデータ) (2021-11-10T07:07:54Z) - A Closer Look at Prototype Classifier for Few-shot Image Classification [28.821731837776593]
プロトタイプの分類器は微調整やメタラーニングを伴わずに等しく機能することを示す。
本稿では, 特徴ベクトルのノルムの分散に着目し, 性能を向上できることを示す。
論文 参考訳(メタデータ) (2021-10-11T08:28:43Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。