Fugu-MT 論文翻訳(概要): Hierarchical Vector Quantized Transformer for Multi-class Unsupervised Anomaly Detection

論文の概要: Hierarchical Vector Quantized Transformer for Multi-class Unsupervised Anomaly Detection

arxiv url: http://arxiv.org/abs/2310.14228v1
Date: Sun, 22 Oct 2023 08:20:33 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-25 01:05:21.213945
Title: Hierarchical Vector Quantized Transformer for Multi-class Unsupervised Anomaly Detection
Title（参考訳）: 多種非教師付き異常検出のための階層型ベクトル量子化トランス
Authors: Ruiying Lu, YuJie Wu, Long Tian, Dongsheng Wang, Bo Chen, Xiyang Liu, Ruimin Hu
Abstract要約: 教師なし画像異常検出(UAD)は、正常サンプルの堅牢かつ識別的な表現を学習することを目的としている。本稿では,複数のクラスに統一されたフレームワークを構築することに焦点を当てる。
参考スコア（独自算出の注目度）: 24.11900895337062
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Unsupervised image Anomaly Detection (UAD) aims to learn robust and discriminative representations of normal samples. While separate solutions per class endow expensive computation and limited generalizability, this paper focuses on building a unified framework for multiple classes. Under such a challenging setting, popular reconstruction-based networks with continuous latent representation assumption always suffer from the "identical shortcut" issue, where both normal and abnormal samples can be well recovered and difficult to distinguish. To address this pivotal issue, we propose a hierarchical vector quantized prototype-oriented Transformer under a probabilistic framework. First, instead of learning the continuous representations, we preserve the typical normal patterns as discrete iconic prototypes, and confirm the importance of Vector Quantization in preventing the model from falling into the shortcut. The vector quantized iconic prototype is integrated into the Transformer for reconstruction, such that the abnormal data point is flipped to a normal data point.Second, we investigate an exquisite hierarchical framework to relieve the codebook collapse issue and replenish frail normal patterns. Third, a prototype-oriented optimal transport method is proposed to better regulate the prototypes and hierarchically evaluate the abnormal score. By evaluating on MVTec-AD and VisA datasets, our model surpasses the state-of-the-art alternatives and possesses good interpretability. The code is available at https://github.com/RuiyingLu/HVQ-Trans.
Abstract（参考訳）: 教師なし画像異常検出(UAD)は、正常サンプルの堅牢かつ識別的な表現を学習することを目的としている。クラスごとに異なるソリューションは、高価な計算と限定的な汎用性をもたらすが、本論文では、複数のクラスのための統一フレームワークの構築に焦点を当てる。このような困難な状況下では、連続的な遅延表現仮定を持つ一般的な再構成ベースのネットワークは、通常と異常の両方のサンプルがよく回収され、区別が難しい「識別的ショートカット」問題に常に悩まされる。そこで本研究では,階層型ベクトル量子化プロトタイプ指向トランスを確率的枠組みで提案する。まず、連続表現を学ぶ代わりに、典型的な正規パターンを離散的な象徴的なプロトタイプとして保存し、モデルが近道に落ちるのを防ぐためにベクトル量子化の重要性を確認する。ベクトル量子化された象徴的プロトタイプは、異常なデータポイントが通常のデータポイントに反転するようにトランスフォーマーに統合され、第2に、コードブックの崩壊問題を緩和し、フライル正規パターンを補足するための、必要な階層的フレームワークについて検討する。第3に,プロトタイプを制御し,異常スコアを階層的に評価するために,プロトタイプ指向の最適輸送法を提案する。 MVTec-ADおよびVisAデータセットに基づいて評価することにより、我々のモデルは最先端の代替品を超え、良好な解釈性を有する。コードはhttps://github.com/ruiyinglu/hvq-transで入手できる。

関連論文リスト

Universal Transformation of One-Class Classifiers for Unsupervised Anomaly Detection [51.73001988341294]
異常検出は通常、一級分類問題として定式化される。本稿では,任意の1クラス分類器に基づく異常検出器を,完全に教師なしの手法に変換するデータセット折り畳み方式を提案する。
論文参考訳（メタデータ） (2026-02-13T16:54:12Z)
SMKC: Sketch Based Kernel Correlation Images for Variable Cardinality Time Series Anomaly Detection [0.0]
運用環境では、監視システムはセンサーチャーンを頻繁に経験する。本稿では,異常検出器から動的入力構造を分離するフレームワークSMKCを提案する。 SMKC表現におけるランダムプロジェクションと近傍近傍の検出器は、完全に訓練されたベースラインと競合する。
論文参考訳（メタデータ） (2026-01-28T21:15:11Z)
Correcting False Alarms from Unseen: Adapting Graph Anomaly Detectors at Test Time [60.341117019125214]
グラフ異常検出(GAD)における未確認正規pattErnsの修正のための,軽量かつプラグアンドプレイなテスト時間適応フレームワークを提案する。意味的混乱に対処するために、シフトしたデータと元のデータとをグラフ属性レベルで整合させるグラフ整合器を用いる。 10個の実世界のデータセットに対する大規模な実験により、TUNEは事前学習されたGADモデルの合成パターンと実際の見えない正常パターンの両方への一般化性を著しく向上することが示された。
論文参考訳（メタデータ） (2025-11-10T12:10:05Z)
Few-Shot Pattern Detection via Template Matching and Regression [52.79291493477272]
本稿では,テンプレートマッチングと回帰に基づく簡易かつ効果的な検出器TMRを提案する。凍結したバックボーンの上に少数の学習可能な畳み込み層や投射層を持つ最小限の構造を通して、経験者の空間的レイアウトを効果的に保存し、活用する。提案手法は, RPINE, FSCD-147, FSCD-LVISの3つのベンチマークにおける最先端手法よりも優れ, クロスデータセット評価において強い一般化を示す。
論文参考訳（メタデータ） (2025-08-25T03:52:42Z)
Normality Prior Guided Multi-Semantic Fusion Network for Unsupervised Image Anomaly Detection [7.2755028046583226]
教師なし異常検出のための新しい正規性事前誘導型マルチセマンティックフュージョンネットワークを提案する。上記のマルチセマンティックな特徴を融合してデコーダへの入力として使用し、異常の復元を近似正規性に導く。 MVTec LOCO ADデータセット上でのSOTA性能は、ピクセルsPROが5.7%、イメージAUROCが2.6%向上している。
論文参考訳（メタデータ） (2025-06-23T11:54:15Z)
Prior Normality Prompt Transformer for Multi-class Industrial Image Anomaly Detection [6.865429486202104]
マルチクラス異常検出のためのPNPT(Presideor Normality Prompt Transformer)を導入する。 PNPTは戦略的に通常の意味論を取り入れ、「アイデンティティマッピング」問題を緩和する。これにより、事前の正規性プロンプトを再構築プロセスに統合し、二重ストリームモデルを生成する。
論文参考訳（メタデータ） (2024-06-17T13:10:04Z)
MLAD: A Unified Model for Multi-system Log Anomaly Detection [35.68387377240593]
複数のシステムにまたがる意味的関係推論を組み込んだ新しい異常検出モデルMLADを提案する。具体的には、Sentence-bertを用いてログシーケンス間の類似性を捉え、それらを高次元の学習可能な意味ベクトルに変換する。我々は,各キーワードのシーケンスにおける意義を識別し,マルチシステムデータセットの全体分布をモデル化するために,アテンション層の公式を改訂する。
論文参考訳（メタデータ） (2024-01-15T12:51:13Z)
Spatial-Temporal Graph Enhanced DETR Towards Multi-Frame 3D Object Detection [54.041049052843604]
STEMDは,多フレーム3Dオブジェクト検出のためのDETRのようなパラダイムを改良した,新しいエンドツーエンドフレームワークである。まず、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。最後に、ネットワークが正のクエリと、ベストマッチしない他の非常に類似したクエリを区別することが課題となる。
論文参考訳（メタデータ） (2023-07-01T13:53:14Z)
Hard-normal Example-aware Template Mutual Matching for Industrial Anomaly Detection [78.734927709231]
異常検出器は、クエリー画像の未知の欠陥を検出し、ローカライズするために工業製造で広く使われている。これらの検出器は異常のないサンプルで訓練され、ほとんどの通常のサンプルと区別された異常を成功させた。しかし、ハードノーマルな例は、ほとんどの通常のサンプルから遠く離れており、しばしば既存の方法によって異常と誤認される。
論文参考訳（メタデータ） (2023-03-28T17:54:56Z)
Making Reconstruction-based Method Great Again for Video Anomaly Detection [64.19326819088563]
ビデオの異常検出は重要な問題だが、難しい問題だ。既存の再構成に基づく手法は、昔ながらの畳み込みオートエンコーダに依存している。連続フレーム再構築のための新しいオートエンコーダモデルを提案する。
論文参考訳（メタデータ） (2023-01-28T01:57:57Z)
Transformers meet Stochastic Block Models: Attention with Data-Adaptive Sparsity and Cost [53.746169882193456]
最近の研究は、自己注意の二次的コストを克服するために、様々なスパークアテンションモジュールを提案している。本稿では,それぞれの注意を混合メンバーシップブロックモデルで表現することで,両方の問題を解決するモデルを提案する。我々のモデルは、以前の効率的な変種とオリジナルのトランスフォーマーより優れており、十分に注目されています。
論文参考訳（メタデータ） (2022-10-27T15:30:52Z)
Dynamic Prototype Mask for Occluded Person Re-Identification [88.7782299372656]
既存の手法では、目に見える部分を識別するために、余分なネットワークによって提供される身体の手がかりを利用することで、この問題に対処している。 2つの自己明快な事前知識に基づく新しい動的プロトタイプマスク(DPM)を提案する。この条件下では、隠蔽された表現は、選択された部分空間において自然にうまく整列することができる。
論文参考訳（メタデータ） (2022-07-19T03:31:13Z)
Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文参考訳（メタデータ） (2022-06-23T14:16:30Z)
Rethinking Semantic Segmentation: A Prototype View [126.59244185849838]
学習不可能なプロトタイプをベースとした非パラメトリックセマンティックセマンティックセマンティクスモデルを提案する。我々のフレームワークは、いくつかのデータセットに対して魅力的な結果をもたらす。この作業が、現在のデファクトセマンティックセグメンテーションモデル設計を再考することを期待しています。
論文参考訳（メタデータ） (2022-03-28T21:15:32Z)
Entropy optimized semi-supervised decomposed vector-quantized variational autoencoder model based on transfer learning for multiclass text classification and generation [3.9318191265352196]
多クラステキスト分類とテキスト生成のための半教師付き離散潜在変数モデルを提案する。提案モデルは,量子化変圧器モデルの学習に伝達学習の概念を用いる。実験結果から,提案モデルが最先端モデルを大幅に上回ったことが示唆された。
論文参考訳（メタデータ） (2021-11-10T07:07:54Z)
A Closer Look at Prototype Classifier for Few-shot Image Classification [28.821731837776593]
プロトタイプの分類器は微調整やメタラーニングを伴わずに等しく機能することを示す。本稿では, 特徴ベクトルのノルムの分散に着目し, 性能を向上できることを示す。
論文参考訳（メタデータ） (2021-10-11T08:28:43Z)
Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。我々は,再建基準の代替として,異常スコアの代替尺度を提案した。提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文参考訳（メタデータ） (2020-03-24T08:26:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。