論文の概要: Teacher Encoder-Student Decoder Denoising Guided Segmentation Network for Anomaly Detection
- arxiv url: http://arxiv.org/abs/2501.12104v2
- Date: Wed, 22 Jan 2025 04:21:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-23 13:30:47.816170
- Title: Teacher Encoder-Student Decoder Denoising Guided Segmentation Network for Anomaly Detection
- Title(参考訳): 教師エンコーダ・Student Decoder Denoising Guided Segmentation Network for Anomaly Detection
- Authors: Shixuan Song, Hao Chen, Shu Hu, Xin Wang, Jinrong Hu, Xi Wu,
- Abstract要約: PFADSeg という,事前学習した教師ネットワークと,マルチスケールの機能融合による学生ネットワークと,ガイド付き異常セグメンテーションネットワークを統合フレームワークに統合した新しいモデルを提案する。
PFADSegはMVTec ADデータセットに基づいて、画像レベルのAUCは98.9%、ピクセルレベルの平均精度は76.4%、インスタンスレベルの平均精度は78.7%である。
- 参考スコア(独自算出の注目度): 15.545036112870841
- License:
- Abstract: Visual anomaly detection is a highly challenging task, often categorized as a one-class classification and segmentation problem. Recent studies have demonstrated that the student-teacher (S-T) framework effectively addresses this challenge. However, most S-T frameworks rely solely on pre-trained teacher networks to guide student networks in learning multi-scale similar features, overlooking the potential of the student networks to enhance learning through multi-scale feature fusion. In this study, we propose a novel model named PFADSeg, which integrates a pre-trained teacher network, a denoising student network with multi-scale feature fusion, and a guided anomaly segmentation network into a unified framework. By adopting a unique teacher-encoder and student-decoder denoising mode, the model improves the student network's ability to learn from teacher network features. Furthermore, an adaptive feature fusion mechanism is introduced to train a self-supervised segmentation network that synthesizes anomaly masks autonomously, significantly increasing detection performance. Evaluated on the MVTec AD dataset, PFADSeg achieves state-of-the-art results with an image-level AUC of 98.9%, a pixel-level mean precision of 76.4%, and an instance-level mean precision of 78.7%.
- Abstract(参考訳): 視覚異常検出は極めて困難な課題であり、しばしば一級分類とセグメンテーションの問題に分類される。
近年の研究では、S-Tフレームワークがこの課題に効果的に対処していることが示されている。
しかし、ほとんどのS-Tフレームワークは、学生ネットワークがマルチスケールの類似した特徴を学習する際に、学生ネットワークを指導する訓練済みの教師ネットワークのみに依存しており、学生ネットワークがマルチスケールの機能融合を通じて学習を強化する可能性を見越している。
本研究では,事前学習した教師ネットワークと,マルチスケールの機能融合による学生ネットワークと,ガイド付き異常セグメンテーションネットワークを統合フレームワークに統合したPFADSegという新しいモデルを提案する。
独特な教師エンコーダと生徒デコーダデノナイズモードを採用することで、教師ネットワークの特徴から学習する学生ネットワークの能力を向上させることができる。
さらに、アダプティブな特徴融合機構を導入して、異常マスクを自律的に合成する自己教師付きセグメンテーションネットワークを訓練し、検出性能を大幅に向上させる。
PFADSegはMVTec ADデータセットに基づいて、画像レベルのAUCは98.9%、ピクセルレベルの平均精度は76.4%、インスタンスレベルの平均精度は78.7%である。
関連論文リスト
- Large Language Model Guided Knowledge Distillation for Time Series
Anomaly Detection [12.585365177675607]
AnomalyLLMは15のデータセットで最先端のパフォーマンスを示し、UCRデータセットの少なくとも14.5%の精度向上を実現している。
論文 参考訳(メタデータ) (2024-01-26T09:51:07Z) - DeSTSeg: Segmentation Guided Denoising Student-Teacher for Anomaly
Detection [18.95747313320397]
本稿では,教師ネットワーク,学生エンコーダ・デコーダ,セグメンテーションネットワークを1つのフレームワークに統合したDeSTSegと呼ばれる改良モデルを提案する。
画像レベルのAUCは98.6%,画素レベルの平均精度は75.8%,インスタンスレベルの平均精度は76.4%である。
論文 参考訳(メタデータ) (2022-11-21T10:01:03Z) - Excess Risk of Two-Layer ReLU Neural Networks in Teacher-Student
Settings and its Superiority to Kernel Methods [58.44819696433327]
教師回帰モデルにおける2層ReLUニューラルネットワークのリスクについて検討する。
学生ネットワークは、どの解法よりも確実に優れていることがわかった。
論文 参考訳(メタデータ) (2022-05-30T02:51:36Z) - Graph Consistency based Mean-Teaching for Unsupervised Domain Adaptive
Person Re-Identification [54.58165777717885]
本論文では,教師ネットワークと学生ネットワークの間にGCC(Graph Consistency Constraint)を構築するためのGCMT(Graph Consistency Based Mean-Teaching)手法を提案する。
マーケット-1501、デュークMTMCreID、MSMT17の3つのデータセットの実験により、提案されたGCMTは最先端の手法よりも明確なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2021-05-11T04:09:49Z) - Knowledge Distillation By Sparse Representation Matching [107.87219371697063]
本稿では,一方の畳み込みネットワーク(cnn)から他方へ,スパース表現を用いて中間知識を伝達するスパース表現マッチング(srm)を提案する。
勾配降下を利用して効率的に最適化し、任意のCNNにプラグアンドプレイで統合できるニューラルプロセッシングブロックとして定式化します。
実験の結果,教師と生徒のネットワーク間のアーキテクチャの違いに頑健であり,複数のデータセットにまたがる他のkd技術よりも優れていた。
論文 参考訳(メタデータ) (2021-03-31T11:47:47Z) - Anomaly Detection on Attributed Networks via Contrastive Self-Supervised
Learning [50.24174211654775]
本論文では,アトリビュートネットワーク上の異常検出のためのコントラスト型自己監視学習フレームワークを提案する。
このフレームワークは、新しいタイプのコントラストインスタンスペアをサンプリングすることで、ネットワークデータからのローカル情報を完全に活用します。
高次元特性と局所構造から情報埋め込みを学習するグラフニューラルネットワークに基づくコントラスト学習モデルを提案する。
論文 参考訳(メタデータ) (2021-02-27T03:17:20Z) - Representation Evaluation Block-based Teacher-Student Network for the
Industrial Quality-relevant Performance Modeling and Monitoring [5.909089256501503]
品質関連故障検出のための改良型教師学生ネットワークに基づく故障検出手法を提案する。
従来の教師-学生ネットワークでは、教師ネットワークと学生ネットワークの特徴の違いが学生ネットワークのパフォーマンス低下を引き起こすためです。
不確実性モデリングは、この差異をモデリングプロセスに追加するために使用され、特徴の違いを減らし、学生ネットワークの性能を向上させるのに有用である。
提案手法はプロセス監視に適用され,プロセス関連部分空間と品質関連部分空間の障害を同時に検出する。
論文 参考訳(メタデータ) (2021-01-20T05:40:44Z) - Efficient Crowd Counting via Structured Knowledge Transfer [122.30417437707759]
クラウドカウントはアプリケーション指向のタスクであり、その推論効率は現実世界のアプリケーションにとって不可欠である。
本稿では,学生ネットワークを軽量かつ高効率に構築する構造的知識伝達フレームワークを提案する。
我々のモデルはNvidia 1080 GPUで最低6.5$times$のスピードアップを取得し、最先端のパフォーマンスも達成しています。
論文 参考訳(メタデータ) (2020-03-23T08:05:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。