論文の概要: MemSeg: A semi-supervised method for image surface defect detection
using differences and commonalities
- arxiv url: http://arxiv.org/abs/2205.00908v1
- Date: Mon, 2 May 2022 13:37:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-03 15:38:20.215923
- Title: MemSeg: A semi-supervised method for image surface defect detection
using differences and commonalities
- Title(参考訳): memseg:差分と共通性を用いた半教師付き画像表面欠陥検出法
- Authors: Minghui Yang, Peng Wu, Jing Liu, Hui Feng
- Abstract要約: 本稿では,産業製品の表面欠陥を検出するために,エンドツーエンドのメモリベースセグメンテーションネットワーク(MemSeg)を提案する。
MemSegは、ネットワークの学習を支援するために、人工的にシミュレーションされた異常サンプルとメモリサンプルを導入している。
MemSeg は AUC スコアが 99.56% と 98.84% の MVTec AD データセット上での最先端 (SOTA) のパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 14.84756881356891
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Under the semi-supervised framework, we propose an end-to-end memory-based
segmentation network (MemSeg) to detect surface defects on industrial products.
Considering the small intra-class variance of products in the same production
line, from the perspective of differences and commonalities, MemSeg introduces
artificially simulated abnormal samples and memory samples to assist the
learning of the network. In the training phase, MemSeg explicitly learns the
potential differences between normal and simulated abnormal images to obtain a
robust classification hyperplane. At the same time, inspired by the mechanism
of human memory, MemSeg uses a memory pool to store the general patterns of
normal samples. By comparing the similarities and differences between input
samples and memory samples in the memory pool to give effective guesses about
abnormal regions; In the inference phase, MemSeg directly determines the
abnormal regions of the input image in an end-to-end manner. Through
experimental validation, MemSeg achieves the state-of-the-art (SOTA)
performance on MVTec AD datasets with AUC scores of 99.56% and 98.84% at the
image-level and pixel-level, respectively. In addition, MemSeg also has a
significant advantage in inference speed benefiting from the end-to-end and
straightforward network structure, which better meets the real-time requirement
in industrial scenarios.
- Abstract(参考訳): 本稿では,産業製品の表面欠陥を検出するために,エンド・ツー・エンドのメモリベースセグメンテーションネットワーク(MemSeg)を提案する。
相違点や共通点の観点から、同一生産ライン内の製品のクラス内ばらつきが小さいことを考慮すると、memsegはネットワークの学習を支援するために、人工的にシミュレートされた異常サンプルとメモリサンプルを導入する。
トレーニング段階では、memsegは正常な画像とシミュレーションされた異常画像の潜在的な違いを明示的に学習し、ロバストな分類超平面を得る。
同時に、人間の記憶機構にインスパイアされたmemsegは、通常のサンプルの一般的なパターンを保存するためにメモリプールを使用する。
メモリプール内の入力サンプルとメモリサンプルの類似性と相違を比較して、異常領域の効果的な推測を行うことにより、推論フェーズにおいて、memsegは、入力画像の異常領域をエンドツーエンドで直接決定する。
実験的な検証により、MemSegはMVTec ADデータセット上で、画像レベルとピクセルレベルでそれぞれ99.56%と98.84%のスコアでSOTA(State-of-the-art)パフォーマンスを達成する。
加えて、MemSegは、産業シナリオにおけるリアルタイム要件を満たす、エンドツーエンドで単純なネットワーク構造から恩恵を受ける推論速度において、大きな優位性を持っている。
関連論文リスト
- AMES: Asymmetric and Memory-Efficient Similarity Estimation for Instance-level Retrieval [14.009257997448634]
本研究は,メモリ効率の制約を考慮に入れたインスタンスレベルの画像検索の問題について検討する。
提案モデルは、画像と画像の類似性を推定するために設計されたトランスフォーマーベースのアーキテクチャを使用する。
標準ベンチマークの結果は、手作りモデルと学習モデルの両方に対するアプローチの優位性を示している。
論文 参考訳(メタデータ) (2024-08-06T16:29:51Z) - MAPL: Memory Augmentation and Pseudo-Labeling for Semi-Supervised Anomaly Detection [0.0]
メモリ拡張(Memory Augmentation)と擬似ラベル(Pseudo-Labeling, MAPL)と呼ばれる, 産業環境における表面欠陥検出のための新しいメソドロジーを導入する。
この手法は、まず異常シミュレーション戦略を導入し、希少または未知の異常型を認識するモデルの能力を著しく改善する。
入力データから直接異常領域を識別するために、MAPLによってエンドツーエンドの学習フレームワークが使用される。
論文 参考訳(メタデータ) (2024-05-10T02:26:35Z) - A SAM-guided Two-stream Lightweight Model for Anomaly Detection [50.28310943263051]
我々は、教師なし異常検出(STLM)のためのSAM誘導2ストリーム軽量モデルを提案する。
MVTec ADベンチマークを用いて行った実験により,約16Mのパラメータを持ち,20msの推論時間を実現したSTLMは,最先端の手法と効果的に競合することが示された。
論文 参考訳(メタデータ) (2024-02-29T13:29:10Z) - Forgery-aware Adaptive Transformer for Generalizable Synthetic Image
Detection [106.39544368711427]
本研究では,様々な生成手法から偽画像を検出することを目的とした,一般化可能な合成画像検出の課題について検討する。
本稿では,FatFormerという新しいフォージェリー適応トランスフォーマー手法を提案する。
提案手法は, 平均98%の精度でGANを観測し, 95%の精度で拡散モデルを解析した。
論文 参考訳(メタデータ) (2023-12-27T17:36:32Z) - Few Shot Part Segmentation Reveals Compositional Logic for Industrial Anomaly Detection [11.996050578189056]
本稿では,論理異常(LA)検出のための新しいコンポーネントセグメンテーションモデルを提案する。
ラベル付き画像間の一貫したセグメンテーションを確保するために,エントロピーロスと合わせてヒストグラムマッチングロスを用いる。
LAを効果的に検出するために,異なるメモリバンクからの異常スコアを推論で標準化する適応スケーリング手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T12:14:31Z) - Investigating Shift Equivalence of Convolutional Neural Networks in
Industrial Defect Segmentation [3.843350895842836]
産業欠陥分割タスクでは、モデルの出力整合性(等価性とも呼ばれる)がしばしば見過ごされる。
CNNにおける従来のサンプリングレイヤの代替として,コンポーネントアテンション多相サンプリング(CAPS)と呼ばれる新しいダウン/アップサンプリング層が提案されている。
マイクロサーフェス欠陥(MSD)データセットと4つの実世界の産業的欠陥データセットの実験結果から,提案手法は高い等価性とセグメンテーション性能を示すことが示された。
論文 参考訳(メタデータ) (2023-09-29T00:04:47Z) - Adaptive Face Recognition Using Adversarial Information Network [57.29464116557734]
顔認識モデルは、トレーニングデータがテストデータと異なる場合、しばしば退化する。
本稿では,新たな敵情報ネットワーク(AIN)を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:14:11Z) - Dual Memory Units with Uncertainty Regulation for Weakly Supervised
Video Anomaly Detection [15.991784541576788]
ビデオとセグメントレベルのラベル指向の既存のアプローチは、主に異常データの表現の抽出に重点を置いている。
本研究では、正規データの表現と異常データの識別特徴の両方を学習するために、不確実性制御デュアルメモリユニット(UR-DMU)モデルを提案する。
我々の手法は、最先端の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2023-02-10T10:39:40Z) - A Model or 603 Exemplars: Towards Memory-Efficient Class-Incremental
Learning [56.450090618578]
CIL(Class-Incremental Learning)は、この要件を満たすために、限られたメモリサイズでモデルをトレーニングすることを目的としている。
モデルサイズを総予算にカウントし,メモリサイズに整合する手法を比較すると,保存モデルは常に機能しないことを示す。
本稿では,メモリ効率のよい拡張可能なMOdelのための MEMO という,シンプルで効果的なベースラインを提案する。
論文 参考訳(メタデータ) (2022-05-26T08:24:01Z) - Memory-Guided Semantic Learning Network for Temporal Sentence Grounding [55.31041933103645]
本稿では,TSGタスクにおいて稀に出現しないコンテンツを学習し,記憶するメモリ拡張ネットワークを提案する。
MGSL-Netは、クロスモーダル・インターアクション・モジュール、メモリ拡張モジュール、異種アテンション・モジュールの3つの主要な部分で構成されている。
論文 参考訳(メタデータ) (2022-01-03T02:32:06Z) - Universal Face Restoration With Memorized Modulation [73.34750780570909]
本稿では,ユニバーサルブラインド顔修復(BFR)のための記憶変調(RMM)フレームワークを提案する。
ランダムノイズと教師なしウェーブレットメモリを適用し、顔強調生成装置を適応的に変調する。
実験により,提案手法が最先端の手法と比較して優れていること,野生における優れた一般化が示された。
論文 参考訳(メタデータ) (2021-10-03T15:55:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。