論文の概要: Few-Shot Defect Segmentation Leveraging Abundant Normal Training Samples
Through Normal Background Regularization and Crop-and-Paste Operation
- arxiv url: http://arxiv.org/abs/2007.09438v2
- Date: Tue, 6 Apr 2021 07:14:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 05:53:40.684422
- Title: Few-Shot Defect Segmentation Leveraging Abundant Normal Training Samples
Through Normal Background Regularization and Crop-and-Paste Operation
- Title(参考訳): 正常な背景正規化と作物・ペースト操作を通した豊富な正常トレーニングサンプルを用いたマイナショット欠陥分割
- Authors: Dongyun Lin, Yanpeng Cao, Wenbing Zhu, and Yiqun Li
- Abstract要約: 産業検査作業では, 欠陥のない画像サンプルが豊富だが, 異常な画像が極めて少ないことが一般的である。
本論文は,正常な(欠陥のない)トレーニングイメージを十分に用いながら,異常な部分しか持たない,難解な少数ショット欠陥分割課題に対処する。
UNetライクなエンコーダ-デコーダ欠陥分割ネットワークのトレーニングに、豊富な欠陥のないイメージを組み込むことにより、2つの効果的な正則化手法を提案する。
- 参考スコア(独自算出の注目度): 4.626338154327536
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In industrial product quality assessment, it is essential to determine
whether a product is defect-free and further analyze the severity of anomality.
To this end, accurate defect segmentation on images of products provides an
important functionality. In industrial inspection tasks, it is common to
capture abundant defect-free image samples but very limited anomalous ones.
Therefore, it is critical to develop automatic and accurate defect segmentation
systems using only a small number of annotated anomalous training images. This
paper tackles the challenging few-shot defect segmentation task with sufficient
normal (defect-free) training images but very few anomalous ones. We present
two effective regularization techniques via incorporating abundant defect-free
images into the training of a UNet-like encoder-decoder defect segmentation
network. We first propose a Normal Background Regularization (NBR) loss which
is jointly minimized with the segmentation loss, enhancing the encoder network
to produce distinctive representations for normal regions. Secondly, we
crop/paste defective regions to the randomly selected normal images for data
augmentation and propose a weighted binary cross-entropy loss to enhance the
training by emphasizing more realistic crop-and-pasted augmented images based
on feature-level similarity comparison. Both techniques are implemented on an
encoder-decoder segmentation network backboned by ResNet-34 for few-shot defect
segmentation. Extensive experiments are conducted on the recently released
MVTec Anomaly Detection dataset with high-resolution industrial images. Under
both 1-shot and 5-shot defect segmentation settings, the proposed method
significantly outperforms several benchmarking methods.
- Abstract(参考訳): 工業製品の品質評価においては, 欠陥のない製品かどうかを判定し, さらに不均一性の重大さを分析することが不可欠である。
この目的のために、製品のイメージの正確な欠陥セグメンテーションは重要な機能を提供します。
産業検査では, 欠陥のない画像が豊富に採取されるのが一般的だが, 異常は少ない。
そのため,少数の注釈付き異常画像のみを用いて,自動的かつ正確な欠陥分割システムの開発が重要である。
本論文は,正常な(欠陥のない)トレーニングイメージを十分に用いながら,異常に少ない,難解な数発欠陥分割課題に取り組む。
UNetライクなエンコーダ-デコーダ欠陥分割ネットワークのトレーニングに、豊富な欠陥のないイメージを組み込んだ2つの効果的な正則化手法を提案する。
まず,セグメンテーション損失と協調して最小化される正規背景正規化(nbr)損失を提案し,エンコーダネットワークを拡張し,正規領域の固有表現を生成する。
次に,データ拡張のためにランダムに選択された正規画像に対して欠陥領域を収穫・ペーストし,特徴レベルの類似性比較に基づいてより現実的な作物・ペースト拡張画像を強調することにより,重み付き二値クロスエントロピー損失を提案する。
どちらの手法もresnet-34によってバックボーン化されたエンコーダ/デコーダセグメンテーションネットワーク上で実装されている。
最近リリースされたmvtec anomaly detection datasetで,高分解能産業画像を用いた大規模実験を行った。
1ショットと5ショットの欠陥セグメンテーション設定では、提案手法がいくつかのベンチマーク手法を大きく上回っている。
関連論文リスト
- SINDER: Repairing the Singular Defects of DINOv2 [61.98878352956125]
大規模なデータセットでトレーニングされたビジョントランスフォーマーモデルは、抽出したパッチトークンにアーティファクトを表示することが多い。
本稿では,小さなデータセットのみを用いて構造欠陥を補正するスムーズなスムーズな正規化を提案する。
論文 参考訳(メタデータ) (2024-07-23T20:34:23Z) - Spatial-aware Attention Generative Adversarial Network for Semi-supervised Anomaly Detection in Medical Image [63.59114880750643]
本稿では,一級半教師付き健康画像生成のための空間意識生成ネットワーク(SAGAN)について紹介する。
SAGANは、正常な画像の復元と擬似異常画像の復元によって導かれる、ラベルのないデータに対応する高品質な健康画像を生成する。
3つの医学データセットに対する大規模な実験は、提案されたSAGANが最先端の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2024-05-21T15:41:34Z) - Few-Shot Defect Image Generation via Defect-Aware Feature Manipulation [19.018561017953957]
そこで本研究では, 難易度の高いいくつかの症例において, 第一の欠陥画像生成法を提案する。
まず、欠陥のない画像をバックボーンとしてデータ効率の良いStyleGAN2をトレーニングする。
第二に、欠陥を意識した残留ブロックを背骨に取り付け、適切な欠陥マスクを生成することを学習する。
論文 参考訳(メタデータ) (2023-03-04T11:43:08Z) - Deep Autoencoders for Anomaly Detection in Textured Images using CW-SSIM [5.042611743157464]
複素ウェーブレット構造類似度(CW-SSIM)に基づく損失関数の適用により,この種の画像に対して優れた検出性能が得られることを示す。
既知の異常検出ベンチマーク実験により,この損失関数で訓練した単純なモデルにより,最先端の手法に匹敵する,あるいは優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2022-08-30T08:01:25Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - PAEDID: Patch Autoencoder Based Deep Image Decomposition For Pixel-level
Defective Region Segmentation [16.519583839906904]
欠陥領域分割のための非教師パッチオートエンコーダに基づくディープ画像分解法(PAEDID)を提案する。
パッチオートエンコーダ(PAE)ネットワークにより,より深い画像として共通の背景を学習する。
提案手法を採用することにより、画像中の欠陥領域を教師なしで正確に抽出することができる。
論文 参考訳(メタデータ) (2022-03-28T02:50:06Z) - Fully Convolutional Cross-Scale-Flows for Image-based Defect Detection [24.0966076588569]
欠陥部分の画像サンプルを必要とせずに自動欠陥検出の問題に取り組む。
本稿では,異なるスケールの複数の特徴写像を共同で処理する,完全畳み込み型クロススケール正規化フロー(CS-Flow)を提案する。
ベンチマークデータセットであるMagnetic Tile DefectsとMVTec ADは、15クラス中4クラスで100%AUROCを示す。
論文 参考訳(メタデータ) (2021-10-06T15:35:13Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Towards Unbiased COVID-19 Lesion Localisation and Segmentation via
Weakly Supervised Learning [66.36706284671291]
本研究では,画像レベルラベルのみに監視されたデータ駆動型フレームワークを提案する。
このフレームワークは、生成する対向ネットワークと病変特異的デコーダの助けを借りて、原画像から潜在的な病変を明示的に分離することができる。
論文 参考訳(メタデータ) (2021-03-01T06:05:49Z) - Same Same But DifferNet: Semi-Supervised Defect Detection with
Normalizing Flows [24.734388664558708]
畳み込みニューラルネットワークによって抽出された特徴の記述性を利用して、その密度を推定する。
これらの可能性に基づいて、欠陥を示すスコアリング関数を開発する。
本稿では,新しいMVTec ADとMagnetic Tile Defectsデータセットに対する既存のアプローチよりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-08-28T10:49:28Z) - Salvage Reusable Samples from Noisy Data for Robust Learning [70.48919625304]
本稿では,Web画像を用いた深部FGモデルのトレーニングにおいて,ラベルノイズに対処するための再利用可能なサンプル選択と修正手法を提案する。
私たちのキーとなるアイデアは、再利用可能なサンプルの追加と修正を行い、それらをクリーンな例とともに活用してネットワークを更新することです。
論文 参考訳(メタデータ) (2020-08-06T02:07:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。