論文の概要: AnomalyFactory: Regard Anomaly Generation as Unsupervised Anomaly Localization
- arxiv url: http://arxiv.org/abs/2408.09533v1
- Date: Sun, 18 Aug 2024 16:40:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-20 18:24:47.961352
- Title: AnomalyFactory: Regard Anomaly Generation as Unsupervised Anomaly Localization
- Title(参考訳): AnomalyFactory: 教師なし異常局所化としての異常発生について
- Authors: Ying Zhao,
- Abstract要約: AnomalyFactoryは、同じネットワークアーキテクチャで異常発生とローカライゼーションを統一する。
MVTecAD、VisA、MVTecLOCO、MADSim、RealIADを含む5つのデータセットで包括的な実験が行われた。
- 参考スコア(独自算出の注目度): 3.180143442781838
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in anomaly generation approaches alleviate the effect of data insufficiency on task of anomaly localization. While effective, most of them learn multiple large generative models on different datasets and cumbersome anomaly prediction models for different classes. To address the limitations, we propose a novel scalable framework, named AnomalyFactory, that unifies unsupervised anomaly generation and localization with same network architecture. It starts with a BootGenerator that combines structure of a target edge map and appearance of a reference color image with the guidance of a learned heatmap. Then, it proceeds with a FlareGenerator that receives supervision signals from the BootGenerator and reforms the heatmap to indicate anomaly locations in the generated image. Finally, it easily transforms the same network architecture to a BlazeDetector that localizes anomaly pixels with the learned heatmap by converting the anomaly images generated by the FlareGenerator to normal images. By manipulating the target edge maps and combining them with various reference images, AnomalyFactory generates authentic and diversity samples cross domains. Comprehensive experiments carried on 5 datasets, including MVTecAD, VisA, MVTecLOCO, MADSim and RealIAD, demonstrate that our approach is superior to competitors in generation capability and scalability.
- Abstract(参考訳): 異常発生手法の最近の進歩は、異常局所化タスクにおけるデータ不足の影響を軽減する。
効果はあるものの、ほとんどの人は異なるデータセットで複数の大きな生成モデルを学び、異なるクラスに対する面倒な異常予測モデルを学ぶ。
この制約に対処するため,AnomalyFactoryという新しいスケーラブルなフレームワークを提案し,同じネットワークアーキテクチャを用いて,教師なしの異常発生とローカライゼーションを統一する。
ターゲットエッジマップの構造と参照カラーイメージの外観と学習されたヒートマップのガイダンスを組み合わせたBootGeneratorから始まる。
次に、BootGeneratorから監視信号を受け取り、ヒートマップを修正して、生成されたイメージ内の異常な位置を示す。
最後に、FrareGeneratorによって生成された異常画像を通常の画像に変換することで、学習したヒートマップで異常画素をローカライズするBlazeDetectorに、同じネットワークアーキテクチャを簡単に変換する。
AnomalyFactoryは、ターゲットのエッジマップを操作して、さまざまな参照イメージと組み合わせることで、ドメイン間の真正および多様性のサンプルを生成する。
MVTecAD、VisA、MVTecLOCO、MADSim、RealIADを含む5つのデータセットで実施した総合的な実験は、我々のアプローチが生成能力とスケーラビリティにおいて競合より優れていることを実証している。
関連論文リスト
- GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。
既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。
本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文 参考訳(メタデータ) (2023-12-10T05:13:40Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - ISSTAD: Incremental Self-Supervised Learning Based on Transformer for
Anomaly Detection and Localization [12.975540251326683]
本稿では,Transformerのバックボーンネットワークに基づく新しいアプローチを提案する。
通常の画像のみに基づいてMasked Autoencoder(MAE)モデルを訓練する。
その後の段階では、劣化した正規画像を生成するためにピクセルレベルのデータ拡張技術を適用する。
このプロセスにより、モデルは破損した領域の修復方法を学び、各ピクセルの状態を分類できる。
論文 参考訳(メタデータ) (2023-03-30T13:11:26Z) - The Eyecandies Dataset for Unsupervised Multimodal Anomaly Detection and
Localization [1.3124513975412255]
Eyecandiesは、教師なしの異常検出とローカライゼーションのための新しいデータセットである。
複数の雷条件下で、手続き的に生成されたキャンディーのフォトリアリスティック画像が制御された環境でレンダリングされる。
論文 参考訳(メタデータ) (2022-10-10T11:19:58Z) - AnoViT: Unsupervised Anomaly Detection and Localization with Vision
Transformer-based Encoder-Decoder [3.31490164885582]
我々は,画像パッチ間のグローバルな関係を学習することにより,通常の情報を反映する視覚変換器を用いたエンコーダデコーダモデルAnoViTを提案する。
提案モデルは,3つのベンチマークデータセット上での畳み込みモデルよりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-03-21T09:01:37Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z) - Anomaly localization by modeling perceptual features [3.04585143845864]
特徴拡張型VAEは、入力画像を画素空間や複数の異なる特徴空間で再構成することで訓練される。
MVTec異常検出およびローカライゼーションデータセットの最先端手法に対する明確な改善を実現する。
論文 参考訳(メタデータ) (2020-08-12T15:09:13Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。