論文の概要: CUT: A Controllable, Universal, and Training-Free Visual Anomaly Generation Framework
- arxiv url: http://arxiv.org/abs/2406.01078v1
- Date: Mon, 3 Jun 2024 07:58:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-06 01:58:18.651258
- Title: CUT: A Controllable, Universal, and Training-Free Visual Anomaly Generation Framework
- Title(参考訳): CUT: コントロール可能な、ユニバーサルで、トレーニング不要なビジュアル異常生成フレームワーク
- Authors: Han Sun, Yunkang Cao, Olga Fink,
- Abstract要約: 我々は、制御可能、ユニバーサル、およびトレーニング不要な視覚異常生成フレームワークであるCUTを提案する。
不可視データと新規な異常型の両方にわたって,制御可能かつ現実的な異常生成を実現する。
生成した異常サンプルを用いてVLADモデルをトレーニングすることにより、複数のベンチマーク異常検出タスクで最先端の性能を実現する。
- 参考スコア(独自算出の注目度): 11.609545429511595
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual anomaly detection (AD) inherently faces significant challenges due to the scarcity of anomalous data. Although numerous works have been proposed to synthesize anomalous samples, the generated samples often lack authenticity or can only reflect the distribution of the available training data samples. In this work, we propose CUT: a Controllable, Universal and Training-free visual anomaly generation framework, which leverages the capability of Stable Diffusion (SD) in image generation to generate diverse and realistic anomalies. With CUT, we achieve controllable and realistic anomaly generation universally across both unseen data and novel anomaly types, using a single model without acquiring additional training effort. To demonstrate the effectiveness of our approach, we propose a Vision-Language-based Anomaly Detection framework (VLAD). By training the VLAD model with our generated anomalous samples, we achieve state-of-the-art performance on several benchmark anomaly detection tasks, highlighting the significant improvements enabled by our synthetic data.
- Abstract(参考訳): 視覚異常検出(AD)は、異常データの不足により本質的に重大な課題に直面している。
異常サンプルを合成するための多くの研究が提案されているが、生成されたサンプルは信頼性に欠けることが多く、利用可能なトレーニングデータサンプルの分布のみを反映できる。
本研究では,画像生成における安定拡散(SD)の能力を生かして,多種多様な現実的な異常を生成する,制御可能・ユニバーサル・トレーニング不要な視覚異常生成フレームワークCUTを提案する。
CUTでは、新たなトレーニングを行なわずに単一のモデルを用いて、目に見えないデータと新しい異常タイプの両方にわたって、制御可能で現実的な異常生成を実現する。
提案手法の有効性を示すために,視覚言語に基づく異常検出フレームワーク(VLAD)を提案する。
生成した異常サンプルを用いてVLADモデルをトレーニングすることにより、いくつかのベンチマーク異常検出タスクで最先端のパフォーマンスを実現し、合成データによって実現された重要な改善点を浮き彫りにした。
関連論文リスト
- Leveraging Latent Diffusion Models for Training-Free In-Distribution Data Augmentation for Surface Defect Detection [9.784793380119806]
データ拡張のためのトレーニング不要な拡散型In-Distribution Anomaly GenerationパイプラインであるDIAGを紹介する。
従来の画像生成技術とは異なり、我々は、ドメインの専門家がモデルにマルチモーダルガイダンスを提供する、Human-in-the-loopパイプラインを実装している。
我々は、挑戦的なKSDD2データセットに対する最先端データ拡張アプローチに関して、DIAGの有効性と汎用性を実証する。
論文 参考訳(メタデータ) (2024-07-04T14:28:52Z) - Few-shot Online Anomaly Detection and Segmentation [29.693357653538474]
本稿では,難易度の高いオンライン異常検出・セグメンテーション(FOADS)の課題に対処することに焦点を当てる。
FOADSフレームワークでは、モデルを数ショットの通常のデータセットでトレーニングし、その後、正常サンプルと異常サンプルの両方を含む未ラベルのストリーミングデータを活用することで、その能力の検査と改善を行う。
限られたトレーニングサンプルを用いた性能向上のために,ImageNetで事前学習したCNNから抽出したマルチスケール特徴埋め込みを用いて,ロバストな表現を得る。
論文 参考訳(メタデータ) (2024-03-27T02:24:00Z) - Toward Generalist Anomaly Detection via In-context Residual Learning with Few-shot Sample Prompts [25.629973843455495]
Generalist Anomaly Detection (GAD)は、ターゲットデータにさらなるトレーニングを加えることなく、さまざまなアプリケーションドメインからさまざまなデータセットの異常を検出するために一般化可能な、単一の検出モデルをトレーニングすることを目的としている。
InCTRLと呼ばれるGADのための文脈内残差学習モデルを学習する新しい手法を提案する。
InCTRLは最高のパフォーマーであり、最先端の競合手法を著しく上回っている。
論文 参考訳(メタデータ) (2024-03-11T08:07:46Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。
既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。
本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文 参考訳(メタデータ) (2023-12-10T05:13:40Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - The Eyecandies Dataset for Unsupervised Multimodal Anomaly Detection and
Localization [1.3124513975412255]
Eyecandiesは、教師なしの異常検出とローカライゼーションのための新しいデータセットである。
複数の雷条件下で、手続き的に生成されたキャンディーのフォトリアリスティック画像が制御された環境でレンダリングされる。
論文 参考訳(メタデータ) (2022-10-10T11:19:58Z) - An Outlier Exposure Approach to Improve Visual Anomaly Detection
Performance for Mobile Robots [76.36017224414523]
移動ロボットの視覚異常検出システム構築の問題点を考察する。
標準異常検出モデルは、非異常データのみからなる大規模なデータセットを用いて訓練される。
本研究では,これらのデータを利用してリアルNVP異常検出モデルの性能向上を図る。
論文 参考訳(メタデータ) (2022-09-20T15:18:13Z) - Explainable Deep Few-shot Anomaly Detection with Deviation Networks [123.46611927225963]
本稿では,弱い教師付き異常検出フレームワークを導入し,検出モデルを訓練する。
提案手法は,ラベル付き異常と事前確率を活用することにより,識別正規性を学習する。
我々のモデルはサンプル効率が高く頑健であり、クローズドセットとオープンセットの両方の設定において最先端の競合手法よりもはるかに優れている。
論文 参考訳(メタデータ) (2021-08-01T14:33:17Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。