論文の概要: Anomagic: Crossmodal Prompt-driven Zero-shot Anomaly Generation
- arxiv url: http://arxiv.org/abs/2511.10020v1
- Date: Fri, 14 Nov 2025 01:26:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.644269
- Title: Anomagic: Crossmodal Prompt-driven Zero-shot Anomaly Generation
- Title(参考訳): 異常: クロスモーダル・プロンプト駆動ゼロショット異常発生
- Authors: Yuxin Jiang, Wei Luo, Hui Zhang, Qiyu Chen, Haiming Yao, Weiming Shen, Yunkang Cao,
- Abstract要約: アノマジック(英: Anomagic)は、前例の異常を必要としない意味的コヒーレントな異常を生成するゼロショットの異常生成法である。
トレーニングを容易にするために、13の公開データセットから集められた12,987の異常マスクキャプチャトリプルのコレクションであるAnomVerseを紹介した。
- 参考スコア(独自算出の注目度): 28.439752711568406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose Anomagic, a zero-shot anomaly generation method that produces semantically coherent anomalies without requiring any exemplar anomalies. By unifying both visual and textual cues through a crossmodal prompt encoding scheme, Anomagic leverages rich contextual information to steer an inpainting-based generation pipeline. A subsequent contrastive refinement strategy enforces precise alignment between synthesized anomalies and their masks, thereby bolstering downstream anomaly detection accuracy. To facilitate training, we introduce AnomVerse, a collection of 12,987 anomaly-mask-caption triplets assembled from 13 publicly available datasets, where captions are automatically generated by multimodal large language models using structured visual prompts and template-based textual hints. Extensive experiments demonstrate that Anomagic trained on AnomVerse can synthesize more realistic and varied anomalies than prior methods, yielding superior improvements in downstream anomaly detection. Furthermore, Anomagic can generate anomalies for any normal-category image using user-defined prompts, establishing a versatile foundation model for anomaly generation.
- Abstract(参考訳): 本稿では,従来の異常を必要とせず,意味的コヒーレントな異常を生成するゼロショット異常生成手法であるAnomagicを提案する。
クロスモーダルなプロンプトエンコーディングスキームを通じて視覚的およびテキスト的キューを統一することにより、Anomagicはリッチなコンテキスト情報を活用して、塗装ベースの生成パイプラインを操る。
その後のコントラスト改善戦略では、合成された異常とそのマスクの正確なアライメントが強制され、下流の異常検出精度が向上する。
トレーニングを容易にするために、13の公開データセットから収集された12,987個の異常マスクキャプチャトリプルのコレクションであるAnomVerseを導入し、構造化ビジュアルプロンプトとテンプレートベースのテキストヒントを使用して、多モーダルな大規模言語モデルによってキャプションを自動的に生成する。
大規模な実験では、AnomVerseで訓練されたAnomagicが従来の方法よりも現実的で多様な異常を合成できることが示され、下流の異常検出の精度が向上した。
さらに、Anomagicは、ユーザ定義のプロンプトを使用して、任意の通常のカテゴリ画像の異常を生成することができ、異常生成のための汎用基盤モデルを確立することができる。
関連論文リスト
- AnoStyler: Text-Driven Localized Anomaly Generation via Lightweight Style Transfer [14.610038284393164]
AnoStylerはテキスト誘導型転送としてゼロショット異常生成をフレーム化する。
CLIPベースの損失関数で訓練された軽量なU-Netモデルを用いて、通常の画像を視覚的にリアルな異常画像にスタイリングする。
論文 参考訳(メタデータ) (2025-11-10T04:20:31Z) - Generate Aligned Anomaly: Region-Guided Few-Shot Anomaly Image-Mask Pair Synthesis for Industrial Inspection [53.137651284042434]
異常検査は製造業において重要な役割を担っているが、異常サンプルの不足は既存の方法の有効性を制限している。
本稿では,GAA (Generate grained Anomaly) を提案する。
GAAは少数のサンプルのみを用いて現実的で多様で意味的に整合した異常を発生させる。
論文 参考訳(メタデータ) (2025-07-13T12:56:59Z) - Few-Shot Anomaly-Driven Generation for Anomaly Classification and Segmentation [38.76264181764036]
異常検出は, 産業検査における異常サンプルの不足により, 実用的かつ困難な課題である。
本稿では,現実的かつ多様な異常を生成するために拡散モデルを誘導するAnoGen法を提案する。
本手法は,DRAEMとDesTSegを基礎モデルとして構築し,一般的な産業用異常検出データセットであるMVTecの実験を行う。
論文 参考訳(メタデータ) (2025-05-14T10:25:06Z) - Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [109.72772150095646]
FAPromptは、精密なZSADのためのきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
産業的欠陥と医療的異常の両方をカバーする19の実世界のデータセットの実験は、FAPromptが画像レベルのZSADタスクとピクセルレベルのZSADタスクの両方で最先端の手法を大幅に上回っていることを実証している。
論文 参考訳(メタデータ) (2024-10-14T08:41:31Z) - Ensembled Cold-Diffusion Restorations for Unsupervised Anomaly Detection [7.94529540044472]
Unsupervised Anomaly Detection (UAD) は、異常のないデータセットから学習した規範的分布と比較したテストサンプル中の異常を識別することを目的としている。
生成モデルに基づくアプローチは、異常のないテスト画像を生成することによって解釈可能性を提供するが、通常、微妙な異常を識別することはできない。
本稿では, 両戦略の強みを組み合わせた新しい手法を提案する。 生成型冷拡散パイプラインは, 合成劣化画像の正常な元の外観に戻すことを目標として訓練される。
論文 参考訳(メタデータ) (2024-07-09T08:02:46Z) - Learn Suspected Anomalies from Event Prompts for Video Anomaly Detection [16.77262005540559]
イベントプロンプトから疑わしい異常の学習を導くための新しい枠組みが提案されている。
これにより、新しいマルチプロンプト学習プロセスにより、すべてのビデオの視覚的セマンティックな特徴を制限できる。
提案手法はAPやAUCといった最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-02T10:42:47Z) - AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。
既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。
本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文 参考訳(メタデータ) (2023-12-10T05:13:40Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - SaliencyCut: Augmenting Plausible Anomalies for Anomaly Detection [24.43321988051129]
そこで本稿では,SaliencyCutという新たなデータ拡張手法を提案する。
次に、各サンプルから微細な異常特徴を抽出し評価するために、異常学習ヘッドにパッチワイド残余モジュールを新規に設計する。
論文 参考訳(メタデータ) (2023-06-14T08:55:36Z) - Explainable Deep Few-shot Anomaly Detection with Deviation Networks [123.46611927225963]
本稿では,弱い教師付き異常検出フレームワークを導入し,検出モデルを訓練する。
提案手法は,ラベル付き異常と事前確率を活用することにより,識別正規性を学習する。
我々のモデルはサンプル効率が高く頑健であり、クローズドセットとオープンセットの両方の設定において最先端の競合手法よりもはるかに優れている。
論文 参考訳(メタデータ) (2021-08-01T14:33:17Z) - Toward Deep Supervised Anomaly Detection: Reinforcement Learning from
Partially Labeled Anomaly Data [150.9270911031327]
本稿では,一部のラベル付き異常事例と大規模ラベルなしデータセットを用いた異常検出の問題点について考察する。
既存の関連手法は、通常、一連の異常にまたがらない限られた異常例にのみ適合するか、ラベルのないデータから教師なしの学習を進めるかのいずれかである。
そこで本研究では,ラベル付きおよびラベルなし両方の異常の検出をエンドツーエンドに最適化する,深層強化学習に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-15T03:05:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。