論文の概要: SeaS: Few-shot Industrial Anomaly Image Generation with Separation and Sharing Fine-tuning
- arxiv url: http://arxiv.org/abs/2410.14987v2
- Date: Wed, 16 Jul 2025 11:29:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 14:40:09.14284
- Title: SeaS: Few-shot Industrial Anomaly Image Generation with Separation and Sharing Fine-tuning
- Title(参考訳): SeaS: 分離・共有ファインチューニングによる数発の産業異常画像生成
- Authors: Zhewei Dai, Shilei Zeng, Haotian Liu, Xurui Li, Feng Xue, Yu Zhou,
- Abstract要約: 各種異常, 正当性正規製品, 高精度な異常マスクを自動生成する産業用生成モデルであるSeaSを紹介する。
U-Netの差別化学習能力は、わずかに劣化した通常の製品と多様な異常の視覚的特徴を捉えていることを示す。
SeaSは、工業生産のための新しいベンチマークを設定し、下流のアプリケーションを大幅に強化した。
- 参考スコア(独自算出の注目度): 15.230365669066803
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce SeaS, a unified industrial generative model for automatically creating diverse anomalies, authentic normal products, and precise anomaly masks. While extensive research exists, most efforts either focus on specific tasks, i.e., anomalies or normal products only, or require separate models for each anomaly type. Consequently, prior methods either offer limited generative capability or depend on a vast array of anomaly-specific models. We demonstrate that U-Net's differentiated learning ability captures the distinct visual traits of slightly-varied normal products and diverse anomalies, enabling us to construct a unified model for all tasks. Specifically, we first introduce an Unbalanced Abnormal (UA) Text Prompt, comprising one normal token and multiple anomaly tokens. More importantly, our Decoupled Anomaly Alignment (DA) loss decouples anomaly attributes and binds them to distinct anomaly tokens of UA, enabling SeaS to create unseen anomalies by recombining these attributes. Furthermore, our Normal-image Alignment (NA) loss aligns the normal token to normal patterns, making generated normal products globally consistent and locally varied. Finally, SeaS produces accurate anomaly masks by fusing discriminative U-Net features with high-resolution VAE features. SeaS sets a new benchmark for industrial generation, significantly enhancing downstream applications, with average improvements of $+8.66\%$ pixel-level AP for synthesis-based AD approaches, $+1.10\%$ image-level AP for unsupervised AD methods, and $+12.79\%$ IoU for supervised segmentation models. Code is available at \href{https://github.com/HUST-SLOW/SeaS}{https://github.com/HUST-SLOW/SeaS}.
- Abstract(参考訳): 各種異常, 正当性正規製品, 高精度な異常マスクを自動生成する産業用生成モデルであるSeaSを紹介する。
大規模な研究は存在するが、ほとんどの取り組みは特定のタスク、すなわち異常または通常の製品のみに焦点を当てるか、またはそれぞれの異常タイプごとに別々のモデルを必要とする。
その結果、事前の手法は、限られた生成能力を提供するか、または多数の異常固有のモデルに依存している。
U-Netの差別化学習能力は、わずかに劣化した通常の製品と多様な異常の視覚的特徴を捉え、全てのタスクに統一されたモデルを構築することができることを示した。
具体的には、まず、1つの正規トークンと複数の異常トークンからなる非平衡異常(UA)テキストプロンプトを導入する。
さらに重要なのは、Decoupled Anomaly Alignment(DA)損失は異常属性を分離し、それらを異なるUAの異常トークンにバインドすることで、SeaSがこれらの属性を再結合することで、目に見えない異常を発生させることができることです。
さらに、正規像アライメント(NA)損失は、通常のトークンを通常のパターンに整合させ、生成した正規積をグローバルに一貫し、局所的に変化させる。
最後に、SeaSは、高い解像度のVAE特徴を持つ差別的U-Net特徴を融合することにより、正確な異常マスクを生成する。
SeaSは産業生産のための新しいベンチマークを設定し、下流のアプリケーションを大幅に強化し、合成ベースのADアプローチでは平均で$+8.66\%$ピクセルレベルのAP、教師なしADメソッドでは$+1.10\%$イメージレベルのAP、教師なしセグメンテーションモデルでは$+12.79\%$IoUを平均的に改善した。
コードは \href{https://github.com/HUST-SLOW/SeaS}{https://github.com/HUST-SLOW/SeaS} で公開されている。
関連論文リスト
- Generate Aligned Anomaly: Region-Guided Few-Shot Anomaly Image-Mask Pair Synthesis for Industrial Inspection [53.137651284042434]
異常検査は製造業において重要な役割を担っているが、異常サンプルの不足は既存の方法の有効性を制限している。
本稿では,GAA (Generate grained Anomaly) を提案する。
GAAは少数のサンプルのみを用いて現実的で多様で意味的に整合した異常を発生させる。
論文 参考訳(メタデータ) (2025-07-13T12:56:59Z) - Learning to Detect Multi-class Anomalies with Just One Normal Image Prompt [4.887838886202545]
通常の特徴を再構成し,ただ1つの正常画像プロンプト(OneNIP)で異常特徴を復元する,シンプルで効果的な手法を提案する。
以前の研究とは対照的に、OneNIPは1つの通常の画像プロンプトで初めて異常を再構築または復元し、統一された異常検出性能を効果的に向上させる。
OneNIPは、MVTec、BTAD、VisAの3つの業界異常検出ベンチマークにおいて、以前の方法よりも優れている。
論文 参考訳(メタデータ) (2025-05-14T10:25:14Z) - AnomalyHybrid: A Domain-agnostic Generative Framework for General Anomaly Detection [3.180143442781838]
AnomalyHybridは、本物で多様な異常を生成するために設計されたドメインに依存しないフレームワークである。
AnomalyHybridはGAN(Generative Adversarial Network)ベースのフレームワークで、参照画像の外観をそれぞれターゲット画像の深さとエッジ構造に統合する2つのデコーダを備えている。
論文 参考訳(メタデータ) (2025-04-06T03:28:30Z) - KKA: Improving Vision Anomaly Detection through Anomaly-related Knowledge from Large Language Models [54.63075553088399]
Key Knowledge Augmentation (KKA)は,大規模言語モデル(LLM)から異常関連知識を抽出する手法である。
KKAは、生成した異常を、通常のサンプルと類似性に応じて、容易な異常と硬い異常と分類する。
実験の結果,提案手法は様々な視覚異常検出器の性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2025-02-14T07:46:49Z) - GenIAS: Generator for Instantiating Anomalies in time Series [54.959865643340535]
可変オートエンコーダを用いた時系列異常検出(TSAD)のための生成モデルを開発した。
GenIASはTSADタスクのための多種多様な現実的な合成異常を生成するように設計されている。
実験の結果,GenIASは従来型および深部異常検出モデル17より一貫して優れていた。
論文 参考訳(メタデータ) (2025-02-12T10:10:04Z) - Towards Accurate Unified Anomaly Segmentation [25.415671183061317]
画像からの教師なし異常検出(UAD)は、正常なデータ分布をモデル化し、異常を識別し、ローカライズするための離散表現を作成する。
効率的で統一されたワン・フォー・オール・スキームの最近の進歩にもかかわらず、さらなる監視のために異常を正確にセグメント化することは困難である。
未解決セグメンテーションタスクに対処するため,Unified Anomaly (UniAS)を導入する。
UniASは、MVTec-ADおよびVisAデータセット上のpAP/DSCで65.12/59.33と40.06/32.50という最先端の異常セグメンテーション性能を達成する。
論文 参考訳(メタデータ) (2025-01-21T17:02:51Z) - AnomalyNCD: Towards Novel Anomaly Class Discovery in Industrial Scenarios [16.77348120041789]
本稿では,異なる異常検出手法に適合する多クラス異常分類ネットワークであるAnomalyNCDを提案する。
異常の非優位性に対処するため,我々は主要素バイナライゼーション(MEBin)を設計し,異常中心の画像を得る。
次に、弱い意味を持つ異常を学習するために、マスクによって導かれる孤立した異常に焦点を当てたマスク誘導表現学習を設計する。
論文 参考訳(メタデータ) (2024-10-18T11:07:12Z) - Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [88.34095233600719]
FAPromptは、より正確なZSADのためにきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
画像レベルおよび画素レベルのZSADタスクにおいて、最先端の手法を少なくとも3%-5%のAUC/APで大幅に上回っている。
論文 参考訳(メタデータ) (2024-10-14T08:41:31Z) - Fine-grained Image-to-LiDAR Contrastive Distillation with Visual Foundation Models [55.99654128127689]
Visual Foundation Models (VFM) は、3D表現学習を強化するために使用される。
VFMは、弱制御された画素間コントラスト蒸留のためのセマンティックラベルを生成する。
我々は,空間分布とカテゴリー周波数の不均衡に対応するために,点のサンプリング確率を適応させる。
論文 参考訳(メタデータ) (2024-05-23T07:48:19Z) - Self-supervised learning for classifying paranasal anomalies in the maxillary sinus [31.45131665942058]
自己教師付き学習は、ラベルのないデータから表現を学習するために使用することができる。
上顎洞の副鼻腔奇形を分類する下流タスクのために設計されたSSLメソッドはない。
提案手法では,教師なし異常検出フレームワークで訓練された3次元畳み込みオートエンコーダを用いる。
論文 参考訳(メタデータ) (2024-04-29T11:14:11Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。
既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。
本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文 参考訳(メタデータ) (2023-12-10T05:13:40Z) - Composite Score for Anomaly Detection in Imbalanced Real-World
Industrial Dataset [0.0]
本稿では,PCBA(Printed Circuit Board Assembly)イメージを,通常の製品で訓練されたベクトル量子生成適応ネットワーク(VQGAN)を用いて再構成する産業パートナーのユースケースについて述べる。
いくつかの正常な画像と異常な画像から複数のマルチレベルメトリクスが抽出され、再構成の違いによって異常が強調される。
クラスアイファーは、抽出されたメトリクスのおかげで複合異常スコアを構築するように訓練される。
論文 参考訳(メタデータ) (2022-11-25T09:41:07Z) - AnoSeg: Anomaly Segmentation Network Using Self-Supervised Learning [11.234583962952891]
本稿では、自己教師付き学習を用いて、正確な異常マップを直接生成できる新しい異常分割ネットワーク(AnoSeg)を提案する。
高精度な異常セグメンテーションのために提案されたAnoSegは、3つの新しい手法を考察している。
実験の結果,提案手法はMVTec ADデータセットに対して,最先端の異常検出および異常セグメンテーション法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-10-07T12:36:36Z) - Explainable Deep Few-shot Anomaly Detection with Deviation Networks [123.46611927225963]
本稿では,弱い教師付き異常検出フレームワークを導入し,検出モデルを訓練する。
提案手法は,ラベル付き異常と事前確率を活用することにより,識別正規性を学習する。
我々のモデルはサンプル効率が高く頑健であり、クローズドセットとオープンセットの両方の設定において最先端の競合手法よりもはるかに優れている。
論文 参考訳(メタデータ) (2021-08-01T14:33:17Z) - Locally Masked Convolution for Autoregressive Models [107.4635841204146]
LMConvは標準的な2Dコンボリューションの簡単な修正であり、任意のマスクを画像の各位置の重みに適用することができる。
我々は,パラメータを共有するが生成順序が異なる分布推定器のアンサンブルを学習し,全画像密度推定の性能を向上させる。
論文 参考訳(メタデータ) (2020-06-22T17:59:07Z) - Modeling the Distribution of Normal Data in Pre-Trained Deep Features
for Anomaly Detection [2.9864637081333085]
画像中の異常検出(AD)は、標準からかなり逸脱した画像や画像のサブ構造を特定することを指す。
本研究では,大きな自然画像データセット上での識別モデルにより学習された深い特徴表現が,正規性を記述するのに適していることを示す。
論文 参考訳(メタデータ) (2020-05-28T16:43:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。