論文の概要: SeaS: Few-shot Industrial Anomaly Image Generation with Separation and Sharing Fine-tuning
- arxiv url: http://arxiv.org/abs/2410.14987v1
- Date: Sat, 19 Oct 2024 05:37:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-22 13:18:52.428468
- Title: SeaS: Few-shot Industrial Anomaly Image Generation with Separation and Sharing Fine-tuning
- Title(参考訳): SeaS: 分離・共有ファインチューニングによる数発の産業異常画像生成
- Authors: Zhewei Dai, Shilei Zeng, Haotian Liu, Xurui Li, Feng Xue, Yu Zhou,
- Abstract要約: 多様な異常や正確なピクセル単位のアノテーションの作成について検討する。
実際の生産ラインを観察することで、異常は形や外観によってランダムに変化することがわかった。
我々は,U-Netと高分解能VAEの特徴の識別的特徴を融合させることにより,生成した異常に対する高忠実度アノテーションを作成する。
- 参考スコア(独自算出の注目度): 15.230365669066803
- License:
- Abstract: Current segmentation methods require many training images and precise masks, while insufficient anomaly images hinder their application in industrial scenarios. To address such an issue, we explore producing diverse anomalies and accurate pixel-wise annotations. By observing the real production lines, we find that anomalies vary randomly in shape and appearance, whereas products hold globally consistent patterns with slight local variations. Such a characteristic inspires us to develop a Separation and Sharing Fine-tuning (SeaS) approach using only a few abnormal and some normal images. Firstly, we propose the Unbalanced Abnormal (UA) Text Prompt tailored to industrial anomaly generation, consisting of one product token and several anomaly tokens. Then, for anomaly images, we propose a Decoupled Anomaly Alignment (DA) loss to bind the attributes of the anomalies to different anomaly tokens. Re-blending such attributes may produce never-seen anomalies, achieving a high diversity of anomalies. For normal images, we propose a Normal-image Alignment (NA) loss to learn the products' key features that are used to synthesize products with both global consistency and local variations. The two training processes are separated but conducted on a shared U-Net. Finally, SeaS produces high-fidelity annotations for the generated anomalies by fusing discriminative features of U-Net and high-resolution VAE features. Extensive evaluations on the challenging MVTec AD and MVTec 3D AD dataset demonstrate the effectiveness of our approach. For anomaly image generation, we achieve 1.88 on IS and 0.34 on IC-LPIPS on MVTec AD dataset, 1.95 on IS and 0.30 on IC-LPIPS on MVTec 3D AD dataset. For downstream task, using our generated anomaly image-mask pairs, three common segmentation methods achieve an average 11.17% improvement on IoU on MVTec AD dataset, and a 15.49% enhancement in IoU on MVTec 3D AD dataset.
- Abstract(参考訳): 現在のセグメンテーション法は、多くのトレーニング画像と正確なマスクを必要とするが、異常な画像は産業シナリオにおけるそれらの応用を妨げる。
このような問題に対処するため、多様な異常や正確なピクセル単位のアノテーションの作成について検討する。
実生産ラインを観察することで、異常は形状や外観がランダムに変化するのに対し、製品は局所的な変化がわずかである。
このような特徴は、ごく少数の異常画像といくつかの正常画像を用いて、分離・共有ファインチューニング(SeaS)アプローチを開発するきっかけとなる。
まず,1つの製品トークンと複数の異常トークンからなる産業用異常生成に適した不均衡テキストプロンプトを提案する。
次に、異常画像に対して、異常の属性を異なる異常トークンにバインドする非結合異常アライメント(DA)損失を提案する。
このような属性を再解釈すると、目に見えない異常が発生し、異常の多様性が高い。
通常の画像に対して,グローバルな一貫性と局所的な変動を両立させた製品合成に使用される製品の特徴を学習するために,正規像アライメント(NA)損失を提案する。
2つのトレーニングプロセスは分離されるが、共有U-Net上で実行される。
最後に、SeaSは、U-Netの識別的特徴と高解像度のVAE特徴を融合することにより、生成された異常に対して高忠実なアノテーションを生成する。
MVTec ADとMVTec 3D ADデータセットの大規模な評価は,我々のアプローチの有効性を示している。
異常画像生成では、ISで1.88、MVTec ADデータセットでIC-LPIPSで0.34、ISで1.95、MVTec 3D ADデータセットでIC-LPIPSで0.30を達成する。
ダウンストリームタスクでは、生成した異常なイメージマスクペアを使用して、MVTec ADデータセット上でのIoUの平均11.17%の改善、MVTec 3D ADデータセット上でのIoUの15.49%の強化を実現している。
関連論文リスト
- Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [88.34095233600719]
FAPromptは、より正確なZSADのためにきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
画像レベルおよび画素レベルのZSADタスクにおいて、最先端の手法を少なくとも3%-5%のAUC/APで大幅に上回っている。
論文 参考訳(メタデータ) (2024-10-14T08:41:31Z) - Fine-grained Image-to-LiDAR Contrastive Distillation with Visual Foundation Models [55.99654128127689]
Visual Foundation Models (VFM) は、3D表現学習を強化するために使用される。
VFMは、弱制御された画素間コントラスト蒸留のためのセマンティックラベルを生成する。
我々は,空間分布とカテゴリー周波数の不均衡に対応するために,点のサンプリング確率を適応させる。
論文 参考訳(メタデータ) (2024-05-23T07:48:19Z) - Self-supervised learning for classifying paranasal anomalies in the maxillary sinus [31.45131665942058]
自己教師付き学習は、ラベルのないデータから表現を学習するために使用することができる。
上顎洞の副鼻腔奇形を分類する下流タスクのために設計されたSSLメソッドはない。
提案手法では,教師なし異常検出フレームワークで訓練された3次元畳み込みオートエンコーダを用いる。
論文 参考訳(メタデータ) (2024-04-29T11:14:11Z) - A SAM-guided Two-stream Lightweight Model for Anomaly Detection [50.28310943263051]
我々は、教師なし異常検出(STLM)のためのSAM誘導2ストリーム軽量モデルを提案する。
MVTec ADベンチマークを用いて行った実験により,約16Mのパラメータを持ち,20msの推論時間を実現したSTLMは,最先端の手法と効果的に競合することが示された。
論文 参考訳(メタデータ) (2024-02-29T13:29:10Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。
既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。
本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文 参考訳(メタデータ) (2023-12-10T05:13:40Z) - Composite Score for Anomaly Detection in Imbalanced Real-World
Industrial Dataset [0.0]
本稿では,PCBA(Printed Circuit Board Assembly)イメージを,通常の製品で訓練されたベクトル量子生成適応ネットワーク(VQGAN)を用いて再構成する産業パートナーのユースケースについて述べる。
いくつかの正常な画像と異常な画像から複数のマルチレベルメトリクスが抽出され、再構成の違いによって異常が強調される。
クラスアイファーは、抽出されたメトリクスのおかげで複合異常スコアを構築するように訓練される。
論文 参考訳(メタデータ) (2022-11-25T09:41:07Z) - AnoSeg: Anomaly Segmentation Network Using Self-Supervised Learning [11.234583962952891]
本稿では、自己教師付き学習を用いて、正確な異常マップを直接生成できる新しい異常分割ネットワーク(AnoSeg)を提案する。
高精度な異常セグメンテーションのために提案されたAnoSegは、3つの新しい手法を考察している。
実験の結果,提案手法はMVTec ADデータセットに対して,最先端の異常検出および異常セグメンテーション法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-10-07T12:36:36Z) - Modeling the Distribution of Normal Data in Pre-Trained Deep Features
for Anomaly Detection [2.9864637081333085]
画像中の異常検出(AD)は、標準からかなり逸脱した画像や画像のサブ構造を特定することを指す。
本研究では,大きな自然画像データセット上での識別モデルにより学習された深い特徴表現が,正規性を記述するのに適していることを示す。
論文 参考訳(メタデータ) (2020-05-28T16:43:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。