論文の概要: TransFusion -- A Transparency-Based Diffusion Model for Anomaly Detection
- arxiv url: http://arxiv.org/abs/2311.09999v2
- Date: Wed, 10 Jul 2024 13:44:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-11 22:09:30.961725
- Title: TransFusion -- A Transparency-Based Diffusion Model for Anomaly Detection
- Title(参考訳): TransFusion -- 異常検出のための透明性に基づく拡散モデル
- Authors: Matic Fučka, Vitjan Zavrtanik, Danijel Skočaj,
- Abstract要約: 本稿では,2つのデータセットにおける最先端性能を実現する識別異常検出手法を提案する。
TransFusion は VisA と MVTec AD の両方のデータセットで、画像レベルの AUROC はそれぞれ98.5% と 99.2% である。
- 参考スコア(独自算出の注目度): 2.7855886538423182
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Surface anomaly detection is a vital component in manufacturing inspection. Current discriminative methods follow a two-stage architecture composed of a reconstructive network followed by a discriminative network that relies on the reconstruction output. Currently used reconstructive networks often produce poor reconstructions that either still contain anomalies or lack details in anomaly-free regions. Discriminative methods are robust to some reconstructive network failures, suggesting that the discriminative network learns a strong normal appearance signal that the reconstructive networks miss. We reformulate the two-stage architecture into a single-stage iterative process that allows the exchange of information between the reconstruction and localization. We propose a novel transparency-based diffusion process where the transparency of anomalous regions is progressively increased, restoring their normal appearance accurately while maintaining the appearance of anomaly-free regions using localization cues of previous steps. We implement the proposed process as TRANSparency DifFUSION (TransFusion), a novel discriminative anomaly detection method that achieves state-of-the-art performance on both the VisA and the MVTec AD datasets, with an image-level AUROC of 98.5% and 99.2%, respectively. Code: https://github.com/MaticFuc/ECCV_TransFusion
- Abstract(参考訳): 表面異常検出は製造検査において重要な要素である。
現在の差別的手法は、再構成されたネットワークと、再構成された出力に依存する識別的ネットワークからなる2段階のアーキテクチャに従う。
現在使用されている再建ネットワークは、しばしば貧弱な再構成を生み出すが、これはまだ異常を含むか、異常のない領域で詳細を欠いている。
識別的手法は、いくつかの再構成的ネットワーク障害に対して堅牢であり、識別的ネットワークは、再構成的ネットワークが見逃す強い正常な信号を学ぶことを示唆している。
我々は、2段階のアーキテクチャを1段階の反復的なプロセスに再構成し、再構築とローカライゼーションの間で情報の交換を可能にする。
本研究では, 異常領域の透明性を徐々に向上させ, 異常領域の出現を維持しつつ, 正常な外観を正確に復元する, 新たな透明性に基づく拡散プロセスを提案する。
本稿では,VisAとMVTec ADの両方のデータセットに対して,画像レベルのAUROCの98.5%と99.2%の精度で最先端の性能を実現する,新たな識別異常検出手法であるTransparency DifFUSION(TransFusion)として提案手法を実装した。
コード:https://github.com/MaticFuc/ECCV_TransFusion
関連論文リスト
- Multi-feature Reconstruction Network using Crossed-mask Restoration for Unsupervised Industrial Anomaly Detection [4.742650815342744]
産業生産における品質検査には, 教師なし異常検出が重要である。
本稿では,クロスマスク復元を用いた多機能再構成ネットワークMFRNetを提案する。
提案手法は,4つの公開データセットと1つの自作データセットにおいて,他の最先端のデータセットと高い競争力,あるいは大幅に上回っている。
論文 参考訳(メタデータ) (2024-04-20T05:13:56Z) - Produce Once, Utilize Twice for Anomaly Detection [6.501323305130114]
我々は、再構成ネットワークにおける識別情報電位を再利用することにより、精度と効率を両立させるPOUTAを導出する。
POUTAは、特別な設計をせずに、最先端の数発の異常検出方法よりも優れた性能を実現している。
論文 参考訳(メタデータ) (2023-12-20T10:49:49Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - Reversing the Abnormal: Pseudo-Healthy Generative Networks for Anomaly
Detection [8.737589725372398]
PHANES(Pseudo Healthy Generative Network for Anomaly)と呼ばれる新しい教師なしアプローチを導入する。
本手法は, 異常を回復し, 健康な組織を保存し, 異常領域を偽の健康再建に置き換える機能を有する。
我々は、T1w脳MRIデータセットの脳梗塞検出におけるPHANESの有効性を実証し、最先端(SOTA)法よりも大幅に改善したことを示す。
論文 参考訳(メタデータ) (2023-03-15T08:54:20Z) - DDS2M: Self-Supervised Denoising Diffusion Spatio-Spectral Model for
Hyperspectral Image Restoration [103.79030498369319]
ハイパースペクトル画像復元のための自己教師付き拡散モデルを提案する。
textttDDS2Mは、既存の拡散法と比較して、より強力な一般化能力を持っている。
HSIのノイズ除去、ノイズ除去、様々なHSIの超解像実験は、既存のタスク固有状態よりもtextttDDS2Mの方が優れていることを示した。
論文 参考訳(メタデータ) (2023-03-12T14:57:04Z) - Gait Cycle Reconstruction and Human Identification from Occluded
Sequences [2.198430261120653]
我々は,歩行認識を行う前に,隠蔽されたフレームを入力シーケンスで再構築する有効なニューラルネットワークモデルを提案する。
我々はLSTMネットワークを用いて,前向きと後向きの両方から隠蔽フレームの埋め込みを予測する。
LSTMは平均二乗損失を最小限に抑えるために訓練されるが、核融合ネットワークは、接地構造と再構成されたサンプルの間の画素単位のクロスエントロピー損失を最適化するために訓練される。
論文 参考訳(メタデータ) (2022-06-20T16:04:31Z) - Visual Attention Emerges from Recurrent Sparse Reconstruction [82.78753751860603]
本稿では,人間の視覚的注意機構の2つの特徴,すなわち再発と空間性に基づく新しい注意形態について述べる。
自己注意は単一ステップの最適化と空間制約のないVARSの特殊な場合であることを示す。
VARSは、一般的な視覚変換器における自己注意の代替として容易に利用でき、様々なベンチマークでその堅牢性を一貫して改善することができる。
論文 参考訳(メタデータ) (2022-04-23T00:35:02Z) - Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。
実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-11-27T12:12:57Z) - Iterative Network for Image Super-Resolution [69.07361550998318]
単一画像超解像(SISR)は、最近の畳み込みニューラルネットワーク(CNN)の発展により、大幅に活性化されている。
本稿では、従来のSISRアルゴリズムに関する新たな知見を提供し、反復最適化に依存するアプローチを提案する。
反復最適化の上に,新しい反復型超解像ネットワーク (ISRN) を提案する。
論文 参考訳(メタデータ) (2020-05-20T11:11:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。