論文の概要: TransFusion -- A Transparency-Based Diffusion Model for Anomaly
Detection
- arxiv url: http://arxiv.org/abs/2311.09999v1
- Date: Thu, 16 Nov 2023 16:23:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-17 13:41:44.382851
- Title: TransFusion -- A Transparency-Based Diffusion Model for Anomaly
Detection
- Title(参考訳): TransFusion -- 異常検出のための透明性に基づく拡散モデル
- Authors: Matic Fu\v{c}ka, Vitjan Zavrtanik, Danijel Sko\v{c}aj
- Abstract要約: 再構成された異常検出手法は、対象物の正常な外観を復元し、理想的には異常領域のみを変更する。
近年の再構成手法では拡散モデルが採用されているが, 標準拡散法では問題に十分対応していない。
本稿では,異常領域の透明性が徐々に増大する,透過性に基づく新しい拡散プロセスを提案する。
TransFusion は VisA と MVTec AD の両方のデータセットで、画像レベルの AUROC はそれぞれ98.5% と 99.2% である。
- 参考スコア(独自算出の注目度): 3.130722489512822
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Surface anomaly detection is a vital component in manufacturing inspection.
Reconstructive anomaly detection methods restore the normal appearance of an
object, ideally modifying only the anomalous regions. Due to the limitations of
commonly used reconstruction architectures, the produced reconstructions are
often poor and either still contain anomalies or lack details in anomaly-free
regions. Recent reconstructive methods adopt diffusion models, however with the
standard diffusion process the problems are not adequately addressed. We
propose a novel transparency-based diffusion process, where the transparency of
anomalous regions is progressively increased, restoring their normal appearance
accurately and maintaining the appearance of anomaly-free regions without loss
of detail. We propose TRANSparency DifFUSION (TransFusion), a discriminative
anomaly detection method that implements the proposed diffusion process,
enabling accurate downstream anomaly detection. TransFusion achieves
state-of-the-art performance on both the VisA and the MVTec AD datasets, with
an image-level AUROC of 98.5% and 99.2%, respectively.
- Abstract(参考訳): 表面異常検出は製造検査において重要な要素である。
再構成異常検出法は、異常領域のみを理想的に修正して、物体の正常な外観を復元する。
一般的に使用されている再建建築の制限のため、生産された再建は貧弱であり、異常がまだ残っているか、異常のない地域では詳細が欠落している。
近年の再構成手法では拡散モデルが採用されているが,標準拡散法では問題に十分対応していない。
そこで我々は, 異常領域の透明性が徐々に向上し, 正常な外観を正確に復元し, 詳細を損なわずに異常領域の出現を維持する, 新たな透明性に基づく拡散プロセスを提案する。
本研究では,提案手法を実装した識別的異常検出法である透明性拡散(transfusion)を提案する。
TransFusion は VisA と MVTec AD の両方のデータセットで、画像レベルの AUROC はそれぞれ98.5% と 99.2% である。
関連論文リスト
- Multi-feature Reconstruction Network using Crossed-mask Restoration for Unsupervised Industrial Anomaly Detection [4.742650815342744]
産業生産における品質検査には, 教師なし異常検出が重要である。
本稿では,クロスマスク復元を用いた多機能再構成ネットワークMFRNetを提案する。
提案手法は,4つの公開データセットと1つの自作データセットにおいて,他の最先端のデータセットと高い競争力,あるいは大幅に上回っている。
論文 参考訳(メタデータ) (2024-04-20T05:13:56Z) - Produce Once, Utilize Twice for Anomaly Detection [6.501323305130114]
我々は、再構成ネットワークにおける識別情報電位を再利用することにより、精度と効率を両立させるPOUTAを導出する。
POUTAは、特別な設計をせずに、最先端の数発の異常検出方法よりも優れた性能を実現している。
論文 参考訳(メタデータ) (2023-12-20T10:49:49Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - Reversing the Abnormal: Pseudo-Healthy Generative Networks for Anomaly
Detection [8.737589725372398]
PHANES(Pseudo Healthy Generative Network for Anomaly)と呼ばれる新しい教師なしアプローチを導入する。
本手法は, 異常を回復し, 健康な組織を保存し, 異常領域を偽の健康再建に置き換える機能を有する。
我々は、T1w脳MRIデータセットの脳梗塞検出におけるPHANESの有効性を実証し、最先端(SOTA)法よりも大幅に改善したことを示す。
論文 参考訳(メタデータ) (2023-03-15T08:54:20Z) - DDS2M: Self-Supervised Denoising Diffusion Spatio-Spectral Model for
Hyperspectral Image Restoration [103.79030498369319]
ハイパースペクトル画像復元のための自己教師付き拡散モデルを提案する。
textttDDS2Mは、既存の拡散法と比較して、より強力な一般化能力を持っている。
HSIのノイズ除去、ノイズ除去、様々なHSIの超解像実験は、既存のタスク固有状態よりもtextttDDS2Mの方が優れていることを示した。
論文 参考訳(メタデータ) (2023-03-12T14:57:04Z) - Gait Cycle Reconstruction and Human Identification from Occluded
Sequences [2.198430261120653]
我々は,歩行認識を行う前に,隠蔽されたフレームを入力シーケンスで再構築する有効なニューラルネットワークモデルを提案する。
我々はLSTMネットワークを用いて,前向きと後向きの両方から隠蔽フレームの埋め込みを予測する。
LSTMは平均二乗損失を最小限に抑えるために訓練されるが、核融合ネットワークは、接地構造と再構成されたサンプルの間の画素単位のクロスエントロピー損失を最適化するために訓練される。
論文 参考訳(メタデータ) (2022-06-20T16:04:31Z) - Visual Attention Emerges from Recurrent Sparse Reconstruction [82.78753751860603]
本稿では,人間の視覚的注意機構の2つの特徴,すなわち再発と空間性に基づく新しい注意形態について述べる。
自己注意は単一ステップの最適化と空間制約のないVARSの特殊な場合であることを示す。
VARSは、一般的な視覚変換器における自己注意の代替として容易に利用でき、様々なベンチマークでその堅牢性を一貫して改善することができる。
論文 参考訳(メタデータ) (2022-04-23T00:35:02Z) - Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。
実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-11-27T12:12:57Z) - Iterative Network for Image Super-Resolution [69.07361550998318]
単一画像超解像(SISR)は、最近の畳み込みニューラルネットワーク(CNN)の発展により、大幅に活性化されている。
本稿では、従来のSISRアルゴリズムに関する新たな知見を提供し、反復最適化に依存するアプローチを提案する。
反復最適化の上に,新しい反復型超解像ネットワーク (ISRN) を提案する。
論文 参考訳(メタデータ) (2020-05-20T11:11:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。