論文の概要: Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection
- arxiv url: http://arxiv.org/abs/2401.03145v1
- Date: Sat, 6 Jan 2024 07:30:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-09 20:25:11.533489
- Title: Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection
- Title(参考訳): 3次元産業異常検出のための自己教師付き特徴適応
- Authors: Yuanpeng Tu, Boshen Zhang, Liang Liu, Yuxi Li, Chenhai Xu, Jiangning
Zhang, Yabiao Wang, Chengjie Wang, Cai Rong Zhao
- Abstract要約: 具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
- 参考スコア(独自算出の注目度): 59.41026558455904
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Industrial anomaly detection is generally addressed as an unsupervised task
that aims at locating defects with only normal training samples. Recently,
numerous 2D anomaly detection methods have been proposed and have achieved
promising results, however, using only the 2D RGB data as input is not
sufficient to identify imperceptible geometric surface anomalies. Hence, in
this work, we focus on multi-modal anomaly detection. Specifically, we
investigate early multi-modal approaches that attempted to utilize models
pre-trained on large-scale visual datasets, i.e., ImageNet, to construct
feature databases. And we empirically find that directly using these
pre-trained models is not optimal, it can either fail to detect subtle defects
or mistake abnormal features as normal ones. This may be attributed to the
domain gap between target industrial data and source data.Towards this problem,
we propose a Local-to-global Self-supervised Feature Adaptation (LSFA) method
to finetune the adaptors and learn task-oriented representation toward anomaly
detection.Both intra-modal adaptation and cross-modal alignment are optimized
from a local-to-global perspective in LSFA to ensure the representation quality
and consistency in the inference stage.Extensive experiments demonstrate that
our method not only brings a significant performance boost to feature embedding
based approaches, but also outperforms previous State-of-The-Art (SoTA) methods
prominently on both MVTec-3D AD and Eyecandies datasets, e.g., LSFA achieves
97.1% I-AUROC on MVTec-3D, surpass previous SoTA by +3.4%.
- Abstract(参考訳): 産業異常検出は一般に、通常のトレーニングサンプルのみで欠陥を見つけることを目的とした教師なしのタスクとして扱われる。
近年,多くの2次元異常検出手法が提案され,有望な結果が得られたが,入力として2次元RGBデータのみを用いることで,知覚不能な幾何学的表面異常を識別するには不十分である。
そこで本研究では,マルチモーダル異常検出に焦点をあてる。
具体的には,大規模ビジュアルデータセット,すなわちimagenet上で事前トレーニングされたモデルを用いて特徴データベースを構築する初期マルチモーダルアプローチについて検討する。
そして、これらの事前訓練されたモデルを直接使用するのが最適ではなく、微妙な欠陥を検出したり、異常な特徴を通常のモデルと間違えたりすることを実証的に発見します。
This may be attributed to the domain gap between target industrial data and source data.Towards this problem, we propose a Local-to-global Self-supervised Feature Adaptation (LSFA) method to finetune the adaptors and learn task-oriented representation toward anomaly detection.Both intra-modal adaptation and cross-modal alignment are optimized from a local-to-global perspective in LSFA to ensure the representation quality and consistency in the inference stage.Extensive experiments demonstrate that our method not only brings a significant performance boost to feature embedding based approaches, but also outperforms previous State-of-The-Art (SoTA) methods prominently on both MVTec-3D AD and Eyecandies datasets, e.g., LSFA achieves 97.1% I-AUROC on MVTec-3D, surpass previous SoTA by +3.4%.
関連論文リスト
- COFT-AD: COntrastive Fine-Tuning for Few-Shot Anomaly Detection [19.946344683965425]
FSADの課題に対処する新しい手法を提案する。
重みをモデル化するために、大規模なソースデータセットで事前トレーニングされたモデルを使用します。
提案手法の有効性を示すために,3つの制御されたADタスクと4つの実世界のADタスクに対して,数発の異常検出を行った。
論文 参考訳(メタデータ) (2024-02-29T09:48:19Z) - UniMODE: Unified Monocular 3D Object Detection [70.27631528933482]
我々は,鳥眼視(BEV)検出パラダイムに基づく検出器を構築した。
本稿では,この課題に起因する収束不安定性に対応するために,不均一なBEVグリッド設計を提案する。
統一検出器UniMODEが導出され、挑戦的なOmni3Dデータセットの先行技術を上回る。
論文 参考訳(メタデータ) (2024-02-28T18:59:31Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - Unraveling the "Anomaly" in Time Series Anomaly Detection: A
Self-supervised Tri-domain Solution [89.16750999704969]
異常ラベルは時系列異常検出において従来の教師付きモデルを妨げる。
自己教師型学習のような様々なSOTA深層学習技術がこの問題に対処するために導入されている。
自己教師型3領域異常検出器(TriAD)を提案する。
論文 参考訳(メタデータ) (2023-11-19T05:37:18Z) - An Iterative Method for Unsupervised Robust Anomaly Detection Under Data
Contamination [24.74938110451834]
ほとんどの深層異常検出モデルは、データセットから正規性を学ぶことに基づいている。
実際、正規性仮定は実データ分布の性質によってしばしば破られる。
このギャップを減らし、より優れた正規性表現を実現するための学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T02:36:19Z) - Unsupervised Anomaly Detection via Nonlinear Manifold Learning [0.0]
異常は、残りのデータから著しく逸脱するサンプルであり、その検出は機械学習モデルを構築する上で大きな役割を果たす。
非線形多様体学習に基づく頑健で効率的かつ解釈可能な手法を導入し,教師なし設定における異常を検出する。
論文 参考訳(メタデータ) (2023-06-15T18:48:10Z) - CRADL: Contrastive Representations for Unsupervised Anomaly Detection
and Localization [2.8659934481869715]
医用画像における教師なし異常検出は、訓練中に異常データを必要とせず、任意の異常を検出し、位置決めすることを目的としている。
現在の最先端の手法のほとんどは、画像上で直接動作する潜在変数生成モデルを使用している。
コントラストプレテクストタスクで訓練されたエンコーダの低次元表現空間において,正規サンプルの分布を直接モデル化するCRADLを提案する。
論文 参考訳(メタデータ) (2023-01-05T16:07:49Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [55.52743265122446]
ディープオートエンコーダは視覚領域における異常検出のタスクに使われてきた。
我々は、訓練中に識別情報を使用することが可能な自己指導型学習体制を適用することで、この問題に対処する。
MVTec ADデータセットを用いた実験では,高い検出性能と局所化性能を示した。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文 参考訳(メタデータ) (2021-03-30T10:38:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。