論文の概要: M3DM-NR: RGB-3D Noisy-Resistant Industrial Anomaly Detection via Multimodal Denoising
- arxiv url: http://arxiv.org/abs/2406.02263v1
- Date: Tue, 4 Jun 2024 12:33:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-05 16:32:17.850360
- Title: M3DM-NR: RGB-3D Noisy-Resistant Industrial Anomaly Detection via Multimodal Denoising
- Title(参考訳): M3DM-NR:RGB-3Dマルチモーダルデノナイジングによる耐雑音性産業異常検出
- Authors: Chengjie Wang, Haokun Zhu, Jinlong Peng, Yue Wang, Ran Yi, Yunsheng Wu, Lizhuang Ma, Jiangning Zhang,
- Abstract要約: 既存の産業異常検出手法は主に、原始RGB画像を用いた教師なし学習に重点を置いている。
本稿では,CLIPの強力なマルチモーダル識別機能を利用する新しい耐雑音性M3DM-NRフレームワークを提案する。
M3DM-NRは3D-RGBマルチモーダルノイズ異常検出において最先端の手法より優れていた。
- 参考スコア(独自算出の注目度): 63.39134873744748
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing industrial anomaly detection methods primarily concentrate on unsupervised learning with pristine RGB images. Yet, both RGB and 3D data are crucial for anomaly detection, and the datasets are seldom completely clean in practical scenarios. To address above challenges, this paper initially delves into the RGB-3D multi-modal noisy anomaly detection, proposing a novel noise-resistant M3DM-NR framework to leveraging strong multi-modal discriminative capabilities of CLIP. M3DM-NR consists of three stages: Stage-I introduces the Suspected References Selection module to filter a few normal samples from the training dataset, using the multimodal features extracted by the Initial Feature Extraction, and a Suspected Anomaly Map Computation module to generate a suspected anomaly map to focus on abnormal regions as reference. Stage-II uses the suspected anomaly maps of the reference samples as reference, and inputs image, point cloud, and text information to achieve denoising of the training samples through intra-modal comparison and multi-scale aggregation operations. Finally, Stage-III proposes the Point Feature Alignment, Unsupervised Feature Fusion, Noise Discriminative Coreset Selection, and Decision Layer Fusion modules to learn the pattern of the training dataset, enabling anomaly detection and segmentation while filtering out noise. Extensive experiments show that M3DM-NR outperforms state-of-the-art methods in 3D-RGB multi-modal noisy anomaly detection.
- Abstract(参考訳): 既存の産業異常検出手法は主に、原始RGB画像を用いた教師なし学習に重点を置いている。
しかし、RGBデータと3Dデータの両方が異常検出に不可欠であり、実際のシナリオではデータセットが完全にクリーンであることはめったにない。
上記の課題に対処するため,本論文はまずRGB-3Dマルチモーダルノイズ異常検出に取り組み,CLIPの強力なマルチモーダル識別機能を活用するための新しいノイズ耐性M3DM-NRフレームワークを提案する。
M3DM-NRは3つのステージで構成されている。Stage-Iはトレーニングデータセットからいくつかの通常のサンプルをフィルタリングするために参照参照選択モジュールを導入し、初期特徴抽出によって抽出されたマルチモーダル特徴を使用して、参照として異常領域に注目する疑わしい異常マップを生成する。
Stage-IIでは、参照サンプルの疑わしい異常マップを参照として使用し、画像、点雲、テキスト情報を入力して、モーダル内比較とマルチスケールアグリゲーション操作を通じてトレーニングサンプルのノイズ化を実現する。
最後に、Stage-IIIは、学習データセットのパターンを学ぶためにPoint Feature Alignment、Unsupervised Feature Fusion、Nozz Discriminative Coreset Selection、Decision Layer Fusionモジュールを提案し、ノイズをフィルタリングしながら異常検出とセグメンテーションを可能にする。
M3DM-NRは3D-RGBマルチモーダルノイズ異常検出において最先端の手法より優れていた。
関連論文リスト
- Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping [12.442574943138794]
本稿では、点雲とRGB画像を利用して異常をローカライズする産業用マルチモーダル異常検出(AD)タスクについて検討する。
我々は,新しい軽量かつ高速なフレームワークを導入し,特徴を1つのモダリティからもう1つのモダリティへのマップを,名目標本上で学習する。
論文 参考訳(メタデータ) (2023-12-07T18:41:21Z) - Dual-Branch Reconstruction Network for Industrial Anomaly Detection with
RGB-D Data [1.861332908680942]
3次元点雲とRGB画像に基づくマルチモーダル産業異常検出が出現し始めている。
上記の方法は、より長い推論時間と高いメモリ使用量を必要とするため、業界におけるリアルタイムな要求を満たすことはできない。
本稿では、RGB-D入力に基づく軽量な二重分岐再構成ネットワークを提案し、通常例と異常例の判定境界を学習する。
論文 参考訳(メタデータ) (2023-11-12T10:19:14Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - BSDM: Background Suppression Diffusion Model for Hyperspectral Anomaly
Detection [29.01709467137784]
ハイパースペクトル異常検出(HAD)の大きな課題は、入力ハイパースペクトル画像(HSI)の複雑な背景である。
本稿では,HADのための新しいソリューションBSDM(backgroundpression diffusion model)を提案する。これは,遅延背景分布を同時に学習し,複雑な背景を抑えるために異なるデータセットに一般化することができる。
我々の研究は、手動でラベル付けされたデータを必要とすることなく、HADの性能を向上させる新しいバックグラウンド抑圧手法を練り上げた。
論文 参考訳(メタデータ) (2023-07-19T09:45:06Z) - Multimodal Industrial Anomaly Detection via Hybrid Fusion [59.16333340582885]
ハイブリッド核融合方式を用いた新しいマルチモーダル異常検出法を提案する。
本モデルでは,MVTecD-3 ADデータセットにおける検出精度とセグメンテーション精度の両面で,最先端(SOTA)手法より優れている。
論文 参考訳(メタデータ) (2023-03-01T15:48:27Z) - The role of noise in denoising models for anomaly detection in medical
images [62.0532151156057]
病理脳病変は脳画像に多彩な外観を示す。
正規データのみを用いた教師なし異常検出手法が提案されている。
空間分解能の最適化と雑音の大きさの最適化により,異なるモデル学習体制の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-01-19T21:39:38Z) - Omni-frequency Channel-selection Representations for Unsupervised
Anomaly Detection [11.926787216956459]
本稿では,周波数を考慮した新しいOmni- frequency Channel-Selection Reconstruction (OCR-GAN) ネットワークを提案する。
提案手法は, 再建ベースラインを+38.1, 現行のSOTA法を+0.3に大きく上回っている。
論文 参考訳(メタデータ) (2022-03-01T06:35:15Z) - Generalizing Face Forgery Detection with High-frequency Features [63.33397573649408]
現在のCNNベースの検出器は、メソッド固有の色テクスチャに過度に適合するため、一般化に失敗する傾向にある。
フェースフォージェリ検出に高周波雑音を用いることを提案する。
1つは、複数のスケールで高周波ノイズを抽出するマルチスケールの高周波特徴抽出モジュールである。
2つ目は、低レベルRGB特徴抽出器を導く残差誘導空間注意モジュールで、新しい視点からフォージェリートレースにもっと集中する。
論文 参考訳(メタデータ) (2021-03-23T08:19:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。