論文の概要: Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping
- arxiv url: http://arxiv.org/abs/2312.04521v1
- Date: Thu, 7 Dec 2023 18:41:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-08 13:46:29.335135
- Title: Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping
- Title(参考訳): クロスモーダル特徴マッピングによるマルチモーダル産業異常検出
- Authors: Alex Costanzino, Pierluigi Zama Ramirez, Giuseppe Lisanti, Luigi Di
Stefano
- Abstract要約: 本稿では、点雲とRGB画像を利用して異常をローカライズする産業用マルチモーダル異常検出(AD)タスクについて検討する。
我々は,新しい軽量かつ高速なフレームワークを導入し,特徴を1つのモダリティからもう1つのモダリティへのマップを,名目標本上で学習する。
- 参考スコア(独自算出の注目度): 13.592619256889815
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The paper explores the industrial multimodal Anomaly Detection (AD) task,
which exploits point clouds and RGB images to localize anomalies. We introduce
a novel light and fast framework that learns to map features from one modality
to the other on nominal samples. At test time, anomalies are detected by
pinpointing inconsistencies between observed and mapped features. Extensive
experiments show that our approach achieves state-of-the-art detection and
segmentation performance in both the standard and few-shot settings on the
MVTec 3D-AD dataset while achieving faster inference and occupying less memory
than previous multimodal AD methods. Moreover, we propose a layer-pruning
technique to improve memory and time efficiency with a marginal sacrifice in
performance.
- Abstract(参考訳): この論文は、点雲とrgb画像を利用して異常をローカライズする産業用マルチモーダル異常検出(ad)タスクを探求する。
我々は,新しい軽量で高速なフレームワークを導入し,名目的なサンプル上で,あるモダリティから他のモダリティへ機能をマップすることを学ぶ。
テスト時には、観測された特徴とマッピングされた特徴との矛盾を指摘して異常を検出する。
広汎な実験により,MVTec 3D-ADデータセットの標準設定と少ショット設定の両方において,従来のマルチモーダルAD手法よりも高速な推論とメモリ占有を実現し,最先端検出とセグメンテーション性能を実現することができた。
さらに,性能を犠牲にしてメモリ効率と時間効率を向上させるための層刈り技術を提案する。
関連論文リスト
- Spatial-Temporal Enhanced Transformer Towards Multi-Frame 3D Object
Detection [59.03596380773798]
我々は、DETRのようなパラダイムに基づいた、多フレーム3Dオブジェクト検出のための新しいエンドツーエンドフレームワークであるSTEMDを提案する。
具体的には、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
我々は,計算オーバーヘッドをわずかに加えるだけで,難解なシナリオに対処する手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-07-01T13:53:14Z) - Multimodal Industrial Anomaly Detection via Hybrid Fusion [59.16333340582885]
ハイブリッド核融合方式を用いた新しいマルチモーダル異常検出法を提案する。
本モデルでは,MVTecD-3 ADデータセットにおける検出精度とセグメンテーション精度の両面で,最先端(SOTA)手法より優れている。
論文 参考訳(メタデータ) (2023-03-01T15:48:27Z) - Gait Recognition in the Wild with Multi-hop Temporal Switch [81.35245014397759]
野生での歩行認識は、より実践的な問題であり、マルチメディアとコンピュータビジョンのコミュニティの注目を集めています。
本稿では,現実のシーンにおける歩行パターンの効果的な時間的モデリングを実現するために,新しいマルチホップ時間スイッチ方式を提案する。
論文 参考訳(メタデータ) (2022-09-01T10:46:09Z) - Benchmarking Deep Models for Salient Object Detection [67.07247772280212]
汎用SALOD(General SALient Object Detection)ベンチマークを構築し,複数のSOD手法の総合的な比較を行った。
以上の実験では、既存の損失関数は、通常いくつかの指標に特化しているが、他の指標には劣る結果が報告されている。
我々は,深層ネットワークに画素レベルと画像レベルの両方の監視信号を統合することにより,より識別的な特徴を学習するためのエッジ・アウェア・ロス(EA)を提案する。
論文 参考訳(メタデータ) (2022-02-07T03:43:16Z) - Time-Series Anomaly Detection with Implicit Neural Representation [0.38073142980733]
Inlicit Neural Representation-based Anomaly Detection (INRAD)を提案する。
入力に時間がかかり、その時点で対応する値を出力する単純な多層パーセプトロンを訓練する。
そして,その表現誤りを異常検出のための異常スコアとして利用する。
論文 参考訳(メタデータ) (2022-01-28T06:17:24Z) - UFPMP-Det: Toward Accurate and Efficient Object Detection on Drone
Imagery [26.27705791338182]
本稿では,UFPMP-Det(Unified Foreground Packing)を用いたマルチプロキシ検出ネットワーク(Multi-Proxy Detection Network)を提案する。
UFPMP-Detは、高解像度の入力画像をフォアグラウンド比の低いかなり多くのチップに分割して検出する一般的なソリューションとは異なる、非常に小さなスケールの多数のインスタンスを扱うように設計されている。
広く使われているVisDroneとUAVDTデータセットで実験が行われ、UFPMP-Detは新たな最先端スコアをはるかに高速で報告し、その利点を強調している。
論文 参考訳(メタデータ) (2021-12-20T09:28:44Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - CMA-Net: A Cascaded Mutual Attention Network for Light Field Salient
Object Detection [17.943924748737622]
本稿では,全焦点と深さのモダリティからハイレベルな特徴を浮き彫りにすることを目的とした2つの新しい相互注意モジュールからなるcma-netを提案する。
提案するcma-netは、広く適用された2つのライトフィールドベンチマークデータセットで30のsodメソッド(大きなマージン)を上回る。
論文 参考訳(メタデータ) (2021-05-03T15:32:12Z) - Exploring Data Augmentation for Multi-Modality 3D Object Detection [82.9988604088494]
ポイントクラウドとイメージに基づくマルチモダリティメソッドは、ポイントクラウドのみを使用するアプローチよりも、わずかに良いか、時には悪いだけである。
トランスフォーメーションフローと呼ばれるパイプラインを提案し、トランスフォーメーションのリバースとリプレイによってシングルモードとマルチモードのデータ拡張のギャップを埋める。
また,本手法は第3回nuScenes検出チャレンジでPKL賞を受賞した。
論文 参考訳(メタデータ) (2020-12-23T15:23:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。