論文の概要: Detect, Classify, Act: Categorizing Industrial Anomalies with Multi-Modal Large Language Models
- arxiv url: http://arxiv.org/abs/2505.02626v1
- Date: Mon, 05 May 2025 13:08:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 18:49:35.679981
- Title: Detect, Classify, Act: Categorizing Industrial Anomalies with Multi-Modal Large Language Models
- Title(参考訳): 検出・分類・行為:多モード大言語モデルによる産業異常の分類
- Authors: Sassan Mokhtar, Arian Mousakhan, Silvio Galesso, Jawad Tayyub, Thomas Brox,
- Abstract要約: 本稿では,異常分類のための新しいパイプラインであるVELMを提案する。
我々は、広く使われているMVTec-ADとVisA-ACデータセットの洗練されたバージョンであるMVTec-ACとVisA-ACを紹介する。
提案手法は,MVTec-ADで80.4%,MVTec-ACで84%の精度を達成し,VELMの有効性を示した。
- 参考スコア(独自算出の注目度): 27.008700759998945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in visual industrial anomaly detection have demonstrated exceptional performance in identifying and segmenting anomalous regions while maintaining fast inference speeds. However, anomaly classification-distinguishing different types of anomalies-remains largely unexplored despite its critical importance in real-world inspection tasks. To address this gap, we propose VELM, a novel LLM-based pipeline for anomaly classification. Given the critical importance of inference speed, we first apply an unsupervised anomaly detection method as a vision expert to assess the normality of an observation. If an anomaly is detected, the LLM then classifies its type. A key challenge in developing and evaluating anomaly classification models is the lack of precise annotations of anomaly classes in existing datasets. To address this limitation, we introduce MVTec-AC and VisA-AC, refined versions of the widely used MVTec-AD and VisA datasets, which include accurate anomaly class labels for rigorous evaluation. Our approach achieves a state-of-the-art anomaly classification accuracy of 80.4% on MVTec-AD, exceeding the prior baselines by 5%, and 84% on MVTec-AC, demonstrating the effectiveness of VELM in understanding and categorizing anomalies. We hope our methodology and benchmark inspire further research in anomaly classification, helping bridge the gap between detection and comprehensive anomaly characterization.
- Abstract(参考訳): 近年の視覚的産業異常検出の進歩は、高速な推論速度を維持しつつ、異常領域の同定とセグメント化において、例外的な性能を示した。
しかし, 実世界の検査作業において重要な役割を担っているにもかかわらず, 様々な種類の異常を識別する異常分類は, ほとんど発見されていない。
このギャップに対処するために,新しいLLMに基づく異常分類パイプラインであるVELMを提案する。
推定速度の重要さを考慮し、まず、教師なし異常検出法を視覚専門家として適用し、観測の正常性を評価する。
異常が検出された場合、LSMはその型を分類する。
異常分類モデルの開発と評価における重要な課題は、既存のデータセットにおける異常分類の正確なアノテーションの欠如である。
この制限に対処するため,広範に使用されているMVTec-ADおよびVisAデータセットの洗練されたバージョンであるMVTec-ACとVisA-ACを導入する。
提案手法は,MVTec-ADで80.4%,MVTec-ACで84%,診断・分類におけるVELMの有効性を示した。
我々の方法論とベンチマークは、異常分類のさらなる研究を刺激し、検出と包括的異常分類のギャップを埋めるのに役立つことを願っている。
関連論文リスト
- AnomalyNCD: Towards Novel Anomaly Class Discovery in Industrial Scenarios [16.77348120041789]
本稿では,異なる異常検出手法に適合する多クラス異常分類ネットワークであるAnomalyNCDを提案する。
異常の非優位性に対処するため,我々は主要素バイナライゼーション(MEBin)を設計し,異常中心の画像を得る。
次に、弱い意味を持つ異常を学習するために、マスクによって導かれる孤立した異常に焦点を当てたマスク誘導表現学習を設計する。
論文 参考訳(メタデータ) (2024-10-18T11:07:12Z) - MeLIAD: Interpretable Few-Shot Anomaly Detection with Metric Learning and Entropy-based Scoring [2.394081903745099]
本稿では,新たな異常検出手法であるMeLIADを提案する。
MeLIADはメートル法学習に基づいており、真の異常の事前分布仮定に頼ることなく、設計による解釈可能性を達成する。
解釈可能性の定量的かつ定性的な評価を含む5つの公開ベンチマークデータセットの実験は、MeLIADが異常検出とローカライゼーション性能の改善を達成することを実証している。
論文 参考訳(メタデータ) (2024-09-20T16:01:43Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - Open-Set Graph Anomaly Detection via Normal Structure Regularisation [30.638274744518682]
Open-set Graph Anomaly Detection (GAD)は、少数の正規ノードと異常ノードを使用して検出モデルをトレーニングすることを目的としている。
現在の監督型GAD法は、目に見えない異常を正常なノードとして検出する多くの誤りを招き、その異常を過度に強調する傾向にある。
本稿では,新しいオープンセットGAD手法,すなわち正規構造正規化(NSReg)を提案する。
論文 参考訳(メタデータ) (2023-11-12T13:25:28Z) - Prototypical Residual Networks for Anomaly Detection and Localization [80.5730594002466]
本稿では,PRN(Prototypeal Residual Network)というフレームワークを提案する。
PRNは、異常領域の分割マップを正確に再構築するために、異常領域と正常パターンの間の様々なスケールとサイズの特徴的残差を学習する。
異常を拡大・多様化するために,見かけの相違と外観の相違を考慮に入れた様々な異常発生戦略を提示する。
論文 参考訳(メタデータ) (2022-12-05T05:03:46Z) - Explainable Deep Few-shot Anomaly Detection with Deviation Networks [123.46611927225963]
本稿では,弱い教師付き異常検出フレームワークを導入し,検出モデルを訓練する。
提案手法は,ラベル付き異常と事前確率を活用することにより,識別正規性を学習する。
我々のモデルはサンプル効率が高く頑健であり、クローズドセットとオープンセットの両方の設定において最先端の競合手法よりもはるかに優れている。
論文 参考訳(メタデータ) (2021-08-01T14:33:17Z) - Understanding the Effect of Bias in Deep Anomaly Detection [15.83398707988473]
異常検出はラベル付き異常データの不足のため、機械学習においてユニークな課題となる。
最近の研究は、追加のラベル付き異常サンプルによる深部異常検出モデルのトレーニングを増強することで、このような問題を緩和しようとするものである。
本稿では,異常検出に対するバイアス付き異常集合の効果を理解することを目的とする。
論文 参考訳(メタデータ) (2021-05-16T03:55:02Z) - Toward Deep Supervised Anomaly Detection: Reinforcement Learning from
Partially Labeled Anomaly Data [150.9270911031327]
本稿では,一部のラベル付き異常事例と大規模ラベルなしデータセットを用いた異常検出の問題点について考察する。
既存の関連手法は、通常、一連の異常にまたがらない限られた異常例にのみ適合するか、ラベルのないデータから教師なしの学習を進めるかのいずれかである。
そこで本研究では,ラベル付きおよびラベルなし両方の異常の検出をエンドツーエンドに最適化する,深層強化学習に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-15T03:05:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。