Fugu-MT 論文翻訳(概要): Exploring Large Vision-Language Models for Robust and Efficient Industrial Anomaly Detection

論文の概要: Exploring Large Vision-Language Models for Robust and Efficient Industrial Anomaly Detection

arxiv url: http://arxiv.org/abs/2412.00890v1
Date: Sun, 01 Dec 2024 17:00:43 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-04 21:11:22.24448
Title: Exploring Large Vision-Language Models for Robust and Efficient Industrial Anomaly Detection
Title（参考訳）: ロバストかつ高効率な産業異常検出のための大規模視線モデル探索
Authors: Kun Qian, Tianyu Sun, Wenhong Wang,
Abstract要約: CLAD(Contrastive Cross-Modal Training)を用いた視覚言語異常検出法を提案する。 CLADは、視覚的特徴とテキスト的特徴をコントラスト学習を用いて共有埋め込み空間に整列する。 CLADは画像レベルの異常検出と画素レベルの異常局所化の両方において最先端の手法より優れていることを示す。
参考スコア（独自算出の注目度）: 4.691083532629246
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Industrial anomaly detection (IAD) plays a crucial role in the maintenance and quality control of manufacturing processes. In this paper, we propose a novel approach, Vision-Language Anomaly Detection via Contrastive Cross-Modal Training (CLAD), which leverages large vision-language models (LVLMs) to improve both anomaly detection and localization in industrial settings. CLAD aligns visual and textual features into a shared embedding space using contrastive learning, ensuring that normal instances are grouped together while anomalies are pushed apart. Through extensive experiments on two benchmark industrial datasets, MVTec-AD and VisA, we demonstrate that CLAD outperforms state-of-the-art methods in both image-level anomaly detection and pixel-level anomaly localization. Additionally, we provide ablation studies and human evaluation to validate the importance of key components in our method. Our approach not only achieves superior performance but also enhances interpretability by accurately localizing anomalies, making it a promising solution for real-world industrial applications.
Abstract（参考訳）: 産業異常検出(IAD)は製造工程の維持と品質管理において重要な役割を担っている。本稿では,産業環境における異常検出と局所化の両方を改善するために,大規模視覚言語モデル(LVLM)を活用したCLADを用いた視覚言語異常検出手法を提案する。 CLADは、視覚的特徴とテキスト的特徴をコントラスト学習を用いて共有埋め込み空間に整合させ、異常が押し離されながら正常なインスタンスがグループ化されることを保証する。 2つのベンチマーク産業データセットであるMVTec-ADとVisAの広範な実験により、CLADは画像レベルの異常検出と画素レベルの異常ローカライゼーションの両方において最先端の手法より優れていることを示した。また,本手法における重要成分の重要性を評価するために,アブレーション研究と人的評価を行った。提案手法は,優れた性能を達成できるだけでなく,異常を正確に局所化することで解釈可能性を高める。

関連論文リスト

Learning local and global prototypes with optimal transport for unsupervised anomaly detection and localization [0.28647133890966986]
教師なし異常検出は、トレーニング中に正常なデータ、すなわち欠陥のない一連のデータにアクセスすることで、サンプルの欠陥部分を検出することを目的としている。本稿では,プロトタイプ学習に基づく新しいUAD手法を提案する。
論文参考訳（メタデータ） (2025-08-18T13:51:36Z)
Region-Aware CAM: High-Resolution Weakly-Supervised Defect Segmentation via Salient Region Perception [2.9962030276180758]
本稿では,弱教師付きセマンティックセマンティックセグメンテーションフレームワークを提案する。リージョン対応のクラスアクティベーションマップ(CAM)と擬似ラベルトレーニングで構成されている。提案手法は,弱教師付き学習と高精度欠陥分割のギャップを効果的に埋めるものである。
論文参考訳（メタデータ） (2025-06-28T12:24:45Z)
Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detection [50.343419243749054]
異常検出は、医学診断や工業的欠陥検出などの分野において重要である。 CLIPの粗粒化画像テキストアライメントは、微粒化異常に対する局所化と検出性能を制限する。クレーンは最先端のZSADを2%から28%に改善し、画像レベルとピクセルレベルの両方で、推論速度では競争力を維持している。
論文参考訳（メタデータ） (2025-04-15T10:42:25Z)
Beyond Academic Benchmarks: Critical Analysis and Best Practices for Visual Industrial Anomaly Detection [40.174488947319645]
製造における視覚検査の自動化には,異常検出(AD)が不可欠である。本稿では,(1)実世界のデータセットの重要性を実証し,実際の生産データを用いたベンチマークを確立すること,(2)実践的応用に有用な指標を用いて,既存のSOTA手法を公平に比較すること,(3)学術と産業のギャップを埋めるための重要な課題と新たな視点を論じることで,この分野の最近の進歩を包括的に分析すること,の3つの主要な貢献を行う。
論文参考訳（メタデータ） (2025-03-30T14:11:46Z)
Robust Distribution Alignment for Industrial Anomaly Detection under Distribution Shift [51.24522135151649]
異常検出は産業アプリケーションの品質管理において重要な役割を担っている。既存の方法は、一般化可能なモデルをトレーニングすることで、ドメインシフトに対処しようとする。提案手法は,最先端の異常検出法や領域適応法と比較して,優れた結果を示す。
論文参考訳（メタデータ） (2025-03-19T05:25:52Z)
EIAD: Explainable Industrial Anomaly Detection Via Multi-Modal Large Language Models [23.898938659720503]
工業異常検出(IAD)は製造中の製品品質を確保するために重要である。本稿では,コア特徴抽出からダイアログ機能を分離する専用マルチモーダル欠陥ローカライゼーションモジュールを提案する。私たちはまた、Defect Detection Question Answering (DDQA) という、最初のマルチモーダル産業異常検出トレーニングデータセットにも貢献する。
論文参考訳（メタデータ） (2025-03-18T11:33:29Z)
VMAD: Visual-enhanced Multimodal Large Language Model for Zero-Shot Anomaly Detection [19.79027968793026]
Zero-shot Anomaly Detection (ZSAD)は、未確認のオブジェクト内の異常を認識し、ローカライズする。既存のZSADメソッドは、クローズドワールド設定によって制限され、事前に定義されたプロンプトで見つからない欠陥に苦労する。我々は、視覚的IAD知識ときめ細かい知覚でMLLMを強化する新しいフレームワークVMAD(Visual-enhanced MLLM Anomaly Detection)を提案する。
論文参考訳（メタデータ） (2024-09-30T09:51:29Z)
Learning Feature Inversion for Multi-class Anomaly Detection under General-purpose COCO-AD Benchmark [101.23684938489413]
異常検出(AD)は、しばしば産業品質検査や医学的病変検査のための異常の検出に焦点が当てられている。この研究はまず、COCOをADフィールドに拡張することにより、大規模で汎用的なCOCO-ADデータセットを構築する。セグメンテーション分野のメトリクスにインスパイアされた我々は、より実用的なしきい値に依存したAD固有のメトリクスをいくつか提案する。
論文参考訳（メタデータ） (2024-04-16T17:38:26Z)
Anomaly Detection by Adapting a pre-trained Vision Language Model [48.225404732089515]
トレーニング済みのCLIPモデルに適応することで,異常検出のためのCLIP-ADAという統合フレームワークを提案する。学習可能なプロンプトを導入し、自己教師付き学習を通して異常パターンに関連付けることを提案する。 MVTec-AD と VisA の異常検出と局所化のための最新技術 97.5/55.6 と 89.3/33.1 を実現した。
論文参考訳（メタデータ） (2024-03-14T15:35:07Z)
Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文参考訳（メタデータ） (2024-01-06T07:30:41Z)
SCL-VI: Self-supervised Context Learning for Visual Inspection of Industrial Defects [4.487908181569429]
本稿では,有名なジグソーパズルに取り組むことで,最適なエンコーダを導出する自己教師型学習アルゴリズムを提案する。提案手法では, 対象画像を9つのパッチに分割し, エンコーダに2つのパッチ間の相対的な位置関係を予測して, リッチなセマンティクスを抽出する。
論文参考訳（メタデータ） (2023-11-11T08:01:40Z)
Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文参考訳（メタデータ） (2023-07-07T04:03:48Z)
Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文参考訳（メタデータ） (2021-03-08T10:56:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。