論文の概要: MultiADS: Defect-aware Supervision for Multi-type Anomaly Detection and Segmentation in Zero-Shot Learning
- arxiv url: http://arxiv.org/abs/2504.06740v1
- Date: Wed, 09 Apr 2025 09:52:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-10 13:06:19.809259
- Title: MultiADS: Defect-aware Supervision for Multi-type Anomaly Detection and Segmentation in Zero-Shot Learning
- Title(参考訳): MultiADS:ゼロショット学習における多重型異常検出とセグメンテーションのためのデフェクト・アウェア・スーパービジョン
- Authors: Ylli Sadikaj, Hongkuan Zhou, Lavdim Halilaj, Stefan Schmid, Steffen Staab, Claudia Plant,
- Abstract要約: 曲がったり、切られたり、引っかいたりといった、異なるタイプの欠陥を知ることが重要です。
欠陥タイプ」を認識する能力は、現代の生産ラインにおける異常の自動処理を可能にする。
ゼロショット学習手法であるMultiADSを提案する。
- 参考スコア(独自算出の注目度): 27.235318937019255
- License:
- Abstract: Precise optical inspection in industrial applications is crucial for minimizing scrap rates and reducing the associated costs. Besides merely detecting if a product is anomalous or not, it is crucial to know the distinct type of defect, such as a bent, cut, or scratch. The ability to recognize the "exact" defect type enables automated treatments of the anomalies in modern production lines. Current methods are limited to solely detecting whether a product is defective or not without providing any insights on the defect type, nevertheless detecting and identifying multiple defects. We propose MultiADS, a zero-shot learning approach, able to perform Multi-type Anomaly Detection and Segmentation. The architecture of MultiADS comprises CLIP and extra linear layers to align the visual- and textual representation in a joint feature space. To the best of our knowledge, our proposal, is the first approach to perform a multi-type anomaly segmentation task in zero-shot learning. Contrary to the other baselines, our approach i) generates specific anomaly masks for each distinct defect type, ii) learns to distinguish defect types, and iii) simultaneously identifies multiple defect types present in an anomalous product. Additionally, our approach outperforms zero/few-shot learning SoTA methods on image-level and pixel-level anomaly detection and segmentation tasks on five commonly used datasets: MVTec-AD, Visa, MPDD, MAD and Real-IAD.
- Abstract(参考訳): 産業応用における精密光学検査は, スクラップ率の最小化と関連するコストの削減に不可欠である。
製品が異常かどうかを単に検出するだけでなく、曲がったり、切れたり、引っかいたりといった、異なるタイプの欠陥を知ることが重要である。
欠陥タイプ」を認識する能力は、現代の生産ラインにおける異常の自動処理を可能にする。
現在の方法は、欠陥タイプに関する洞察を与えなくても、製品が欠陥であるかどうかのみを検出できるが、にもかかわらず、複数の欠陥を検出して識別する。
ゼロショット学習手法であるMultiADSを提案する。
MultiADSのアーキテクチャは、CLIPと余分な線形層からなり、共同機能空間における視覚的およびテキスト的表現を整列させる。
我々の知る限り,提案手法はゼロショット学習において,複数タイプの異常セグメンテーションタスクを実行するための最初のアプローチである。
他のベースラインとは対照的に、我々のアプローチ
一 個々の欠陥の種類ごとに特定の異常マスクを発生させること。
二 欠陥の種類を区別することを学び、
三 異常製品に存在する複数の欠陥タイプを同時に識別すること。
さらに,画像レベルおよび画素レベルの異常検出およびセグメンテーションタスク(MVTec-AD, Visa, MPDD, MAD, Real-IAD)では,ゼロ/ファウショット学習のSoTA法よりも優れていた。
関連論文リスト
- Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [88.34095233600719]
FAPromptは、より正確なZSADのためにきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
画像レベルおよび画素レベルのZSADタスクにおいて、最先端の手法を少なくとも3%-5%のAUC/APで大幅に上回っている。
論文 参考訳(メタデータ) (2024-10-14T08:41:31Z) - Customizing Visual-Language Foundation Models for Multi-modal Anomaly Detection and Reasoning [3.2331030725755645]
複数のシナリオに適用可能な一般的な異常検出モデルを開発する。
本手法では,タスク記述,クラスコンテキスト,正規性規則,参照画像など,マルチモーダルなプロンプト型について検討する。
予備研究は,視覚と言語の組み合わせが,モデルをカスタマイズする条件として,異常検出性能を高めることを実証した。
論文 参考訳(メタデータ) (2024-03-17T04:30:57Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - AnomalyCLIP: Object-agnostic Prompt Learning for Zero-shot Anomaly Detection [30.679012320439625]
AnomalyCLIPはオブジェクトに依存しないテキストを学習し、画像の一般的な正規性と異常をキャプチャする。
非常に多様なクラスセマンティクスのデータセットにおける異常の検出とセグメンテーションにおいて、優れたゼロショット性能を実現する。
論文 参考訳(メタデータ) (2023-10-29T10:03:49Z) - Improving Vision Anomaly Detection with the Guidance of Language
Modality [64.53005837237754]
本稿では,マルチモーダルの観点から視覚モダリティの課題に取り組む。
本稿では,冗長な情報問題とスパース空間問題に対処するために,クロスモーダルガイダンス(CMG)を提案する。
視覚異常検出のためのよりコンパクトな潜在空間を学習するために、CMLEは言語モダリティから相関構造行列を学習する。
論文 参考訳(メタデータ) (2023-10-04T13:44:56Z) - Multimodal Industrial Anomaly Detection via Hybrid Fusion [59.16333340582885]
ハイブリッド核融合方式を用いた新しいマルチモーダル異常検出法を提案する。
本モデルでは,MVTecD-3 ADデータセットにおける検出精度とセグメンテーション精度の両面で,最先端(SOTA)手法より優れている。
論文 参考訳(メタデータ) (2023-03-01T15:48:27Z) - Deep Learning based Defect classification and detection in SEM images: A
Mask R-CNN approach [2.7180863515048674]
我々は,コンピュータビジョンのためのディープラーニングアルゴリズムであるMask-RCNN(Regional Convolutional Neural Network)の応用を実証した。
我々は,ブリッジ,ブレーク,ライン崩壊など,クラス間のさまざまな欠陥パターンを検出し,セグメンテーションすることを目的としている。
論文 参考訳(メタデータ) (2022-11-03T23:26:40Z) - Self-Supervised Masked Convolutional Transformer Block for Anomaly
Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。
本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文 参考訳(メタデータ) (2022-09-25T04:56:10Z) - Self-Supervised Predictive Convolutional Attentive Block for Anomaly
Detection [97.93062818228015]
本稿では,再建に基づく機能を,新たな自己監督型予測アーキテクチャビルディングブロックに統合することを提案する。
我々のブロックは、受容領域におけるマスク領域に対する再構成誤差を最小限に抑える損失を備える。
画像やビデオの異常検出のための最先端フレームワークに組み込むことで,ブロックの汎用性を実証する。
論文 参考訳(メタデータ) (2021-11-17T13:30:31Z) - MLMA-Net: multi-level multi-attentional learning for multi-label object
detection in textile defect images [0.0]
本稿では,マルチレベル・マルチアテンショナル・ディープ・ラーニング・ネットワーク(MLMA-Net)を提案する。
その結果,実世界の産業データセットに対する最先端のアプローチよりも,ネットワークが特徴的特徴を抽出し,性能が向上していることが示唆された。
論文 参考訳(メタデータ) (2021-01-31T04:50:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。