論文の概要: MultiADS: Defect-aware Supervision for Multi-type Anomaly Detection and Segmentation in Zero-Shot Learning
- arxiv url: http://arxiv.org/abs/2504.06740v1
- Date: Wed, 09 Apr 2025 09:52:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-17 20:18:08.167858
- Title: MultiADS: Defect-aware Supervision for Multi-type Anomaly Detection and Segmentation in Zero-Shot Learning
- Title(参考訳): MultiADS:ゼロショット学習における多重型異常検出とセグメンテーションのためのデフェクト・アウェア・スーパービジョン
- Authors: Ylli Sadikaj, Hongkuan Zhou, Lavdim Halilaj, Stefan Schmid, Steffen Staab, Claudia Plant,
- Abstract要約: 曲がったり、切られたり、引っかいたりといった、異なるタイプの欠陥を知ることが重要です。
欠陥タイプ」を認識する能力は、現代の生産ラインにおける異常の自動処理を可能にする。
ゼロショット学習手法であるMultiADSを提案する。
- 参考スコア(独自算出の注目度): 27.235318937019255
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Precise optical inspection in industrial applications is crucial for minimizing scrap rates and reducing the associated costs. Besides merely detecting if a product is anomalous or not, it is crucial to know the distinct type of defect, such as a bent, cut, or scratch. The ability to recognize the "exact" defect type enables automated treatments of the anomalies in modern production lines. Current methods are limited to solely detecting whether a product is defective or not without providing any insights on the defect type, nevertheless detecting and identifying multiple defects. We propose MultiADS, a zero-shot learning approach, able to perform Multi-type Anomaly Detection and Segmentation. The architecture of MultiADS comprises CLIP and extra linear layers to align the visual- and textual representation in a joint feature space. To the best of our knowledge, our proposal, is the first approach to perform a multi-type anomaly segmentation task in zero-shot learning. Contrary to the other baselines, our approach i) generates specific anomaly masks for each distinct defect type, ii) learns to distinguish defect types, and iii) simultaneously identifies multiple defect types present in an anomalous product. Additionally, our approach outperforms zero/few-shot learning SoTA methods on image-level and pixel-level anomaly detection and segmentation tasks on five commonly used datasets: MVTec-AD, Visa, MPDD, MAD and Real-IAD.
- Abstract(参考訳): 産業応用における精密光学検査は, スクラップ率の最小化と関連するコストの削減に不可欠である。
製品が異常かどうかを単に検出するだけでなく、曲がったり、切れたり、引っかいたりといった、異なるタイプの欠陥を知ることが重要である。
欠陥タイプ」を認識する能力は、現代の生産ラインにおける異常の自動処理を可能にする。
現在の方法は、欠陥タイプに関する洞察を与えなくても、製品が欠陥であるかどうかのみを検出できるが、にもかかわらず、複数の欠陥を検出して識別する。
ゼロショット学習手法であるMultiADSを提案する。
MultiADSのアーキテクチャは、CLIPと余分な線形層からなり、共同機能空間における視覚的およびテキスト的表現を整列させる。
我々の知る限り,提案手法はゼロショット学習において,複数タイプの異常セグメンテーションタスクを実行するための最初のアプローチである。
他のベースラインとは対照的に、我々のアプローチ
一 個々の欠陥の種類ごとに特定の異常マスクを発生させること。
二 欠陥の種類を区別することを学び、
三 異常製品に存在する複数の欠陥タイプを同時に識別すること。
さらに,画像レベルおよび画素レベルの異常検出およびセグメンテーションタスク(MVTec-AD, Visa, MPDD, MAD, Real-IAD)では,ゼロ/ファウショット学習のSoTA法よりも優れていた。
関連論文リスト
- Learning Multi-view Multi-class Anomaly Detection [10.199404082194947]
MVMCAD(Multi-View Multi-Class Anomaly Detection Model)を導入し、複数のビューからの情報を統合して異常を正確に識別する。
具体的には、凍結エンコーダの前にプリエンコーダの事前拡張機構を追加する半凍結エンコーダを提案する。
AAM(Anomaly Amplification Module)は、グローバルトークンのインタラクションをモデル化し、通常のリージョンを抑圧する。
論文 参考訳(メタデータ) (2025-04-30T03:59:58Z) - Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections [50.343419243749054]
異常検出(AD)は、通常のデータ分布から逸脱を識別する。
本稿では,視覚エンコーダから抽出した画像コンテキストに基づいて,テキストエンコーダのプロンプトを条件付ける手法を提案する。
提案手法は,14のデータセットにおいて,各メトリクスに対して2%から29%の性能向上を実現している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - PA-CLIP: Enhancing Zero-Shot Anomaly Detection through Pseudo-Anomaly Awareness [10.364634539199422]
本稿では,背景雑音を低減し,擬似異常に基づくフレームワークによる欠陥検出を向上するゼロショット異常検出手法であるPA-CLIPを紹介する。
提案手法は,グローバルおよびローカルの詳細な情報を収集するためのマルチスケール特徴集約戦略を統合する。
既存のゼロショット法よりも優れており、工業的欠陥検出のための堅牢なソリューションを提供する。
論文 参考訳(メタデータ) (2025-03-03T08:29:27Z) - Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [88.34095233600719]
FAPromptは、より正確なZSADのためにきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
画像レベルおよび画素レベルのZSADタスクにおいて、最先端の手法を少なくとも3%-5%のAUC/APで大幅に上回っている。
論文 参考訳(メタデータ) (2024-10-14T08:41:31Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - Myriad: Large Multimodal Model by Applying Vision Experts for Industrial Anomaly Detection [86.24898024621008]
産業異常検出に視覚専門家を適用した新しい大規模マルチモーダルモデルを提案する(略してMyriad)。
我々は,視覚専門家が生成する異常マップをLMMのガイダンスとして利用し,視覚モデルが異常領域により多くの注意を払うように誘導する。
提案手法は最先端の手法に対して良好に機能するだけでなく,IAD分野におけるLMMの柔軟性や命令追従性を継承する。
論文 参考訳(メタデータ) (2023-10-29T16:49:45Z) - Improving Vision Anomaly Detection with the Guidance of Language
Modality [64.53005837237754]
本稿では,マルチモーダルの観点から視覚モダリティの課題に取り組む。
本稿では,冗長な情報問題とスパース空間問題に対処するために,クロスモーダルガイダンス(CMG)を提案する。
視覚異常検出のためのよりコンパクトな潜在空間を学習するために、CMLEは言語モダリティから相関構造行列を学習する。
論文 参考訳(メタデータ) (2023-10-04T13:44:56Z) - UniFormaly: Towards Task-Agnostic Unified Framework for Visual Anomaly
Detection [6.260747047974035]
We present UniFormaly, a universal and powerful anomaly detection framework。
我々は,オンラインエンコーダ方式の準最適問題を指摘することによって,オフ・ザ・シェルフアプローチの必要性を強調した。
UniFormalyは様々なタスクやデータセットで優れた結果を得る。
論文 参考訳(メタデータ) (2023-07-24T06:04:12Z) - Multimodal Industrial Anomaly Detection via Hybrid Fusion [59.16333340582885]
ハイブリッド核融合方式を用いた新しいマルチモーダル異常検出法を提案する。
本モデルでは,MVTecD-3 ADデータセットにおける検出精度とセグメンテーション精度の両面で,最先端(SOTA)手法より優れている。
論文 参考訳(メタデータ) (2023-03-01T15:48:27Z) - Deep Learning based Defect classification and detection in SEM images: A
Mask R-CNN approach [2.7180863515048674]
我々は,コンピュータビジョンのためのディープラーニングアルゴリズムであるMask-RCNN(Regional Convolutional Neural Network)の応用を実証した。
我々は,ブリッジ,ブレーク,ライン崩壊など,クラス間のさまざまな欠陥パターンを検出し,セグメンテーションすることを目的としている。
論文 参考訳(メタデータ) (2022-11-03T23:26:40Z) - Self-Supervised Predictive Convolutional Attentive Block for Anomaly
Detection [97.93062818228015]
本稿では,再建に基づく機能を,新たな自己監督型予測アーキテクチャビルディングブロックに統合することを提案する。
我々のブロックは、受容領域におけるマスク領域に対する再構成誤差を最小限に抑える損失を備える。
画像やビデオの異常検出のための最先端フレームワークに組み込むことで,ブロックの汎用性を実証する。
論文 参考訳(メタデータ) (2021-11-17T13:30:31Z) - MLMA-Net: multi-level multi-attentional learning for multi-label object
detection in textile defect images [0.0]
本稿では,マルチレベル・マルチアテンショナル・ディープ・ラーニング・ネットワーク(MLMA-Net)を提案する。
その結果,実世界の産業データセットに対する最先端のアプローチよりも,ネットワークが特徴的特徴を抽出し,性能が向上していることが示唆された。
論文 参考訳(メタデータ) (2021-01-31T04:50:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。