Fugu-MT 論文翻訳(概要): MultiADS: Defect-aware Supervision for Multi-type Anomaly Detection and Segmentation in Zero-Shot Learning

論文の概要: MultiADS: Defect-aware Supervision for Multi-type Anomaly Detection and Segmentation in Zero-Shot Learning

arxiv url: http://arxiv.org/abs/2504.06740v1
Date: Wed, 09 Apr 2025 09:52:04 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-17 20:18:08.167858
Title: MultiADS: Defect-aware Supervision for Multi-type Anomaly Detection and Segmentation in Zero-Shot Learning
Title（参考訳）: MultiADS:ゼロショット学習における多重型異常検出とセグメンテーションのためのデフェクト・アウェア・スーパービジョン
Authors: Ylli Sadikaj, Hongkuan Zhou, Lavdim Halilaj, Stefan Schmid, Steffen Staab, Claudia Plant,
Abstract要約: 曲がったり、切られたり、引っかいたりといった、異なるタイプの欠陥を知ることが重要です。欠陥タイプ」を認識する能力は、現代の生産ラインにおける異常の自動処理を可能にする。ゼロショット学習手法であるMultiADSを提案する。
参考スコア（独自算出の注目度）: 27.235318937019255
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Precise optical inspection in industrial applications is crucial for minimizing scrap rates and reducing the associated costs. Besides merely detecting if a product is anomalous or not, it is crucial to know the distinct type of defect, such as a bent, cut, or scratch. The ability to recognize the "exact" defect type enables automated treatments of the anomalies in modern production lines. Current methods are limited to solely detecting whether a product is defective or not without providing any insights on the defect type, nevertheless detecting and identifying multiple defects. We propose MultiADS, a zero-shot learning approach, able to perform Multi-type Anomaly Detection and Segmentation. The architecture of MultiADS comprises CLIP and extra linear layers to align the visual- and textual representation in a joint feature space. To the best of our knowledge, our proposal, is the first approach to perform a multi-type anomaly segmentation task in zero-shot learning. Contrary to the other baselines, our approach i) generates specific anomaly masks for each distinct defect type, ii) learns to distinguish defect types, and iii) simultaneously identifies multiple defect types present in an anomalous product. Additionally, our approach outperforms zero/few-shot learning SoTA methods on image-level and pixel-level anomaly detection and segmentation tasks on five commonly used datasets: MVTec-AD, Visa, MPDD, MAD and Real-IAD.
Abstract（参考訳）: 産業応用における精密光学検査は, スクラップ率の最小化と関連するコストの削減に不可欠である。製品が異常かどうかを単に検出するだけでなく、曲がったり、切れたり、引っかいたりといった、異なるタイプの欠陥を知ることが重要である。欠陥タイプ」を認識する能力は、現代の生産ラインにおける異常の自動処理を可能にする。現在の方法は、欠陥タイプに関する洞察を与えなくても、製品が欠陥であるかどうかのみを検出できるが、にもかかわらず、複数の欠陥を検出して識別する。ゼロショット学習手法であるMultiADSを提案する。 MultiADSのアーキテクチャは、CLIPと余分な線形層からなり、共同機能空間における視覚的およびテキスト的表現を整列させる。我々の知る限り,提案手法はゼロショット学習において,複数タイプの異常セグメンテーションタスクを実行するための最初のアプローチである。他のベースラインとは対照的に、我々のアプローチ一個々の欠陥の種類ごとに特定の異常マスクを発生させること。二欠陥の種類を区別することを学び、三異常製品に存在する複数の欠陥タイプを同時に識別すること。さらに,画像レベルおよび画素レベルの異常検出およびセグメンテーションタスク(MVTec-AD, Visa, MPDD, MAD, Real-IAD)では,ゼロ/ファウショット学習のSoTA法よりも優れていた。

関連論文リスト

Universal Transformation of One-Class Classifiers for Unsupervised Anomaly Detection [51.73001988341294]
異常検出は通常、一級分類問題として定式化される。本稿では,任意の1クラス分類器に基づく異常検出器を,完全に教師なしの手法に変換するデータセット折り畳み方式を提案する。
論文参考訳（メタデータ） (2026-02-13T16:54:12Z)
Explainable Deep Convolutional Multi-Type Anomaly Detection [0.3845204730009788]
ほとんどの説明可能な異常検出法は、しばしば異常を識別するが、異常の種類を区別する能力は欠如している。提案するMultiTypeFCDDは,説明可能な多型異常検出のための実用的な代替手段として設計された,シンプルで軽量な畳み込みフレームワークである。提案手法をReal-IADデータセット上で評価し,最先端の複雑なモデルと競合する結果をもたらす。
論文参考訳（メタデータ） (2025-11-14T11:04:34Z)
UniADC: A Unified Framework for Anomaly Detection and Classification [18.556123041540577]
本稿では,画像中の異常領域を同時に検出し,特定のカテゴリを特定することを目的とした,統一された異常検出・分類の課題を紹介する。異常検出と分類の統一モデルであるUniADCを提案する。 MVTec-FS,MTD,WFDDを含む3つの異常検出および分類データセットについて広範な実験を行い,UniADCは異常検出,局所化,分類において既存の手法より一貫して優れていることを示した。
論文参考訳（メタデータ） (2025-11-10T02:42:08Z)
Image-Intrinsic Priors for Integrated Circuit Defect Detection and Novel Class Discovery via Self-Supervised Learning [15.311912138752431]
集積回路製造は非常に複雑であり、欠陥はどの段階でも発生し、収率の低下と製品信頼性の低下を引き起こす。本稿では,IC SEM画像における画像固有プリミティブを利用した,欠陥検出と新しいクラス発見のためのサポートセットフリーフレームワークであるIC DefectNCDを提案する。
論文参考訳（メタデータ） (2025-11-05T02:10:08Z)
ShortcutBreaker: Low-Rank Noisy Bottleneck with Global Perturbation Attention for Multi-Class Unsupervised Anomaly Detection [59.89803740308262]
ShortcutBreakerはMUADタスクのための新しい統合された機能再構成フレームワークである。ショートカットの問題に対処する2つの重要なイノベーションが特徴だ。提案手法は,4つのデータセットに対して,99.8%,98.9%,90.6%,87.8%の顕著な画像レベルのAUROCを実現する。
論文参考訳（メタデータ） (2025-10-21T06:51:30Z)
Foundation Visual Encoders Are Secretly Few-Shot Anomaly Detectors [58.75916798814376]
FoundADと呼ばれる数発の異常検出装置を開発した。画像中の異常量は学習した埋め込みの差と直接相関する。簡単な演算子は、画像中の分布外領域を特徴付け識別する異常検出の有効なツールとして機能する。
論文参考訳（メタデータ） (2025-10-02T11:53:20Z)
CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection [54.85000884785013]
異常検出は、異常の定義の曖昧さ、異常型の多様性、トレーニングデータの不足による複雑な問題である。識別的基盤モデルと生成的基礎モデルの両方を活用するCLIPfusionを提案する。本手法は, 異常検出の多面的課題に対処する上で, マルチモーダル・マルチモデル融合の有効性を裏付けるものである。
論文参考訳（メタデータ） (2025-06-13T13:30:15Z)
Learning Multi-view Multi-class Anomaly Detection [10.199404082194947]
MVMCAD(Multi-View Multi-Class Anomaly Detection Model)を導入し、複数のビューからの情報を統合して異常を正確に識別する。具体的には、凍結エンコーダの前にプリエンコーダの事前拡張機構を追加する半凍結エンコーダを提案する。 AAM(Anomaly Amplification Module)は、グローバルトークンのインタラクションをモデル化し、通常のリージョンを抑圧する。
論文参考訳（メタデータ） (2025-04-30T03:59:58Z)
Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections [50.343419243749054]
異常検出(AD)は、通常のデータ分布から逸脱を識別する。本稿では,視覚エンコーダから抽出した画像コンテキストに基づいて,テキストエンコーダのプロンプトを条件付ける手法を提案する。提案手法は,14のデータセットにおいて,各メトリクスに対して2%から29%の性能向上を実現している。
論文参考訳（メタデータ） (2025-04-15T10:42:25Z)
PA-CLIP: Enhancing Zero-Shot Anomaly Detection through Pseudo-Anomaly Awareness [10.364634539199422]
本稿では,背景雑音を低減し,擬似異常に基づくフレームワークによる欠陥検出を向上するゼロショット異常検出手法であるPA-CLIPを紹介する。提案手法は,グローバルおよびローカルの詳細な情報を収集するためのマルチスケール特徴集約戦略を統合する。既存のゼロショット法よりも優れており、工業的欠陥検出のための堅牢なソリューションを提供する。
論文参考訳（メタデータ） (2025-03-03T08:29:27Z)
Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [88.34095233600719]
FAPromptは、より正確なZSADのためにきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。画像レベルおよび画素レベルのZSADタスクにおいて、最先端の手法を少なくとも3%-5%のAUC/APで大幅に上回っている。
論文参考訳（メタデータ） (2024-10-14T08:41:31Z)
Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文参考訳（メタデータ） (2023-11-13T02:54:17Z)
Myriad: Large Multimodal Model by Applying Vision Experts for Industrial Anomaly Detection [86.24898024621008]
産業異常検出に視覚専門家を適用した新しい大規模マルチモーダルモデルを提案する(略してMyriad)。我々は,視覚専門家が生成する異常マップをLMMのガイダンスとして利用し,視覚モデルが異常領域により多くの注意を払うように誘導する。提案手法は最先端の手法に対して良好に機能するだけでなく,IAD分野におけるLMMの柔軟性や命令追従性を継承する。
論文参考訳（メタデータ） (2023-10-29T16:49:45Z)
Improving Vision Anomaly Detection with the Guidance of Language Modality [64.53005837237754]
本稿では,マルチモーダルの観点から視覚モダリティの課題に取り組む。本稿では,冗長な情報問題とスパース空間問題に対処するために,クロスモーダルガイダンス(CMG)を提案する。視覚異常検出のためのよりコンパクトな潜在空間を学習するために、CMLEは言語モダリティから相関構造行列を学習する。
論文参考訳（メタデータ） (2023-10-04T13:44:56Z)
UniFormaly: Towards Task-Agnostic Unified Framework for Visual Anomaly Detection [6.260747047974035]
We present UniFormaly, a universal and powerful anomaly detection framework。我々は,オンラインエンコーダ方式の準最適問題を指摘することによって,オフ・ザ・シェルフアプローチの必要性を強調した。 UniFormalyは様々なタスクやデータセットで優れた結果を得る。
論文参考訳（メタデータ） (2023-07-24T06:04:12Z)
Multimodal Industrial Anomaly Detection via Hybrid Fusion [59.16333340582885]
ハイブリッド核融合方式を用いた新しいマルチモーダル異常検出法を提案する。本モデルでは,MVTecD-3 ADデータセットにおける検出精度とセグメンテーション精度の両面で,最先端(SOTA)手法より優れている。
論文参考訳（メタデータ） (2023-03-01T15:48:27Z)
Deep Learning based Defect classification and detection in SEM images: A Mask R-CNN approach [2.7180863515048674]
我々は,コンピュータビジョンのためのディープラーニングアルゴリズムであるMask-RCNN(Regional Convolutional Neural Network)の応用を実証した。我々は,ブリッジ,ブレーク,ライン崩壊など,クラス間のさまざまな欠陥パターンを検出し,セグメンテーションすることを目的としている。
論文参考訳（メタデータ） (2022-11-03T23:26:40Z)
Self-Supervised Predictive Convolutional Attentive Block for Anomaly Detection [97.93062818228015]
本稿では,再建に基づく機能を,新たな自己監督型予測アーキテクチャビルディングブロックに統合することを提案する。我々のブロックは、受容領域におけるマスク領域に対する再構成誤差を最小限に抑える損失を備える。画像やビデオの異常検出のための最先端フレームワークに組み込むことで,ブロックの汎用性を実証する。
論文参考訳（メタデータ） (2021-11-17T13:30:31Z)
MLMA-Net: multi-level multi-attentional learning for multi-label object detection in textile defect images [0.0]
本稿では,マルチレベル・マルチアテンショナル・ディープ・ラーニング・ネットワーク(MLMA-Net)を提案する。その結果,実世界の産業データセットに対する最先端のアプローチよりも,ネットワークが特徴的特徴を抽出し,性能が向上していることが示唆された。
論文参考訳（メタデータ） (2021-01-31T04:50:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。