論文の概要: AnomalyMoE: Towards a Language-free Generalist Model for Unified Visual Anomaly Detection
- arxiv url: http://arxiv.org/abs/2508.06203v1
- Date: Fri, 08 Aug 2025 10:33:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-11 20:39:06.198197
- Title: AnomalyMoE: Towards a Language-free Generalist Model for Unified Visual Anomaly Detection
- Title(参考訳): AnomalyMoE:Unified Visual Anomaly Detectionのための言語自由ジェネリストモデルを目指して
- Authors: Zhaopeng Gu, Bingke Zhu, Guibo Zhu, Yingying Chen, Wei Ge, Ming Tang, Jinqiao Wang,
- Abstract要約: AnomalyMoEは、Mixture-of-Expertsアーキテクチャに基づいた、新しく普遍的な異常検出フレームワークである。
我々の重要な洞察は、複雑な異常検出問題を3つの異なる意味階層に分解することである。
AnomalyMoEはパッチ、コンポーネント、グローバルレベルで3つの専用の専門家ネットワークを使用している。
- 参考スコア(独自算出の注目度): 29.06542941993374
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Anomaly detection is a critical task across numerous domains and modalities, yet existing methods are often highly specialized, limiting their generalizability. These specialized models, tailored for specific anomaly types like textural defects or logical errors, typically exhibit limited performance when deployed outside their designated contexts. To overcome this limitation, we propose AnomalyMoE, a novel and universal anomaly detection framework based on a Mixture-of-Experts (MoE) architecture. Our key insight is to decompose the complex anomaly detection problem into three distinct semantic hierarchies: local structural anomalies, component-level semantic anomalies, and global logical anomalies. AnomalyMoE correspondingly employs three dedicated expert networks at the patch, component, and global levels, and is specialized in reconstructing features and identifying deviations at its designated semantic level. This hierarchical design allows a single model to concurrently understand and detect a wide spectrum of anomalies. Furthermore, we introduce an Expert Information Repulsion (EIR) module to promote expert diversity and an Expert Selection Balancing (ESB) module to ensure the comprehensive utilization of all experts. Experiments on 8 challenging datasets spanning industrial imaging, 3D point clouds, medical imaging, video surveillance, and logical anomaly detection demonstrate that AnomalyMoE establishes new state-of-the-art performance, significantly outperforming specialized methods in their respective domains.
- Abstract(参考訳): 異常検出は、多くの領域やモダリティにまたがる重要なタスクであるが、既存の手法はしばしば高度に特殊化され、一般化可能性を制限する。
これらの特殊なモデルは、テクスチャ欠陥や論理的エラーのような特定の異常タイプに適したもので、通常、指定されたコンテキスト外に配置されたときに限られたパフォーマンスを示す。
この制限を克服するために,Mixture-of-Experts (MoE)アーキテクチャに基づいた,新しい,普遍的な異常検出フレームワークであるAnomalyMoEを提案する。
我々の重要な洞察は、複雑な異常検出問題を、局所的な構造的異常、コンポーネントレベルの意味的異常、大域的な論理的異常の3つの異なる階層に分解することである。
AnomalyMoEはパッチ、コンポーネント、グローバルレベルで3つの専門的ネットワークを使用し、特徴の再構築と指定されたセマンティックレベルでの偏差の特定に特化している。
この階層的設計により、単一のモデルで広い範囲の異常を同時に理解し、検出することができる。
さらに、専門家の多様性を促進するためのエキスパートインフォメーション・リパルス(EIR)モジュールと、専門家全員の総合的な利用を保証する専門家選択バランス(ESB)モジュールも導入する。
産業画像、3Dポイントクラウド、医用画像、ビデオ監視、論理異常検出を含む8つの挑戦的なデータセットの実験は、AnomalyMoEが新しい最先端のパフォーマンスを確立し、それぞれのドメインにおける特殊手法を著しく上回っていることを示す。
関連論文リスト
- MoECLIP: Patch-Specialized Experts for Zero-shot Anomaly Detection [6.6626674107399495]
MoECLIPはZSAD(Zero-Shot Anomaly Detection)タスクのためのMixture-of-Expertsアーキテクチャである。
パッチレベルの適応は、各イメージパッチを独自の特性に基づいて、特殊なローランド適応(LoRA)の専門家に動的にルーティングすることで実現している。
論文 参考訳(メタデータ) (2026-03-03T15:36:55Z) - Learning Discriminative and Generalizable Anomaly Detector for Dynamic Graph with Limited Supervision [31.57563937222115]
動的グラフ異常検出(DGAD)は、多くの実世界のアプリケーションにとって重要であるが、ラベル付き異常が不足しているため、依然として困難である。
本稿では,3つの主要コンポーネントを持つ有効で一般化可能な,モデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-23T16:25:35Z) - MAU-GPT: Enhancing Multi-type Industrial Anomaly Understanding via Anomaly-aware and Generalist Experts Adaptation [31.60185302007424]
マルチタイプ産業異常理解のための包括的データセットであるMAU-Setを紹介する。
そこで我々は,産業的異常理解に特化したドメイン適応型マルチモーダル大規模モデルMAU-GPTを提案する。
AMoE-LoRAメカニズムは、異常認識とジェネラリストの専門家の適応を統一し、多様な欠陥クラスに対する理解と推論の両方を強化する。
論文 参考訳(メタデータ) (2026-01-31T05:36:49Z) - CASL: Curvature-Augmented Self-supervised Learning for 3D Anomaly Detection [49.74534277563012]
本稿では,再編成パラダイムに基づくCASL(Curvature-Augmented Self-supervised Learning)フレームワークを提案する。
提案手法では,各点の空間座標を予測するためにデコーダを誘導するマルチスケール曲率プロンプトを導入する。
単純な異常分類の微調整により、先導的な検出性能を実現する。
論文 参考訳(メタデータ) (2025-11-17T02:58:09Z) - CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection [49.11819337853632]
異常検出は、異常の定義の曖昧さ、異常型の多様性、トレーニングデータの不足による複雑な問題である。
識別的基盤モデルと生成的基礎モデルの両方を活用するCLIPfusionを提案する。
本手法は, 異常検出の多面的課題に対処する上で, マルチモーダル・マルチモデル融合の有効性を裏付けるものである。
論文 参考訳(メタデータ) (2025-06-13T13:30:15Z) - Towards Training-free Anomaly Detection with Vision and Language Foundation Models [17.991678161890174]
異常検出は、産業品質検査のような現実世界の応用に有用である。
論理的および構造的異常検出のトレーニングを必要としない新しいマルチモーダルフレームワークであるLogSADを紹介する。
論文 参考訳(メタデータ) (2025-03-24T04:07:59Z) - ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.202323209244]
ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文 参考訳(メタデータ) (2024-05-27T02:42:33Z) - Generating and Reweighting Dense Contrastive Patterns for Unsupervised
Anomaly Detection [59.34318192698142]
我々は、先行のない異常発生パラダイムを導入し、GRADと呼ばれる革新的な教師なし異常検出フレームワークを開発した。
PatchDiffは、様々な種類の異常パターンを効果的に公開する。
MVTec ADとMVTec LOCOデータセットの両方の実験も、前述の観測をサポートする。
論文 参考訳(メタデータ) (2023-12-26T07:08:06Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - Myriad: Large Multimodal Model by Applying Vision Experts for Industrial Anomaly Detection [86.24898024621008]
産業異常検出に視覚専門家を適用した新しい大規模マルチモーダルモデルを提案する(略してMyriad)。
我々は,視覚専門家が生成する異常マップをLMMのガイダンスとして利用し,視覚モデルが異常領域により多くの注意を払うように誘導する。
提案手法は最先端の手法に対して良好に機能するだけでなく,IAD分野におけるLMMの柔軟性や命令追従性を継承する。
論文 参考訳(メタデータ) (2023-10-29T16:49:45Z) - Learning Global-Local Correspondence with Semantic Bottleneck for
Logical Anomaly Detection [6.553276620691242]
本稿では,論理的制約を伴う視覚異常検出のためのGlobal-Local Cor correspondingence Framework (GLCF) という新しいフレームワークを提案する。
視覚異常検出は、産業的異常検出や医学的疾患の診断など、様々な現実世界の応用において活発な研究領域となっている。
論文 参考訳(メタデータ) (2023-03-10T08:09:40Z) - Prototypical Residual Networks for Anomaly Detection and Localization [80.5730594002466]
本稿では,PRN(Prototypeal Residual Network)というフレームワークを提案する。
PRNは、異常領域の分割マップを正確に再構築するために、異常領域と正常パターンの間の様々なスケールとサイズの特徴的残差を学習する。
異常を拡大・多様化するために,見かけの相違と外観の相違を考慮に入れた様々な異常発生戦略を提示する。
論文 参考訳(メタデータ) (2022-12-05T05:03:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。