論文の概要: MoECLIP: Patch-Specialized Experts for Zero-shot Anomaly Detection
- arxiv url: http://arxiv.org/abs/2603.03101v2
- Date: Wed, 04 Mar 2026 03:55:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-05 14:47:28.986871
- Title: MoECLIP: Patch-Specialized Experts for Zero-shot Anomaly Detection
- Title(参考訳): MoECLIP: ゼロショット異常検出のためのパッチ特化専門家
- Authors: Jun Yeong Park, JunYoung Seo, Minji Kang, Yu Rang Park,
- Abstract要約: MoECLIPはZSAD(Zero-Shot Anomaly Detection)タスクのためのMixture-of-Expertsアーキテクチャである。
パッチレベルの適応は、各イメージパッチを独自の特性に基づいて、特殊なローランド適応(LoRA)の専門家に動的にルーティングすることで実現している。
- 参考スコア(独自算出の注目度): 6.6626674107399495
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The CLIP model's outstanding generalization has driven recent success in Zero-Shot Anomaly Detection (ZSAD) for detecting anomalies in unseen categories. The core challenge in ZSAD is to specialize the model for anomaly detection tasks while preserving CLIP's powerful generalization capability. Existing approaches attempting to solve this challenge share the fundamental limitation of a patch-agnostic design that processes all patches monolithically without regard for their unique characteristics. To address this limitation, we propose MoECLIP, a Mixture-of-Experts (MoE) architecture for the ZSAD task, which achieves patch-level adaptation by dynamically routing each image patch to a specialized Low-Rank Adaptation (LoRA) expert based on its unique characteristics. Furthermore, to prevent functional redundancy among the LoRA experts, we introduce (1) Frozen Orthogonal Feature Separation (FOFS), which orthogonally separates the input feature space to force experts to focus on distinct information, and (2) a simplex equiangular tight frame (ETF) loss to regulate the expert outputs to form maximally equiangular representations. Comprehensive experimental results across 14 benchmark datasets spanning industrial and medical domains demonstrate that MoECLIP outperforms existing state-of-the-art methods. The code is available at https://github.com/CoCoRessa/MoECLIP.
- Abstract(参考訳): CLIPモデルの卓越した一般化は、目に見えないカテゴリの異常を検出するゼロショット異常検出(ZSAD)で最近成功している。
ZSADの中核的な課題は、CLIPの強力な一般化能力を保ちながら、異常検出タスクのモデルを専門化することである。
この問題を解決するための既存のアプローチは、パッチに依存しない設計の基本的な制限を共有している。
この制限に対処するため,ZSADタスク用のMixture-of-Experts (MoE)アーキテクチャであるMoECLIPを提案する。
さらに, 機能的冗長性を防止するため, 1) 入力特徴空間を直交的に分離して異なる情報に集中させる冷凍直交特徴分離 (FOFS) と, 2) 専門家の出力を調節して最大等角表現を形成するための単純な等角的タイトフレーム (ETF) の損失を導入する。
産業領域と医療領域にまたがる14のベンチマークデータセットの総合的な実験結果から、MoECLIPが既存の最先端の手法より優れていることが示された。
コードはhttps://github.com/CoCoRessa/MoECLIPで入手できる。
関連論文リスト
- Contrastive Spectral Rectification: Test-Time Defense towards Zero-shot Adversarial Robustness of CLIP [68.44229678548298]
コントラストスペクトル整流(Contrastive Spectral Rectification, CSR)は、敵の例に対する効率的な試験時間防御である。
CSRはSOTAを18.1%上回り、AutoAttackに勝っている。
CSRは様々な視覚的タスクに幅広い適用性を示す。
論文 参考訳(メタデータ) (2026-01-27T05:24:45Z) - Mixture of Ranks with Degradation-Aware Routing for One-Step Real-World Image Super-Resolution [76.66229730098759]
実世界の画像超解像(Real-ISR)では、既存のアプローチは主に微調整された事前学習拡散モデルに依存している。
単一ステップ画像超解像のためのMixture-of-Ranks (MoR)アーキテクチャを提案する。
LoRAの各ランクを独立した専門家として扱う、きめ細かい専門家分割戦略を導入する。
論文 参考訳(メタデータ) (2025-11-20T04:11:44Z) - Beyond Redundancy: Diverse and Specialized Multi-Expert Sparse Autoencoder [59.89996751196727]
スパースオートエンコーダ(SAE)は、大規模な言語モデルを解釈するための強力なツールとして登場した。
SAEの隠蔽層は、空間的制約を満たすために高い次元性を持ち、結果として禁止的なトレーニングと推論コストをもたらす。
近年のMixture of Experts (MoE) アプローチは、SAEsによってゲートアクティベーションを持つより狭い専門家ネットワークにこの問題に対処しようとしている。
本稿では,(1)専門化を促進するために意味的に重み付けされた専門家サブセットを同時に関与する複数の専門家活性化,(2)適応的な高周波スケーリングによって多様性を高める特徴スケーリングという2つの重要なイノベーションを提案する。
論文 参考訳(メタデータ) (2025-11-07T22:19:34Z) - Hierarchical Self-Supervised Representation Learning for Depression Detection from Speech [51.14752758616364]
音声による抑うつ検出 (SDD) は、従来の臨床評価に代わる有望で非侵襲的な代替手段である。
HAREN-CTCは,マルチタスク学習フレームワーク内でのクロスアテンションを用いて,多層SSL機能を統合した新しいアーキテクチャである。
このモデルはDAIC-WOZで0.81、MODMAで0.82の最先端マクロF1スコアを達成し、両方の評価シナリオで先行手法より優れている。
論文 参考訳(メタデータ) (2025-10-05T09:32:12Z) - LEAF: A Robust Expert-Based Framework for Few-Shot Continual Event Detection [7.094483187879095]
LEAFは、連続イベント検出のための新しくて堅牢なエキスパートベースのフレームワークである。
各専門家はローランク適応(LoRA)行列でパラメータ化される。
セマンティックアウェアの専門家選択機構は、インスタンスを最も関係のある専門家に動的にルーティングし、専門家の専門化と知識干渉の低減を可能にする。
論文 参考訳(メタデータ) (2025-09-29T10:00:25Z) - Mixture of Experts Guided by Gaussian Splatters Matters: A new Approach to Weakly-Supervised Video Anomaly Detection [7.435598538875321]
ビデオ異常検出(VAD)は、異常事象のばらつきとラベル付きデータの限られた可用性のために難しい課題である。
本稿では,一組のエキスパートモデルを用いて,それぞれが特定の異常型をキャプチャする新しいフレームワークを提案する。
提案手法は,UCF-Crimeデータセット上で91.58%のAUCを達成し,XD-ViolenceデータセットとMSADデータセットにおいて優れた結果を示す。
論文 参考訳(メタデータ) (2025-08-08T13:48:48Z) - AnomalyMoE: Towards a Language-free Generalist Model for Unified Visual Anomaly Detection [29.06542941993374]
AnomalyMoEは、Mixture-of-Expertsアーキテクチャに基づいた、新しく普遍的な異常検出フレームワークである。
我々の重要な洞察は、複雑な異常検出問題を3つの異なる意味階層に分解することである。
AnomalyMoEはパッチ、コンポーネント、グローバルレベルで3つの専用の専門家ネットワークを使用している。
論文 参考訳(メタデータ) (2025-08-08T10:33:18Z) - Bridge Feature Matching and Cross-Modal Alignment with Mutual-filtering for Zero-shot Anomaly Detection [25.349261412750586]
本研究では,ZSAD 用 textbfFiSeCLIP とトレーニング不要 textbfCLIP を導入し,特徴マッチングとクロスモーダルアライメントを組み合わせた。
本手法は,異常検出ベンチマークにおいて,異常分類とセグメンテーションの両方において優れた性能を示す。
論文 参考訳(メタデータ) (2025-07-15T05:42:17Z) - Towards Generalized Range-View LiDAR Segmentation in Adverse Weather [65.22588361803942]
我々は、厳しい天候下でのLiDARセグメンテーションの一般化に影響を及ぼす固有の課題を特定し、分析する。
既存のモデルのコアアーキテクチャを変更することなく、ロバスト性を高めるモジュール式で軽量なフレームワークを提案する。
提案手法は,推定オーバーヘッドを最小限に抑え,悪天候への一般化を著しく改善する。
論文 参考訳(メタデータ) (2025-06-10T16:48:27Z) - AFR-CLIP: Enhancing Zero-Shot Industrial Anomaly Detection with Stateless-to-Stateful Anomaly Feature Rectification [11.844008592270555]
本稿では,CLIPに基づく異常特徴修正フレームワークであるAFR-CLIPを提案する。
視覚的特徴とテキスト的特徴のコサイン類似度を測定して異常マップを生成する。
産業と医療の領域にわたる11の異常検出ベンチマークで実験が行われた。
論文 参考訳(メタデータ) (2025-03-17T08:18:55Z) - Complexity Experts are Task-Discriminative Learners for Any Image Restoration [80.46313715427928]
複雑性の専門家" - 様々な計算複雑性と受容的なフィールドを持つフレキシブルな専門家ブロックを紹介します。
この選好は、タスク固有の割り当てを効果的に推進し、適切な複雑さを持つ専門家にタスクを割り当てる。
提案したMoCE-IRモデルは最先端の手法より優れており、その効率性と実用性が確認されている。
論文 参考訳(メタデータ) (2024-11-27T15:58:07Z) - P-WAE: Generalized Patch-Wasserstein Autoencoder for Anomaly Screening [17.24628770042803]
Patch-wise Wasserstein AutoEncoder (P-WAE) アーキテクチャを提案する。
特に、ジグソーパズルの解法と結合したパッチワイド変分推論モデルを設計する。
MVTec ADデータセットを用いた総合的な実験は、我々のプロポの優れた性能を実証する。
論文 参考訳(メタデータ) (2021-08-09T05:31:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。