論文の概要: A Masked Reverse Knowledge Distillation Method Incorporating Global and Local Information for Image Anomaly Detection
- arxiv url: http://arxiv.org/abs/2512.15326v1
- Date: Wed, 17 Dec 2025 11:23:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-18 17:06:26.956144
- Title: A Masked Reverse Knowledge Distillation Method Incorporating Global and Local Information for Image Anomaly Detection
- Title(参考訳): 画像異常検出のための大域的・局所的な情報を含むマスケ逆知識蒸留法
- Authors: Yuxin Jiang, Yunkang Can, Weiming Shen,
- Abstract要約: Masked reverse knowledge distillation (MRKD)は、画像再構成のタスクを画像復元に変換する。
ILMは、入力信号を監督信号と区別することで、グローバルな情報をキャプチャするのに役立つ。
FLMは、学習した表現が十分な局所情報を含むことを保証するために、合成特徴レベルの異常を取り入れている。
- 参考スコア(独自算出の注目度): 17.565626906983933
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Knowledge distillation is an effective image anomaly detection and localization scheme. However, a major drawback of this scheme is its tendency to overly generalize, primarily due to the similarities between input and supervisory signals. In order to address this issue, this paper introduces a novel technique called masked reverse knowledge distillation (MRKD). By employing image-level masking (ILM) and feature-level masking (FLM), MRKD transforms the task of image reconstruction into image restoration. Specifically, ILM helps to capture global information by differentiating input signals from supervisory signals. On the other hand, FLM incorporates synthetic feature-level anomalies to ensure that the learned representations contain sufficient local information. With these two strategies, MRKD is endowed with stronger image context capture capacity and is less likely to be overgeneralized. Experiments on the widely-used MVTec anomaly detection dataset demonstrate that MRKD achieves impressive performance: image-level 98.9% AU-ROC, pixel-level 98.4% AU-ROC, and 95.3% AU-PRO. In addition, extensive ablation experiments have validated the superiority of MRKD in mitigating the overgeneralization problem.
- Abstract(参考訳): 知識蒸留は画像異常の検出と局所化に有効な手法である。
しかし、このスキームの大きな欠点は、入力信号と監督信号の類似性から、過度に一般化する傾向にある。
この問題に対処するために,マスク型リバースナレッジ蒸留(MRKD)と呼ばれる新しい手法を提案する。
画像レベルのマスキング(ILM)と特徴レベルのマスキング(FLM)を用いることで、MRKDは画像再構成のタスクを画像復元に変換する。
特に、ILMは、入力信号と監督信号とを区別することで、グローバルな情報を取得するのに役立ちます。
一方、FLMは、学習した表現が十分な局所情報を含むことを保証するために、合成特徴レベルの異常を取り入れている。
これら2つの戦略により、MRKDにはより強力な画像コンテキストキャプチャ能力が与えられ、過度に一般化される可能性が低い。
広く使用されているMVTec異常検出データセットの実験では、MRKDは、画像レベル98.9%のAU-ROC、ピクセルレベル98.4%のAU-ROC、95.3%のAU-PROという素晴らしい性能を達成している。
さらに、広範囲にわたるアブレーション実験により、過一般化問題を緩和するMRKDの優位性が確認された。
関連論文リスト
- CINEMAE: Leveraging Frozen Masked Autoencoders for Cross-Generator AI Image Detection [25.84217122259626]
CINEMAEはテキスト検出法の中核となる原則を視覚領域に適用する。
我々は、安定拡散v1.4のみをトレーニングし、GenImageベンチマークの8つの未知のジェネレータに対して95%以上の精度を達成した。
このことは、文脈条件の再構成の不確実性が、AIGC検出のための堅牢で転送可能な信号を提供することを示している。
論文 参考訳(メタデータ) (2025-11-09T11:05:45Z) - Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detection [50.343419243749054]
異常検出は、医学診断や工業的欠陥検出などの分野において重要である。
CLIPの粗粒化画像テキストアライメントは、微粒化異常に対する局所化と検出性能を制限する。
クレーンは最先端のZSADを2%から28%に改善し、画像レベルとピクセルレベルの両方で、推論速度では競争力を維持している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - IterMask3D: Unsupervised Anomaly Detection and Segmentation with Test-Time Iterative Mask Refinement in 3D Brain MR [12.79359555945222]
「教師なし異常検出・分節法は、正規の訓練分布を学習するためにモデルを訓練する。」
我々は3次元脳MRIのための反復型空間マスク精錬戦略である$rmIterMask3Dを提案する。
論文 参考訳(メタデータ) (2025-04-07T10:41:23Z) - UniUIR: Considering Underwater Image Restoration as An All-in-One Learner [62.65503609562905]
我々はUniUIRと呼ばれるユニバーサル水中画像復元手法を提案する。
劣化固有の問題を分離し、UIRタスクにおける様々な劣化の相関関係を探るため、我々はMamba Mixture-of-Expertsモジュールを設計した。
このモジュールは、空間領域と周波数領域の両方において劣化前の情報を抽出し、最適なタスク固有のプロンプトを適応的に選択する。
論文 参考訳(メタデータ) (2025-01-22T16:10:42Z) - LADMIM: Logical Anomaly Detection with Masked Image Modeling in Discrete Latent Space [0.0]
マスク付き画像モデリングは、画像中のマスキング領域の特徴表現を予測する自己教師付き学習技術である。
本稿では,MIMの特性を利用して論理異常を効果的に検出する手法を提案する。
提案手法をMVTecLOCOデータセット上で評価し,平均AUC 0.867。
論文 参考訳(メタデータ) (2024-10-14T07:50:56Z) - Deep Learning Based Speckle Filtering for Polarimetric SAR Images. Application to Sentinel-1 [51.404644401997736]
本稿では、畳み込みニューラルネットワークを用いて偏光SAR画像のスペックルを除去するための完全なフレームワークを提案する。
実験により,提案手法はスペックル低減と分解能保存の両方において例外的な結果をもたらすことが示された。
論文 参考訳(メタデータ) (2024-08-28T10:07:17Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Self-Supervised Masking for Unsupervised Anomaly Detection and
Localization [22.671913403500728]
本研究では,ランダムマスキングと復元による自己教師あり学習手法を提案し,SSM(Self-Supervised Masking)と名づけた。
SSMは、塗布ネットワークのトレーニングを強化するだけでなく、推測時のマスク予測の効率を大幅に向上させる。
推論における異常検出と局所化の効率と有効性を改善するために,新しいプログレッシブマスク改良手法を提案する。
論文 参考訳(メタデータ) (2022-05-13T11:42:06Z) - Multi-modal Aggregation Network for Fast MR Imaging [85.25000133194762]
我々は,完全サンプル化された補助モダリティから補完表現を発見できる,MANetという新しいマルチモーダル・アグリゲーション・ネットワークを提案する。
我々のMANetでは,完全サンプリングされた補助的およびアンアンサンプされた目標モダリティの表現は,特定のネットワークを介して独立に学習される。
私たちのMANetは、$k$-spaceドメインの周波数信号を同時に回復できるハイブリッドドメイン学習フレームワークに従います。
論文 参考訳(メタデータ) (2021-10-15T13:16:59Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。