論文の概要: Wavelet-Enhanced PaDiM for Industrial Anomaly Detection
- arxiv url: http://arxiv.org/abs/2508.16034v1
- Date: Fri, 22 Aug 2025 01:37:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-25 16:42:36.223503
- Title: Wavelet-Enhanced PaDiM for Industrial Anomaly Detection
- Title(参考訳): ウェーブレットによる産業異常検出のためのPaDiM
- Authors: Cory Gardner, Byungseok Min, Tae-Hyuk Ahn,
- Abstract要約: 離散ウェーブレット変換解析と多層CNN特徴を構造化的に統合したウェーブレット拡張PaDiMを提案する。
複数のバックボーンを持つ MVTec AD データセット上で WE-PaDiM を評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Anomaly detection and localization in industrial images are essential for automated quality inspection. PaDiM, a prominent method, models the distribution of normal image features extracted by pre-trained Convolutional Neural Networks (CNNs) but reduces dimensionality through random channel selection, potentially discarding structured information. We propose Wavelet-Enhanced PaDiM (WE-PaDiM), which integrates Discrete Wavelet Transform (DWT) analysis with multi-layer CNN features in a structured manner. WE-PaDiM applies 2D DWT to feature maps from multiple backbone layers, selects specific frequency subbands (e.g., LL, LH, HL), spatially aligns them, and concatenates them channel-wise before modeling with PaDiM's multivariate Gaussian framework. This DWT-before-concatenation strategy provides a principled method for feature selection based on frequency content relevant to anomalies, leveraging multi-scale wavelet information as an alternative to random selection. We evaluate WE-PaDiM on the challenging MVTec AD dataset with multiple backbones (ResNet-18 and EfficientNet B0-B6). The method achieves strong performance in anomaly detection and localization, yielding average results of 99.32% Image-AUC and 92.10% Pixel-AUC across 15 categories with per-class optimized configurations. Our analysis shows that wavelet choices affect performance trade-offs: simpler wavelets (e.g., Haar) with detail subbands (HL or LH/HL/HH) often enhance localization, while approximation bands (LL) improve image-level detection. WE-PaDiM thus offers a competitive and interpretable alternative to random feature selection in PaDiM, achieving robust results suitable for industrial inspection with comparable efficiency.
- Abstract(参考訳): 産業画像の異常検出と局所化は自動品質検査に不可欠である。
著名な手法であるPaDiMは、事前訓練された畳み込みニューラルネットワーク(CNN)によって抽出された通常の画像特徴の分布をモデル化するが、ランダムチャネル選択により次元性を減少させ、構造化された情報を破棄する可能性がある。
本稿では、離散ウェーブレット変換(DWT)解析と多層CNN特徴を構造化的に統合したウェーブレット拡張PaDiM(WE-PaDiM)を提案する。
WE-PaDiMは、複数のバックボーン層からのマップを特徴付けるために2次元DWTを適用し、特定の周波数サブバンド(例えば、LL、LH、HL)を選択し、それらを空間的に整列させ、PaDiMの多変量ガウスフレームワークでモデル化する前にそれらをチャネル的に結合する。
このDWT-before-concatenation戦略は、ランダム選択の代替としてマルチスケールウェーブレット情報を利用する、異常に関連する周波数コンテンツに基づく特徴選択の原則的手法を提供する。
複数のバックボーンを持つMVTec ADデータセット上でWE-PaDiMを評価した(ResNet-18とEfficientNet B0-B6)。
この手法は異常検出とローカライゼーションにおいて高い性能を達成し、画像AUCの99.32%、Pixel-AUCの92.10%、クラスごとに最適化された構成の15のカテゴリで平均結果が得られる。
詳細サブバンド(HLまたはLH/HL/HH)を持つ単純なウェーブレット(例えばHaar)は、しばしばローカライゼーションを高め、近似バンド(LL)は画像レベルの検出を改善する。
したがって、WE-PaDiMはPaDiMにおけるランダムな特徴選択の競合的で解釈可能な代替手段を提供し、工業検査に匹敵する効率で堅牢な結果が得られる。
関連論文リスト
- MR-EEGWaveNet: Multiresolutional EEGWaveNet for Seizure Detection from Long EEG Recordings [7.9595266728435545]
本稿では,背景電気グラム(EEG)アーチファクト/ノイズから発作イベントを効率よく識別する,新しいエンド・ツー・エンドモデル"MR-EEGWaveNet"を提案する。
このモデルには、畳み込み、特徴抽出、予測という3つのモジュールがある。
提案したMR-EEGWaveNetは、従来の非多重分解能アプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-05-23T14:40:50Z) - 3D Wavelet Convolutions with Extended Receptive Fields for Hyperspectral Image Classification [12.168520751389622]
ディープニューラルネットワークは、ハイパースペクトル画像分類において多くの課題に直面している。
本稿ではウェーブレット変換と統合された改良型3D-DenseNetモデルWCNetを提案する。
実験結果から,IN,UP,KSCデータセットにおいて優れた性能を示した。
論文 参考訳(メタデータ) (2025-04-15T01:39:42Z) - FE-UNet: Frequency Domain Enhanced U-Net for Low-Frequency Information-Rich Image Segmentation [48.034848981295525]
CNNと人間の視覚系における周波数帯域感度の差について検討する。
本稿では、生体視覚機構にインスパイアされたウェーブレット適応スペクトル融合(WASF)法を提案する。
我々は SAM2 のバックボーンネットワークを利用する FE-UNet モデルを開発し, セグメンテーション精度を確保するために細調整した Hiera-Large モジュールを組み込んだ。
論文 参考訳(メタデータ) (2025-02-06T07:24:34Z) - One-Dimensional Deep Image Prior for Curve Fitting of S-Parameters from
Electromagnetic Solvers [57.441926088870325]
Deep Image Prior(ディープ・イメージ・プライオリ、ディープ・イメージ・プライオリ、DIP)は、ランダムなd畳み込みニューラルネットワークの重みを最適化し、ノイズや過度な測定値からの信号に適合させる技術である。
本稿では,Vector Fitting (VF) の実装に対して,ほぼすべてのテスト例において優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-06T20:28:37Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - FAMLP: A Frequency-Aware MLP-Like Architecture For Domain Generalization [73.41395947275473]
本稿では、変換周波数領域において、ドメイン固有の特徴をフィルタリングする新しい周波数認識アーキテクチャを提案する。
3つのベンチマークの実験では、最先端の手法をそれぞれ3%、4%、9%のマージンで上回った。
論文 参考訳(メタデータ) (2022-03-24T07:26:29Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - Hyperspectral Band Selection for Multispectral Image Classification with
Convolutional Networks [0.0]
ハイパースペクトル画像から波長の減少したセットを選択するための新しいバンド選択法を提案する。
本手法により,マルチスペクトルセンサの設計に適した結果が得られることを示す。
論文 参考訳(メタデータ) (2021-06-01T17:24:35Z) - PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and
Localization [64.39761523935613]
本稿では,画像中の異常を同時検出・ローカライズするPatch Distribution Modeling, PaDiMを提案する。
PaDiMは、パッチの埋め込みに事前訓練された畳み込みニューラルネットワーク(CNN)を使用している。
また、CNNの異なるセマンティックレベル間の相関を利用して、異常のローカライズも改善している。
論文 参考訳(メタデータ) (2020-11-17T17:29:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。