論文の概要: Overcoming the Identity Mapping Problem in Self-Supervised Hyperspectral Anomaly Detection
- arxiv url: http://arxiv.org/abs/2504.04115v1
- Date: Sat, 05 Apr 2025 09:12:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-08 14:09:54.141072
- Title: Overcoming the Identity Mapping Problem in Self-Supervised Hyperspectral Anomaly Detection
- Title(参考訳): 自己監督型ハイパースペクトル異常検出におけるアイデンティティマッピング問題の克服
- Authors: Yongchuan Cui, Jinhe Zhang, Peng Liu, Weijing Song, Yi Zeng,
- Abstract要約: 自己監督型ハイパースペクトル異常検出(HAD)モデルはアイデンティティマッピング問題(IMP)にしばしば悩まされる
IMPは、特にネットワークの複雑さの増大やトレーニングの長期化など、モデルが全体像に過度に適合する傾向を示す。
本稿では,摂動に対するスーパーピクセルプーリングとアッププール,再構成のための誤り適応畳み込み,正規化のためのオンライン背景画素マイニングという3つの方法を紹介する。
- 参考スコア(独自算出の注目度): 6.547234350675682
- License:
- Abstract: The surge of deep learning has catalyzed considerable progress in self-supervised Hyperspectral Anomaly Detection (HAD). The core premise for self-supervised HAD is that anomalous pixels are inherently more challenging to reconstruct, resulting in larger errors compared to the background. However, owing to the powerful nonlinear fitting capabilities of neural networks, self-supervised models often suffer from the Identity Mapping Problem (IMP). The IMP manifests as a tendency for the model to overfit to the entire image, particularly with increasing network complexity or prolonged training iterations. Consequently, the whole image can be precisely reconstructed, and even the anomalous pixels exhibit imperceptible errors, making them difficult to detect. Despite the proposal of several models aimed at addressing the IMP-related issues, a unified descriptive framework and validation of solutions for IMP remain lacking. In this paper, we conduct an in-depth exploration to IMP, and summarize a unified framework that describes IMP from the perspective of network optimization, which encompasses three aspects: perturbation, reconstruction, and regularization. Correspondingly, we introduce three solutions: superpixel pooling and uppooling for perturbation, error-adaptive convolution for reconstruction, and online background pixel mining for regularization. With extensive experiments being conducted to validate the effectiveness, it is hoped that our work will provide valuable insights and inspire further research for self-supervised HAD. Code: \url{https://github.com/yc-cui/Super-AD}.
- Abstract(参考訳): 深層学習の急増は、自己監督型ハイパースペクトル異常検出(HAD)においてかなりの進歩をもたらした。
自己監督型HADの中核となる前提は、異常画素は本質的に再構成が困難であり、背景よりもエラーが大きいことである。
しかし、ニューラルネットワークの強力な非線形フィッティング能力のため、自己教師型モデルはアイデンティティマッピング問題(IMP)に悩まされることが多い。
IMPは、特にネットワークの複雑さの増大やトレーニングの長期化など、モデルが全体像に過度に適合する傾向を示す。
その結果、画像全体を正確に再構成することができ、異常画素でさえ認識不能な誤りを示し、検出が困難になる。
IMPに関連する問題に対処するためのモデルがいくつか提案されているにもかかわらず、統一された記述フレームワークとIMPのためのソリューションの検証は依然として不足している。
本稿では,IMP の詳細な探索を行い,ネットワーク最適化の観点から IMP を記述した統合フレームワークを要約する。
これに対応して,摂動に対するスーパーピクセルプーリングとアッププール,再構成のための誤り適応的畳み込み,正規化のためのオンライン背景画素マイニングという3つのソリューションを導入する。
有効性を検証するための広範囲な実験が実施され、我々の研究が貴重な洞察を与え、自己監督型HADのためのさらなる研究を促すことが期待されている。
コード: \url{https://github.com/yc-cui/Super-AD}。
関連論文リスト
- InDeed: Interpretable image deep decomposition with guaranteed generalizability [28.595151003310452]
画像分解は、イメージを基本成分に分解することを目的としている。
深層学習はそのようなタスクには強力だが、解釈可能性と一般化性に焦点を合わせることはめったにない。
本稿では,階層型ベイズモデルとディープラーニングを組み合わせた,解釈可能な深層画像分解のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-02T07:58:26Z) - Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection [58.87142367781417]
航法的に訓練された検出器は、限定的で単調な偽のパターンに過度に適合する傾向にあり、特徴空間は高度に制約され、低ランクになる。
潜在的な治療法の1つは、ビジョンファウンデーションモデルに事前訓練された知識を取り入れて、機能領域を広げることである。
主成分を凍結し,残った成分のみを適応させることで,偽造関係のパターンを学習しながら,事前学習した知識を保存できる。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z) - Feature Attenuation of Defective Representation Can Resolve Incomplete Masking on Anomaly Detection [1.0358639819750703]
教師なし異常検出(UAD)研究では、計算効率が高くスケーラブルなソリューションを開発する必要がある。
再建・塗り替えのアプローチを再考し、強みと弱みを分析して改善する。
異常再構成の特徴情報を減衰させる2つの層のみを用いるFADeR(Feature Attenuation of Defective Representation)を提案する。
論文 参考訳(メタデータ) (2024-07-05T15:44:53Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - ReContrast: Domain-Specific Anomaly Detection via Contrastive
Reconstruction [29.370142078092375]
殆どの高度な教師なし異常検出(UAD)手法は、大規模データセットで事前訓練された冷凍エンコーダネットワークの特徴表現をモデル化することに依存している。
本稿では,事前学習した画像領域に対するバイアスを低減するために,ネットワーク全体を最適化する新しい疫学的UAD手法であるReContrastを提案する。
2つの一般的な産業欠陥検出ベンチマークと3つの医用画像UADタスクで実験を行い、現在の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-05T05:21:15Z) - Robust Single Image Dehazing Based on Consistent and Contrast-Assisted
Reconstruction [95.5735805072852]
画像復調モデルのロバスト性を改善するための新しい密度変分学習フレームワークを提案する。
具体的には、デハジングネットワークは、一貫性の規則化されたフレームワークの下で最適化されている。
我々の手法は最先端のアプローチを大きく上回っている。
論文 参考訳(メタデータ) (2022-03-29T08:11:04Z) - A-ESRGAN: Training Real-World Blind Super-Resolution with Attention
U-Net Discriminators [0.0]
ブラインド画像超解像(SR)は、未知の複雑な歪みに苦しむ低解像度画像の復元を目的とした、CVにおける長年の課題である。
本稿では,A-ESRGANについて述べる。A-ESRGAN,A-ESRGAN,A-ESRGAN,A-ESRGAN,A-ESRGAN,A-ESRGAN,A-ESRGAN。
論文 参考訳(メタデータ) (2021-12-19T02:50:23Z) - Proactive Pseudo-Intervention: Causally Informed Contrastive Learning
For Interpretable Vision Models [103.64435911083432]
PPI(Proactive Pseudo-Intervention)と呼ばれる新しい対照的な学習戦略を提案する。
PPIは、因果関係のない画像の特徴を保護するために積極的に介入する。
また,重要な画像画素を識別するための,因果的に通知された新たなサリエンスマッピングモジュールを考案し,モデル解釈の容易性を示す。
論文 参考訳(メタデータ) (2020-12-06T20:30:26Z) - Limited-angle tomographic reconstruction of dense layered objects by
dynamical machine learning [68.9515120904028]
強い散乱準透明物体の有限角トモグラフィーは困難で、非常に不適切な問題である。
このような問題の状況を改善することにより、アーティファクトの削減には、事前の定期化が必要である。
我々は,新しい分割畳み込みゲート再帰ユニット(SC-GRU)をビルディングブロックとして,リカレントニューラルネットワーク(RNN)アーキテクチャを考案した。
論文 参考訳(メタデータ) (2020-07-21T11:48:22Z) - Enhancing Perceptual Loss with Adversarial Feature Matching for
Super-Resolution [5.258555266148511]
単一画像超解法 (SISR) は不確定な数の有効解を持つ不確定問題である。
これらのパターンアーティファクトの根本原因は、知覚的損失の事前学習目標と超解答目標とのミスマッチに遡ることができる。
論文 参考訳(メタデータ) (2020-05-15T12:36:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。