論文の概要: Amplitude-Phase Recombination: Rethinking Robustness of Convolutional
Neural Networks in Frequency Domain
- arxiv url: http://arxiv.org/abs/2108.08487v1
- Date: Thu, 19 Aug 2021 04:04:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-20 14:41:51.162385
- Title: Amplitude-Phase Recombination: Rethinking Robustness of Convolutional
Neural Networks in Frequency Domain
- Title(参考訳): 振幅位相再結合:周波数領域における畳み込みニューラルネットワークのロバスト性再考
- Authors: Guangyao Chen, Peixi Peng, Li Ma, Jia Li, Lin Du, Yonghong Tian
- Abstract要約: CNNは、トレーニング画像の高周波成分と密接に関連する局所最適値に収束する傾向にある。
現在の画像の位相スペクトルとイントラクタ画像の振幅スペクトルを再結合して設計されたデータ拡張に関する新しい視点。
- 参考スコア(独自算出の注目度): 31.182376196295365
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, the generalization behavior of Convolutional Neural Networks (CNN)
is gradually transparent through explanation techniques with the frequency
components decomposition. However, the importance of the phase spectrum of the
image for a robust vision system is still ignored. In this paper, we notice
that the CNN tends to converge at the local optimum which is closely related to
the high-frequency components of the training images, while the amplitude
spectrum is easily disturbed such as noises or common corruptions. In contrast,
more empirical studies found that humans rely on more phase components to
achieve robust recognition. This observation leads to more explanations of the
CNN's generalization behaviors in both robustness to common perturbations and
out-of-distribution detection, and motivates a new perspective on data
augmentation designed by re-combing the phase spectrum of the current image and
the amplitude spectrum of the distracter image. That is, the generated samples
force the CNN to pay more attention to the structured information from phase
components and keep robust to the variation of the amplitude. Experiments on
several image datasets indicate that the proposed method achieves
state-of-the-art performances on multiple generalizations and calibration
tasks, including adaptability for common corruptions and surface variations,
out-of-distribution detection, and adversarial attack.
- Abstract(参考訳): 近年,畳み込みニューラルネットワーク(CNN)の一般化動作は,周波数成分分解による説明手法により徐々に透明化されている。
しかし、ロバストな視覚システムにおける画像の位相スペクトルの重要性はいまだ無視されている。
本稿では,CNNがトレーニング画像の高周波成分と密接な関係にある局所最適値に収束する傾向にあるのに対して,振幅スペクトルはノイズや一般的な腐敗などによって容易に乱される。
対照的に、より実証的な研究により、人間は堅牢な認識を達成するためにより多くの位相成分に依存していることがわかった。
この観察により、CNNの一般的な摂動に対する頑健さと分布外検出の両方における一般化挙動がより説明され、現在の画像の位相スペクトルと散逸画像の振幅スペクトルを再結合して設計されたデータ拡張に対する新たな視点が動機付けられる。
すなわち、生成されたサンプルはcnnに位相成分の構造化情報により多くの注意を払うよう強制し、振幅の変化に頑健に維持する。
複数の画像データセットにおける実験により,提案手法は,共通の腐敗や表面変動に対する適応性,分散検出,逆攻撃など,複数の一般化とキャリブレーションタスクにおいて最先端のパフォーマンスを達成していることが示された。
関連論文リスト
- Wavelet-based Bi-dimensional Aggregation Network for SAR Image Change Detection [53.842568573251214]
3つのSARデータセットによる実験結果から、我々のWBANetは現代最先端の手法を著しく上回っていることが明らかとなった。
我々のWBANetは、それぞれのデータセットで98.33%、96.65%、96.62%の正確な分類(PCC)を達成している。
論文 参考訳(メタデータ) (2024-07-18T04:36:10Z) - Hybrid Convolutional and Attention Network for Hyperspectral Image Denoising [54.110544509099526]
ハイパースペクトル画像(HSI)は、ハイパースペクトルデータの効果的な解析と解釈に重要である。
ハイブリット・コンボリューション・アテンション・ネットワーク(HCANet)を提案する。
主流HSIデータセットに対する実験結果は,提案したHCANetの合理性と有効性を示している。
論文 参考訳(メタデータ) (2024-03-15T07:18:43Z) - Spectrum Translation for Refinement of Image Generation (STIG) Based on
Contrastive Learning and Spectral Filter Profile [15.5188527312094]
生成した画像の周波数領域における相違を緩和する枠組みを提案する。
これは、コントラスト学習に基づく画像生成(STIG)の洗練のためのスペクトル変換によって実現される。
我々は,STIGの有効性を実証するために,8つのフェイク画像データセットと様々な最先端モデルにまたがるフレームワークの評価を行った。
論文 参考訳(メタデータ) (2024-03-08T06:39:24Z) - Hyperspectral Image Denoising via Self-Modulating Convolutional Neural
Networks [15.700048595212051]
相関スペクトルと空間情報を利用した自己変調畳み込みニューラルネットワークを提案する。
モデルの中心には新しいブロックがあり、隣り合うスペクトルデータに基づいて、ネットワークが適応的に特徴を変換することができる。
合成データと実データの両方の実験解析により,提案したSM-CNNは,他の最先端HSI復調法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-09-15T06:57:43Z) - Exploiting Frequency Spectrum of Adversarial Images for General
Robustness [3.480626767752489]
相成分に重点を置いた逆行訓練は、クリーン、逆行、および一般的な汚職精度のモデル性能を著しく向上させる。
そこで本稿では, 周波数ベースデータ拡張手法であるAdversarial Amplitude Swapを提案し, クリーン画像と逆画像の振幅スペクトルを交換する。
これらの画像は、敵画像の代用として機能し、様々な敵訓練設定で実装することができる。
論文 参考訳(メタデータ) (2023-05-15T08:36:32Z) - Exploring Invariant Representation for Visible-Infrared Person
Re-Identification [77.06940947765406]
異なるスペクトルを横断する歩行者にアイデンティティを関連付けることを目的とした、クロススペクトルの人物再識別は、モダリティの相違の主な課題に直面している。
本稿では、ロバスト機能マイニングネットワーク(RFM)と呼ばれるエンドツーエンドのハイブリッド学習フレームワークにおいて、画像レベルと特徴レベルの両方の問題に対処する。
RegDBとSYSU-MM01という2つの標準的なクロススペクトル人物識別データセットの実験結果により,最先端の性能が示された。
論文 参考訳(メタデータ) (2023-02-02T05:24:50Z) - Deep Semantic Statistics Matching (D2SM) Denoising Network [70.01091467628068]
本稿では,Deep Semantic Statistics Matching (D2SM) Denoising Networkを紹介する。
事前訓練された分類ネットワークの意味的特徴を利用して、意味的特徴空間における明瞭な画像の確率的分布と暗黙的に一致させる。
識別画像のセマンティックな分布を学習することで,ネットワークの認知能力を大幅に向上させることを実証的に見出した。
論文 参考訳(メタデータ) (2022-07-19T14:35:42Z) - Adversarial amplitude swap towards robust image classifiers [3.480626767752489]
逆画像の振幅スペクトルと位相スペクトルがCNN分類器の頑健性に及ぼす影響について検討する。
実験の結果, 対向画像の振幅スペクトルとクリーン画像の位相スペクトルを組み合わせた画像は, 適度な摂動と一般の摂動を許容できることがわかった。
論文 参考訳(メタデータ) (2022-03-14T14:32:11Z) - Exploring Inter-frequency Guidance of Image for Lightweight Gaussian
Denoising [1.52292571922932]
本稿では,周波数帯域を低域から高域に漸進的に洗練するために,IGNetと呼ばれる新しいネットワークアーキテクチャを提案する。
この設計では、より周波数間先行と情報を利用するため、モデルサイズは軽量化でき、競争結果も維持できる。
論文 参考訳(メタデータ) (2021-12-22T10:35:53Z) - Improving robustness against common corruptions with frequency biased
models [112.65717928060195]
目に見えない画像の腐敗は 驚くほど大きなパフォーマンス低下を引き起こします
画像の破損タイプは周波数スペクトルで異なる特性を持ち、ターゲットタイプのデータ拡張の恩恵を受けます。
畳み込み特徴マップの総変動(TV)を最小限に抑え、高周波堅牢性を高める新しい正規化方式を提案する。
論文 参考訳(メタデータ) (2021-03-30T10:44:50Z) - Spatial-Phase Shallow Learning: Rethinking Face Forgery Detection in
Frequency Domain [88.7339322596758]
本論文では,空間画像と位相スペクトルを組み合わせ,顔の偽造のアップサンプリング成果をキャプチャするSPSL(Spatial-Phase Shallow Learning)法を提案する。
SPSLは、クロスデータセット評価における最先端性能とマルチクラス分類を実現し、単一データセット評価において同等の結果を得ることができる。
論文 参考訳(メタデータ) (2021-03-02T16:45:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。