論文の概要: Robust Image Classification Using A Low-Pass Activation Function and DCT
Augmentation
- arxiv url: http://arxiv.org/abs/2007.09453v2
- Date: Sun, 13 Jun 2021 03:01:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 05:52:53.174424
- Title: Robust Image Classification Using A Low-Pass Activation Function and DCT
Augmentation
- Title(参考訳): 低パスアクティベーション関数とdct拡張を用いたロバスト画像分類
- Authors: Md Tahmid Hossain, Shyh Wei Teng, Ferdous Sohel, Guojun Lu
- Abstract要約: 周波数領域における一般的な汚職、すなわち高周波汚職(HFc、ノイズ)と低周波汚職(LFc、ブラー)を分析します。
低域通過フィルタをAF(LP-ReLU)に注入し,HFcに対するロバスト性を向上させる。
LFc に対処するため,LP-ReLU と Cosine Transform を用いた拡張処理を補完する。
- 参考スコア(独自算出の注目度): 9.303593006906496
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Convolutional Neural Network's (CNN's) performance disparity on clean and
corrupted datasets has recently come under scrutiny. In this work, we analyse
common corruptions in the frequency domain, i.e., High Frequency corruptions
(HFc, e.g., noise) and Low Frequency corruptions (LFc, e.g., blur). Although a
simple solution to HFc is low-pass filtering, ReLU -- a widely used Activation
Function (AF), does not have any filtering mechanism. In this work, we instill
low-pass filtering into the AF (LP-ReLU) to improve robustness against HFc. To
deal with LFc, we complement LP-ReLU with Discrete Cosine Transform based
augmentation. LP-ReLU, coupled with DCT augmentation, enables a deep network to
tackle the entire spectrum of corruption. We use CIFAR-10-C and Tiny ImageNet-C
for evaluation and demonstrate improvements of 5% and 7.3% in accuracy
respectively, compared to the State-Of-The-Art (SOTA). We further evaluate our
method's stability on a variety of perturbations in CIFAR-10-P and Tiny
ImageNet-P, achieving new SOTA in these experiments as well. To further
strengthen our understanding regarding CNN's lack of robustness, a decision
space visualisation process is proposed and presented in this work.
- Abstract(参考訳): convolutional neural network(cnn)は、クリーンで破損したデータセットに対するパフォーマンスの差を最近調査している。
本研究では,周波数領域,すなわち高周波破壊(hfc,例えばノイズ)と低周波数破壊(lfc、例えばぼかし)の共通破壊を分析した。
HFcの単純な解決策はローパスフィルタリングであるが、広く使われているアクティベーション関数(AF)であるReLUにはフィルタリング機構がない。
本研究では,低域通過フィルタをAPF(LP-ReLU)に注入し,HFcに対するロバスト性を向上する。
LFcに対処するため、LP-ReLUと離散コサイン変換による拡張を補完する。
DCT拡張と組み合わせたLP-ReLUにより、ディープネットワークは腐敗のスペクトル全体に取り組むことができる。
評価には CIFAR-10-C と Tiny ImageNet-C を用い,その精度は State-Of-The-Art (SOTA) と比較して5%, 7.3% 向上した。
さらに, CIFAR-10-P と Tiny ImageNet-P の様々な摂動に対する手法の安定性を評価し, これらの実験において新たな SOTA を実現する。
CNNの堅牢性の欠如に関する理解を深めるために, 決定空間の可視化プロセスを提案し, 本研究で紹介する。
関連論文リスト
- Misalignment-Robust Frequency Distribution Loss for Image Transformation [51.0462138717502]
本稿では,画像強調や超解像といった深層学習に基づく画像変換手法における共通の課題に対処することを目的とする。
本稿では、周波数領域内における分布距離を計算するための、新しいシンプルな周波数分布損失(FDL)を提案する。
本手法は,周波数領域におけるグローバル情報の思慮深い活用により,トレーニング制約として実証的に有効であることが実証された。
論文 参考訳(メタデータ) (2024-02-28T09:27:41Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Soft Diffusion: Score Matching for General Corruptions [84.26037497404195]
我々は,任意の線形汚職過程のスコア関数を確実に学習するSoft Score Matchingと呼ばれる新しい目的を提案する。
本研究の目的は, 汚職過程の家族に対して, 適正な規則性条件下での確率の勾配を学習することである。
提案手法はCelebA-64上でのFIDスコアを1.85ドルで達成し,従来の線形拡散モデルよりも優れていた。
論文 参考訳(メタデータ) (2022-09-12T17:45:03Z) - Wavelet-Attention CNN for Image Classification [0.0]
画像分類のためのWavelet-Attention Convolutional Neural Network (WA-CNN)を提案する。
WA-CNNは、基本オブジェクトの構造を保存するために、特徴マップを低周波および高周波のコンポーネントに分解する。
提案するWA-CNNは,他のネットワークと比較して,分類精度の大幅な向上を実現している。
論文 参考訳(メタデータ) (2022-01-23T14:00:33Z) - Frequency Disentangled Residual Network [11.388328269522006]
ResNet(Residual Networks)は様々なコンピュータビジョンや画像処理アプリケーションに利用されている。
残留ブロックは、トレーニング可能なパラメータを持つ少数の畳み込み層で構成され、過度に適合する。
これらの問題に対処するために、周波数不整合残差ネットワーク(FDResNet)を提案する。
論文 参考訳(メタデータ) (2021-09-26T10:52:18Z) - Improving robustness against common corruptions with frequency biased
models [112.65717928060195]
目に見えない画像の腐敗は 驚くほど大きなパフォーマンス低下を引き起こします
画像の破損タイプは周波数スペクトルで異なる特性を持ち、ターゲットタイプのデータ拡張の恩恵を受けます。
畳み込み特徴マップの総変動(TV)を最小限に抑え、高周波堅牢性を高める新しい正規化方式を提案する。
論文 参考訳(メタデータ) (2021-03-30T10:44:50Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z) - A Self-Supervised Feature Map Augmentation (FMA) Loss and Combined
Augmentations Finetuning to Efficiently Improve the Robustness of CNNs [34.353598594018194]
本稿では,FMA(Feature-map augmentation)損失と呼ばれる新たな正規化損失を提案する。
第2に、データ効率のよい方法で複数の拡張タイプに頑健な単一モデルを実現するための、新しい組合せ拡張(CA)ファインタニング戦略を提案する。
論文 参考訳(メタデータ) (2020-12-02T18:32:14Z) - Iterative Network for Image Super-Resolution [69.07361550998318]
単一画像超解像(SISR)は、最近の畳み込みニューラルネットワーク(CNN)の発展により、大幅に活性化されている。
本稿では、従来のSISRアルゴリズムに関する新たな知見を提供し、反復最適化に依存するアプローチを提案する。
反復最適化の上に,新しい反復型超解像ネットワーク (ISRN) を提案する。
論文 参考訳(メタデータ) (2020-05-20T11:11:47Z) - Edge Preserving CNN SAR Despeckling Algorithm [1.933681537640272]
我々は,畳み込みニューラルネットワークを訓練し,再検討するための新たなコスト関数を定義する。
目的は、エッジの保存を制御し、人工構造物や都市部をよりよくフィルターすることである。
その結果、同種でない領域において、良質な結果を均一な領域に保ち、非常に良好な改善が得られた。
論文 参考訳(メタデータ) (2020-01-14T11:26:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。