論文の概要: Frequency Pooling: Shift-Equivalent and Anti-Aliasing Downsampling
- arxiv url: http://arxiv.org/abs/2109.11839v1
- Date: Fri, 24 Sep 2021 09:32:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-27 22:54:08.912123
- Title: Frequency Pooling: Shift-Equivalent and Anti-Aliasing Downsampling
- Title(参考訳): 周波数プーリング:シフト等価およびアンチエイリアスダウンサンプリング
- Authors: Zhendong Zhang
- Abstract要約: 本研究では、フーリエ変換とナイキスト周波数の特性に基づいて、周波数プーリングがシフト等価であり、アンチエイリアスであることを示す。
画像分類実験により、周波数プーリングはCNNのシフトに対して精度とロバスト性を向上させることが示された。
- 参考スコア(独自算出の注目度): 9.249235534786072
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Convolution utilizes a shift-equivalent prior of images, thus leading to
great success in image processing tasks. However, commonly used poolings in
convolutional neural networks (CNNs), such as max-pooling, average-pooling, and
strided-convolution, are not shift-equivalent. Thus, the shift-equivalence of
CNNs is destroyed when convolutions and poolings are stacked. Moreover,
anti-aliasing is another essential property of poolings from the perspective of
signal processing. However, recent poolings are neither shift-equivalent nor
anti-aliasing. To address this issue, we propose a new pooling method that is
shift-equivalent and anti-aliasing, named frequency pooling. Frequency pooling
first transforms the features into the frequency domain, and then removes the
frequency components beyond the Nyquist frequency. Finally, it transforms the
features back to the spatial domain. We prove that frequency pooling is
shift-equivalent and anti-aliasing based on the property of Fourier transform
and Nyquist frequency. Experiments on image classification show that frequency
pooling improves accuracy and robustness with respect to the shifts of CNNs.
- Abstract(参考訳): 畳み込みは画像のシフト等価な事前処理を利用するため、画像処理タスクで大きな成功を収める。
しかし、最大プール、平均プール、ストライド畳み込みなどの畳み込みニューラルネットワーク(CNN)で一般的に使用されるプーリングはシフト等価ではない。
これにより、畳み込みやプーリングの積み重ねによってCNNのシフト等価性が破壊される。
さらに、アンチエイリアシングは信号処理の観点からのプーリングの重要な特性である。
しかし、最近のプールはシフト等価でもアンチエイリアスでもない。
この問題に対処するために、シフト等価かつアンチエイリアスである周波数プーリングと呼ばれる新しいプール法を提案する。
周波数プーリングは、まず特徴を周波数領域に変換し、次にナイキスト周波数を超える周波数成分を除去する。
そして最後に、その特徴を空間領域に戻す。
フーリエ変換とナイキスト周波数の特性に基づいて,周波数プーリングがシフト等価かつアンチエイリアスであることを証明する。
画像分類実験により,cnnのシフトに対する周波数プーリングの精度とロバスト性が向上した。
関連論文リスト
- FreGS: 3D Gaussian Splatting with Progressive Frequency Regularization [67.47895278233717]
周波数空間における過度再構成問題に対処するために, 進行周波数正規化手法を開発した。
FreGSは優れた斬新なビュー合成を実現し、最先端の技術を一貫して上回っている。
論文 参考訳(メタデータ) (2024-03-11T17:00:27Z) - Misalignment-Robust Frequency Distribution Loss for Image Transformation [51.0462138717502]
本稿では,画像強調や超解像といった深層学習に基づく画像変換手法における共通の課題に対処することを目的とする。
本稿では、周波数領域内における分布距離を計算するための、新しいシンプルな周波数分布損失(FDL)を提案する。
本手法は,周波数領域におけるグローバル情報の思慮深い活用により,トレーニング制約として実証的に有効であることが実証された。
論文 参考訳(メタデータ) (2024-02-28T09:27:41Z) - Fix your downsampling ASAP! Be natively more robust via Aliasing and
Spectral Artifact free Pooling [11.72025865314187]
畳み込みニューラルネットワークは、画像に一連の畳み込み、正規化、非線形性、およびダウンサンプリング操作をエンコードする。
以前の研究では、サンプリング中のわずかなミスでさえエイリアスに繋がる可能性があることが、ネットワークの堅牢性の欠如に直接起因していることが示された。
本稿では,アーティファクトを含まないアーティファクト・プール・ショートASAPを提案する。
論文 参考訳(メタデータ) (2023-07-19T07:47:23Z) - On the Shift Invariance of Max Pooling Feature Maps in Convolutional
Neural Networks [0.0]
ガボル型フィルタによるサブサンプル畳み込みはエイリアスしがちであり、小さな入力シフトに敏感である。
安定性を実現する上で,フィルタの周波数と向きが果たす重要な役割を強調した。
二重ツリー複合ウェーブレットパケット変換に基づく決定論的特徴抽出器を設計し,本理論を実験的に検証する。
論文 参考訳(メタデータ) (2022-09-19T08:15:30Z) - Hierarchical Spherical CNNs with Lifting-based Adaptive Wavelets for
Pooling and Unpooling [101.72318949104627]
本稿では, 階層型畳み込みニューラルネットワーク(HS-CNN)の新たな枠組みを提案し, プールやアンプールのための適応球面ウェーブレットを学習する。
LiftHS-CNNは、画像レベルのタスクとピクセルレベルのタスクの両方において、より効率的な階層的特徴学習を実現する。
論文 参考訳(メタデータ) (2022-05-31T07:23:42Z) - Adaptive Frequency Learning in Two-branch Face Forgery Detection [66.91715092251258]
本稿では、AFDと呼ばれる2分岐検出フレームワークにおいて、周波数情報を適応的に学習する手法を提案する。
我々は、固定周波数変換からネットワークを解放し、データおよびタスク依存の変換層でより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-27T14:25:52Z) - Exploring Novel Pooling Strategies for Edge Preserved Feature Maps in
Convolutional Neural Networks [0.0]
アンチエイリアス化された畳み込みニューラルネットワーク(CNN)は、CNNにおけるプールの実施方法を見直す上で、ある程度の復活をもたらした。
Laplacian-Gaussian Concatenation with Attention (LGCA) pooling と Wavelet based almost-detailed Concatenation with attention (WADCA) pooling である。
提案手法は, 分類, セグメンテーション, オートエンコーダにおいて, 従来のプール法よりも優れていることが示唆された。
論文 参考訳(メタデータ) (2021-10-17T15:11:51Z) - Dense Pruning of Pointwise Convolutions in the Frequency Domain [10.58456555092086]
本研究では,各点層を離散コサイン変換(DCT)でラップする手法を提案する。
スパース演算子に依存する重み打ち法とは異なり、連続周波数帯打ち法は完全な密度計算をもたらす。
提案手法をMobileNetV2に適用することにより,計算時間を22%削減し,精度を1%向上させる。
論文 参考訳(メタデータ) (2021-09-16T04:02:45Z) - WaveFill: A Wavelet-based Generation Network for Image Inpainting [57.012173791320855]
WaveFillはウェーブレットベースの塗装ネットワークで、画像を複数の周波数帯域に分解する。
WaveFillは、空間情報を自然に保存する離散ウェーブレット変換(DWT)を用いて画像を分解する。
低周波帯にL1再構成損失を、高周波帯に敵対損失を施し、それによって周波数間紛争を効果的に軽減する。
論文 参考訳(メタデータ) (2021-07-23T04:44:40Z) - WaveTransform: Crafting Adversarial Examples via Input Decomposition [69.01794414018603]
本稿では,低周波サブバンドと高周波サブバンドに対応する逆雑音を生成するWaveTransformを紹介する。
実験により,提案攻撃は防衛アルゴリズムに対して有効であり,CNN間での転送も可能であることが示された。
論文 参考訳(メタデータ) (2020-10-29T17:16:59Z) - Robust Learning with Frequency Domain Regularization [1.370633147306388]
モデルのフィルタの周波数スペクトルを制約し,新しい正規化手法を提案する。
本研究では,(1)対向的摂動を抑えること,(2)異なるアーキテクチャにおける一般化のギャップを小さくすること,(3)微調整を伴わない伝達学習シナリオにおける一般化能力を向上させることによる正規化の有効性を実証する。
論文 参考訳(メタデータ) (2020-07-07T07:29:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。