論文の概要: Fix your downsampling ASAP! Be natively more robust via Aliasing and Spectral Artifact free Pooling
- arxiv url: http://arxiv.org/abs/2307.09804v2
- Date: Tue, 23 Sep 2025 08:04:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.343405
- Title: Fix your downsampling ASAP! Be natively more robust via Aliasing and Spectral Artifact free Pooling
- Title(参考訳): AliasingとSpectral Artifact Free Poolingで、より堅牢になる
- Authors: Julia Grabinski, Steffen Jung, Janis Keuper, Margret Keuper,
- Abstract要約: 畳み込みニューラルネットワーク(CNN)は様々なコンピュータビジョンタスクで成功している。
ほとんどのCNNの空間ピラミッド設計は、明らかに基本的な信号処理法に違反している。
本稿では,周波数領域におけるエイリアスフリーなダウンサンプリング動作について提案する。
- 参考スコア(独自算出の注目度): 33.248833550125745
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Convolutional Neural Networks (CNNs) are successful in various computer vision tasks. From an image and signal processing point of view, this success is counter-intuitive, as the inherent spatial pyramid design of most CNNs is apparently violating basic signal processing laws, i.e. the Sampling Theorem in their downsampling operations. This issue has been broadly neglected until recent work in the context of adversarial attacks and distribution shifts showed that there is a strong correlation between the vulnerability of CNNs and aliasing artifacts induced by bandlimit-violating downsampling. As a remedy, we propose an alias-free downsampling operation in the frequency domain, denoted Frequency Low Cut Pooling (FLC Pooling) which we further extend to Aliasing and Sinc Artifact-free Pooling (ASAP). ASAP is alias-free and removes further artifacts from sinc-interpolation. Our experimental evaluation on ImageNet-1k, ImageNet-C and CIFAR datasets on various CNN architectures demonstrates that networks using FLC Pooling and ASAP as downsampling methods learn more stable features as measured by their robustness against common corruptions and adversarial attacks, while maintaining a clean accuracy similar to the respective baseline models.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)は様々なコンピュータビジョンタスクで成功している。
画像と信号処理の観点から見ると、この成功は直感に反するものであり、ほとんどのCNNの空間ピラミッド設計は明らかに基本的な信号処理法に違反している。
この問題は、CNNの脆弱性と帯域制限に違反するダウンサンプリングによって引き起こされるアーティファクトのエイリアスの間に強い相関があることが証明されるまで、広く無視されてきた。
本稿では、周波数領域におけるエイリアスフリーなダウンサンプリング操作であるFLCプーリング(FLC Pooling)を提案し、Aliasing と Sinc Artifact-free Pooling (ASAP) にさらに拡張する。
ASAPはエイリアスフリーであり、 sinc-interpolation からさらにアーティファクトを除去する。
各種CNNアーキテクチャ上でのImageNet-1k, ImageNet-C, CIFARデータセットに関する実験的評価により, FLC Pooling と ASAP をダウンサンプリング手法として用いたネットワークは,各ベースラインモデルに類似したクリーンな精度を維持しつつ, 共通の汚職や敵攻撃に対するロバスト性から, より安定した特徴を学習できることが示されている。
関連論文リスト
- Freq-Mip-AA : Frequency Mip Representation for Anti-Aliasing Neural Radiance Fields [3.796287987989994]
Mip-NeRFはフラストタムを用いてピクセルを描画し、統合位置符号化(IPE)を提案する。
このアプローチは有効であるが、ボリュームアーキテクチャに依存しているため、長いトレーニング時間を必要とする。
本稿では,グリッドベース表現を利用した新しいアンチエイリアス手法を提案する。
論文 参考訳(メタデータ) (2024-06-19T06:33:56Z) - Arbitrary-Scale Point Cloud Upsampling by Voxel-Based Network with
Latent Geometric-Consistent Learning [52.825441454264585]
Voxel-based Network (textbfPU-VoxelNet) を用いた任意のスケールのクラウド・アップサンプリング・フレームワークを提案する。
ボクセル表現から継承された完全性と規則性により、ボクセルベースのネットワークは3次元表面を近似する事前定義されたグリッド空間を提供することができる。
密度誘導グリッド再サンプリング法を開発し、高忠実度点を生成するとともに、サンプリング出力を効果的に回避する。
論文 参考訳(メタデータ) (2024-03-08T07:31:14Z) - Fine Structure-Aware Sampling: A New Sampling Training Scheme for Pixel-Aligned Implicit Models in Single-View Human Reconstruction [98.30014795224432]
本研究では,単一視点の人物再構成のための暗黙的画素アライメントモデルをトレーニングするために,FSS(Final Structured-Aware Sampling)を導入する。
FSSは表面の厚さと複雑さに積極的に適応する。
また、画素アライメント型暗黙的モデルのためのメッシュ厚み損失信号を提案する。
論文 参考訳(メタデータ) (2024-02-29T14:26:46Z) - Aliasing is a Driver of Adversarial Attacks [35.262520934751]
本稿では, 対向摂動の存在は, ニューラルネットワークのエイリアスに起因しているという仮説を考察する。
我々の最終的な目標は、説明可能な非訓練型構造変化のみを用いて、敵攻撃に対する堅牢性を高めることである。
実験の結果,抗エイリアスと対人攻撃の関連性は良好であった。
論文 参考訳(メタデータ) (2022-12-22T14:52:44Z) - Degradation-Aware Unfolding Half-Shuffle Transformer for Spectral
Compressive Imaging [142.11622043078867]
圧縮画像と物理マスクからパラメータを推定し,これらのパラメータを用いて各イテレーションを制御する,DAUF(Degradation-Aware Unfolding Framework)を提案する。
HST を DAUF に接続することにより,HSI 再構成のための変換器の深部展開法であるデグレーション・アウェア・アンフォールディング・ハーフシャッフル変換器 (DAUHST) を確立した。
論文 参考訳(メタデータ) (2022-05-20T11:37:44Z) - FrequencyLowCut Pooling -- Plug & Play against Catastrophic Overfitting [12.062691258844628]
本稿では,任意のCNNアーキテクチャに簡単に接続可能な,自由なダウンサンプリング操作を提案する。
実験の結果,単純かつ高速なFGSM逆行訓練と組み合わせることで,超パラメータフリー演算子がモデルロバスト性を大幅に向上することがわかった。
論文 参考訳(メタデータ) (2022-04-01T14:51:28Z) - Coarse-to-Fine Sparse Transformer for Hyperspectral Image Reconstruction [138.04956118993934]
本稿では, サース・トゥ・ファインス・スパース・トランス (CST) を用いた新しいトランス方式を提案する。
HSI再構成のための深層学習にHSI空間を埋め込んだCST
特に,CSTは,提案したスペクトル認識スクリーニング機構(SASM)を粗いパッチ選択に使用し,選択したパッチを,細かなピクセルクラスタリングと自己相似性キャプチャのために,カスタマイズしたスペクトル集約ハッシュ型マルチヘッド自己アテンション(SAH-MSA)に入力する。
論文 参考訳(メタデータ) (2022-03-09T16:17:47Z) - Anti-aliasing Deep Image Classifiers using Novel Depth Adaptive Blurring
and Activation Function [7.888131635057012]
深層畳み込みネットワークは画像翻訳やシフトに弱い。
教科書の解決策は、ダウンサンプリングの前にローパスフィルタリングである。
単調なぼかしとは対照的に,Depth Adaptive Blurringの方が有効であることを示す。
論文 参考訳(メタデータ) (2021-10-03T01:00:52Z) - Normalized Convolution Upsampling for Refined Optical Flow Estimation [23.652615797842085]
正常化された畳み込みのUPsampler (NCUP)は光学流れCNNsの訓練の間にフル レゾリューションの流れを作り出す有効な共同アップサンプリングのアプローチです。
提案手法では,アップサンプリングタスクをスパース問題として定式化し,正規化畳み込みニューラルネットワークを用いて解く。
6%のエラー低減とKITTIデータセットのオンパーで、Sintelベンチマークの最新の結果を達成し、パラメータを7.5%削減します。
論文 参考訳(メタデータ) (2021-02-13T18:34:03Z) - Salvage Reusable Samples from Noisy Data for Robust Learning [70.48919625304]
本稿では,Web画像を用いた深部FGモデルのトレーニングにおいて,ラベルノイズに対処するための再利用可能なサンプル選択と修正手法を提案する。
私たちのキーとなるアイデアは、再利用可能なサンプルの追加と修正を行い、それらをクリーンな例とともに活用してネットワークを更新することです。
論文 参考訳(メタデータ) (2020-08-06T02:07:21Z) - Cascaded Regression Tracking: Towards Online Hard Distractor
Discrimination [202.2562153608092]
本稿では,2段階の逐次回帰トラッカーを提案する。
第1段階では, 容易に同定可能な負の候補を抽出する。
第2段階では、残留するあいまいな硬質試料をダブルチェックするために、離散サンプリングに基づくリッジ回帰を設計する。
論文 参考訳(メタデータ) (2020-06-18T07:48:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。