論文の概要: Fix your downsampling ASAP! Be natively more robust via Aliasing and Spectral Artifact free Pooling
- arxiv url: http://arxiv.org/abs/2307.09804v2
- Date: Tue, 23 Sep 2025 08:04:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.343405
- Title: Fix your downsampling ASAP! Be natively more robust via Aliasing and Spectral Artifact free Pooling
- Title(参考訳): AliasingとSpectral Artifact Free Poolingで、より堅牢になる
- Authors: Julia Grabinski, Steffen Jung, Janis Keuper, Margret Keuper,
- Abstract要約: 畳み込みニューラルネットワーク(CNN)は様々なコンピュータビジョンタスクで成功している。
ほとんどのCNNの空間ピラミッド設計は、明らかに基本的な信号処理法に違反している。
本稿では,周波数領域におけるエイリアスフリーなダウンサンプリング動作について提案する。
- 参考スコア(独自算出の注目度): 33.248833550125745
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Convolutional Neural Networks (CNNs) are successful in various computer vision tasks. From an image and signal processing point of view, this success is counter-intuitive, as the inherent spatial pyramid design of most CNNs is apparently violating basic signal processing laws, i.e. the Sampling Theorem in their downsampling operations. This issue has been broadly neglected until recent work in the context of adversarial attacks and distribution shifts showed that there is a strong correlation between the vulnerability of CNNs and aliasing artifacts induced by bandlimit-violating downsampling. As a remedy, we propose an alias-free downsampling operation in the frequency domain, denoted Frequency Low Cut Pooling (FLC Pooling) which we further extend to Aliasing and Sinc Artifact-free Pooling (ASAP). ASAP is alias-free and removes further artifacts from sinc-interpolation. Our experimental evaluation on ImageNet-1k, ImageNet-C and CIFAR datasets on various CNN architectures demonstrates that networks using FLC Pooling and ASAP as downsampling methods learn more stable features as measured by their robustness against common corruptions and adversarial attacks, while maintaining a clean accuracy similar to the respective baseline models.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)は様々なコンピュータビジョンタスクで成功している。
画像と信号処理の観点から見ると、この成功は直感に反するものであり、ほとんどのCNNの空間ピラミッド設計は明らかに基本的な信号処理法に違反している。
この問題は、CNNの脆弱性と帯域制限に違反するダウンサンプリングによって引き起こされるアーティファクトのエイリアスの間に強い相関があることが証明されるまで、広く無視されてきた。
本稿では、周波数領域におけるエイリアスフリーなダウンサンプリング操作であるFLCプーリング(FLC Pooling)を提案し、Aliasing と Sinc Artifact-free Pooling (ASAP) にさらに拡張する。
ASAPはエイリアスフリーであり、 sinc-interpolation からさらにアーティファクトを除去する。
各種CNNアーキテクチャ上でのImageNet-1k, ImageNet-C, CIFARデータセットに関する実験的評価により, FLC Pooling と ASAP をダウンサンプリング手法として用いたネットワークは,各ベースラインモデルに類似したクリーンな精度を維持しつつ, 共通の汚職や敵攻撃に対するロバスト性から, より安定した特徴を学習できることが示されている。
関連論文リスト
- Freq-Mip-AA : Frequency Mip Representation for Anti-Aliasing Neural Radiance Fields [3.796287987989994]
Mip-NeRFはフラストタムを用いてピクセルを描画し、統合位置符号化(IPE)を提案する。
このアプローチは有効であるが、ボリュームアーキテクチャに依存しているため、長いトレーニング時間を必要とする。
本稿では,グリッドベース表現を利用した新しいアンチエイリアス手法を提案する。
論文 参考訳(メタデータ) (2024-06-19T06:33:56Z) - Arbitrary-Scale Point Cloud Upsampling by Voxel-Based Network with
Latent Geometric-Consistent Learning [52.825441454264585]
Voxel-based Network (textbfPU-VoxelNet) を用いた任意のスケールのクラウド・アップサンプリング・フレームワークを提案する。
ボクセル表現から継承された完全性と規則性により、ボクセルベースのネットワークは3次元表面を近似する事前定義されたグリッド空間を提供することができる。
密度誘導グリッド再サンプリング法を開発し、高忠実度点を生成するとともに、サンプリング出力を効果的に回避する。
論文 参考訳(メタデータ) (2024-03-08T07:31:14Z) - Fine Structure-Aware Sampling: A New Sampling Training Scheme for Pixel-Aligned Implicit Models in Single-View Human Reconstruction [98.30014795224432]
本研究では,単一視点の人物再構成のための暗黙的画素アライメントモデルをトレーニングするために,FSS(Final Structured-Aware Sampling)を導入する。
FSSは表面の厚さと複雑さに積極的に適応する。
また、画素アライメント型暗黙的モデルのためのメッシュ厚み損失信号を提案する。
論文 参考訳(メタデータ) (2024-02-29T14:26:46Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Aliasing is a Driver of Adversarial Attacks [35.262520934751]
本稿では, 対向摂動の存在は, ニューラルネットワークのエイリアスに起因しているという仮説を考察する。
我々の最終的な目標は、説明可能な非訓練型構造変化のみを用いて、敵攻撃に対する堅牢性を高めることである。
実験の結果,抗エイリアスと対人攻撃の関連性は良好であった。
論文 参考訳(メタデータ) (2022-12-22T14:52:44Z) - Degradation-Aware Unfolding Half-Shuffle Transformer for Spectral
Compressive Imaging [142.11622043078867]
圧縮画像と物理マスクからパラメータを推定し,これらのパラメータを用いて各イテレーションを制御する,DAUF(Degradation-Aware Unfolding Framework)を提案する。
HST を DAUF に接続することにより,HSI 再構成のための変換器の深部展開法であるデグレーション・アウェア・アンフォールディング・ハーフシャッフル変換器 (DAUHST) を確立した。
論文 参考訳(メタデータ) (2022-05-20T11:37:44Z) - FrequencyLowCut Pooling -- Plug & Play against Catastrophic Overfitting [12.062691258844628]
本稿では,任意のCNNアーキテクチャに簡単に接続可能な,自由なダウンサンプリング操作を提案する。
実験の結果,単純かつ高速なFGSM逆行訓練と組み合わせることで,超パラメータフリー演算子がモデルロバスト性を大幅に向上することがわかった。
論文 参考訳(メタデータ) (2022-04-01T14:51:28Z) - Coarse-to-Fine Sparse Transformer for Hyperspectral Image Reconstruction [138.04956118993934]
本稿では, サース・トゥ・ファインス・スパース・トランス (CST) を用いた新しいトランス方式を提案する。
HSI再構成のための深層学習にHSI空間を埋め込んだCST
特に,CSTは,提案したスペクトル認識スクリーニング機構(SASM)を粗いパッチ選択に使用し,選択したパッチを,細かなピクセルクラスタリングと自己相似性キャプチャのために,カスタマイズしたスペクトル集約ハッシュ型マルチヘッド自己アテンション(SAH-MSA)に入力する。
論文 参考訳(メタデータ) (2022-03-09T16:17:47Z) - New SAR target recognition based on YOLO and very deep multi-canonical
correlation analysis [0.1503974529275767]
本稿では,異なるCNN層から有効な特徴を適応的に融合させることにより,SAR画像ターゲット分類のためのロバストな特徴抽出手法を提案する。
MSTARデータセットの実験により,提案手法が最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-10-28T18:10:26Z) - Anti-aliasing Deep Image Classifiers using Novel Depth Adaptive Blurring
and Activation Function [7.888131635057012]
深層畳み込みネットワークは画像翻訳やシフトに弱い。
教科書の解決策は、ダウンサンプリングの前にローパスフィルタリングである。
単調なぼかしとは対照的に,Depth Adaptive Blurringの方が有効であることを示す。
論文 参考訳(メタデータ) (2021-10-03T01:00:52Z) - Frequency Pooling: Shift-Equivalent and Anti-Aliasing Downsampling [9.249235534786072]
本研究では、フーリエ変換とナイキスト周波数の特性に基づいて、周波数プーリングがシフト等価であり、アンチエイリアスであることを示す。
画像分類実験により、周波数プーリングはCNNのシフトに対して精度とロバスト性を向上させることが示された。
論文 参考訳(メタデータ) (2021-09-24T09:32:10Z) - NeRF in detail: Learning to sample for view synthesis [104.75126790300735]
ニューラルレイディアンス場(NeRF)法は目覚ましい新しいビュー合成を実証している。
この作業では、バニラ粗大なアプローチの明確な制限に対処します -- パフォーマンスに基づいており、手元にあるタスクのエンドツーエンドをトレーニングしていません。
我々は、サンプルの提案と、そのネットワークにおける重要性を学習し、そのニューラルネットワークアーキテクチャに対する複数の代替案を検討し比較する、微分可能なモジュールを導入する。
論文 参考訳(メタデータ) (2021-06-09T17:59:10Z) - How Convolutional Neural Networks Deal with Aliasing [0.0]
画像分類器cnnは、原則としてアンチエイリアスフィルタを実装できるが、中間層でエイリアスが発生するのを防げないことを示す。
まず,入力時の発振を識別するCNNの能力を評価し,中間チャネルの冗長性がタスクの成功に重要な役割を担っていることを示す。
第2に、画像分類器CNNは、原則として、アンチエイリアスフィルタを実装することができるが、中間層でエイリアスを行うのを妨げないことを示す。
論文 参考訳(メタデータ) (2021-02-15T18:52:47Z) - Normalized Convolution Upsampling for Refined Optical Flow Estimation [23.652615797842085]
正常化された畳み込みのUPsampler (NCUP)は光学流れCNNsの訓練の間にフル レゾリューションの流れを作り出す有効な共同アップサンプリングのアプローチです。
提案手法では,アップサンプリングタスクをスパース問題として定式化し,正規化畳み込みニューラルネットワークを用いて解く。
6%のエラー低減とKITTIデータセットのオンパーで、Sintelベンチマークの最新の結果を達成し、パラメータを7.5%削減します。
論文 参考訳(メタデータ) (2021-02-13T18:34:03Z) - Refining activation downsampling with SoftPool [74.1840492087968]
畳み込みニューラルネットワーク(cnns)は、アクティベーションマップのサイズを減らすためにプールを使用する。
指数重化アクティベーションダウンサンプリングの高速かつ効率的な方法であるSoftPoolを提案します。
SoftPoolは、アクティベーションマップの縮小でより多くの情報を保持できることを示します。
論文 参考訳(メタデータ) (2021-01-02T12:09:49Z) - Deep learning for gravitational-wave data analysis: A resampling
white-box approach [62.997667081978825]
我々は、LIGO検出器からの単一干渉計データを用いて、畳み込みニューラルネットワーク(CNN)を用いて、コンパクトなバイナリコレッセンスにおける重力波(GW)信号を検出する。
CNNはノイズを検出するのに非常に正確だが、GW信号のリコールに十分な感度がないため、CNNはGWトリガの生成よりもノイズ低減に適している。
論文 参考訳(メタデータ) (2020-09-09T03:28:57Z) - Salvage Reusable Samples from Noisy Data for Robust Learning [70.48919625304]
本稿では,Web画像を用いた深部FGモデルのトレーニングにおいて,ラベルノイズに対処するための再利用可能なサンプル選択と修正手法を提案する。
私たちのキーとなるアイデアは、再利用可能なサンプルの追加と修正を行い、それらをクリーンな例とともに活用してネットワークを更新することです。
論文 参考訳(メタデータ) (2020-08-06T02:07:21Z) - Cascaded Regression Tracking: Towards Online Hard Distractor
Discrimination [202.2562153608092]
本稿では,2段階の逐次回帰トラッカーを提案する。
第1段階では, 容易に同定可能な負の候補を抽出する。
第2段階では、残留するあいまいな硬質試料をダブルチェックするために、離散サンプリングに基づくリッジ回帰を設計する。
論文 参考訳(メタデータ) (2020-06-18T07:48:01Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。