論文の概要: An Effective Anti-Aliasing Approach for Residual Networks
- arxiv url: http://arxiv.org/abs/2011.10675v1
- Date: Fri, 20 Nov 2020 22:55:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 06:06:21.392024
- Title: An Effective Anti-Aliasing Approach for Residual Networks
- Title(参考訳): 残留ネットワークに対する効果的なアンチエイリアシング手法
- Authors: Cristina Vasconcelos, Hugo Larochelle, Vincent Dumoulin, Nicolas Le
Roux, Ross Goroshin
- Abstract要約: 周波数エイリアス(英: Frequency aliasing)とは、画像や特徴マップなどの信号のサブサンプリング時に発生する現象であり、サブサンプリング出力の歪みを引き起こす。
トレーニング不能なぼかしフィルタを配置し,キー位置でスムーズなアクティベーション関数を用いることで,この効果を緩和できることを示す。
これらの単純なアーキテクチャ変更は、ImageNet-C上の自然な汚職による画像分類とMeta-Datasetでの少数ショット学習の両方において、アウト・オブ・ディストリビューションの一般化を大幅に改善する。
- 参考スコア(独自算出の注目度): 27.962502376542588
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image pre-processing in the frequency domain has traditionally played a vital
role in computer vision and was even part of the standard pipeline in the early
days of deep learning. However, with the advent of large datasets, many
practitioners concluded that this was unnecessary due to the belief that these
priors can be learned from the data itself. Frequency aliasing is a phenomenon
that may occur when sub-sampling any signal, such as an image or feature map,
causing distortion in the sub-sampled output. We show that we can mitigate this
effect by placing non-trainable blur filters and using smooth activation
functions at key locations, particularly where networks lack the capacity to
learn them. These simple architectural changes lead to substantial improvements
in out-of-distribution generalization on both image classification under
natural corruptions on ImageNet-C [10] and few-shot learning on Meta-Dataset
[17], without introducing additional trainable parameters and using the default
hyper-parameters of open source codebases.
- Abstract(参考訳): 周波数領域における画像前処理は、コンピュータビジョンにおいて伝統的に重要な役割を担い、ディープラーニングの初期において標準パイプラインの一部であった。
しかし、大規模なデータセットの出現に伴い、多くの実践者は、これらの先行データがデータ自体から学べるという考えから、これは不要であると結論づけた。
周波数エイリアス(英: Frequency aliasing)とは、画像や特徴マップなどの信号のサブサンプリング時に発生する現象であり、サブサンプリング出力の歪みを引き起こす。
この効果を,訓練不能なぼかしフィルタを配置し,重要な位置,特にネットワークが学習能力に欠ける場所でスムーズなアクティベーション機能を使用することで軽減できることを示す。
これらの単純なアーキテクチャ変更は、imagenet-c [10]の自然腐敗下でのイメージ分類とメタデータセット[17]でのわずかなショット学習の両方において、トレーニング可能なパラメータの追加や、デフォルトのオープンソースコードベースのハイパーパラメータを使用することなく、大きな改善をもたらす。
関連論文リスト
- Frequency-Guided Masking for Enhanced Vision Self-Supervised Learning [49.275450836604726]
本稿では、事前学習の有効性を大幅に向上させる、新しい周波数ベースの自己監視学習(SSL)手法を提案する。
我々は、知識蒸留によって強化された2ブランチのフレームワークを使用し、モデルがフィルタされた画像と原画像の両方を入力として取り込むことを可能にする。
論文 参考訳(メタデータ) (2024-09-16T15:10:07Z) - Deep Learning Based Speckle Filtering for Polarimetric SAR Images. Application to Sentinel-1 [51.404644401997736]
本稿では、畳み込みニューラルネットワークを用いて偏光SAR画像のスペックルを除去するための完全なフレームワークを提案する。
実験により,提案手法はスペックル低減と分解能保存の両方において例外的な結果をもたらすことが示された。
論文 参考訳(メタデータ) (2024-08-28T10:07:17Z) - Inpainting Normal Maps for Lightstage data [3.1002416427168304]
本研究では,GAN(Generative Adversarial Network)を用いた正規地図の塗装手法を提案する。
提案手法は,弓ネクタイ型ジェネレータネットワークと識別器ネットワークを併用し,トレーニングフェーズを交互に行うことによって,従来の一般的な画像塗装技術を拡張した。
提案手法は,高性能でリアルな塗布された正規地図を効果的に生成し,性能評価に適していることが示唆された。
論文 参考訳(メタデータ) (2024-01-16T03:59:07Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - PRISTA-Net: Deep Iterative Shrinkage Thresholding Network for Coded
Diffraction Patterns Phase Retrieval [6.982256124089]
位相検索は、計算画像および画像処理における非線型逆問題である。
我々は,1次反復しきい値しきい値アルゴリズム(ISTA)に基づく深層展開ネットワークであるPRISTA-Netを開発した。
非線形変換,しきい値,ステップサイズなど,提案するPRISTA-Netフレームワークのパラメータはすべて,設定されるのではなく,エンドツーエンドで学習される。
論文 参考訳(メタデータ) (2023-09-08T07:37:15Z) - Frequency Dropout: Feature-Level Regularization via Randomized Filtering [24.53978165468098]
深層畳み込みニューラルネットワークは、トレーニング信号から急激な相関を拾うことができる。
本稿では、畳み込みニューラルネットワークが周波数固有の画像特徴を学習するのを防ぐためのトレーニング戦略である周波数ドロップアウトを提案する。
提案手法は,予測精度の向上だけでなく,ドメインシフトに対する堅牢性の向上も示唆している。
論文 参考訳(メタデータ) (2022-09-20T16:42:21Z) - Deep Convolutional Pooling Transformer for Deepfake Detection [54.10864860009834]
本研究では,局所的・グローバル的に決定的な画像特徴を取り入れた深部畳み込み変換器を提案する。
具体的には,抽出した特徴を充実させ,有効性を高めるために,畳み込みプーリングと再アテンションを適用した。
提案手法は、内部実験と相互データセット実験の両方において、最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2022-09-12T15:05:41Z) - Impact of Aliasing on Generalization in Deep Convolutional Networks [29.41652467340308]
深層畳み込みネットワークの一般化におけるエイリアスの影響について検討する。
キー位置で非トレーニング可能な低域通過フィルタを挿入することでエイリアスを緩和する方法を示す。
論文 参考訳(メタデータ) (2021-08-07T17:12:03Z) - TFill: Image Completion via a Transformer-Based Architecture [69.62228639870114]
画像補完を無方向性シーケンス対シーケンス予測タスクとして扱うことを提案する。
トークン表現には,小かつ重複しないRFを持つ制限型CNNを用いる。
第2フェーズでは、可視領域と発生領域の外観整合性を向上させるために、新しい注意認識層(aal)を導入する。
論文 参考訳(メタデータ) (2021-04-02T01:42:01Z) - Generic Perceptual Loss for Modeling Structured Output Dependencies [78.59700528239141]
トレーニングされた重みではなく、ネットワーク構造が重要であることを示す。
我々は、出力の構造化依存関係をモデル化するためにランダムに重み付けされたディープcnnが使用できることを実証する。
論文 参考訳(メタデータ) (2021-03-18T23:56:07Z) - $\P$ILCRO: Making Importance Landscapes Flat Again [7.047473967702792]
本稿は、既存の畳み込みアーキテクチャの大部分が、初期化において、特定の特徴のランドスケープを定義していることを示す。
画素単位のランドスケープ曲線正規化対象物に対する P-objective または PILCRO を導出する。
一般的なコンピュータビジョンネットワークのP正規化バージョンは、平坦なランドスケープを持ち、より高速なトレーニングを行い、その結果、精度が向上し、テスト時のノイズに対してより堅牢であることを示す。
論文 参考訳(メタデータ) (2020-01-27T11:20:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。