論文の概要: Normalize Filters! Classical Wisdom for Deep Vision
- arxiv url: http://arxiv.org/abs/2506.04401v1
- Date: Wed, 04 Jun 2025 19:32:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-06 21:53:49.39894
- Title: Normalize Filters! Classical Wisdom for Deep Vision
- Title(参考訳): フィルターの正規化! 深部視覚のための古典的知恵
- Authors: Gustavo Perez, Stella X. Yu,
- Abstract要約: 本稿では,フィルタ正規化を提案し,次に学習可能なスケーリングとシフト,すなわちバッチ正規化を提案する。
提案手法は, 人工および自然強度変動ベンチマークにおいて, 大幅な改善を実現する。
解析の結果,非正規化フィルタは性能を低下させるが,フィルタ正規化は学習を正規化することがわかった。
- 参考スコア(独自算出の注目度): 32.953265823087754
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Classical image filters, such as those for averaging or differencing, are carefully normalized to ensure consistency, interpretability, and to avoid artifacts like intensity shifts, halos, or ringing. In contrast, convolutional filters learned end-to-end in deep networks lack such constraints. Although they may resemble wavelets and blob/edge detectors, they are not normalized in the same or any way. Consequently, when images undergo atmospheric transfer, their responses become distorted, leading to incorrect outcomes. We address this limitation by proposing filter normalization, followed by learnable scaling and shifting, akin to batch normalization. This simple yet effective modification ensures that the filters are atmosphere-equivariant, enabling co-domain symmetry. By integrating classical filtering principles into deep learning (applicable to both convolutional neural networks and convolution-dependent vision transformers), our method achieves significant improvements on artificial and natural intensity variation benchmarks. Our ResNet34 could even outperform CLIP by a large margin. Our analysis reveals that unnormalized filters degrade performance, whereas filter normalization regularizes learning, promotes diversity, and improves robustness and generalization.
- Abstract(参考訳): 平均化や差分などの古典的な画像フィルタは、一貫性、解釈可能性を確保し、強度シフト、ハロ、リングなどのアーティファクトを避けるために慎重に正規化されている。
対照的に、深層ネットワークでエンドツーエンドに学習した畳み込みフィルタはそのような制約を欠いている。
ウェーブレットやブロブ/エッジ検出器に似ているかもしれないが、同じ方法でもいかなる方法でも正常化されない。
その結果、画像が大気の移動を受けると、その反応は歪んでしまい、誤った結果がもたらされる。
この制限をフィルタ正規化を提案し,次に学習可能なスケーリングとシフト,すなわちバッチ正規化を提案する。
この単純で効果的な修正は、フィルターが大気同変であることを保証し、共ドメイン対称性を可能にする。
従来のフィルタリング原理を深層学習(畳み込みニューラルネットワークと畳み込み依存型視覚変換器の両方に適用可能)に統合することにより,人工的および自然的強度変動ベンチマークにおいて大幅な改善が達成される。
私たちのResNet34はCLIPをはるかに上回ります。
解析の結果,非正規化フィルタは性能を低下させるが,フィルタ正規化は学習を正規化し,多様性を促進し,堅牢性や一般化を改善する。
関連論文リスト
- Catch-Up Mix: Catch-Up Class for Struggling Filters in CNN [15.3232203753165]
ディープラーニングモデルは、しばしば複雑さと過度な適合に関する課題に直面します。
注目すべき懸念の1つは、このモデルは予測を行うためのフィルターの限られたサブセットに大きく依存することが多いことである。
そこで本研究では,Catch-up Mixと呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-01-24T02:42:50Z) - Understanding the Covariance Structure of Convolutional Filters [86.0964031294896]
最近では、ConvMixerやConvNeXtのようなViTにインスパイアされた畳み込みネットワークは、注目すべき構造を持つ大カーネル深度畳み込みを使用している。
まず,このような学習フィルタの共分散行列が高度に構造化されていることを観測し,より大規模なネットワークを効果的に初期化するために,小さなネットワークから計算した共分散が用いられることを発見した。
論文 参考訳(メタデータ) (2022-10-07T15:59:13Z) - Combinations of Adaptive Filters [38.0505909175152]
適応フィルタの組み合わせは、分割と征服の原理を利用する。
特に、計算学習分野において、複数の学習アルゴリズムの出力を組み合わせるという課題が研究されている。
論文 参考訳(メタデータ) (2021-12-22T22:21:43Z) - Learning Versatile Convolution Filters for Efficient Visual Recognition [125.34595948003745]
本稿では,効率的な畳み込みニューラルネットワーク構築のための多目的フィルタを提案する。
本稿では,ネットワークの複雑性に関する理論的解析を行い,効率的な畳み込み手法を提案する。
ベンチマークデータセットとニューラルネットワークの実験結果は、我々の汎用フィルタが元のフィルタと同等の精度を達成できることを実証している。
論文 参考訳(メタデータ) (2021-09-20T06:07:14Z) - Unsharp Mask Guided Filtering [53.14430987860308]
本論文の目的は,フィルタ中の構造伝達の重要性を強調した画像フィルタリングである。
アンシャープマスキングにインスパイアされたガイドフィルタの新しい簡易な定式化を提案する。
我々の定式化は低域フィルタに先立ってフィルタを楽しみ、単一の係数を推定することで明示的な構造伝達を可能にする。
論文 参考訳(メタデータ) (2021-06-02T19:15:34Z) - Efficient Spatially Adaptive Convolution and Correlation [11.167305713900074]
本研究では,空間的に異なる線形変換をフィルタに適用できる表現理論フレームワークを提案する。
このフレームワークは、回転(2Dおよび3D)やスケールのような変換群に対する拡張畳み込みと相関の効率的な実装を可能にする。
本稿では,パターンマッチング,画像特徴記述,ベクトル場可視化,適応画像フィルタリングへの応用について述べる。
論文 参考訳(メタデータ) (2020-06-23T17:41:10Z) - Dependency Aware Filter Pruning [74.69495455411987]
重要でないフィルタを割ることは、推論コストを軽減するための効率的な方法である。
以前の作業は、その重み基準やそれに対応するバッチノームスケーリング要因に従ってフィルタをプルークする。
所望の空間性を達成するために,空間性誘導正規化を動的に制御する機構を提案する。
論文 参考訳(メタデータ) (2020-05-06T07:41:22Z) - Filter Grafting for Deep Neural Networks: Reason, Method, and
Cultivation [86.91324735966766]
フィルタは現代の畳み込みニューラルネットワーク(CNN)のキーコンポーネントである
本稿では,この目的を達成するためにフィルタグラフト(textbfMethod)を導入する。
我々は,フィルタの情報を測定するための新しい基準と,グラフトされた情報をネットワーク間でバランスをとるための適応重み付け戦略を開発する。
論文 参考訳(メタデータ) (2020-04-26T08:36:26Z) - Recognizing Instagram Filtered Images with Feature De-stylization [81.38905784617089]
本稿では,Instagramのフィルターによって,事前学習モデルがどのような影響を受けているかについて検討する。
画像のグローバルな外観を変えるだけの単純な構造保存フィルタは、畳み込み特徴空間に大きな違いをもたらす可能性が示唆された。
我々は,特徴マップのスケーリングとシフトに使用されるパラメータを予測し,フィルタによって引き起こされる変化を“無視”する,軽量なデスティル化モジュールを導入する。
論文 参考訳(メタデータ) (2019-12-30T16:48:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。