論文の概要: As large as it gets: Learning infinitely large Filters via Neural
Implicit Functions in the Fourier Domain
- arxiv url: http://arxiv.org/abs/2307.10001v1
- Date: Wed, 19 Jul 2023 14:21:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-20 13:48:11.788488
- Title: As large as it gets: Learning infinitely large Filters via Neural
Implicit Functions in the Fourier Domain
- Title(参考訳): 最大:フーリエ領域における神経暗黙関数による無限大フィルタの学習
- Authors: Julia Grabinski, Janis Keuper and Margret Keuper
- Abstract要約: 我々は、視覚アプリケーションにおけるコンテキスト認識ニューラルネットワークにおいて、受容野が本当にどれほど大きい必要があるかを調査することを目的としている。
本稿では,ニューラルネットワークの暗黙関数としてフィルタ重みの空間的・周波数的表現を学習することを提案する。
結果として生じるニューラル暗黙周波数CNNは、大規模な画像分類ベンチマークの最先端と同等の結果を得る最初のモデルである。
- 参考スコア(独自算出の注目度): 11.72025865314187
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivated by the recent trend towards the usage of larger receptive fields
for more context-aware neural networks in vision applications, we aim to
investigate how large these receptive fields really need to be. To facilitate
such study, several challenges need to be addressed, most importantly: (i) We
need to provide an effective way for models to learn large filters (potentially
as large as the input data) without increasing their memory consumption during
training or inference, (ii) the study of filter sizes has to be decoupled from
other effects such as the network width or number of learnable parameters, and
(iii) the employed convolution operation should be a plug-and-play module that
can replace any conventional convolution in a Convolutional Neural Network
(CNN) and allow for an efficient implementation in current frameworks. To
facilitate such models, we propose to learn not spatial but frequency
representations of filter weights as neural implicit functions, such that even
infinitely large filters can be parameterized by only a few learnable weights.
The resulting neural implicit frequency CNNs are the first models to achieve
results on par with the state-of-the-art on large image classification
benchmarks while executing convolutions solely in the frequency domain and can
be employed within any CNN architecture. They allow us to provide an extensive
analysis of the learned receptive fields. Interestingly, our analysis shows
that, although the proposed networks could learn very large convolution
kernels, the learned filters practically translate into well-localized and
relatively small convolution kernels in the spatial domain.
- Abstract(参考訳): 視覚アプリケーションにおける、よりコンテキスト認識型ニューラルネットワークのための、より大きな受容フィールドの使用への最近のトレンドに動機づけられ、これらの受容フィールドが実際にどのくらい大きい必要があるかを調べることを目的としています。
このような研究を促進するためには、いくつかの課題に取り組む必要がある。
(i)トレーニングや推論中にメモリ消費を増加させることなく、モデルが大きなフィルタ(潜在的には入力データと同じ大きさ)を学習するための効果的な方法を提供する必要がある。
(ii)フィルタサイズの研究は、ネットワーク幅や学習可能なパラメータの数といった他の効果から切り離さなければならない。
(iii) 使用される畳み込み操作は,従来の畳み込みニューラルネットワーク(CNN)の畳み込みを置き換え,現在のフレームワークで効率的な実装を可能にするプラグイン・アンド・プレイモジュールであるべきである。
このようなモデルを容易にするために,フィルタ重みの空間的,周波数的表現をニューラルネットワークの暗黙的関数として学習し,無限大のフィルタであっても数個の学習可能な重みでパラメータ化できることを提案する。
結果として生じるニューラル暗黙周波数CNNは、大きな画像分類ベンチマークの最先端と同等の結果を得る最初のモデルであり、周波数領域のみで畳み込みを実行し、任意のCNNアーキテクチャで使用できる。
学習した受容領域の広範囲な分析を可能にします。
興味深いことに、提案するネットワークは非常に大きな畳み込みカーネルを学習できるが、学習されたフィルタは、空間領域において、よく局在化され、比較的小さな畳み込みカーネルに変換される。
関連論文リスト
- Solving Large-scale Spatial Problems with Convolutional Neural Networks [88.31876586547848]
大規模空間問題に対する学習効率を向上させるために移動学習を用いる。
畳み込みニューラルネットワーク (CNN) は, 信号の小さな窓で訓練できるが, 性能劣化の少ない任意の大信号で評価できる。
論文 参考訳(メタデータ) (2023-06-14T01:24:42Z) - The Power of Linear Combinations: Learning with Random Convolutions [2.0305676256390934]
現代のCNNは、ランダムな(空間的な)畳み込みフィルタを更新することなく、高いテスト精度を達成することができる。
これらのランダムフィルタの組み合わせは、結果の操作を暗黙的に正規化することができる。
私たちは3ドル3セントの畳み込みを学習することで比較的小さな利益しか得られないが、学習率はカーネルサイズに比例して増加する。
論文 参考訳(メタデータ) (2023-01-26T19:17:10Z) - Variable Bitrate Neural Fields [75.24672452527795]
本稿では,特徴格子を圧縮し,メモリ消費を最大100倍に削減する辞書手法を提案する。
辞書の最適化をベクトル量子化オートデコーダ問題として定式化し、直接監督できない空間において、エンドツーエンドの離散神経表現を学習する。
論文 参考訳(メタデータ) (2022-06-15T17:58:34Z) - Learning Versatile Convolution Filters for Efficient Visual Recognition [125.34595948003745]
本稿では,効率的な畳み込みニューラルネットワーク構築のための多目的フィルタを提案する。
本稿では,ネットワークの複雑性に関する理論的解析を行い,効率的な畳み込み手法を提案する。
ベンチマークデータセットとニューラルネットワークの実験結果は、我々の汎用フィルタが元のフィルタと同等の精度を達成できることを実証している。
論文 参考訳(メタデータ) (2021-09-20T06:07:14Z) - Global Filter Networks for Image Classification [90.81352483076323]
本稿では,対数線形複雑度を持つ周波数領域における長期空間依存性を学習する,概念的に単純だが計算効率のよいアーキテクチャを提案する。
この結果から,GFNetはトランスフォーマー型モデルやCNNの効率,一般化能力,堅牢性において,非常に競争力のある代替手段となる可能性が示唆された。
論文 参考訳(メタデータ) (2021-07-01T17:58:16Z) - Resolution learning in deep convolutional networks using scale-space
theory [31.275270391367425]
ディープ畳み込みニューラルネットワーク(CNN)の解像度は、一般的に、フィルタサイズを通じて受容野のサイズと、特徴写像上の層や強みのある畳み込みによって制限される。
我々は、ハードコードされた高解像度パラメータを廃止し、データから適切な解像度を学習することを提案する。
スケール空間理論を用いてフィルタの自己相似パラメトリゼーションを求め、ガウス微分フィルタの学習的組み合わせによりフィルタを近似するために、N-Jet: truncated Taylor級数を用いる。
論文 参考訳(メタデータ) (2021-06-07T08:23:02Z) - Graph Neural Networks with Adaptive Frequency Response Filter [55.626174910206046]
適応周波数応答フィルタを用いたグラフニューラルネットワークフレームワークAdaGNNを開発した。
提案手法の有効性を,様々なベンチマークデータセット上で実証的に検証した。
論文 参考訳(メタデータ) (2021-04-26T19:31:21Z) - Learning Sparse Filters in Deep Convolutional Neural Networks with a
l1/l2 Pseudo-Norm [5.3791844634527495]
ディープニューラルネットワーク(DNN)は、多くのタスクで効率的であることが証明されているが、高いメモリと計算コストが伴う。
近年の研究では、それらの構造は性能を損なうことなくよりコンパクトにすることができることが示されている。
フィルタ係数に定義された比 l1/l2 の擬ノルムに基づいて, 疎度誘導正規化項を提案する。
論文 参考訳(メタデータ) (2020-07-20T11:56:12Z) - Dependency Aware Filter Pruning [74.69495455411987]
重要でないフィルタを割ることは、推論コストを軽減するための効率的な方法である。
以前の作業は、その重み基準やそれに対応するバッチノームスケーリング要因に従ってフィルタをプルークする。
所望の空間性を達成するために,空間性誘導正規化を動的に制御する機構を提案する。
論文 参考訳(メタデータ) (2020-05-06T07:41:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。