論文の概要: Depthwise-STFT based separable Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2001.09912v1
- Date: Mon, 27 Jan 2020 17:07:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 08:35:33.139084
- Title: Depthwise-STFT based separable Convolutional Neural Networks
- Title(参考訳): 奥行きSTFTに基づく分離畳み込みニューラルネットワーク
- Authors: Sudhakar Kumawat, Shanmuganathan Raman
- Abstract要約: 我々はDepthwise-STFT Separable Layerと呼ばれる新しい畳み込み層を提案する。
標準の奥行き分離可能な畳み込み層に代わるものとして機能する。
提案手法は,CIFAR-10とCIFAR-100の画像分類データセットにおいて,標準の奥行き分離可能な層ベースモデルよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 35.636461829966095
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a new convolutional layer called Depthwise-STFT
Separable layer that can serve as an alternative to the standard depthwise
separable convolutional layer. The construction of the proposed layer is
inspired by the fact that the Fourier coefficients can accurately represent
important features such as edges in an image. It utilizes the Fourier
coefficients computed (channelwise) in the 2D local neighborhood (e.g., 3x3) of
each position of the input map to obtain the feature maps. The Fourier
coefficients are computed using 2D Short Term Fourier Transform (STFT) at
multiple fixed low frequency points in the 2D local neighborhood at each
position. These feature maps at different frequency points are then linearly
combined using trainable pointwise (1x1) convolutions. We show that the
proposed layer outperforms the standard depthwise separable layer-based models
on the CIFAR-10 and CIFAR-100 image classification datasets with reduced
space-time complexity.
- Abstract(参考訳): 本稿では,標準の奥行き方向分離可能な畳み込み層に代わるものとして機能する,奥行き方向分離層と呼ばれる新しい畳み込み層を提案する。
提案した層の構築は、フーリエ係数が画像のエッジなどの重要な特徴を正確に表現できるという事実に着想を得たものである。
入力マップの各位置の2次元局所近傍(例えば3x3)で計算されたフーリエ係数を利用して特徴写像を得る。
フーリエ係数は2次元短項フーリエ変換(STFT)を用いて各位置における2次元局所近傍の複数の固定低周波点で計算される。
異なる周波数点におけるこれらの特徴写像は、訓練可能な点(1x1)畳み込みを用いて線形に結合される。
提案する層は,cifar-10およびcifar-100画像分類データセット上の標準深度分離層ベースモデルよりも,時空間複雑性を低減した。
関連論文リスト
- MDNF: Multi-Diffusion-Nets for Neural Fields on Meshes [5.284425534494986]
本稿では,空間領域と周波数領域にまたがる多分解能を持つトライアングルメッシュ上でのニューラルフィールドを表現する新しいフレームワークを提案する。
ニューラルフーリエフィルタバンク(NFFB)にインスパイアされた我々のアーキテクチャは、より微細な分解能レベルと高い周波数帯域を関連付けることによって周波数領域と周波数領域を分解する。
本稿では, 合成RGB関数, UVテクスチャ座標, 正規化など, 多様なニューラルネットワークへの応用を通じて, 本手法の有効性を実証する。
論文 参考訳(メタデータ) (2024-09-04T19:08:13Z) - Neural Fourier Filter Bank [18.52741992605852]
本稿では, 効率的かつ高精度な再構築手法を提案する。
ウェーブレットにインスパイアされた我々は、信号が空間的にも周波数的にも分解されるニューラルネットワークを学習する。
論文 参考訳(メタデータ) (2022-12-04T03:45:08Z) - Transform Once: Efficient Operator Learning in Frequency Domain [69.74509540521397]
本研究では、周波数領域の構造を利用して、空間や時間における長距離相関を効率的に学習するために設計されたディープニューラルネットワークについて検討する。
この研究は、単一変換による周波数領域学習のための青写真を導入している。
論文 参考訳(メタデータ) (2022-11-26T01:56:05Z) - Deep Fourier Up-Sampling [100.59885545206744]
フーリエ領域のアップサンプリングは、そのような局所的な性質に従わないため、より難しい。
これらの問題を解決するために理論的に健全なDeep Fourier Up-Sampling (FourierUp)を提案する。
論文 参考訳(メタデータ) (2022-10-11T06:17:31Z) - Block Walsh-Hadamard Transform Based Binary Layers in Deep Neural
Networks [7.906608953906891]
畳み込みは、現代のディープニューラルネットワークのコアオペレーションである。
フーリエ変換の代わりに二進ブロックウォルシュ・アダマール変換(WHT)を提案する。
我々はWHTベースのバイナリレイヤを使用して、ディープニューラルネットワークの通常の畳み込みレイヤを置き換える。
論文 参考訳(メタデータ) (2022-01-07T23:52:41Z) - Learnable Fourier Features for Multi-DimensionalSpatial Positional
Encoding [96.9752763607738]
本稿では,学習可能なフーリエ特徴に基づく位置符号化手法を提案する。
本研究では,多次元位置符号化のための学習可能な特徴表現が既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-05T04:40:18Z) - Depthwise Spatio-Temporal STFT Convolutional Neural Networks for Human
Action Recognition [42.400429835080416]
従来の3D畳み込みニューラルネットワーク(CNN)は計算コストが高く、メモリ集約性があり、過度に適合する傾向がある。
本稿では,3次元CNNにおける3次元畳み込み層の代替として機能する新しい畳み込みブロックのクラスを提案する。
Some-something v1, v2, Jester, Diving Kinetics-400, UCF 101, HMDB 51を含む7つの行動認識データセットについて,STFTブロックをベースとした3D CNNが,現状と比較して同等以上の性能で達成可能であることを示す。
論文 参考訳(メタデータ) (2020-07-22T12:26:04Z) - DO-Conv: Depthwise Over-parameterized Convolutional Layer [66.46704754669169]
本稿では,各入力チャネルが異なる2次元カーネルに変換されるような,奥行きの畳み込みを付加した畳み込み層の拡張を提案する。
従来の畳み込み層をDO-Conv層に置き換えただけでCNNの性能が向上することを示す。
論文 参考訳(メタデータ) (2020-06-22T06:57:10Z) - Region adaptive graph fourier transform for 3d point clouds [51.193111325231165]
本稿では,3次元点雲特性の圧縮のための領域適応グラフフーリエ変換(RA-GFT)を提案する。
RA-GFTは従来の手法よりも複雑性と性能のトレードオフが優れている。
論文 参考訳(メタデータ) (2020-03-04T02:47:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。