論文の概要: Image classification in frequency domain with 2SReLU: a second harmonics
superposition activation function
- arxiv url: http://arxiv.org/abs/2006.10853v1
- Date: Thu, 18 Jun 2020 21:11:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 14:18:14.108695
- Title: Image classification in frequency domain with 2SReLU: a second harmonics
superposition activation function
- Title(参考訳): 2srelu周波数領域の画像分類:第2高調波重畳活性化関数
- Authors: Thomio Watanabe and Denis F. Wolf
- Abstract要約: 深層畳み込みニューラルネットワークは複雑なパターンを特定し、超人的な能力でタスクを実行することができる。
本研究では、周波数領域の観点から、画像分類畳み込みニューラルネットワークとその構築ブロックを記述する。
本稿では,ディープネットワークにおける高周波成分を保存する非線形アクティベーション機能である2SReLU層を提案する。
- 参考スコア(独自算出の注目度): 1.3706331473063877
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep Convolutional Neural Networks are able to identify complex patterns and
perform tasks with super-human capabilities. However, besides the exceptional
results, they are not completely understood and it is still impractical to
hand-engineer similar solutions. In this work, an image classification
Convolutional Neural Network and its building blocks are described from a
frequency domain perspective. Some network layers have established counterparts
in the frequency domain like the convolutional and pooling layers. We propose
the 2SReLU layer, a novel non-linear activation function that preserves high
frequency components in deep networks. It is demonstrated that in the frequency
domain it is possible to achieve competitive results without using the
computationally costly convolution operation. A source code implementation in
PyTorch is provided at: https://gitlab.com/thomio/2srelu
- Abstract(参考訳): 深層畳み込みニューラルネットワークは複雑なパターンを特定し、超人的な能力でタスクを実行することができる。
しかし、例外的な結果の他に、それらは完全には理解されておらず、手書きによる類似の解法はいまだに実用的ではない。
本研究では、周波数領域の観点から、画像分類畳み込みニューラルネットワークとその構築ブロックを記述する。
一部のネットワーク層は、畳み込み層やプール層のような周波数領域に対応するものを確立している。
本稿では,ディープネットワークにおける高周波成分を保存する非線形アクティベーション機能である2SReLU層を提案する。
周波数領域では計算コストのかかる畳み込み演算を使わずに競争力のある結果が得られることを示す。
PyTorchのソースコード実装は、https://gitlab.com/thomio/2sreluで提供されている。
関連論文リスト
- TFDMNet: A Novel Network Structure Combines the Time Domain and
Frequency Domain Features [34.91485245048524]
本稿では、畳み込み層を置き換える新しい要素ワイド乗算層(EML)を提案する。
また、過度に適合する問題を緩和するための重み付け機構も導入する。
実験結果から,TFDMNetはMNIST, CIFAR-10, ImageNetデータベース上で優れた性能を示すことがわかった。
論文 参考訳(メタデータ) (2024-01-29T08:18:21Z) - Neural Fourier Filter Bank [18.52741992605852]
本稿では, 効率的かつ高精度な再構築手法を提案する。
ウェーブレットにインスパイアされた我々は、信号が空間的にも周波数的にも分解されるニューラルネットワークを学習する。
論文 参考訳(メタデータ) (2022-12-04T03:45:08Z) - Frequency Dropout: Feature-Level Regularization via Randomized Filtering [24.53978165468098]
深層畳み込みニューラルネットワークは、トレーニング信号から急激な相関を拾うことができる。
本稿では、畳み込みニューラルネットワークが周波数固有の画像特徴を学習するのを防ぐためのトレーニング戦略である周波数ドロップアウトを提案する。
提案手法は,予測精度の向上だけでなく,ドメインシフトに対する堅牢性の向上も示唆している。
論文 参考訳(メタデータ) (2022-09-20T16:42:21Z) - Gluing Neural Networks Symbolically Through Hyperdimensional Computing [8.209945970790741]
ニューラルネットワークの出力信号の最終的な分類を符号化するためにバイナリハイパーベクタを用いるという概念について検討する。
これにより、複数のニューラルネットワークが協力して問題を解決することができ、オーバーヘッドは少なくなる。
これは、非常に少ないオーバーヘッドを使用しながら、芸術の状態を上回り、あるいはそれと同等であることがわかった。
論文 参考訳(メタデータ) (2022-05-31T04:44:02Z) - Global Filter Networks for Image Classification [90.81352483076323]
本稿では,対数線形複雑度を持つ周波数領域における長期空間依存性を学習する,概念的に単純だが計算効率のよいアーキテクチャを提案する。
この結果から,GFNetはトランスフォーマー型モデルやCNNの効率,一般化能力,堅牢性において,非常に競争力のある代替手段となる可能性が示唆された。
論文 参考訳(メタデータ) (2021-07-01T17:58:16Z) - Over-and-Under Complete Convolutional RNN for MRI Reconstruction [57.95363471940937]
MR画像再構成のための最近のディープラーニングに基づく手法は、通常、汎用的なオートエンコーダアーキテクチャを利用する。
OUCR(Over-and-Under Complete Convolu?tional Recurrent Neural Network)を提案する。
提案手法は, トレーニング可能なパラメータの少ない圧縮されたセンシングと, 一般的なディープラーニングに基づく手法に対して, 大幅な改善を実現する。
論文 参考訳(メタデータ) (2021-06-16T15:56:34Z) - UltraSR: Spatial Encoding is a Missing Key for Implicit Image
Function-based Arbitrary-Scale Super-Resolution [74.82282301089994]
本研究では,暗黙的イメージ関数に基づく,シンプルで効果的な新しいネットワーク設計であるUltraSRを提案する。
空間符号化は,次の段階の高精度暗黙的画像機能に対する欠落鍵であることを示す。
UltraSRは、すべての超解像スケールでDIV2Kベンチマークに最新のパフォーマンスを設定します。
論文 参考訳(メタデータ) (2021-03-23T17:36:42Z) - Frequency learning for image classification [1.9336815376402716]
本稿では、トレーニング可能な周波数フィルタからなる入力画像のフーリエ変換を探索する新しい手法を提案する。
画像ブロックの周波数領域表現からグローバル特徴とローカル特徴の両方を学習するスライシング手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T00:32:47Z) - Efficient Integer-Arithmetic-Only Convolutional Neural Networks [87.01739569518513]
我々は従来のReLUを境界ReLUに置き換え、その減少は活性化量子化によるものであることを示す。
我々の整数ネットワークは、対応するFPNネットワークと同等の性能を発揮するが、メモリコストは1/4に過ぎず、最新のGPUでは2倍高速である。
論文 参考訳(メタデータ) (2020-06-21T08:23:03Z) - Deep Polynomial Neural Networks [77.70761658507507]
$Pi$Netsは拡張に基づいた関数近似の新しいクラスである。
$Pi$Netsは、画像生成、顔検証、および3Dメッシュ表現学習という3つの困難なタスクで、最先端の結果を生成する。
論文 参考訳(メタデータ) (2020-06-20T16:23:32Z) - Evolving Normalization-Activation Layers [100.82879448303805]
我々は、うまく機能しない候補層を迅速にフィルタリングする効率的な拒絶プロトコルを開発した。
EvoNormsは、新しい正規化活性化層であり、新しい構造を持ち、時には驚くべき構造を持つ。
我々の実験は、EvoNormsがResNets、MobileNets、EfficientNetsなどの画像分類モデルでうまく機能していることを示している。
論文 参考訳(メタデータ) (2020-04-06T19:52:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。