論文の概要: A Structurally Regularized Convolutional Neural Network for Image
Classification using Wavelet-based SubBand Decomposition
- arxiv url: http://arxiv.org/abs/2103.01823v1
- Date: Tue, 2 Mar 2021 16:01:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-03 16:02:29.104049
- Title: A Structurally Regularized Convolutional Neural Network for Image
Classification using Wavelet-based SubBand Decomposition
- Title(参考訳): wavelet-based subband decompositionを用いた画像分類のための構造的正規化畳み込みニューラルネットワーク
- Authors: Pavel Sinha, Ioannis Psaromiligkos, Zeljko Zilic
- Abstract要約: ウェーブレットを用いた画像のサブバンド分解に基づく画像分類のための畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
提案アーキテクチャは、入力画像スペクトルを複数の臨界サンプリングサブバンドに分解し、サブバンド毎に1つのCNNを用いて特徴を抽出し、最後に、抽出した特徴を完全連結層を用いて分類する。
重みとバイアスの量子化と入力の量子化によって引き起こされるノイズに対する提案されたアーキテクチャは、通常のフルバンドCNNよりも堅牢であることを示す。
- 参考スコア(独自算出の注目度): 2.127049691404299
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a convolutional neural network (CNN) architecture for image
classification based on subband decomposition of the image using wavelets. The
proposed architecture decomposes the input image spectra into multiple
critically sampled subbands, extracts features using a single CNN per subband,
and finally, performs classification by combining the extracted features using
a fully connected layer. Processing each of the subbands by an individual CNN,
thereby limiting the learning scope of each CNN to a single subband, imposes a
form of structural regularization. This provides better generalization
capability as seen by the presented results. The proposed architecture achieves
best-in-class performance in terms of total multiply-add-accumulator operations
and nearly best-in-class performance in terms of total parameters required, yet
it maintains competitive classification performance. We also show the proposed
architecture is more robust than the regular full-band CNN to noise caused by
weight-and-bias quantization and input quantization.
- Abstract(参考訳): ウェーブレットを用いた画像のサブバンド分解に基づく画像分類のための畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
提案アーキテクチャは、入力画像スペクトルを複数の臨界サンプリングサブバンドに分解し、サブバンド毎に1つのCNNを用いて特徴を抽出し、最後に、抽出した特徴を完全連結層を用いて分類する。
各サブバンドを個別のCNNで処理することにより、各CNNの学習範囲を単一のサブバンドに制限し、構造正規化の形式を課す。
これにより、上述した結果に示すように、より優れた一般化能力が得られる。
提案アーキテクチャは,総乗算加算器演算における最良クラス性能と,総パラメータの観点からは最良クラス性能を実現するが,競合クラス性能は維持する。
また,提案手法は,重みとバイアスの量子化と入力量子化によって生じる雑音に対して,通常のフルバンドcnnよりも頑健であることを示す。
関連論文リスト
- SENetV2: Aggregated dense layer for channelwise and global
representations [0.0]
我々は,Squeeze残余モジュール内に,多分岐密度層である新しい多層パーセプトロンを導入する。
この融合により、チャネルワイドパターンを捕捉し、グローバルな知識を持つネットワークの能力が向上する。
ベンチマークデータセットの広範な実験を行い、モデルを検証し、確立したアーキテクチャと比較する。
論文 参考訳(メタデータ) (2023-11-17T14:10:57Z) - Pushing the Efficiency Limit Using Structured Sparse Convolutions [82.31130122200578]
本稿では,画像の固有構造を利用して畳み込みフィルタのパラメータを削減する構造的スパース畳み込み(SSC)を提案する。
我々は、SSCが効率的なアーキテクチャにおける一般的なレイヤ(奥行き、グループ回り、ポイント回りの畳み込み)の一般化であることを示す。
SSCに基づくアーキテクチャは、CIFAR-10、CIFAR-100、Tiny-ImageNet、ImageNet分類ベンチマークのベースラインと比較して、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-10-23T18:37:22Z) - A heterogeneous group CNN for image super-resolution [127.2132400582117]
畳み込みニューラルネットワーク(CNN)は、深いアーキテクチャを通して顕著な性能を得た。
異種グループSR CNN(HGSRCNN)を,異なるタイプの構造情報を利用して高品質な画像を得る。
論文 参考訳(メタデータ) (2022-09-26T04:14:59Z) - SpectralFormer: Rethinking Hyperspectral Image Classification with
Transformers [91.09957836250209]
ハイパースペクトル(HS)画像は、ほぼ連続したスペクトル情報によって特徴づけられる。
CNNは、HS画像分類において強力な特徴抽出器であることが証明されている。
我々は、HS画像分類のためのulSpectralFormerと呼ばれる新しいバックボーンネットワークを提案する。
論文 参考訳(メタデータ) (2021-07-07T02:59:21Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Convolutional Neural Networks from Image Markers [62.997667081978825]
特徴 画像マーカーからの学習(FLIM)は、ごく少数の画像でユーザーが描画したストロークから、バックプロパゲーションのない畳み込みフィルタを推定するために最近提案されました。
本稿では、フルコネクテッド層に対してFLIMを拡張し、異なる画像分類問題について実証する。
その結果、FLIMベースの畳み込みニューラルネットワークは、バックプロパゲーションによってゼロから訓練された同じアーキテクチャを上回ります。
論文 参考訳(メタデータ) (2020-12-15T22:58:23Z) - ACDC: Weight Sharing in Atom-Coefficient Decomposed Convolution [57.635467829558664]
我々は,CNNにおいて,畳み込みカーネル間の構造正則化を導入する。
我々はCNNがパラメータや計算量を劇的に減らして性能を維持していることを示す。
論文 参考訳(メタデータ) (2020-09-04T20:41:47Z) - Ensemble learning in CNN augmented with fully connected subnetworks [0.0]
1つのベースCNNと複数のFCSNで構成されるEnsNetと呼ばれる新しいモデルを提案する。
EnsNetは、MNISTで最先端のエラー率0.16%を達成する。
論文 参考訳(メタデータ) (2020-03-19T04:02:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。