論文の概要: RegNet: Self-Regulated Network for Image Classification
- arxiv url: http://arxiv.org/abs/2101.00590v1
- Date: Sun, 3 Jan 2021 09:06:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-12 11:35:41.998881
- Title: RegNet: Self-Regulated Network for Image Classification
- Title(参考訳): RegNet: 画像分類のための自己規制型ネットワーク
- Authors: Jing Xu, Yu Pan, Xinglin Pan, Steven Hoi, Zhang Yi, Zenglin Xu
- Abstract要約: 本稿では,補完的な特徴を抽出するメモリ機構としてレギュレータモジュールを提案する。
レギュレータモジュールは、任意のResNetアーキテクチャに簡単に実装および追加できます。
3つの画像分類データセットの実験結果から,提案するアーキテクチャの性能が実証された。
- 参考スコア(独自算出の注目度): 23.647993573841863
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ResNet and its variants have achieved remarkable successes in various
computer vision tasks. Despite its success in making gradient flow through
building blocks, the simple shortcut connection mechanism limits the ability of
re-exploring new potentially complementary features due to the additive
function. To address this issue, in this paper, we propose to introduce a
regulator module as a memory mechanism to extract complementary features, which
are further fed to the ResNet. In particular, the regulator module is composed
of convolutional RNNs (e.g., Convolutional LSTMs or Convolutional GRUs), which
are shown to be good at extracting Spatio-temporal information. We named the
new regulated networks as RegNet. The regulator module can be easily
implemented and appended to any ResNet architecture. We also apply the
regulator module for improving the Squeeze-and-Excitation ResNet to show the
generalization ability of our method. Experimental results on three image
classification datasets have demonstrated the promising performance of the
proposed architecture compared with the standard ResNet, SE-ResNet, and other
state-of-the-art architectures.
- Abstract(参考訳): ResNetとその変種は様々なコンピュータビジョンタスクで顕著な成功を収めた。
ビルディングブロックに勾配を流すことに成功したにもかかわらず、単純なショートカット接続機構は、付加機能のために新たな補完機能を再検討する能力を制限する。
本稿では,レギュレータモジュールをメモリ機構として導入し,さらにresnetに供給される補完的特徴を抽出することを提案する。
特に、レギュレータモジュールは、時空間情報を抽出するのに優れていることを示す畳み込みRNN(例えば、畳み込みLSTMや畳み込みGRU)で構成されている。
我々は新しい規制ネットワークをRegNetと名付けた。
レギュレータモジュールは簡単に実装でき、どんなResNetアーキテクチャにも追加できる。
また,Squeeze-and-Excitation ResNetの改良のためのレギュレータモジュールを適用し,本手法の一般化能力を示す。
3つの画像分類データセットの実験結果は、標準ResNet、SE-ResNet、その他の最先端アーキテクチャと比較して提案アーキテクチャの有望な性能を示している。
関連論文リスト
- Systematic Architectural Design of Scale Transformed Attention Condenser
DNNs via Multi-Scale Class Representational Response Similarity Analysis [93.0013343535411]
マルチスケールクラス表現応答類似性分析(ClassRepSim)と呼ばれる新しいタイプの分析法を提案する。
ResNetスタイルのアーキテクチャにSTACモジュールを追加すると、最大1.6%の精度が向上することを示す。
ClassRepSim分析の結果は、STACモジュールの効果的なパラメータ化を選択するために利用することができ、競争性能が向上する。
論文 参考訳(メタデータ) (2023-06-16T18:29:26Z) - Semantic-aware Modular Capsule Routing for Visual Question Answering [55.03883681191765]
SuPER と呼ばれるセマンティック・アウェアな modUlar caPsulE フレームワークを提案する。
5つのベンチマークデータセットに対して提案した SUPER スキームの有効性と一般化能力を比較検討した。
論文 参考訳(メタデータ) (2022-07-21T10:48:37Z) - Structured Sparsity Learning for Efficient Video Super-Resolution [99.1632164448236]
我々は、ビデオ超解像(VSR)モデルの特性に応じて、構造化スパシティ学習(SSL)と呼ばれる構造化プルーニング手法を開発する。
SSLでは,残差ブロック,リカレントネットワーク,アップサンプリングネットワークなど,VSRモデルのいくつかの重要なコンポーネントに対するプルーニングスキームを設計する。
論文 参考訳(メタデータ) (2022-06-15T17:36:04Z) - Lightweight Image Enhancement Network for Mobile Devices Using
Self-Feature Extraction and Dense Modulation [0.9911248259437542]
低解像度の入力画像から細部、テクスチャ、構造情報を復元するために、軽量画像強調ネットワークを提案する。
提案するネットワークは,低画質画像から変調パラメータを生成する自己特徴抽出モジュールを含む。
実験結果は,定量評価と定性評価の両方の観点から,既存手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-05-02T12:35:08Z) - IMDeception: Grouped Information Distilling Super-Resolution Network [7.6146285961466]
SISR(Single-Image-Super-Resolution)は、ディープラーニング手法の最近の進歩の恩恵を受けている古典的なコンピュータビジョン問題である。
本稿では,機能集約のためのIICモジュールの代替として,GPRM(Global Progressive Refinement Module)を提案する。
また,1秒あたりのパラメータ数や浮動小数点演算量(FLOPS)をさらに削減するために,GIDB(Grouped Information Distilling Blocks)を提案する。
実験の結果,提案したネットワークは,パラメータ数やFLOPSが限られているにもかかわらず,最先端モデルと同等に動作していることがわかった。
論文 参考訳(メタデータ) (2022-04-25T06:43:45Z) - Using mixup as regularization and tuning hyper-parameters for ResNets [0.0]
アイデンティティマッピングに基づくアーキテクチャ ResNetsとDenseNetsは、イメージ分類タスクにおけるパスブレークの結果を約束している。
この作業はResNetsを再定義し、ミックスアップデータ拡張を正規化として使用し、ハイパーパラメータをチューニングすることで、ResNet50 citeresnetsを改善する。
論文 参考訳(メタデータ) (2021-11-23T02:33:24Z) - IICNet: A Generic Framework for Reversible Image Conversion [40.21904131503064]
Reversible Image conversion (RIC) は、特定の視覚コンテンツ(例えばショートビデオ)と埋め込み画像の間の可逆変換を構築することを目的としている。
Invertible Image Conversion Net (IICNet) は、強力な容量とタスクに依存しない設計のため、様々なRICタスクに対する汎用的なソリューションである。
論文 参考訳(メタデータ) (2021-09-09T13:06:59Z) - Conformer: Local Features Coupling Global Representations for Visual
Recognition [72.9550481476101]
本稿では,畳み込み操作と自己アテンション機構を利用した表現学習のためのハイブリッドネットワーク構造,conformerを提案する。
実験では、コンフォーマーが同等のパラメータ複雑性の下で視覚変換器(DeiT-B)を2.3%上回ることが示されている。
論文 参考訳(メタデータ) (2021-05-09T10:00:03Z) - Structured Convolutions for Efficient Neural Network Design [65.36569572213027]
畳み込みニューラルネットワーク構築ブロックのテクスト単純構造における冗長性を利用してモデル効率に取り組む。
この分解が2Dカーネルや3Dカーネルだけでなく、完全に接続されたレイヤにも適用可能であることを示す。
論文 参考訳(メタデータ) (2020-08-06T04:38:38Z) - OverNet: Lightweight Multi-Scale Super-Resolution with Overscaling
Network [3.6683231417848283]
SISRを任意のスケールで1つのモデルで解くための,深層でも軽量な畳み込みネットワークであるOverNetを紹介した。
我々のネットワークは、従来の手法よりも少ないパラメータを使用しながら、標準ベンチマークにおいて、過去の最先端結果よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-08-05T22:10:29Z) - BiO-Net: Learning Recurrent Bi-directional Connections for
Encoder-Decoder Architecture [82.64881585566825]
本稿では,新たな双方向O字型ネットワーク(BiO-Net)を提案する。
提案手法は,バニラU-Netおよび他の最先端手法よりも優れる。
論文 参考訳(メタデータ) (2020-07-01T05:07:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。