論文の概要: IMDeception: Grouped Information Distilling Super-Resolution Network
- arxiv url: http://arxiv.org/abs/2204.11463v1
- Date: Mon, 25 Apr 2022 06:43:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-26 19:13:46.568292
- Title: IMDeception: Grouped Information Distilling Super-Resolution Network
- Title(参考訳): IMデセプション:超解像ネットワークを用いたグループ情報蒸留
- Authors: Mustafa Ayazoglu
- Abstract要約: SISR(Single-Image-Super-Resolution)は、ディープラーニング手法の最近の進歩の恩恵を受けている古典的なコンピュータビジョン問題である。
本稿では,機能集約のためのIICモジュールの代替として,GPRM(Global Progressive Refinement Module)を提案する。
また,1秒あたりのパラメータ数や浮動小数点演算量(FLOPS)をさらに削減するために,GIDB(Grouped Information Distilling Blocks)を提案する。
実験の結果,提案したネットワークは,パラメータ数やFLOPSが限られているにもかかわらず,最先端モデルと同等に動作していることがわかった。
- 参考スコア(独自算出の注目度): 7.6146285961466
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single-Image-Super-Resolution (SISR) is a classical computer vision problem
that has benefited from the recent advancements in deep learning methods,
especially the advancements of convolutional neural networks (CNN). Although
state-of-the-art methods improve the performance of SISR on several datasets,
direct application of these networks for practical use is still an issue due to
heavy computational load. For this purpose, recently, researchers have focused
on more efficient and high-performing network structures. Information
multi-distilling network (IMDN) is one of the highly efficient SISR networks
with high performance and low computational load. IMDN achieves this efficiency
with various mechanisms such as Intermediate Information Collection (IIC),
working in a global setting, Progressive Refinement Module (PRM), and Contrast
Aware Channel Attention (CCA), employed in a local setting. These mechanisms,
however, do not equally contribute to the efficiency and performance of IMDN.
In this work, we propose the Global Progressive Refinement Module (GPRM) as a
less parameter-demanding alternative to the IIC module for feature aggregation.
To further decrease the number of parameters and floating point operations
persecond (FLOPS), we also propose Grouped Information Distilling Blocks
(GIDB). Using the proposed structures, we design an efficient SISR network
called IMDeception. Experiments reveal that the proposed network performs on
par with state-of-the-art models despite having a limited number of parameters
and FLOPS. Furthermore, using grouped convolutions as a building block of GIDB
increases room for further optimization during deployment. To show its
potential, the proposed model was deployed on NVIDIA Jetson Xavier AGX and it
has been shown that it can run in real-time on this edge device
- Abstract(参考訳): SISR(Single-Image-Super-Resolution)は、ディープラーニング手法の最近の進歩、特に畳み込みニューラルネットワーク(CNN)の進歩の恩恵を受けている古典的なコンピュータビジョン問題である。
最先端の手法は、複数のデータセットにおけるsisrの性能を向上させるが、計算負荷が大きいため、これらのネットワークを実用化するための直接利用は依然として問題である。
この目的のために、近年、研究者はより効率的で高性能なネットワーク構造に焦点を当てている。
Information Multi-distilling Network (IMDN) は、高性能で低計算負荷のSISRネットワークの1つである。
IMDNは、グローバル環境で作業する中間情報収集(IIC)、プログレッシブ・リファインメント・モジュール(PRM)、ローカル環境で使用されるコントラスト・アウェア・チャネル・アテンション(CCA)といった様々なメカニズムでこの効率を実現する。
しかし、これらのメカニズムはIMDNの効率と性能に等しく寄与しない。
本稿では,機能集約のためのiicモジュールに代わるパラメータ要求の少ない代替モジュールとして,グローバル・プログレッシブ・リファインメント・モジュール(gprm)を提案する。
パラメータ数と浮動小数点演算を1秒間(FLOPS)でさらに減少させるため,グループ情報蒸留ブロック(GIDB)を提案する。
提案した構造を用いて、IMDeceptionと呼ばれる効率的なSISRネットワークを設計する。
実験の結果,提案したネットワークはパラメータやFLOPSが限られているにもかかわらず,最先端のモデルと同等に動作していることがわかった。
さらに、GIDBのビルディングブロックとしてグループ化された畳み込みを使用すると、デプロイメント中にさらなる最適化の余地が増加する。
その可能性を示すため、提案されたモデルはNVIDIA Jetson Xavier AGX上にデプロイされ、このエッジデバイス上でリアルタイムに動作可能であることが示されている。
関連論文リスト
- Energy-Aware FPGA Implementation of Spiking Neural Network with LIF Neurons [0.5243460995467893]
スパイキングニューラルネットワーク(SNN)は、TinyMLの最先端ソリューションとして際立っている。
本稿では,第1次Leaky Integrate-and-Fire(LIF)ニューロンモデルに基づく新しいSNNアーキテクチャを提案する。
ハードウェアフレンドリーなLIF設計も提案され、Xilinx Artix-7 FPGA上で実装されている。
論文 参考訳(メタデータ) (2024-11-03T16:42:10Z) - EvSegSNN: Neuromorphic Semantic Segmentation for Event Data [0.6138671548064356]
EvSegSNN は、Parametric Leaky Integrate と Fire のニューロンに依存した、生物学的に検証可能なエンコーダ-デコーダU字型アーキテクチャである。
本稿では,スパイキングニューラルネットワークとイベントカメラを組み合わせることによって,エンド・ツー・エンドのバイオインスパイアされたセマンティックセマンティックセマンティクス手法を提案する。
DDD17で実施された実験は、EvSegSNNがMIoUの観点から最も近い最先端モデルを上回っていることを示している。
論文 参考訳(メタデータ) (2024-06-20T10:36:24Z) - Incorporating Transformer Designs into Convolutions for Lightweight
Image Super-Resolution [46.32359056424278]
大規模な畳み込みカーネルは畳み込みニューラルネットワークの設計に人気がある。
カーネルのサイズが大きくなるとパラメータの数が2倍に増加し、計算量やメモリの要求も大きくなる。
本稿では,自己注意機構を付加した標準畳み込みを改良した近傍注意モジュールを提案する。
NAモジュールをベースとして,TSRと呼ばれる軽量単一画像超解像(SISR)ネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-25T01:32:18Z) - Learning k-Level Structured Sparse Neural Networks Using Group Envelope Regularization [4.0554893636822]
制約のあるリソースに大規模ディープニューラルネットワークをデプロイするための新しいアプローチを導入する。
この手法は推論時間を短縮し、メモリ需要と消費電力を減らすことを目的とする。
論文 参考訳(メタデータ) (2022-12-25T15:40:05Z) - RDRN: Recursively Defined Residual Network for Image Super-Resolution [58.64907136562178]
深部畳み込みニューラルネットワーク(CNN)は、単一画像超解像において顕著な性能を得た。
本稿では,注目ブロックを効率的に活用する新しいネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-11-17T11:06:29Z) - Image Superresolution using Scale-Recurrent Dense Network [30.75380029218373]
畳み込みニューラルネットワーク(CNN)の設計の最近の進歩は、画像超解像(SR)の性能を大幅に向上させた。
残差ブロック内の一連の密接な接続を含む単位上に構築されたスケールリカレントSRアーキテクチャを提案する(Residual Dense Blocks (RDBs))。
我々のスケールリカレント設計は、現在の最先端のアプローチに比べてパラメトリックに効率的でありながら、より高いスケール要因の競合性能を提供する。
論文 参考訳(メタデータ) (2022-01-28T09:18:43Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z) - Iterative Network for Image Super-Resolution [69.07361550998318]
単一画像超解像(SISR)は、最近の畳み込みニューラルネットワーク(CNN)の発展により、大幅に活性化されている。
本稿では、従来のSISRアルゴリズムに関する新たな知見を提供し、反復最適化に依存するアプローチを提案する。
反復最適化の上に,新しい反復型超解像ネットワーク (ISRN) を提案する。
論文 参考訳(メタデータ) (2020-05-20T11:11:47Z) - Deep Adaptive Inference Networks for Single Image Super-Resolution [72.7304455761067]
シングルイメージ超解像(SISR)は、ディープ畳み込みニューラルネットワーク(CNN)の展開により、近年大きく進歩している。
本稿では,深部SISR(AdaDSR)の適応型推論ネットワークを活用することで,この問題に対処する。
我々のAdaDSRは、SISRモデルをバックボーンとし、画像の特徴とリソース制約を入力として取り、ローカルネットワーク深さのマップを予測する軽量アダプタモジュールを備える。
論文 参考訳(メタデータ) (2020-04-08T10:08:20Z) - Toward fast and accurate human pose estimation via soft-gated skip
connections [97.06882200076096]
本稿では,高精度かつ高効率な人間のポーズ推定について述べる。
我々は、最先端技術よりも精度と効率を両立させる文脈において、この設計選択を再分析する。
本モデルでは,MPII と LSP のデータセットから最先端の結果が得られる。
論文 参考訳(メタデータ) (2020-02-25T18:51:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。