論文の概要: PNEN: Pyramid Non-Local Enhanced Networks
- arxiv url: http://arxiv.org/abs/2008.09742v1
- Date: Sat, 22 Aug 2020 03:10:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 08:05:51.398477
- Title: PNEN: Pyramid Non-Local Enhanced Networks
- Title(参考訳): PNEN: ピラミッド非ローカル拡張ネットワーク
- Authors: Feida Zhu, Chaowei Fang, Kai-Kuang Ma
- Abstract要約: 我々は,各画素間の接続を構築するために,新しい非局所モジュールであるピラミッド非局所ブロックを提案する。
提案したモジュールに基づいて,エッジ保存画像平滑化のためのピラミッド非局所拡張ネットワークを考案する。
超解像法と超解像法という2つの既存手法に統合し,一貫した性能向上を実現した。
- 参考スコア(独自算出の注目度): 23.17149002568982
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing neural networks proposed for low-level image processing tasks are
usually implemented by stacking convolution layers with limited kernel size.
Every convolution layer merely involves in context information from a small
local neighborhood. More contextual features can be explored as more
convolution layers are adopted. However it is difficult and costly to take full
advantage of long-range dependencies. We propose a novel non-local module,
Pyramid Non-local Block, to build up connection between every pixel and all
remain pixels. The proposed module is capable of efficiently exploiting
pairwise dependencies between different scales of low-level structures. The
target is fulfilled through first learning a query feature map with full
resolution and a pyramid of reference feature maps with downscaled resolutions.
Then correlations with multi-scale reference features are exploited for
enhancing pixel-level feature representation. The calculation procedure is
economical considering memory consumption and computational cost. Based on the
proposed module, we devise a Pyramid Non-local Enhanced Networks for
edge-preserving image smoothing which achieves state-of-the-art performance in
imitating three classical image smoothing algorithms. Additionally, the pyramid
non-local block can be directly incorporated into convolution neural networks
for other image restoration tasks. We integrate it into two existing methods
for image denoising and single image super-resolution, achieving consistently
improved performance.
- Abstract(参考訳): 低レベルの画像処理タスクのために提案された既存のニューラルネットワークは通常、カーネルサイズが制限された畳み込み層を積み重ねることで実装される。
すべての畳み込み層は、小さなローカル地区からのコンテキスト情報のみを含む。
より多くの畳み込み層が採用されれば、よりコンテキスト的な機能を検討することができる。
しかし、長距離依存関係を完全に活用することは困難でコストがかかる。
我々は,各画素間の接続を構築するために,新しい非局所モジュールであるピラミッド非局所ブロックを提案する。
提案モジュールは,異なるスケールの低レベル構造間の相互依存関係を効率的に利用することができる。
ターゲットは、まずフル解像度のクエリ特徴マップと、ダウンスケール解像度の参照特徴マップのピラミッドを学習することで実現される。
次に、画素レベルの特徴表現を強化するために、マルチスケール参照特徴との相関を利用する。
計算手順は、メモリ消費と計算コストを考慮すると経済的である。
提案モジュールをベースとして、3つの古典的画像平滑化アルゴリズムを模倣して最先端の性能を実現するエッジ保存画像平滑化のためのピラミッド非局所拡張ネットワークを考案した。
さらに、ピラミッド非局所ブロックは、他の画像復元タスクのために畳み込みニューラルネットワークに直接組み込むことができる。
画像分解と超解像の2つの既存手法に統合し,一貫した性能向上を実現した。
関連論文リスト
- Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - Serpent: Scalable and Efficient Image Restoration via Multi-scale Structured State Space Models [22.702352459581434]
サーペントは高解像度画像復元のための効率的なアーキテクチャである。
本稿では,Serpentが最先端技術に匹敵する再現性が得られることを示す。
論文 参考訳(メタデータ) (2024-03-26T17:43:15Z) - Augmenting Convolutional networks with attention-based aggregation [55.97184767391253]
我々は,非局所的推論を実現するために,注目に基づくグローバルマップを用いた畳み込みネットワークの強化方法を示す。
この学習集約層を2つのパラメータ(幅と深さ)でパラメータ化した単純パッチベースの畳み込みネットワークで接続する。
これは、特にメモリ消費の点で、精度と複雑さの間の驚くほど競争力のあるトレードオフをもたらす。
論文 参考訳(メタデータ) (2021-12-27T14:05:41Z) - PixelPyramids: Exact Inference Models from Lossless Image Pyramids [58.949070311990916]
Pixel-Pyramidsは、画像画素の関節分布を符号化するスケール特異的表現を用いたブロック自動回帰手法である。
様々な画像データセット、特に高解像度データに対する密度推定の最先端結果が得られる。
CelebA-HQ 1024 x 1024 では,フローベースモデルの並列化よりもサンプリング速度が優れているにもかかわらず,密度推定値がベースラインの 44% に向上することが観察された。
論文 参考訳(メタデータ) (2021-10-17T10:47:29Z) - GraphFPN: Graph Feature Pyramid Network for Object Detection [44.481481251032264]
本稿では,そのトポロジ構造を固有画像構造に適応させることのできるグラフ特徴ピラミッドネットワークを提案する。
提案したグラフ特徴ピラミッドネットワークは,畳み込み特徴ピラミッドネットワークからマルチスケール特徴を拡張できる。
我々は、オブジェクト検出タスクにおいて、より高速なR-CNNアルゴリズムに統合することで、グラフ特徴ピラミッドネットワークを評価する。
論文 参考訳(メタデータ) (2021-08-02T01:19:38Z) - RepMLP: Re-parameterizing Convolutions into Fully-connected Layers for
Image Recognition [123.59890802196797]
画像認識のための多層パーセプトロン型ニューラルネットワーク構築ブロックであるRepMLPを提案する。
トレーニング中にRepMLP内に畳み込み層を構築し,それをFCにマージして推論を行う。
従来のCNNにRepMLPを挿入することで、ImageNetでは1.8%の精度、顔認識では2.9%、FLOPの低いCityscapeでは2.3%のmIoUを改善します。
論文 参考訳(メタデータ) (2021-05-05T06:17:40Z) - AINet: Association Implantation for Superpixel Segmentation [82.21559299694555]
今回提案する新しいtextbfAssociation textbfImplantation(AI)モジュールは、ネットワークがピクセルとその周辺グリッド間の関係を明示的にキャプチャすることを可能にする。
本手法は最先端性能を実現するだけでなく,十分な推論効率を維持することができた。
論文 参考訳(メタデータ) (2021-01-26T10:40:13Z) - Lightweight Modules for Efficient Deep Learning based Image Restoration [20.701733377216932]
そこで我々は,与えられたベースラインモデルの計算的低コストな変種を生成するために,いくつかの軽量な低レベルモジュールを提案する。
その結果,提案するネットワークは,全容量ベースラインと比較して,視覚的に類似した再構成を一貫して出力することがわかった。
論文 参考訳(メタデータ) (2020-07-11T19:35:00Z) - Pyramid Attention Networks for Image Restoration [124.34970277136061]
自己相似性(Self-similarity)とは、画像復元アルゴリズムで広く使われる画像を指す。
近年の深層畳み込みニューラルネットワークによる画像復元手法は, 自己相似性を十分に活用していない。
画像復元のための新しいピラミッドアテンションモジュールを提案し,マルチスケール特徴ピラミッドから長距離特徴対応をキャプチャする。
論文 参考訳(メタデータ) (2020-04-28T21:12:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。