論文の概要: Learning Enriched Features for Fast Image Restoration and Enhancement
- arxiv url: http://arxiv.org/abs/2205.01649v1
- Date: Tue, 19 Apr 2022 17:59:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-09 00:10:22.680497
- Title: Learning Enriched Features for Fast Image Restoration and Enhancement
- Title(参考訳): 高速画像復元・強調のための学習強化機能
- Authors: Syed Waqas Zamir, Aditya Arora, Salman Khan, Munawar Hayat, Fahad
Shahbaz Khan, Ming-Hsuan Yang, Ling Shao
- Abstract要約: 本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
- 参考スコア(独自算出の注目度): 166.17296369600774
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Given a degraded input image, image restoration aims to recover the missing
high-quality image content. Numerous applications demand effective image
restoration, e.g., computational photography, surveillance, autonomous
vehicles, and remote sensing. Significant advances in image restoration have
been made in recent years, dominated by convolutional neural networks (CNNs).
The widely-used CNN-based methods typically operate either on full-resolution
or on progressively low-resolution representations. In the former case, spatial
details are preserved but the contextual information cannot be precisely
encoded. In the latter case, generated outputs are semantically reliable but
spatially less accurate. This paper presents a new architecture with a holistic
goal of maintaining spatially-precise high-resolution representations through
the entire network, and receiving complementary contextual information from the
low-resolution representations. The core of our approach is a multi-scale
residual block containing the following key elements: (a) parallel
multi-resolution convolution streams for extracting multi-scale features, (b)
information exchange across the multi-resolution streams, (c) non-local
attention mechanism for capturing contextual information, and (d) attention
based multi-scale feature aggregation. Our approach learns an enriched set of
features that combines contextual information from multiple scales, while
simultaneously preserving the high-resolution spatial details. Extensive
experiments on six real image benchmark datasets demonstrate that our method,
named as MIRNet-v2 , achieves state-of-the-art results for a variety of image
processing tasks, including defocus deblurring, image denoising,
super-resolution, and image enhancement. The source code and pre-trained models
are available at https://github.com/swz30/MIRNetv2
- Abstract(参考訳): 劣化した入力画像から、画像復元は、欠落した高品質の画像コンテンツを回復することを目的としている。
多くのアプリケーションは効率的な画像復元(例えば、計算写真、監視、自動運転車、リモートセンシング)を必要としている。
近年では、畳み込みニューラルネットワーク(CNN)が中心となって画像修復の進歩が著しい。
広く使われているCNNベースの手法は、一般的にフル解像度またはプログレッシブに低解像度の表現で動作する。
前者の場合、空間的詳細は保存されるが、文脈情報を正確に符号化することはできない。
後者の場合、生成された出力は意味的に信頼性があるが、空間的には正確ではない。
本稿では,ネットワーク全体を通して空間的にpreciseな高分解能表現を維持し,低解像度表現から相補的なコンテクスト情報を受け取ることを目標とした新しいアーキテクチャを提案する。
私たちのアプローチの核心は、以下のキー要素を含むマルチスケールの残留ブロックです。
(a)マルチスケール特徴抽出のための並列マルチレゾリューション畳み込みストリーム
(b)多解像度ストリーム間の情報交換
(c)文脈情報を取得する非局所的注意機構、及び
(d)注意に基づくマルチスケール特徴集約。
提案手法では,複数のスケールの文脈情報を組み合わせて,高分解能な空間的詳細を同時に保持する機能セットを学習する。
MIRNet-v2 と呼ばれる6つの実画像ベンチマークデータセットの大規模な実験により,デフォーカスデブロアリング,画像デノイング,超解像,画像強調など,様々な画像処理タスクの最先端結果が得られた。
ソースコードと事前トレーニングされたモデルはhttps://github.com/swz30/MIRNetv2で入手できる。
関連論文リスト
- Dilated Strip Attention Network for Image Restoration [5.65781374269726]
画像復元のための拡張ストリップアテンションネットワーク(DSAN)を提案する。
DSA操作を水平および垂直に使用することにより、各場所はより広い領域からコンテキスト情報を収集することができる。
実験の結果,DSANは複数の画像復元作業において最先端のアルゴリズムより優れていることがわかった。
論文 参考訳(メタデータ) (2024-07-26T09:12:30Z) - MRIR: Integrating Multimodal Insights for Diffusion-based Realistic Image Restoration [17.47612023350466]
マルチモーダルなインサイトを持つ拡散型復元法であるMRIRを提案する。
テキストレベルでは、訓練済みのマルチモーダル大言語モデルのパワーを利用して、低品質の画像から意味のある意味情報を推測する。
視覚レベルでは、主にピクセルレベルの制御に焦点を合わせ、Pixelレベルのプロセッサと制御ネットを用いて空間構造を制御する。
論文 参考訳(メタデータ) (2024-07-04T04:55:14Z) - Super-Resolving Face Image by Facial Parsing Information [52.1267613768555]
顔超解像は、低解像度の顔画像を対応する高解像度の画像に変換する技術である。
我々は,低解像度の顔画像から先行する顔を抽出する,新しい解析マップ付き顔超解像ネットワークを構築した。
高解像度特徴はより正確な空間情報を含み、低解像度特徴は強い文脈情報を提供する。
論文 参考訳(メタデータ) (2023-04-06T08:19:03Z) - Restormer: Efficient Transformer for High-Resolution Image Restoration [118.9617735769827]
畳み込みニューラルネットワーク(CNN)は、大規模データから一般化可能な画像の事前学習をうまく行う。
トランスフォーマーは、自然言語とハイレベルな視覚タスクにおいて、顕著なパフォーマンス向上を示している。
我々のモデルであるRecovery Transformer (Restormer) は、いくつかの画像復元タスクにおいて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-11-18T18:59:10Z) - Multi-Stage Progressive Image Restoration [167.6852235432918]
本稿では、これらの競合する目標を最適にバランスできる新しい相乗的設計を提案する。
本提案では, 劣化した入力の復元関数を段階的に学習する多段階アーキテクチャを提案する。
MPRNetという名前の密接な相互接続型マルチステージアーキテクチャは、10のデータセットに対して強力なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2021-02-04T18:57:07Z) - Learning Deep Interleaved Networks with Asymmetric Co-Attention for
Image Restoration [65.11022516031463]
本稿では,高品質(本社)画像再構成のために,異なる状態の情報をどのように組み合わせるべきかを学習するディープインターリーブドネットワーク(DIN)を提案する。
本稿では,各インターリーブノードにアタッチメントされた非対称なコアテンション(AsyCA)を提案し,その特性依存性をモデル化する。
提案したDINはエンドツーエンドで訓練でき、様々な画像復元タスクに適用できる。
論文 参考訳(メタデータ) (2020-10-29T15:32:00Z) - Multi-image Super Resolution of Remotely Sensed Images using Residual
Feature Attention Deep Neural Networks [1.3764085113103222]
本研究は,マルチイメージ超解像課題に効果的に取り組む新しい残像注意モデル(RAMS)を提案する。
本研究では,3次元畳み込みによる視覚特徴の注意機構を導入し,意識的なデータ融合と情報抽出を実現する。
我々の表現学習ネットワークは、冗長な低周波信号を流すためにネストした残差接続を広範囲に利用している。
論文 参考訳(メタデータ) (2020-07-06T22:54:02Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。