論文の概要: Multi-Grid Back-Projection Networks
- arxiv url: http://arxiv.org/abs/2101.00150v1
- Date: Fri, 1 Jan 2021 03:17:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-17 13:53:03.734876
- Title: Multi-Grid Back-Projection Networks
- Title(参考訳): マルチグリッドバックプロジェクションネットワーク
- Authors: Pablo Navarrete Michelini, Wenbin Chen, Hanwen Liu, Dan Zhu, Xingqun
Jiang
- Abstract要約: マルチグリッドバックプロジェクション(MGBP)は、アップスケールアーティファクトで画像やビデオを復元することを学ぶことができる完全な畳み込みネットワークアーキテクチャです。
本稿では,異なる解像度スケールの雑音入力を用いて,出力に発生する人工的詳細量の制御を行う手法を提案する。
- 参考スコア(独自算出の注目度): 18.291563524631986
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Multi-Grid Back-Projection (MGBP) is a fully-convolutional network
architecture that can learn to restore images and videos with upscaling
artifacts. Using the same strategy of multi-grid partial differential equation
(PDE) solvers this multiscale architecture scales computational complexity
efficiently with increasing output resolutions. The basic processing block is
inspired in the iterative back-projection (IBP) algorithm and constitutes a
type of cross-scale residual block with feedback from low resolution
references. The architecture performs in par with state-of-the-arts
alternatives for regression targets that aim to recover an exact copy of a high
resolution image or video from which only a downscale image is known. A
perceptual quality target aims to create more realistic outputs by introducing
artificial changes that can be different from a high resolution original
content as long as they are consistent with the low resolution input. For this
target we propose a strategy using noise inputs in different resolution scales
to control the amount of artificial details generated in the output. The noise
input controls the amount of innovation that the network uses to create
artificial realistic details. The effectiveness of this strategy is shown in
benchmarks and it is explained as a particular strategy to traverse the
perception-distortion plane.
- Abstract(参考訳): MGBP(Multi-Grid Back-Projection)は、画像やビデオをアップスケールしたアーティファクトで復元することのできる、完全な畳み込みネットワークアーキテクチャである。
マルチグリッド偏微分方程式(PDE)の同じ戦略を用いて、このマルチスケールアーキテクチャは、出力解像度を増大させて計算複雑性を効率的にスケールする。
基本処理ブロックは反復バックプロジェクション(ibp)アルゴリズムにインスパイアされ、低解像度参照からのフィードバックを伴うクロススケール残差ブロックの一種を構成する。
このアーキテクチャは、ダウンスケールの画像しか知られていない高解像度画像やビデオの正確なコピーを復元することを目的とした回帰ターゲットの最先端の代替品と同等の性能を発揮する。
知覚品質のターゲットは、低解像度の入力と整合性がある限り、高解像度のオリジナルコンテンツとは異なる人工的な変化を導入することで、より現実的な出力を作り出すことを目的としている。
そこで本研究では,異なる解像度スケールの雑音入力を用いて,出力に発生する人工的詳細量の制御を行う手法を提案する。
ノイズ入力は、ネットワークが人工的なリアルな詳細を作成するのに使用するイノベーションの量を制御する。
この戦略の有効性はベンチマークで示され、知覚歪平面を横切る特定の戦略として説明される。
関連論文リスト
- Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - Efficient Multi-scale Network with Learnable Discrete Wavelet Transform for Blind Motion Deblurring [25.36888929483233]
そこで本研究では,シングルインプットとマルチアウトプット(SIMO)に基づくマルチスケールネットワークを提案する。
実世界の軌道特性を学習可能なウェーブレット変換モジュールと組み合わせて、ぼやけた画像から鋭い画像へのステップバイステップ遷移の方向連続性と周波数特性に着目した。
論文 参考訳(メタデータ) (2023-12-29T02:59:40Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Effective Invertible Arbitrary Image Rescaling [77.46732646918936]
Invertible Neural Networks (INN)は、ダウンスケーリングとアップスケーリングのサイクルを共同で最適化することにより、アップスケーリングの精度を大幅に向上させることができる。
本研究の1つのモデルのみをトレーニングすることにより、任意の画像再スケーリングを実現するために、単純で効果的な非可逆的再スケーリングネットワーク(IARN)を提案する。
LR出力の知覚品質を損なうことなく、双方向任意再スケーリングにおいて最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-09-26T22:22:30Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - SDWNet: A Straight Dilated Network with Wavelet Transformation for Image
Deblurring [23.86692375792203]
画像劣化は、ぼやけた画像から鋭い画像を復元することを目的としたコンピュータビジョンの問題である。
我々のモデルは拡張畳み込みを用いて空間分解能の高い大きな受容場を得ることができる。
本稿では,ウェーブレット変換を用いた新しいモジュールを提案する。
論文 参考訳(メタデータ) (2021-10-12T07:58:10Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z) - Multimodal Deep Unfolding for Guided Image Super-Resolution [23.48305854574444]
ディープラーニング手法は、低解像度の入力から高解像度の出力へのエンドツーエンドのマッピングを学習するために、トレーニングデータに依存する。
本稿では,スパース事前を組み込んだマルチモーダル深層学習設計を提案し,他の画像モダリティからの情報をネットワークアーキテクチャに効果的に統合する。
提案手法は,サイド情報を用いた畳み込みスパース符号化の反復的アルゴリズムに類似した,新しい展開演算子に依存している。
論文 参考訳(メタデータ) (2020-01-21T14:41:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。