論文の概要: High-Resolution Photorealistic Image Translation in Real-Time: A
Laplacian Pyramid Translation Network
- arxiv url: http://arxiv.org/abs/2105.09188v1
- Date: Wed, 19 May 2021 15:05:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-20 13:46:20.255938
- Title: High-Resolution Photorealistic Image Translation in Real-Time: A
Laplacian Pyramid Translation Network
- Title(参考訳): リアルタイムの高分解能フォトリアリスティック画像翻訳:ラプラシアピラミッド翻訳ネットワーク
- Authors: Jie Liang, Hui Zeng, Lei Zhang
- Abstract要約: 閉形式ラプラシアピラミッドの分解と再構成に基づく高分解能フォトリアリスティックI2ITタスクの高速化に着目する。
この2つのタスクを同時に実行するために,ラプラシアンピラミッド翻訳ネットワーク(N)を提案する。
我々のモデルは高解像度の特徴写像を処理し、画像の詳細を忠実に保存することで消費される重い計算の大部分を回避している。
- 参考スコア(独自算出の注目度): 23.981019687483506
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Existing image-to-image translation (I2IT) methods are either constrained to
low-resolution images or long inference time due to their heavy computational
burden on the convolution of high-resolution feature maps. In this paper, we
focus on speeding-up the high-resolution photorealistic I2IT tasks based on
closed-form Laplacian pyramid decomposition and reconstruction. Specifically,
we reveal that the attribute transformations, such as illumination and color
manipulation, relate more to the low-frequency component, while the content
details can be adaptively refined on high-frequency components. We consequently
propose a Laplacian Pyramid Translation Network (LPTN) to simultaneously
perform these two tasks, where we design a lightweight network for translating
the low-frequency component with reduced resolution and a progressive masking
strategy to efficiently refine the high-frequency ones. Our model avoids most
of the heavy computation consumed by processing high-resolution feature maps
and faithfully preserves the image details. Extensive experimental results on
various tasks demonstrate that the proposed method can translate 4K images in
real-time using one normal GPU while achieving comparable transformation
performance against existing methods. Datasets and codes are available:
https://github.com/csjliang/LPTN.
- Abstract(参考訳): 既存の画像から画像への変換法(i2it)は、高分解能特徴マップの畳み込みに計算の重荷がかかるため、低解像度画像や長い推論時間に制限されている。
本稿では, 閉形式ラプラシアンピラミッドの分解と再構成に基づく高分解能フォトリアリスティックI2ITタスクの高速化に着目する。
具体的には, 照明や色操作などの属性変換が低周波成分とより関連し, コンテンツの詳細は高周波成分で適応的に洗練できることを明らかにした。
そこで我々は,この2つのタスクを同時に行うためのラプラシアンピラミッド翻訳ネットワーク (LPTN) を提案し,低周波成分を分解能を低減して翻訳するための軽量ネットワークと,高周波成分を効率よく洗練するためのプログレッシブマスキング戦略を設計した。
本モデルでは,高分解能特徴マップの処理で消費される計算量のほとんどを回避し,画像詳細を忠実に保存する。
各種タスクに対する大規模な実験結果から,提案手法は1つの通常のGPUを用いて4K画像をリアルタイムに変換し,既存の手法と同等な変換性能を実現する。
データセットとコードは、https://github.com/csjliang/lptn。
関連論文リスト
- 4K-Resolution Photo Exposure Correction at 125 FPS with ~8K Parameters [9.410502389242815]
本稿では,8Kパラメータしか持たない超軽量なマルチスケール線形変換(MSLT)ネットワークを提案する。
MSLTネットワークは4K解像度のsRGB画像をTitan GTX GPUで125 Frame-Per-Second (FPS)で処理することができる。
2つのベンチマークデータセットの実験は、写真露出補正の最先端技術に対するMSLTの効率を実証している。
論文 参考訳(メタデータ) (2023-11-15T08:01:12Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - CoordFill: Efficient High-Resolution Image Inpainting via Parameterized
Coordinate Querying [52.91778151771145]
本稿では,近年の連続的暗黙表現の発達により,その限界を初めて破ろうとする。
実験の結果,提案手法はGTX 2080 Ti GPUを用いて2048$times$2048の画像をリアルタイムに処理できることがわかった。
論文 参考訳(メタデータ) (2023-03-15T11:13:51Z) - Multi-Curve Translator for Real-Time High-Resolution Image-to-Image
Translation [24.651984136294242]
Multi-Curve Translator (MCT) は、対応する入力ピクセルと隣接ピクセルの変換ピクセルを予測する。
MCTにより、ダウンサンプリングされた画像のみをネットワークに供給し、フル解像度画像のマッピングを実行することができる。
MCTの変種は4K画像をリアルタイムで処理でき、ベースモデルと同等またはそれ以上のパフォーマンスを達成できる。
論文 参考訳(メタデータ) (2022-03-15T10:06:39Z) - SDWNet: A Straight Dilated Network with Wavelet Transformation for Image
Deblurring [23.86692375792203]
画像劣化は、ぼやけた画像から鋭い画像を復元することを目的としたコンピュータビジョンの問題である。
我々のモデルは拡張畳み込みを用いて空間分解能の高い大きな受容場を得ることができる。
本稿では,ウェーブレット変換を用いた新しいモジュールを提案する。
論文 参考訳(メタデータ) (2021-10-12T07:58:10Z) - Spatial-Separated Curve Rendering Network for Efficient and
High-Resolution Image Harmonization [59.19214040221055]
本稿では,空間分離型曲線描画ネットワーク(S$2$CRNet)を提案する。
提案手法は従来の手法と比較して90%以上のパラメータを減少させる。
提案手法は,既存の手法よりも10ドル以上高速な高解像度画像をリアルタイムにスムーズに処理することができる。
論文 参考訳(メタデータ) (2021-09-13T07:20:16Z) - Fast Monte Carlo Rendering via Multi-Resolution Sampling [6.203886925467029]
モンテカルロレンダリングアルゴリズムを高速化するハイブリッドレンダリング手法を提案する。
提案手法は,高試料レート(LRHS)の低解像度と低試料レート(HRLS)の高解像度の高解像度の2種類のレンダリングを生成する。
論文 参考訳(メタデータ) (2021-06-24T07:35:27Z) - Spatially-Adaptive Pixelwise Networks for Fast Image Translation [57.359250882770525]
高速かつ効率的な画像-画像変換を目的とした新しいジェネレータアーキテクチャを提案する。
私たちはピクセルワイズネットワークを使用します。つまり、各ピクセルは他のピクセルとは独立して処理されます。
私たちのモデルは最先端のベースラインよりも最大18倍高速です。
論文 参考訳(メタデータ) (2020-12-05T10:02:03Z) - Efficient texture-aware multi-GAN for image inpainting [5.33024001730262]
近年のGAN (Generative Adversarial Network) のインペイント手法は顕著に改善されている。
本稿では,性能とレンダリング効率の両方を改善するマルチGANアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-30T14:58:03Z) - Hyperspectral Image Super-resolution via Deep Progressive Zero-centric
Residual Learning [62.52242684874278]
空間情報とスペクトル情報の相互モダリティ分布が問題となる。
本稿では,PZRes-Netという,新しいテクスライトウェイトなディープニューラルネットワークベースのフレームワークを提案する。
本フレームワークは,高分解能かつテクテッセロ中心の残像を学習し,シーンの空間的詳細を高頻度で表現する。
論文 参考訳(メタデータ) (2020-06-18T06:32:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。