論文の概要: 4D LUT: Learnable Context-Aware 4D Lookup Table for Image Enhancement
- arxiv url: http://arxiv.org/abs/2209.01749v1
- Date: Mon, 5 Sep 2022 04:00:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 15:04:14.449537
- Title: 4D LUT: Learnable Context-Aware 4D Lookup Table for Image Enhancement
- Title(参考訳): 4d lut: 学習可能なコンテキストアウェアな4dルックアップテーブル
- Authors: Chengxu Liu, Huan Yang, Jianlong Fu, Xueming Qian
- Abstract要約: 学習可能なコンテキスト対応4次元ルックアップテーブル(4D LUT)を提案する。
写真コンテキストを適応的に学習することで、各画像内の異なる内容のコンテンツ依存的な拡張を実現する。
従来の3D LUT、すなわちRGBへのRGBマッピングと比較して、4D LUTは画像ごとに異なる内容の画素の色変換をより細かく制御できる。
- 参考スコア(独自算出の注目度): 50.49396123016185
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image enhancement aims at improving the aesthetic visual quality of photos by
retouching the color and tone, and is an essential technology for professional
digital photography. Recent years deep learning-based image enhancement
algorithms have achieved promising performance and attracted increasing
popularity. However, typical efforts attempt to construct a uniform enhancer
for all pixels' color transformation. It ignores the pixel differences between
different content (e.g., sky, ocean, etc.) that are significant for
photographs, causing unsatisfactory results. In this paper, we propose a novel
learnable context-aware 4-dimensional lookup table (4D LUT), which achieves
content-dependent enhancement of different contents in each image via
adaptively learning of photo context. In particular, we first introduce a
lightweight context encoder and a parameter encoder to learn a context map for
the pixel-level category and a group of image-adaptive coefficients,
respectively. Then, the context-aware 4D LUT is generated by integrating
multiple basis 4D LUTs via the coefficients. Finally, the enhanced image can be
obtained by feeding the source image and context map into fused context-aware
4D~LUT via quadrilinear interpolation. Compared with traditional 3D LUT, i.e.,
RGB mapping to RGB, which is usually used in camera imaging pipeline systems or
tools, 4D LUT, i.e., RGBC(RGB+Context) mapping to RGB, enables finer control of
color transformations for pixels with different content in each image, even
though they have the same RGB values. Experimental results demonstrate that our
method outperforms other state-of-the-art methods in widely-used benchmarks.
- Abstract(参考訳): 画像強調は、色やトーンを変えることで写真の美的視覚的品質を向上させることを目的としており、プロのデジタル写真に欠かせない技術である。
近年,ディープラーニングに基づく画像強調アルゴリズムは有望な性能を達成し,人気が高まっている。
しかし、典型的な試みは、すべてのピクセルの色変換の均一なエンハンサーを構築しようとするものである。
これは、写真に重要な異なるコンテンツ(例えば、空、海など)のピクセル差を無視し、不満足な結果をもたらす。
本稿では,写真コンテキストを適応的に学習することで,各画像内の異なる内容のコンテンツ依存的な拡張を実現する,学習可能なコンテキスト対応4次元ルックアップテーブル(4D LUT)を提案する。
特に,まず,画素レベルカテゴリのコンテキストマップと画像適応係数のグループを学習するために,軽量なコンテキストエンコーダとパラメータエンコーダを導入する。
そして、この係数を介して複数のベース4D LUTを統合することにより、コンテキスト対応4D LUTを生成する。
最後に、ソース画像とコンテキストマップを4次線形補間により融合したコンテキスト認識4D〜LUTに入力することにより、拡張画像を得ることができる。
従来の3dlut、すなわちrgbからrgbへのマッピングは、カメライメージングパイプラインシステムやツール、すなわちrgbへの4dlut、すなわちrgbへのrgbc(rgb+context)マッピングで一般的に使用される。
実験の結果,本手法は広く使用されているベンチマークにおいて,他の最先端手法よりも優れていることがわかった。
関連論文リスト
- Simple Image Signal Processing using Global Context Guidance [56.41827271721955]
ディープラーニングベースのISPは、深層ニューラルネットワークを使用してRAW画像をDSLRライクなRGBイメージに変換することを目指している。
我々は,全RAW画像からグローバルなコンテキスト情報をキャプチャするために,任意のニューラルISPに統合可能な新しいモジュールを提案する。
本モデルでは,多種多様な実スマートフォン画像を用いて,様々なベンチマークで最新の結果が得られる。
論文 参考訳(メタデータ) (2024-04-17T17:11:47Z) - Enhancing RAW-to-sRGB with Decoupled Style Structure in Fourier Domain [27.1716081216131]
現在の方法では、携帯電話のRAW画像とDSLRカメラのRGB画像の違いを無視する。
本稿では、新しいNeural ISPフレームワーク、FourierISPを紹介する。
このアプローチは、画像を周波数領域内のスタイルと構造に分解し、独立した最適化を可能にする。
論文 参考訳(メタデータ) (2024-01-04T09:18:31Z) - Transform your Smartphone into a DSLR Camera: Learning the ISP in the
Wild [159.71025525493354]
本稿では,スマートフォンが取得したRAW画像に基づいて,DSLRの品質画像を生成する訓練可能な画像信号処理フレームワークを提案する。
トレーニング画像ペア間の色ずれに対処するために、カラー条件ISPネットワークを使用し、各入力RAWと基準DSLR画像間の新しいパラメトリック色マッピングを最適化する。
論文 参考訳(メタデータ) (2022-03-20T20:13:59Z) - Saliency Enhancement using Superpixel Similarity [77.34726150561087]
Saliency Object Detection (SOD) は画像解析にいくつかの応用がある。
深層学習に基づくSOD法は最も効果的であるが、類似した色を持つ前景の部品を見逃すことがある。
スーパーピクセル類似性(SESS)に対するtextitSaliency Enhancement というポストプロセッシング手法を導入する。
我々は,SESSが5つの画像データセット上での3つのディープラーニングに基づくSOD手法の結果を連続的に,かつ著しく改善できることを実証した。
論文 参考訳(メタデータ) (2021-12-01T17:22:54Z) - RGB-D Image Inpainting Using Generative Adversarial Network with a Late
Fusion Approach [14.06830052027649]
Diminished Realityは、ビデオ画像からオブジェクトを取り除き、行方不明の領域を可視画素で埋めることを目的とした技術だ。
生成逆数ネットワークを用いたRGB-D画像の描画手法を提案する。
論文 参考訳(メタデータ) (2021-10-14T14:44:01Z) - Colored Point Cloud to Image Alignment [15.828285556159026]
そこで本研究では,カラーマッチングと幾何マッチングにより,色付き点雲を所定の色画像に整列する微分最適化手法を提案する。
カメラ画像と点雲の色との変換は、点雲の相対的な位置と一致した色とのマッチングを繰り返すことによって行う。
論文 参考訳(メタデータ) (2021-10-07T08:12:56Z) - Learning Image-adaptive 3D Lookup Tables for High Performance Photo
Enhancement in Real-time [33.93249921871407]
本稿では,画像適応型3次元ルックアップテーブル(3D LUT)を学習し,高速でロバストな画像強調を実現する。
アノテーション付きデータからペアワイドやアンペアラーニングを用いて3D LUTを学習する。
我々は、複数のベース3D LUTと小さな畳み込みニューラルネットワーク(CNN)をエンドツーエンドで同時に学習する。
論文 参考訳(メタデータ) (2020-09-30T06:34:57Z) - Geometric Correspondence Fields: Learned Differentiable Rendering for 3D
Pose Refinement in the Wild [96.09941542587865]
野生の任意のカテゴリのオブジェクトに対する微分可能レンダリングに基づく新しい3次元ポーズ精細化手法を提案する。
このようにして、3DモデルとRGB画像のオブジェクトを正確に整列し、3Dポーズ推定を大幅に改善する。
我々は、Pix3Dデータセットの挑戦に対するアプローチを評価し、複数のメトリクスにおける最先端の精錬手法と比較して、最大55%の改善を実現した。
論文 参考訳(メタデータ) (2020-07-17T12:34:38Z) - 3D Photography using Context-aware Layered Depth Inpainting [50.66235795163143]
本稿では、1枚のRGB-D入力画像を3D写真に変換する方法を提案する。
学習に基づく着色モデルでは,新しい局所的な色と深度を隠蔽領域に合成する。
結果の3D写真は、モーションパララックスで効率よくレンダリングできる。
論文 参考訳(メタデータ) (2020-04-09T17:59:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。