論文の概要: Conditional Sequential Modulation for Efficient Global Image Retouching
- arxiv url: http://arxiv.org/abs/2009.10390v1
- Date: Tue, 22 Sep 2020 08:32:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 22:43:53.078541
- Title: Conditional Sequential Modulation for Efficient Global Image Retouching
- Title(参考訳): 効率的なグローバル画像修正のための条件系列変調
- Authors: Jingwen He, Yihao Liu, Yu Qiao, and Chao Dong
- Abstract要約: フォトリタッチは、露出過度、コントラストの低さ、不調和な彩度といった写真的欠陥に悩まされる画像の美的品質を高めることを目的としている。
本稿では,一般的に使用されているリタッチ操作について検討し,これらの画素非依存演算が多層パーセプトロン(MLP)によって近似あるいは定式化可能であることを数学的に確認する。
我々は,効率的なグローバル画像リタッチのための非常に軽量なフレームワークであるSequential Retouching Network (CSRNet)を提案する。
- 参考スコア(独自算出の注目度): 45.99310982782054
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Photo retouching aims at enhancing the aesthetic visual quality of images
that suffer from photographic defects such as over/under exposure, poor
contrast, inharmonious saturation. Practically, photo retouching can be
accomplished by a series of image processing operations. In this paper, we
investigate some commonly-used retouching operations and mathematically find
that these pixel-independent operations can be approximated or formulated by
multi-layer perceptrons (MLPs). Based on this analysis, we propose an extremely
light-weight framework - Conditional Sequential Retouching Network (CSRNet) -
for efficient global image retouching. CSRNet consists of a base network and a
condition network. The base network acts like an MLP that processes each pixel
independently and the condition network extracts the global features of the
input image to generate a condition vector. To realize retouching operations,
we modulate the intermediate features using Global Feature Modulation (GFM), of
which the parameters are transformed by condition vector. Benefiting from the
utilization of $1\times1$ convolution, CSRNet only contains less than 37k
trainable parameters, which is orders of magnitude smaller than existing
learning-based methods. Extensive experiments show that our method achieves
state-of-the-art performance on the benchmark MIT-Adobe FiveK dataset
quantitively and qualitatively. Code is available at
https://github.com/hejingwenhejingwen/CSRNet.
- Abstract(参考訳): photo retouchingは、露出の過剰/アンダー、コントラストの低下、不調和といった写真の欠陥に苦しむ画像の美的視覚品質を向上させることを目的としている。
実際に、写真のリタッチは一連の画像処理操作によって実現できる。
本稿では,よく使われるリタッチ操作について検討し,画素非依存操作を多層パーセプトロン(mlps)で近似あるいは定式化できることを数学的に確認する。
本研究では,より効率的なグローバルイメージリタッチを実現するための超軽量フレームワークである条件付きシーケンシャルリタッチネットワーク(csrnet)を提案する。
CSRNetはベースネットワークと条件ネットワークで構成されている。
ベースネットワークは各画素を独立して処理するMLPとして機能し、条件ネットワークは入力画像のグローバルな特徴を抽出して条件ベクトルを生成する。
修正操作を実現するために,条件ベクトルによってパラメータが変換されるGlobal Feature Modulation (GFM)を用いて中間特徴を変調する。
CSRNetは$1\times1$の畳み込みを利用しており、既存の学習ベースの手法よりも桁違い小さい37k以下のトレーニング可能なパラメータしか含まない。
実験の結果,この手法はMIT-Adobe FiveKのベンチマークを用いて,定量的かつ定性的に,最先端の性能を実現することがわかった。
コードはhttps://github.com/hejingwenhejingwen/csrnetで入手できる。
関連論文リスト
- Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - Efficient Model Agnostic Approach for Implicit Neural Representation
Based Arbitrary-Scale Image Super-Resolution [5.704360536038803]
単一の画像超解像(SISR)は、主に深層畳み込みネットワークによって大きく進歩した。
従来のネットワークは、画像を一定のスケールにスケールアップすることに限定されており、任意のスケールのイメージを生成するために暗黙の神経機能を利用することになる。
我々は,任意のスケールで超解像を実現する,新しい,効率的なフレームワークであるMixture of Experts Implicit Super-Resolution(MoEISR)を導入する。
論文 参考訳(メタデータ) (2023-11-20T05:34:36Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - LR-CSNet: Low-Rank Deep Unfolding Network for Image Compressive Sensing [19.74767410530179]
深部展開型ネットワーク(DUN)は、圧縮センシング(CS)に有効なアプローチであることが証明されている。
本研究では,自然画像CSのための低ランクCSネットワーク(LR-CSNet)を提案する。
広範に検討された3つのデータセットに対する実験は、LR-CSNetの有望な性能を示す。
論文 参考訳(メタデータ) (2022-12-18T13:54:11Z) - Effective Invertible Arbitrary Image Rescaling [77.46732646918936]
Invertible Neural Networks (INN)は、ダウンスケーリングとアップスケーリングのサイクルを共同で最適化することにより、アップスケーリングの精度を大幅に向上させることができる。
本研究の1つのモデルのみをトレーニングすることにより、任意の画像再スケーリングを実現するために、単純で効果的な非可逆的再スケーリングネットワーク(IARN)を提案する。
LR出力の知覚品質を損なうことなく、双方向任意再スケーリングにおいて最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-09-26T22:22:30Z) - Deep Amended Gradient Descent for Efficient Spectral Reconstruction from
Single RGB Images [42.26124628784883]
本稿では、AGD-Netという、コンパクトで効率的でエンドツーエンドの学習ベースのフレームワークを提案する。
まず、古典的勾配降下アルゴリズムに基づいて問題を明示的に定式化する。
AGD-Netは、平均1.0dB以上のリコンストラクション品質を向上させることができる。
論文 参考訳(メタデータ) (2021-08-12T05:54:09Z) - Very Lightweight Photo Retouching Network with Conditional Sequential
Modulation [42.311196534333284]
極めて軽量なフレームワーク-条件付き逐次リタッチネットワーク(CSRNet)を提案する。
CSRNetは37K未満のトレーニング可能なパラメータしか含まないが、これは既存の学習ベースの手法よりも桁違いに小さい。
実験では、ベンチマークMIT-Adobe FiveKデータセットで最新のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2021-04-13T15:11:02Z) - Steering Self-Supervised Feature Learning Beyond Local Pixel Statistics [60.92229707497999]
画像の特定の変換の識別に基づく自己教師型特徴学習の新しい原理を提案する。
実験により,LCI,画像ワープ,回転などの変換を識別する学習が,技術一般化能力の状態を特徴付けることを示した。
論文 参考訳(メタデータ) (2020-04-05T22:09:08Z) - PCSGAN: Perceptual Cyclic-Synthesized Generative Adversarial Networks
for Thermal and NIR to Visible Image Transformation [17.205434613674104]
これらの問題に対処するため,PCSGAN (Perceptual Cyclic-Synthesized Generative Adrial Network) が導入された。
PCSGANは、画素単位での逆損失(すなわち特徴ベース)と逆損失の組み合わせを使用する。
提案したPCSGANは, Pix2pix, DualGAN, CycleGAN, PS2GAN, PANなどの最先端画像モデルよりも, SSIM, MSE, PSNR, LPIPS評価の点で優れている。
論文 参考訳(メタデータ) (2020-02-13T11:55:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。