論文の概要: Very Lightweight Photo Retouching Network with Conditional Sequential
Modulation
- arxiv url: http://arxiv.org/abs/2104.06279v1
- Date: Tue, 13 Apr 2021 15:11:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-14 13:40:59.069989
- Title: Very Lightweight Photo Retouching Network with Conditional Sequential
Modulation
- Title(参考訳): 条件付きシーケンシャル変調を用いた超軽量フォトリタッチネットワーク
- Authors: Yihao Liu, Jingwen He, Xiangyu Chen, Zhengwen Zhang, Hengyuan Zhao,
Chao Dong, Yu Qiao
- Abstract要約: 極めて軽量なフレームワーク-条件付き逐次リタッチネットワーク(CSRNet)を提案する。
CSRNetは37K未満のトレーニング可能なパラメータしか含まないが、これは既存の学習ベースの手法よりも桁違いに小さい。
実験では、ベンチマークMIT-Adobe FiveKデータセットで最新のパフォーマンスを達成した。
- 参考スコア(独自算出の注目度): 42.311196534333284
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Photo retouching aims at improving the aesthetic visual quality of images
that suffer from photographic defects such as poor contrast, over/under
exposure, and inharmonious saturation. In practice, photo retouching can be
accomplished by a series of image processing operations. As most commonly-used
retouching operations are pixel-independent, i.e., the manipulation on one
pixel is uncorrelated with its neighboring pixels, we can take advantage of
this property and design a specialized algorithm for efficient global photo
retouching. We analyze these global operations and find that they can be
mathematically formulated by a Multi-Layer Perceptron (MLP). Based on this
observation, we propose an extremely lightweight framework -- Conditional
Sequential Retouching Network (CSRNet). Benefiting from the utilization of
$1\times1$ convolution, CSRNet only contains less than 37K trainable
parameters, which are orders of magnitude smaller than existing learning-based
methods. Experiments show that our method achieves state-of-the-art performance
on the benchmark MIT-Adobe FiveK dataset quantitively and qualitatively. In
addition to achieve global photo retouching, the proposed framework can be
easily extended to learn local enhancement effects. The extended model, namly
CSRNet-L, also achieves competitive results in various local enhancement tasks.
Codes will be available.
- Abstract(参考訳): フォトリタッチは、コントラストの低下、露出の過剰/アンダー、不調和といった写真の欠陥に苦しむ画像の美的視覚品質を改善することを目的としている。
実際には、一連の画像処理操作によって、写真のリタッチを行うことができる。
最も一般的に使用されているリタッチ操作はピクセルに依存しない、すなわち1ピクセルの操作はその隣接するピクセルとは無関係であるため、この特性を利用し、効率的なグローバルフォトリタッチのための特別なアルゴリズムを設計することができる。
これらのグローバルな操作を分析し,MLP(Multi-Layer Perceptron)によって数学的に定式化できることを示す。
この観察に基づいて,極めて軽量なフレームワークである条件付きシーケンシャルリタッチネットワーク(csrnet)を提案する。
CSRNetは$1\times1$の畳み込みを利用しており、既存の学習ベースの手法よりも桁違い小さい37Kのトレーニング可能なパラメータしか含まない。
実験により,提案手法はMIT-Adobe FiveK ベンチマークを用いて,定量的かつ定性的に,最先端の性能を実現することを示す。
グローバルな写真リタッチを実現することに加えて,提案フレームワークは局所的な拡張効果を学習するために容易に拡張することができる。
CSRNet-Lと呼ばれる拡張モデルは、様々なローカル拡張タスクにおいて競合する結果を得る。
コードは利用可能だ。
関連論文リスト
- Simple Image Signal Processing using Global Context Guidance [56.41827271721955]
ディープラーニングベースのISPは、深層ニューラルネットワークを使用してRAW画像をDSLRライクなRGBイメージに変換することを目指している。
我々は,全RAW画像からグローバルなコンテキスト情報をキャプチャするために,任意のニューラルISPに統合可能な新しいモジュールを提案する。
本モデルでは,多種多様な実スマートフォン画像を用いて,様々なベンチマークで最新の結果が得られる。
論文 参考訳(メタデータ) (2024-04-17T17:11:47Z) - Efficient Model Agnostic Approach for Implicit Neural Representation
Based Arbitrary-Scale Image Super-Resolution [5.704360536038803]
単一の画像超解像(SISR)は、主に深層畳み込みネットワークによって大きく進歩した。
従来のネットワークは、画像を一定のスケールにスケールアップすることに限定されており、任意のスケールのイメージを生成するために暗黙の神経機能を利用することになる。
我々は,任意のスケールで超解像を実現する,新しい,効率的なフレームワークであるMixture of Experts Implicit Super-Resolution(MoEISR)を導入する。
論文 参考訳(メタデータ) (2023-11-20T05:34:36Z) - SCRNet: a Retinex Structure-based Low-light Enhancement Model Guided by
Spatial Consistency [22.54951703413469]
本稿では,SCRNet(Spatial Consistency Retinex Network)と呼ばれる,新しい低照度画像強調モデルを提案する。
提案モデルでは, 空間的整合性の原理に着想を得て, チャネルレベル, セマンティックレベル, テクスチャレベルという3つのレベルの整合性を考慮した。
様々な低照度画像データセットに対する広範囲な評価は、提案したSCRNetが既存の最先端手法より優れていることを示している。
論文 参考訳(メタデータ) (2023-05-14T03:32:19Z) - LR-CSNet: Low-Rank Deep Unfolding Network for Image Compressive Sensing [19.74767410530179]
深部展開型ネットワーク(DUN)は、圧縮センシング(CS)に有効なアプローチであることが証明されている。
本研究では,自然画像CSのための低ランクCSネットワーク(LR-CSNet)を提案する。
広範に検討された3つのデータセットに対する実験は、LR-CSNetの有望な性能を示す。
論文 参考訳(メタデータ) (2022-12-18T13:54:11Z) - Controllable Image Enhancement [66.18525728881711]
いくつかのパラメータを制御して、複数のスタイルで高品質な画像を生成できる半自動画像強調アルゴリズムを提案する。
エンコーダ・デコーダフレームワークは、リタッチスキルを潜在コードにエンコードし、イメージ信号処理機能のパラメータにデコードする。
論文 参考訳(メタデータ) (2022-06-16T23:54:53Z) - High-Quality Pluralistic Image Completion via Code Shared VQGAN [51.7805154545948]
高速な推論速度で高品質と多様性を両立させることができる多元画像補完のための新しい枠組みを提案する。
我々のフレームワークは、セマンティックにリッチな離散的なコードを効率的かつ堅牢に学習することができ、画像再構成の品質が大幅に向上する。
論文 参考訳(メタデータ) (2022-04-05T01:47:35Z) - SPI-GAN: Towards Single-Pixel Imaging through Generative Adversarial
Network [6.722629246312285]
本稿では,SPI-GANと呼ばれる一画素イメージングのための生成的対向的ネットワークベース再構成フレームワークを提案する。
サンプリング比が5%に低下しても、17.92dBのPSNRと0.487のSSIMで画像を再構成することができる。
論文 参考訳(メタデータ) (2021-07-03T03:06:09Z) - Conditional Sequential Modulation for Efficient Global Image Retouching [45.99310982782054]
フォトリタッチは、露出過度、コントラストの低さ、不調和な彩度といった写真的欠陥に悩まされる画像の美的品質を高めることを目的としている。
本稿では,一般的に使用されているリタッチ操作について検討し,これらの画素非依存演算が多層パーセプトロン(MLP)によって近似あるいは定式化可能であることを数学的に確認する。
我々は,効率的なグローバル画像リタッチのための非常に軽量なフレームワークであるSequential Retouching Network (CSRNet)を提案する。
論文 参考訳(メタデータ) (2020-09-22T08:32:04Z) - Steering Self-Supervised Feature Learning Beyond Local Pixel Statistics [60.92229707497999]
画像の特定の変換の識別に基づく自己教師型特徴学習の新しい原理を提案する。
実験により,LCI,画像ワープ,回転などの変換を識別する学習が,技術一般化能力の状態を特徴付けることを示した。
論文 参考訳(メタデータ) (2020-04-05T22:09:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。