論文の概要: Goal Conditioned Reinforcement Learning for Photo Finishing Tuning
- arxiv url: http://arxiv.org/abs/2503.07300v1
- Date: Mon, 10 Mar 2025 13:20:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:45:59.067469
- Title: Goal Conditioned Reinforcement Learning for Photo Finishing Tuning
- Title(参考訳): ゴール条件付き強化学習によるフォトフィニッシュチューニング
- Authors: Jiarui Wu, Yujin Wang, Lingen Li, Zhang Fan, Tianfan Xue,
- Abstract要約: フォトフィニッシュチューニングは、Adobe LightroomやDarktableのような、写真フィニッシュパイプラインのマニュアルチューニングプロセスを自動化することを目的としている。
本稿では,ゴールイメージを条件としてパラメータを効率的にチューニングする,新しい目標条件強化学習フレームワークを提案する。
本手法の利点を実証するため,写真仕上げチューニングと写真スタイル化チューニングタスクについて詳細な実験を行った。
- 参考スコア(独自算出の注目度): 3.482833958555655
- License:
- Abstract: Photo finishing tuning aims to automate the manual tuning process of the photo finishing pipeline, like Adobe Lightroom or Darktable. Previous works either use zeroth-order optimization, which is slow when the set of parameters increases, or rely on a differentiable proxy of the target finishing pipeline, which is hard to train. To overcome these challenges, we propose a novel goal-conditioned reinforcement learning framework for efficiently tuning parameters using a goal image as a condition. Unlike previous approaches, our tuning framework does not rely on any proxy and treats the photo finishing pipeline as a black box. Utilizing a trained reinforcement learning policy, it can efficiently find the desired set of parameters within just 10 queries, while optimization based approaches normally take 200 queries. Furthermore, our architecture utilizes a goal image to guide the iterative tuning of pipeline parameters, allowing for flexible conditioning on pixel-aligned target images, style images, or any other visually representable goals. We conduct detailed experiments on photo finishing tuning and photo stylization tuning tasks, demonstrating the advantages of our method. Project website: https://openimaginglab.github.io/RLPixTuner/.
- Abstract(参考訳): フォトフィニッシュチューニングは、Adobe LightroomやDarktableのような、写真フィニッシュパイプラインのマニュアルチューニングプロセスを自動化することを目的としている。
以前の作業では、パラメータのセットが増加すると遅くなるゼロ階最適化や、トレーニングが難しいターゲットフィニッシュパイプラインの差別化可能なプロキシが使用されていた。
これらの課題を克服するために,目標画像を条件としてパラメータを効率的にチューニングする新しい目標条件強化学習フレームワークを提案する。
従来のアプローチとは異なり、チューニングフレームワークはプロキシを一切依存せず、フォトフィニッシュパイプラインをブラックボックスとして扱う。
トレーニングされた強化学習ポリシを利用することで、必要なパラメータセットを10クエリ内で効率的に見つけることができ、最適化ベースのアプローチでは通常は200クエリが使用される。
さらに,本アーキテクチャでは,目標画像を用いてパイプラインパラメータの反復的チューニングを導出し,画素配列のターゲット画像やスタイル画像,その他の視覚的に表現可能な目標に対するフレキシブルな条件付けを可能にする。
本手法の利点を実証するため,写真仕上げチューニングと写真スタイル化チューニングタスクについて詳細な実験を行った。
プロジェクトウェブサイト: https://openimaginglab.github.io/RLPixTuner/。
関連論文リスト
- Tuning-Free Visual Customization via View Iterative Self-Attention Control [10.657829781274254]
この課題に対処するために、textitView Iterative Self-Attention Control (VisCtrl)を提案する。
VisCtrlは、ターゲット画像中の別の被写体にユーザ特定被写体の外観と構造を注入する、トレーニング不要な方法である。
提案手法は,数ステップで1つの参照画像のみを用いて一貫した,調和的な編集を行う。
論文 参考訳(メタデータ) (2024-06-10T13:41:10Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Bridging Vision and Language Encoders: Parameter-Efficient Tuning for
Referring Image Segmentation [72.27914940012423]
画像セグメンテーションの参照における効率的なチューニング問題について検討する。
クロスモーダル情報交換を容易にするBridgerと呼ばれる新しいアダプタを提案する。
画像分割のための軽量デコーダも設計する。
論文 参考訳(メタデータ) (2023-07-21T12:46:15Z) - Crowd-Powered Photo Enhancement Featuring an Active Learning Based Local
Filter [42.400427631514596]
コンテンツ認識型ローカルエンハンスメントのための,クラウドを利用したローカルエンハンスメント手法を提案する。
パラメータの局所最適化を容易にするために,能動的学習に基づく局所フィルタを提案する。
実験の結果,提案フィルタは既存のフィルタよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-06-15T17:55:11Z) - Controllable Image Enhancement [66.18525728881711]
いくつかのパラメータを制御して、複数のスタイルで高品質な画像を生成できる半自動画像強調アルゴリズムを提案する。
エンコーダ・デコーダフレームワークは、リタッチスキルを潜在コードにエンコードし、イメージ信号処理機能のパラメータにデコードする。
論文 参考訳(メタデータ) (2022-06-16T23:54:53Z) - Pruning-as-Search: Efficient Neural Architecture Search via Channel
Pruning and Structural Reparameterization [50.50023451369742]
プルーニング・アズ・サーチ(Pruning-as-Search、PaS)は、必要なサブネットワークを自動的に効率的に検索するエンドツーエンドのプルーニング手法である。
提案したアーキテクチャは,ImageNet-1000分類タスクにおいて,1.0%$ Top-1精度で先行技術より優れていた。
論文 参考訳(メタデータ) (2022-06-02T17:58:54Z) - I-Tuning: Tuning Language Models with Image for Caption Generation [9.511101155155957]
本研究では,凍結したPLMをキャプション生成のための画像で調整する新たな視点を提案する。
我々は,この手法をI-Tuningと表現し,画像から視覚情報を自動フィルタリングし,PLMの出力隠れ状態を調整する。
論文 参考訳(メタデータ) (2022-02-14T09:36:50Z) - DSRN: an Efficient Deep Network for Image Relighting [8.346635942881722]
深い画像リライトにより、照明固有のリタッチによる自動写真強化が可能。
本稿では,画像リライトのための効率的なリアルタイムフレームワークであるDeep Stacked Relighting Network (DSRN)を提案する。
我々のモデルは非常に軽量で、総サイズは約42MBで、解像度1024×1024$のイメージに対して平均推定時間は約0.0116sである。
論文 参考訳(メタデータ) (2021-02-18T09:54:15Z) - Self-Tuning Stochastic Optimization with Curvature-Aware Gradient
Filtering [53.523517926927894]
サンプルごとのHessian-vector積と勾配を用いて、自己チューニングの二次構造を構築する。
モデルに基づく手続きが雑音勾配設定に収束することを証明する。
これは自己チューニング二次体を構築するための興味深いステップである。
論文 参考訳(メタデータ) (2020-11-09T22:07:30Z) - Powers of layers for image-to-image translation [60.5529622990682]
本稿では,未ペア画像から画像への変換タスクに対処するシンプルなアーキテクチャを提案する。
固定重み付きイメージオートエンコーダアーキテクチャから始める。
各タスクに対して、潜在空間で動作している残留ブロックを学習し、ターゲット領域に到達するまで繰り返し呼び出される。
論文 参考訳(メタデータ) (2020-08-13T09:02:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。