Fugu-MT 論文翻訳(概要): TreEnhance: An Automatic Tree-Search Based Method for Low-Light Image Enhancement

論文の概要: TreEnhance: An Automatic Tree-Search Based Method for Low-Light Image Enhancement

arxiv url: http://arxiv.org/abs/2205.12639v1
Date: Wed, 25 May 2022 10:33:55 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-26 15:29:37.464081
Title: TreEnhance: An Automatic Tree-Search Based Method for Low-Light Image Enhancement
Title（参考訳）: TreEnhance: 低照度画像強調のための自動木探索方式
Authors: Marco Cotogni, Claudio Cusano
Abstract要約: 本稿では、低照度画像強調のための自動方法であるTreEnhanceを提案する。この方法は木探索理論、特にモンテカルロ木探索(MCTS)アルゴリズムと深い強化学習を組み合わせたものである。 TreEnhanceはイメージ解像度に制約を課さず、最小限のチューニングでさまざまなシナリオで使用することができる。
参考スコア（独自算出の注目度）: 5.617903764268157
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: In this paper we present TreEnhance, an automatic method for low-light image enhancement capable of improving the quality of digital images. The method combines tree search theory, and in particular the Monte Carlo Tree Search (MCTS) algorithm, with deep reinforcement learning. Given as input a low-light image, TreEnhance produces as output its enhanced version together with the sequence of image editing operations used to obtain it. The method repeatedly alternates two main phases. In the generation phase a modified version of MCTS explores the space of image editing operations and selects the most promising sequence. In the optimization phase the parameters of a neural network, implementing the enhancement policy, are updated. After training, two different inference solutions are proposed for the enhancement of new images: one is based on MCTS and is more accurate but more time and memory consuming; the other directly applies the learned policy and is faster but slightly less precise. Unlike other methods from the state of the art, TreEnhance does not pose any constraint on the image resolution and can be used in a variety of scenarios with minimal tuning. We tested the method on two datasets: the Low-Light dataset and the Adobe Five-K dataset obtaining good results from both a qualitative and a quantitative point of view.
Abstract（参考訳）: 本稿では,デジタル画像の品質向上が可能な低照度画像強調自動手法であるTreEnhanceを提案する。この方法は木探索理論、特にモンテカルロ木探索(MCTS)アルゴリズムと深い強化学習を組み合わせたものである。ローライト画像が入力されると、TreEnhanceはその拡張バージョンを出力として生成し、画像編集操作のシーケンスを出力する。この方法は2つの主要なフェーズを繰り返す。生成フェーズでは、MCTSの修正版が画像編集操作の空間を探索し、最も有望なシーケンスを選択する。最適化フェーズでは、強化ポリシーを実装したニューラルネットワークのパラメータが更新される。トレーニング後、2つの異なる推論ソリューションが新しい画像の強化のために提案されている: 1つはMCTSに基づいており、より正確であるが、時間とメモリの消費がより多く、もう1つは直接学習ポリシーを適用し、より速く、わずかに正確ではない。最先端の他の方法とは異なり、TreEnhanceは画像解像度に制約を課さず、最小限のチューニングでさまざまなシナリオで使用することができる。低照度データセットとadobe 5-kデータセットという2つのデータセットでこの手法をテストし、質的および定量的な観点から良い結果を得た。

関連論文リスト

Entropy-Driven Genetic Optimization for Deep-Feature-Guided Low-Light Image Enhancement [1.0428401220897083]
NSGA-IIアルゴリズムによって導かれる、教師なし、ファジィにインスパイアされた画像強調フレームワークを提案する。我々は,複数の目標,すなわち画像エントロピーの増大,知覚的類似性の向上,適切な明るさを維持するために,GPU加速NSGA-IIアルゴリズムを用いる。本モデルでは, 平均BRISQUEとNIQEのスコアが19.82と3.652であり, 全ての未ペアデータセットにおいて優れた性能を示す。
論文参考訳（メタデータ） (2025-05-16T13:40:56Z)
Generating Multi-Image Synthetic Data for Text-to-Image Customization [48.59231755159313]
テキスト・ツー・イメージ・モデルのカスタマイズにより、ユーザーはカスタムのコンセプトを挿入し、目に見えない設定でコンセプトを生成することができる。既存の方法は、コストのかかるテストタイム最適化か、マルチイメージの監督なしにシングルイメージのトレーニングデータセットのトレーニングエンコーダに依存している。両制約に対処する簡単なアプローチを提案する。
論文参考訳（メタデータ） (2025-02-03T18:59:41Z)
Diffusion-Enhanced Test-time Adaptation with Text and Image Augmentation [67.37146712877794]
IT3Aは、未知の新しいドメインから各テストサンプルをマルチモーダル拡張するために、事前訓練された生成モデルを利用する新しいテスト時間適応手法である。事前学習された視覚と言語モデルからの強化されたデータを組み合わせることで、未知の新しいテストデータに適応するモデルの能力を高めることができる。ゼロショット設定では、IT3Aは5.50%の精度で最先端のテスト時間プロンプトチューニング手法より優れている。
論文参考訳（メタデータ） (2024-12-12T20:01:24Z)
GraPE: A Generate-Plan-Edit Framework for Compositional T2I Synthesis [10.47359822447001]
本稿では,複雑な多段階生成のタスクを3段階に分解する,T2I合成の代替パラダイムを提案する。提案手法は,モジュール性が高く,トレーニングが自由であり,画像生成モデルと編集モデルの組み合わせに対して適用可能であるという事実から,その強みを導出する。
論文参考訳（メタデータ） (2024-12-08T22:29:56Z)
Optimizing CLIP Models for Image Retrieval with Maintained Joint-Embedding Alignment [0.7499722271664144]
Contrastive Language and Image Pairing (CLIP) はマルチメディア検索における変換手法である。 CLIPは通常、2つのニューラルネットワークを同時にトレーニングし、テキストとイメージペアのジョイント埋め込みを生成する。本稿では,様々な画像に基づく類似性検索シナリオに対して,CLIPモデルを最適化するという課題に対処する。
論文参考訳（メタデータ） (2024-09-03T14:33:01Z)
CodeEnhance: A Codebook-Driven Approach for Low-Light Image Enhancement [97.95330185793358]
低照度画像強調(LLIE)は、低照度画像を改善することを目的としている。既存の手法では、様々な明るさ劣化からの回復の不確実性と、テクスチャと色情報の喪失という2つの課題に直面している。我々は、量子化された先行値と画像の精細化を利用して、新しいエンハンスメント手法、CodeEnhanceを提案する。
論文参考訳（メタデータ） (2024-04-08T07:34:39Z)
Consolidating Attention Features for Multi-view Image Editing [126.19731971010475]
本研究では,空間制御に基づく幾何学的操作に着目し,様々な視点にまたがって編集プロセスを統合する手法を提案する。編集画像の内部クエリ機能に基づいて訓練されたニューラルラジアンス場QNeRFを紹介する。拡散時間の経過とともにクエリをよりよく統合する、プログレッシブで反復的な手法により、プロセスを洗練します。
論文参考訳（メタデータ） (2024-02-22T18:50:18Z)
Exposure Bracketing is All You Need for Unifying Image Restoration and Enhancement Tasks [50.822601495422916]
本稿では,露光ブラケット写真を利用して画像復元と拡張作業を統合することを提案する。実世界のペアの収集が困難であるため,まず合成ペアデータを用いてモデルを事前学習する手法を提案する。特に,時間変調リカレントネットワーク(TMRNet)と自己教師あり適応手法を提案する。
論文参考訳（メタデータ） (2024-01-01T14:14:35Z)
HybridMIM: A Hybrid Masked Image Modeling Framework for 3D Medical Image Segmentation [29.15746532186427]
HybridMIMは3次元医用画像セグメンテーションのためのマスク付き画像モデリングに基づく新しいハイブリッド自己教師型学習手法である。医用画像の意味情報を3段階に分けて学習し,1)3次元画像の重要な内容を再構成する部分領域予測を行うことにより,トレーニング前の時間負担を大幅に軽減する。提案するフレームワークは,エンコーダバックボーンとしてCNNとトランスフォーマーの両方をサポートするとともに,イメージセグメンテーションのためのデコーダの事前トレーニングも可能である。
論文参考訳（メタデータ） (2023-03-18T04:43:12Z)
Text-to-Image Generation via Implicit Visual Guidance and Hypernetwork [38.55086153299993]
我々は、暗黙的な視覚誘導損失と生成目的の組み合わせにより、追加の検索画像を受け入れるテキスト・画像生成のためのアプローチを開発する。符号化層の重み更新を予測するために,新しいハイパーネットワーク変調型ビジュアルテキスト符号化方式を提案する。実験の結果,既存のGANモデルよりも優れた検索ビジュアルデータを付加したモデルが導出された。
論文参考訳（メタデータ） (2022-08-17T19:25:00Z)
Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文参考訳（メタデータ） (2022-07-09T13:35:12Z)
Controllable Image Enhancement [66.18525728881711]
いくつかのパラメータを制御して、複数のスタイルで高品質な画像を生成できる半自動画像強調アルゴリズムを提案する。エンコーダ・デコーダフレームワークは、リタッチスキルを潜在コードにエンコードし、イメージ信号処理機能のパラメータにデコードする。
論文参考訳（メタデータ） (2022-06-16T23:54:53Z)
Enhance Images as You Like with Unpaired Learning [8.104571453311442]
本稿では,低照度から高照度の画像空間における一対多の関係を学習するために,軽量な一経路条件生成対向ネットワーク(cGAN)を提案する。我々のネットワークは、様々な参照画像上に設定された所定の入力条件から、拡張された画像の集合を生成することを学習する。我々のモデルは、ノイズとクリーンなデータセットの完全な教師付き手法と同等に競合する視覚的および定量的な結果を得る。
論文参考訳（メタデータ） (2021-10-04T03:00:44Z)
R2RNet: Low-light Image Enhancement via Real-low to Real-normal Network [7.755223662467257]
本稿ではR2RNetと呼ばれる低照度画像強調のための新しいReal-low to Real-normal Networkを提案する。合成画像で訓練された他のほとんどの方法とは異なり、我々は最初の大規模実世界ペアロー/ノーマルライト画像データセットを収集する。提案手法はコントラストを適切に改善し,ノイズを同時に抑制することができる。
論文参考訳（メタデータ） (2021-06-28T09:33:13Z)
TediGAN: Text-Guided Diverse Face Image Generation and Manipulation [52.83401421019309]
TediGANはマルチモーダル画像生成とテキスト記述による操作のためのフレームワークである。 StyleGANインバージョンモジュールは、よく訓練されたStyleGANの潜在空間に実際の画像をマッピングする。視覚言語的類似性は、画像とテキストを共通の埋め込み空間にマッピングすることで、テキスト画像マッチングを学ぶ。インスタンスレベルの最適化は、操作におけるID保存のためのものだ。
論文参考訳（メタデータ） (2020-12-06T16:20:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。