論文の概要: Local Low-light Image Enhancement via Region-Aware Normalization
- arxiv url: http://arxiv.org/abs/2208.07711v3
- Date: Thu, 30 Nov 2023 09:45:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-01 20:55:06.087126
- Title: Local Low-light Image Enhancement via Region-Aware Normalization
- Title(参考訳): 領域認識正規化による局所低光度画像強調
- Authors: Shihurong Yao and Yizhan Huang and Xiaogang Xu
- Abstract要約: 本稿では,ローカルLLIEの要件を体系的に定義する。
RANLENと呼ばれる局所的拡張のための地域対応正規化について紹介する。
我々の戦略は、様々な構造を持つ既存のグローバルLLIEネットワークに適用できる。
- 参考スコア(独自算出の注目度): 17.43291370371288
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the realm of Low-Light Image Enhancement (LLIE), existing research
primarily focuses on enhancing images globally. However, many applications
require local LLIE, where users are allowed to illuminate specific regions
using an input mask, such as creating a protagonist stage or spotlight effect.
However, this task has received limited attention currently. This paper aims to
systematically define the requirements of local LLIE and proposes a novel
strategy to convert current existing global LLIE methods into local versions.
The image space is divided into three regions: Masked Area A be enlightened to
achieve the desired lighting effects; Transition Area B is a smooth transition
from the enlightened area (Area A) to the unchanged region (Area C). To achieve
the task of local LLIE, we introduce Region-Aware Normalization for Local
Enhancement, dubbed as RANLEN. RANLEN uses a dynamically designed mask-based
normalization operation, which enhances an image in a spatially varying manner,
ensuring that the enhancement results are consistent with the requirements
specified by the input mask. Additionally, a set of region-aware loss terms is
formulated to facilitate the learning of the local LLIE framework. Our strategy
can be applied to existing global LLIE networks with varying structures.
Extensive experiments demonstrate that our approach can produce the desired
lighting effects compared to global LLIE, all the while offering controllable
local enhancement with various mask shapes.
- Abstract(参考訳): 低光画像強調(LLIE)の領域では、既存の研究は主に画像のグローバル化に焦点を当てている。
しかし、多くのアプリケーションは局所的なllieを必要としており、ユーザーは入力マスクを使って特定の領域を照らすことができる。
しかし、現在この作業は限定的な注目を集めている。
本稿では,ローカルLLIEの要件を体系的に定義することを目的として,既存のグローバルLLIEメソッドをローカルバージョンに変換する新たな戦略を提案する。
画像空間は、3つの領域に分けられる:被写体Aを啓蒙して所望の照明効果を得る、遷移領域Bは啓蒙された領域(AreaA)から変化のない領域(AreaC)への滑らかな遷移である。
ローカルLLIEの課題を達成するために、RANLENと呼ばれるローカルエンハンスメントのためのリージョンアウェア正規化を導入する。
RANLENは動的に設計されたマスクベースの正規化演算を使用し、空間的に異なる方法で画像を拡張し、その結果が入力マスクが指定した要件と一致していることを保証する。
さらに、ローカルLLIEフレームワークの学習を容易にするために、地域対応の損失項のセットが定式化されている。
我々の戦略は、様々な構造を持つ既存のグローバルLLIEネットワークに適用できる。
広範囲にわたる実験により,グローバルリーに比べて所望の照明効果が得られ,マスク形状の異なる局所的な拡張が可能となった。
関連論文リスト
- Contrastive Localized Language-Image Pre-Training [60.4967533101887]
コントラスト言語-画像事前学習(CLIP)は、画像/テキスト表現を生成するために視覚エンコーダを訓練するための著名な方法である。
本稿では,CLIPとリージョンテキストのコントラッシブな損失とモジュールを補完することにより,CLOC(Contrastive Localized Language- Image Pre-Trening)を提案する。
CLOCは画像領域認識および検索タスクのための高品質な地域埋め込みを可能にする。
論文 参考訳(メタデータ) (2024-10-03T17:56:09Z) - Sim-to-Real Grasp Detection with Global-to-Local RGB-D Adaptation [19.384129689848294]
本稿では,RGB-Dグリップ検出のシム・ツー・リアル問題に着目し,ドメイン適応問題として定式化する。
本稿では,RGBと深度データにおけるハイブリッドドメインギャップに対処し,マルチモーダルな特徴アライメントが不十分なグローバル・ローカルな手法を提案する。
論文 参考訳(メタデータ) (2024-03-18T06:42:38Z) - RegionGPT: Towards Region Understanding Vision Language Model [88.42271128373191]
RegionGPT(RGPT)は、複雑な地域レベルのキャプションと理解のために設計された新しいフレームワークである。
我々は、詳細な地域レベルのキャプションを備えたトレーニングセットを充実させる、自動領域キャプションデータ生成パイプラインを開発する。
本研究では,領域レベルのタスクに対して,汎用的なRGPTモデルを効果的に適用し,性能を大幅に向上させることを実証する。
論文 参考訳(メタデータ) (2024-03-04T18:58:08Z) - Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - GaitGL: Learning Discriminative Global-Local Feature Representations for
Gait Recognition [29.128348655227416]
GaitGLはグローバルローカルな歩行認識ネットワークである。
GLCLは、GFR抽出器とマスクベースのLFR抽出器からなる二重分岐構造である。
実験により、GaitGLは最先端の歩行認識方法よりも優れた性能を達成することが示された。
論文 参考訳(メタデータ) (2022-08-02T11:50:21Z) - Bagging Regional Classification Activation Maps for Weakly Supervised
Object Localization [11.25759292976175]
BagCAMsは、ローカライゼーションタスクのためのよく訓練された分類器をより良く投影するためのプラグアンドプレイ機構である。
我々のBagCAMは、地域ローカライザの集合を定義するために、提案した地域ローカライザ生成戦略を採用する。
実験により,提案したBagCAMを用いることで,ベースラインWSOL法の性能が向上することが示唆された。
論文 参考訳(メタデータ) (2022-07-16T03:03:01Z) - Region-Based Semantic Factorization in GANs [67.90498535507106]
本稿では,任意の画像領域についてGAN(Generative Adversarial Networks)が学習した潜在意味を分解するアルゴリズムを提案する。
適切に定義された一般化されたレイリー商を通して、アノテーションや訓練なしにそのような問題を解く。
様々な最先端のGANモデルに対する実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-02-19T17:46:02Z) - LODE: Deep Local Deblurring and A New Benchmark [106.80269193462712]
我々はBLur-Aware Deblurring Network(BladeNet)と呼ばれる新しいフレームワークを提案する。
ローカルブラー合成モジュールは局所的にぼやけたトレーニングペアを生成し、ローカルブラー知覚モジュールは局所的にぼやけた領域を自動的に捕捉し、Blar-guided Space Attentionモジュールは遅延ネットワークを空間的注意でガイドする。
我々は,REDS と LODE データセットの広範な実験を行い,BladeNet がPSNR を 2.5dB で改善し,SotAs を局所的に改善し,グローバルデブロアに匹敵する性能を維持していることを示す。
論文 参考訳(メタデータ) (2021-09-19T15:57:28Z) - RegionViT: Regional-to-Local Attention for Vision Transformers [17.70988054450176]
ビジョントランスフォーマー(ViT)は、画像分類における畳み込みニューラルネットワーク(CNN)に匹敵する結果を達成するための強力な能力を示している。
本稿では,ピラミッド構造を取り入れた新しい建築物を提案する。
我々のアプローチは、多くの並行処理を含む最先端のViT亜種に匹敵する、あるいは同等である。
論文 参考訳(メタデータ) (2021-06-04T19:57:11Z) - Gait Recognition via Effective Global-Local Feature Representation and
Local Temporal Aggregation [28.721376937882958]
歩行認識は最も重要な生体計測技術の一つであり、多くの分野で応用されている。
近年の歩行認識フレームワークは、人間のグローバルな外観または地域から抽出された記述子によって各歩行フレームを表現している。
歩行認識のための識別的特徴表現を実現するための新しい特徴抽出・融合フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-03T04:07:13Z) - Each Part Matters: Local Patterns Facilitate Cross-view Geo-localization [54.00111565818903]
クロスビューなジオローカライゼーションは、異なるプラットフォームから同じ地理的ターゲットの画像を見つけることである。
既存の手法は通常、画像センター内の地理的ターゲットの微細な特徴をマイニングすることに集中している。
我々は、文脈情報を活用するために、ローカルパターンネットワーク(LPN)と呼ばれるシンプルで効果的なディープニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-08-26T16:06:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。