論文の概要: Rethinking the Atmospheric Scattering-driven Attention via Channel and Gamma Correction Priors for Low-Light Image Enhancement
- arxiv url: http://arxiv.org/abs/2409.05274v3
- Date: Fri, 20 Dec 2024 19:44:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 19:42:47.688884
- Title: Rethinking the Atmospheric Scattering-driven Attention via Channel and Gamma Correction Priors for Low-Light Image Enhancement
- Title(参考訳): 低照度画像強調のためのチャネル補正とガンマ補正による大気散乱駆動注意の再考
- Authors: Shyang-En Weng, Cheng-Yen Hsiao, Shaou-Gang Miaou, Ricky Christanto,
- Abstract要約: 本稿では,Channel-Prior and Gamma-Estimation Network (CPGA-Net)の拡張版を紹介する。
CPGA-Net+は大気散乱モデルによって駆動される注意機構を組み込んでいる。
ガンマ補正を施したプラグインアテンションによるグローバル画像処理とローカル画像処理の両方に効果的に対処する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Enhancing low-light images remains a critical challenge in computer vision, as does designing lightweight models for edge devices that can handle the computational demands of deep learning. In this article, we introduce an extended version of the Channel-Prior and Gamma-Estimation Network (CPGA-Net), termed CPGA-Net+, which incorporates an attention mechanism driven by a reformulated Atmospheric Scattering Model and effectively addresses both global and local image processing through Plug-in Attention with gamma correction. These innovations enable CPGA-Net+ to achieve superior performance on image enhancement tasks for supervised and unsupervised learning, surpassing lightweight state-of-the-art methods with high efficiency. Furthermore, we provide a theoretical analysis showing that our approach inherently decomposes the enhancement process into restoration and lightening stages, aligning with the fundamental image degradation model. To further optimize efficiency, we introduce a block simplification technique that reduces computational costs by more than two-thirds. Experimental results validate the effectiveness of CPGA-Net+ and highlight its potential for applications in resource-constrained environments.
- Abstract(参考訳): 低照度画像の強調は、ディープラーニングの計算要求に対処できるエッジデバイスの軽量モデルを設計するなど、コンピュータビジョンにおいて依然として重要な課題である。
本稿では,CPGA-Net+と呼ばれるChannel-Prior and Gamma-Estimation Network(CPGA-Net)の拡張版を紹介する。
これらの革新により、CPGA-Net+は、教師付きおよび教師なし学習のための画像強化タスクにおいて、高い効率で軽量な最先端の手法を超越して、優れたパフォーマンスを達成することができる。
さらに,本手法は,基本画像劣化モデルと整合して,エンハンスメント過程を復元・軽量化段階に本質的に分解することを示す理論的解析を行った。
さらに効率を最適化するために,計算コストを3分の2以上削減するブロック単純化手法を導入する。
実験によりCPGA-Net+の有効性が検証され,資源制約環境における応用の可能性を強調した。
関連論文リスト
- PuriLight: A Lightweight Shuffle and Purification Framework for Monocular Depth Estimation [15.413017422345545]
PuriLightは、自己教師付き単眼深度推定のためのフレームワークである。
計算効率と詳細保存という2つの課題に対処する。
PuriLightは、最小限のトレーニングパラメータで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-02-11T17:35:21Z) - Low-Light Enhancement via Encoder-Decoder Network with Illumination Guidance [0.0]
本稿では,低照度画像強調のための新しいディープラーニングフレームワーク,Theを紹介する。
Illumination Guidance (EDNIG) を用いたデコーダネットワーク
EDNIGはBright Channel Prior (BCP)から派生した照明マップをガイダンス入力として統合する。
合成損失関数を用いてGAN(Generative Adversarial Network)フレームワーク内で最適化され、対向損失、画素単位の平均二乗誤差(MSE)、知覚損失を組み合わせた。
論文 参考訳(メタデータ) (2025-07-04T09:35:00Z) - Latent Wavelet Diffusion For Ultra-High-Resolution Image Synthesis [56.311477476580926]
超高分解能(2K-4K)画像合成におけるディテールとテクスチャの忠実度を大幅に向上させる軽量トレーニングフレームワークであるLatent Wavelet Diffusion (LWD)を提案する。
LWDはウェーブレットエネルギーマップから導かれる新しい周波数対応マスキング戦略を導入し、潜在空間の詳細な領域にトレーニングプロセスを動的に焦点をあてる。
論文 参考訳(メタデータ) (2025-05-31T07:28:32Z) - Entropy-Driven Genetic Optimization for Deep-Feature-Guided Low-Light Image Enhancement [1.0428401220897083]
NSGA-IIアルゴリズムによって導かれる、教師なし、ファジィにインスパイアされた画像強調フレームワークを提案する。
我々は,複数の目標,すなわち画像エントロピーの増大,知覚的類似性の向上,適切な明るさを維持するために,GPU加速NSGA-IIアルゴリズムを用いる。
本モデルでは, 平均BRISQUEとNIQEのスコアが19.82と3.652であり, 全ての未ペアデータセットにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2025-05-16T13:40:56Z) - Striving for Faster and Better: A One-Layer Architecture with Auto Re-parameterization for Low-Light Image Enhancement [50.93686436282772]
我々は、視覚的品質と計算効率の両方から、画像エンハンサーの限界を掘り下げることを目指している。
タスク要求を再考することにより、視覚的品質と計算効率がモデル学習と構造設計に対応する、明示的な接続を構築する。
最終的には、単一の畳み込み層のみを使用して、優れた視覚的品質を維持しながら、効率的な低照度画像強調を実現する。
論文 参考訳(メタデータ) (2025-02-27T08:20:03Z) - CLIP-Optimized Multimodal Image Enhancement via ISP-CNN Fusion for Coal Mine IoVT under Uneven Illumination [40.70282870053005]
地下環境における低照度および不均一輝度は、画像品質を著しく低下させる。
本稿では,不均一照明に最適化されたISP-CNN融合アーキテクチャを用いて,炭鉱IoVTに適したマルチモーダル画像強調手法を提案する。
論文 参考訳(メタデータ) (2025-02-26T05:09:40Z) - Hardware-Efficient Photonic Tensor Core: Accelerating Deep Neural Networks with Structured Compression [15.665630650382226]
本稿では,構造圧縮型光ニューラルネットワーク(StrC-ONN)アーキテクチャのためのブロック循環型フォトニックテンソルコアを提案する。
この研究は、実用的でスケーラブルなONNへの新たな道筋を探求し、将来の計算効率の課題に対処するための有望な道筋を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-02-01T17:03:45Z) - PhotoGAN: Generative Adversarial Neural Network Acceleration with Silicon Photonics [2.9699290794642366]
PhotoGANは、GANモデルの特殊な操作を扱うために設計された最初のシリコンフォトニック加速器である。
PhotoGANは最先端の加速器に比べて少なくとも4.4倍高いGOPSと2.18倍低いEPBを実現している。
論文 参考訳(メタデータ) (2025-01-23T16:53:31Z) - A Lightweight GAN-Based Image Fusion Algorithm for Visible and Infrared Images [4.473596922028091]
本稿では、可視光と赤外画像の融合に特化して設計された軽量画像融合アルゴリズムを提案する。
提案手法は,GAN (Generative Adversarial Network) において, Convolutional Block Attention Module を統合することでジェネレータを増強する。
M3FDデータセットを用いた実験により、提案アルゴリズムは、融合品質の点で類似した画像融合法より優れていることを示した。
論文 参考訳(メタデータ) (2024-09-07T18:04:39Z) - A Lightweight Low-Light Image Enhancement Network via Channel Prior and Gamma Correction [0.0]
LLIE(ローライト・イメージ・エンハンスメント)とは、低照度シーンの処理に適した画像エンハンスメント技術である。
我々は,暗/明のチャネル先行と深層学習によるガンマ補正を組み合わせた,革新的なLLIEネットワークであるCPGA-Netを紹介する。
論文 参考訳(メタデータ) (2024-02-28T08:18:20Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Low-Resolution Self-Attention for Semantic Segmentation [93.30597515880079]
我々は,グローバルコンテキストを計算コストの大幅な削減で捉えるために,低解像度自己認識(LRSA)機構を導入する。
我々のアプローチは、入力画像の解像度に関わらず、固定された低解像度空間における自己注意を計算することである。
本稿では,エンコーダ・デコーダ構造を持つビジョントランスであるLRFormerを構築することで,LRSA手法の有効性を示す。
論文 参考訳(メタデータ) (2023-10-08T06:10:09Z) - HAT: Hybrid Attention Transformer for Image Restoration [61.74223315807691]
トランスフォーマーに基づく手法は、画像の超解像や復調といった画像復元タスクにおいて顕著な性能を示している。
本稿では,新たなHAT(Hybrid Attention Transformer)を提案する。
我々のHATは,定量的かつ定性的に,最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-09-11T05:17:55Z) - Low-Light Image Enhancement with Illumination-Aware Gamma Correction and
Complete Image Modelling Network [69.96295927854042]
低照度環境は通常、情報の少ない大規模な暗黒地帯に繋がる。
本稿では,ガンマ補正の有効性を深層ネットワークのモデリング能力と統合することを提案する。
指数関数演算は高い計算複雑性をもたらすので、Taylor Series を用いてガンマ補正を近似することを提案する。
論文 参考訳(メタデータ) (2023-08-16T08:46:51Z) - Latent Graph Attention for Enhanced Spatial Context [17.80084080253724]
Latent Graph Attention (LGA) は計算コストが低く(ノード数に比例する)、既存のアーキテクチャにグローバルコンテキストを組み込むための安定的でモジュール化されたフレームワークである。
LGAは局所連結グラフのネットワークを用いて空間的に情報を伝播する。
LGAを取り入れることで、透明なオブジェクトセグメンテーション、デハジングのための画像復元、光フロー推定という3つの難解なアプリケーションの性能が向上することを示す。
論文 参考訳(メタデータ) (2023-07-09T10:56:44Z) - Generative Adversarial Super-Resolution at the Edge with Knowledge
Distillation [1.3764085113103222]
シングルイメージのスーパーソリューションは、信頼できるビジュアルストリームが必要な環境でのロボットタスクをサポートすることができる。
我々は,EdgeSRGANと呼ばれるリアルタイム超解法のための効率的な生成逆ネットワークモデルを提案する。
論文 参考訳(メタデータ) (2022-09-07T10:58:41Z) - Cycle-Interactive Generative Adversarial Network for Robust Unsupervised
Low-Light Enhancement [109.335317310485]
CIGAN(Cycle-Interactive Generative Adversarial Network)は、低照度画像間の照明分布の転送を改善できるだけでなく、詳細な信号も操作できる。
特に、提案した低照度誘導変換は、低照度GAN生成器から劣化GAN生成器へ、低照度画像の特徴をフォワードする。
論文 参考訳(メタデータ) (2022-07-03T06:37:46Z) - Low-light Image Enhancement by Retinex Based Algorithm Unrolling and
Adjustment [50.13230641857892]
本稿では,低照度画像強調(LIE)問題に対する新たなディープラーニングフレームワークを提案する。
提案フレームワークは,大域的明るさと局所的明るさ感度の両方を考慮したアルゴリズムアンロールと調整ネットワークに着想を得た分解ネットワークを含む。
一連の典型的なLIEデータセットの実験では,既存の手法と比較して,定量的かつ視覚的に,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-02-12T03:59:38Z) - Learning Deep Context-Sensitive Decomposition for Low-Light Image
Enhancement [58.72667941107544]
典型的なフレームワークは、照明と反射を同時に推定することであるが、特徴空間にカプセル化されたシーンレベルの文脈情報を無視する。
本研究では,空間スケールにおけるシーンレベルのコンテキスト依存を生かした,コンテキスト依存型分解ネットワークアーキテクチャを提案する。
チャネル数を減らして軽量なCSDNet(LiteCSDNet)を開発する。
論文 参考訳(メタデータ) (2021-12-09T06:25:30Z) - Image-specific Convolutional Kernel Modulation for Single Image
Super-resolution [85.09413241502209]
本稿では,新しい画像特異的畳み込み変調カーネル(IKM)を提案する。
我々は、画像や特徴のグローバルな文脈情報を利用して、畳み込みカーネルを適応的に調整するための注意重みを生成する。
単一画像超解像実験により,提案手法は最先端手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-11-16T11:05:10Z) - Universal and Flexible Optical Aberration Correction Using Deep-Prior
Based Deconvolution [51.274657266928315]
そこで本研究では,収差画像とpsfマップを入力とし,レンズ固有深層プリエントを組み込んだ潜在高品質版を生成する,psf対応プラグイン・アンド・プレイ深層ネットワークを提案する。
具体的には、多彩なレンズの集合からベースモデルを事前訓練し、パラメータを迅速に精製して特定のレンズに適応させる。
論文 参考訳(メタデータ) (2021-04-07T12:00:38Z) - Improving Aerial Instance Segmentation in the Dark with Self-Supervised
Low Light Enhancement [6.500738558466833]
空中画像の低照度条件は、視覚ベースのアプリケーションの性能に悪影響を及ぼす。
自己監督型で低照度画像を高めることができる新しい手法を提案する。
GANを用いた新しい低照度航空データセットも提案する。
論文 参考訳(メタデータ) (2021-02-10T12:24:40Z) - Optimization-Inspired Learning with Architecture Augmentations and
Control Mechanisms for Low-Level Vision [74.9260745577362]
本稿では,GDC(Generative, Discriminative, and Corrective)の原則を集約する,最適化に着想を得た統合学習フレームワークを提案する。
フレキシブルな組み合わせで最適化モデルを効果的に解くために,3つのプロパゲーティブモジュールを構築した。
低レベル視覚タスクにおける実験は、GDCの有効性と適応性を検証する。
論文 参考訳(メタデータ) (2020-12-10T03:24:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。