論文の概要: UHD Low-Light Image Enhancement via Real-Time Enhancement Methods with Clifford Information Fusion
- arxiv url: http://arxiv.org/abs/2604.09321v1
- Date: Fri, 10 Apr 2026 13:47:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.887779
- Title: UHD Low-Light Image Enhancement via Real-Time Enhancement Methods with Clifford Information Fusion
- Title(参考訳): クリフォード情報フュージョンを用いたリアルタイム高精細化によるUHD低照度画像の高精細化
- Authors: Xiaohan Wang, Chen Wu, Dawei Zhao, Guangwei Gao, Dianjie Lu, Guijuan Zhang, Linwei Fan, Xu Lu, Shuai Wu, Hang Wei, Zhuoran Zheng,
- Abstract要約: 幾何学的特徴融合に基づく新しいリアルタイムUHD低照度拡張ネットワークを提案する。
本手法は,1台のコンシューマグレードデバイス上での4K/8K画像に対するミリ秒レベルの推論を実現する。
- 参考スコア(独自算出の注目度): 51.51707075741303
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Considering efficiency, ultra-high-definition (UHD) low-light image restoration is extremely challenging. Existing methods based on Transformer architectures or high-dimensional complex convolutional neural networks often suffer from the "memory wall" bottleneck, failing to achieve millisecond-level inference on edge devices. To address this issue, we propose a novel real-time UHD low-light enhancement network based on geometric feature fusion using Clifford algebra in 2D Euclidean space. First, we construct a four-layer feature pyramid with gradually increasing resolution, which decomposes input images into low-frequency and high-frequency structural components via a Gaussian blur kernel, and adopts a lightweight U-Net based on depthwise separable convolution for dual-branch feature extraction. Second, to resolve structural information loss and artifacts from traditional high-low frequency feature fusion, we introduce spatially aware Clifford algebra, which maps feature tensors to a multivector space (scalars, vectors, bivectors) and uses Clifford similarity to aggregate features while suppressing noise and preserving textures. In the reconstruction stage, the network outputs adaptive Gamma and Gain maps, which perform physically constrained non-linear brightness adjustment via Retinex theory. Integrated with FP16 mixed-precision computation and dynamic operator fusion, our method achieves millisecond-level inference for 4K/8K images on a single consumer-grade device, while outperforming state-of-the-art (SOTA) models on several restoration metrics.
- Abstract(参考訳): 効率を考慮すると、超高精細(UHD)低照度画像復元は非常に困難である。
トランスフォーマーアーキテクチャや高次元複雑な畳み込みニューラルネットワークに基づく既存の手法は、しばしば「メモリウォール」ボトルネックに悩まされ、エッジデバイス上でミリ秒レベルの推論を達成できなかった。
この問題に対処するために,2次元ユークリッド空間におけるクリフォード代数を用いた幾何学的特徴融合に基づく,新しいリアルタイムUHD低照度拡張ネットワークを提案する。
まず,ガウスアンボウカーネルを介し,入力画像を低周波・高周波構造成分に分解する分解能を徐々に高める4層特徴ピラミッドを構築し,デュアルブランチ特徴抽出のための深度分離可能な畳み込みに基づく軽量なU-Netを採用する。
第二に,従来の高周波数特徴融合から得られる構造的情報損失やアーチファクトを解決するために,テンソルを多ベクトル空間(スカラー,ベクトル,ビベクター)に写像する空間的認識のクリフォード代数を導入する。
再構成段階において、ネットワークは適応ガンマとゲインマップを出力し、レチネックス理論を介して物理的に制約のない非線形輝度調整を行う。
本手法はFP16混合精度計算と動的演算子融合を統合し,1つのコンシューマグレードデバイス上での4K/8K画像のミリ秒レベルの推論を実現する。
関連論文リスト
- Dual-Path Learning based on Frequency Structural Decoupling and Regional-Aware Fusion for Low-Light Image Super-Resolution [15.557346345104307]
低照度画像超解像(LLISR)は、照明条件が不十分な場合の視覚的細部と知覚的品質の回復に不可欠である。
本稿では、輝度とテクスチャを意味的に独立したコンポーネントに分離する新しい周波数認識フレームワークであるDecoupling then Perceive (DTP)を提案する。
最も広く使われているLLISRベンチマークの実験は、我々のDTPフレームワークの優位性を実証している。
論文 参考訳(メタデータ) (2026-03-28T15:15:08Z) - High-resolution Photo Enhancement in Real-time: A Laplacian Pyramid Network [73.19214585791268]
本稿では,LLF-LUT++と呼ばれるピラミッドネットワークについて紹介する。
具体的には,ダウンサンプリング画像のグローバル音節特性を活かした画像適応型3D LUTを利用する。
LLF-LUT++は、HDR+データセット上でPSNRが2.64dB改善されただけでなく、4K解像度の画像を1つのGPUでわずか13msで処理することで、さらに削減されている。
論文 参考訳(メタデータ) (2025-10-13T16:52:32Z) - Towards Lightweight Hyperspectral Image Super-Resolution with Depthwise Separable Dilated Convolutional Network [6.5149222591754725]
ハイパースペクトル画像超解像の課題に対処するために, 軽量な深度分離型拡張畳み込みネットワーク (DSDCN) を導入する。
平均二乗誤差(MSE)、L2ノルム正規化に基づく制約、スペクトル角に基づく損失を組み合わせたカスタム損失関数を提案する。
提案モデルは、2つの公開ハイパースペクトルデータセット上で非常に競争力のある性能を実現する。
論文 参考訳(メタデータ) (2025-05-01T07:57:23Z) - Deep Fourier-embedded Network for RGB and Thermal Salient Object Detection [15.470610918037243]
本稿では,正確なRGB-T SODのための純粋フーリエ変換モデルであるDeep Fourier-embedded Network (FreqSal)を提案する。
具体的には,Fast Fourier Transformの効率を線形複雑化して3つの重要なコンポーネントを設計する。
10のバイモーダルSODベンチマークデータセットに対する実験では、FreqSalが既存の29のバイモーダルSODモデルより優れていることが示されている。
論文 参考訳(メタデータ) (2024-11-27T14:55:16Z) - Look-Around Before You Leap: High-Frequency Injected Transformer for Image Restoration [46.96362010335177]
本稿では,画像復元のための簡易かつ効果的な高周波インジェクト変換器HITを提案する。
具体的には,機能マップに高頻度の詳細を組み込んだウィンドウワイドインジェクションモジュール(WIM)を設計し,高品質な画像の復元のための信頼性の高い参照を提供する。
さらに,BIMにおけるチャネル次元の計算によって失われる可能性のある空間的関係を維持するために,空間拡張ユニット(SEU)を導入する。
論文 参考訳(メタデータ) (2024-03-30T08:05:00Z) - Searching a Compact Architecture for Robust Multi-Exposure Image Fusion [55.37210629454589]
2つの大きなスタブリングブロックは、画素の不一致や非効率な推論など、開発を妨げる。
本研究では,高機能なマルチ露光画像融合のための自己アライメントとディテールリプレクションモジュールを取り入れたアーキテクチャ検索に基づくパラダイムを提案する。
提案手法は様々な競争方式より優れており、一般的なシナリオではPSNRが3.19%向上し、不整合シナリオでは23.5%向上した。
論文 参考訳(メタデータ) (2023-05-20T17:01:52Z) - CDDFuse: Correlation-Driven Dual-Branch Feature Decomposition for
Multi-Modality Image Fusion [138.40422469153145]
本稿では,CDDFuse(Relationed-Driven Feature Decomposition Fusion)ネットワークを提案する。
近赤外可視画像融合や医用画像融合など,複数の融合タスクにおいてCDDFuseが有望な結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-11-26T02:40:28Z) - Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。
画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。
我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文 参考訳(メタデータ) (2021-03-25T07:10:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。