論文の概要: High-resolution Photo Enhancement in Real-time: A Laplacian Pyramid Network
- arxiv url: http://arxiv.org/abs/2510.11613v1
- Date: Mon, 13 Oct 2025 16:52:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.466612
- Title: High-resolution Photo Enhancement in Real-time: A Laplacian Pyramid Network
- Title(参考訳): リアルタイムにおける高分解能光強調:ラプラシアピラミッドネットワーク
- Authors: Feng Zhang, Haoyou Deng, Zhiqiang Li, Lida Li, Bin Xu, Qingbo Lu, Zisheng Cao, Minchen Wei, Changxin Gao, Nong Sang, Xiang Bai,
- Abstract要約: 本稿では,LLF-LUT++と呼ばれるピラミッドネットワークについて紹介する。
具体的には,ダウンサンプリング画像のグローバル音節特性を活かした画像適応型3D LUTを利用する。
LLF-LUT++は、HDR+データセット上でPSNRが2.64dB改善されただけでなく、4K解像度の画像を1つのGPUでわずか13msで処理することで、さらに削減されている。
- 参考スコア(独自算出の注目度): 73.19214585791268
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Photo enhancement plays a crucial role in augmenting the visual aesthetics of a photograph. In recent years, photo enhancement methods have either focused on enhancement performance, producing powerful models that cannot be deployed on edge devices, or prioritized computational efficiency, resulting in inadequate performance for real-world applications. To this end, this paper introduces a pyramid network called LLF-LUT++, which integrates global and local operators through closed-form Laplacian pyramid decomposition and reconstruction. This approach enables fast processing of high-resolution images while also achieving excellent performance. Specifically, we utilize an image-adaptive 3D LUT that capitalizes on the global tonal characteristics of downsampled images, while incorporating two distinct weight fusion strategies to achieve coarse global image enhancement. To implement this strategy, we designed a spatial-frequency transformer weight predictor that effectively extracts the desired distinct weights by leveraging frequency features. Additionally, we apply local Laplacian filters to adaptively refine edge details in high-frequency components. After meticulously redesigning the network structure and transformer model, LLF-LUT++ not only achieves a 2.64 dB improvement in PSNR on the HDR+ dataset, but also further reduces runtime, with 4K resolution images processed in just 13 ms on a single GPU. Extensive experimental results on two benchmark datasets further show that the proposed approach performs favorably compared to state-of-the-art methods. The source code will be made publicly available at https://github.com/fengzhang427/LLF-LUT.
- Abstract(参考訳): フォトエンハンスメントは、写真の視覚的美学を増強する上で重要な役割を担っている。
近年、フォトエンハンスメント手法は、エッジデバイスにデプロイできない強力なモデルを生成するか、あるいは計算効率を優先し、現実のアプリケーションに不適切な性能をもたらす。
そこで本稿では,LLF-LUT++と呼ばれるピラミッドネットワークを導入する。
このアプローチにより,高精細画像の高速処理が可能であり,性能も良好である。
具体的には,大局的な大局的な画像強調を実現するために,2つの異なる重み融合戦略を取り入れながら,ダウンサンプル画像のグローバル音節特性を活かした画像適応型3D LUTを利用する。
この戦略を実現するために、周波数特性を利用して所望の異なる重みを効果的に抽出する空間周波数変換器重み予測器を設計した。
さらに、局所ラプラシアフィルタを用いて高周波成分のエッジ詳細を適応的に洗練する。
ネットワーク構造とトランスフォーマーモデルを慎重に再設計した後、LLF-LUT++は、HDR+データセット上でPSNRの2.64dB改善を達成するだけでなく、ランタイムをさらに削減し、単一のGPU上でわずか13msで4K解像度の画像を処理した。
2つのベンチマークデータセットの大規模な実験結果は、提案手法が最先端の手法と比較して好適に動作することを示している。
ソースコードはhttps://github.com/fengzhang427/LLF-LUT.comで公開されている。
関連論文リスト
- LODGE: Level-of-Detail Large-Scale Gaussian Splatting with Efficient Rendering [68.93333348474988]
メモリ制約デバイス上での3次元ガウススプラッティングのための新しいレベル・オブ・ディーテール(LOD)法を提案する。
カメラ距離に基づいてガウスの最適部分集合を反復的に選択する。
本手法は,屋外(階層型3DGS)と屋内(Zip-NeRF)の両方で最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-05-29T06:50:57Z) - LeRF: Learning Resampling Function for Adaptive and Efficient Image Interpolation [64.34935748707673]
最近のディープニューラルネットワーク(DNN)は、学習データ前処理を導入することで、パフォーマンスを著しく向上させた。
本稿では,DNNが学習した構造的前提と局所的連続仮定の両方を活かした学習再サンプリング(Learning Resampling, LeRF)を提案する。
LeRFは空間的に異なる再サンプリング関数を入力画像ピクセルに割り当て、ニューラルネットワークを用いてこれらの再サンプリング関数の形状を予測する。
論文 参考訳(メタデータ) (2024-07-13T16:09:45Z) - OrientDream: Streamlining Text-to-3D Generation with Explicit Orientation Control [66.03885917320189]
OrientDreamは、テキストプロンプトから効率よくマルチビューで一貫した3D生成のためのカメラ指向条件付きフレームワークである。
本戦略は,2次元テキスト・画像拡散モジュールの事前学習におけるカメラ配向条件付き機能の実装を強調する。
提案手法は,一貫したマルチビュー特性を持つ高品質なNeRFモデルを生成するだけでなく,既存手法よりも最適化速度が大幅に向上することを示した。
論文 参考訳(メタデータ) (2024-06-14T13:16:18Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Lookup Table meets Local Laplacian Filter: Pyramid Reconstruction
Network for Tone Mapping [35.47139372780014]
本稿では, 閉形式ラプラシアンピラミッドの分解と復元を利用して, グローバルおよびローカル演算子を統合する新しい戦略について検討する。
周波数情報の特徴を利用して低周波画像のトーンを操作するために,画像適応型3D LUTを用いた。
また、局所ラプラシアフィルタを用いて、高周波成分のエッジ詳細を適応的に洗練する。
論文 参考訳(メタデータ) (2023-10-26T07:05:38Z) - Efficient Context Integration through Factorized Pyramidal Learning for
Ultra-Lightweight Semantic Segmentation [1.0499611180329804]
本稿では,FPL(Facterized Pyramidal Learning)モジュールを提案する。
空間ピラミッドを2つのステージに分解し,モジュール内での簡易かつ効率的な特徴融合により,悪名高いチェッカーボード効果を解決する。
FPLモジュールとFIRユニットをベースとしたFPLNetと呼ばれる超軽量リアルタイムネットワークを提案する。
論文 参考訳(メタデータ) (2023-02-23T05:34:51Z) - Ultra-High-Definition Low-Light Image Enhancement: A Benchmark and
Transformer-Based Method [51.30748775681917]
低照度画像強調(LLIE)の課題を考察し,4K解像度と8K解像度の画像からなる大規模データベースを導入する。
我々は、系統的なベンチマーク研究を行い、現在のLLIEアルゴリズムと比較する。
第2のコントリビューションとして,変換器をベースとした低照度化手法であるLLFormerを紹介する。
論文 参考訳(メタデータ) (2022-12-22T09:05:07Z) - Linear Array Network for Low-light Image Enhancement [11.84047819225589]
本稿では,2次元特徴符号化のみを用いて3次元グローバルウェイトを構築し,畳み込み層が生成する特徴マップを改良する線形アレー自己アテンション(LASA)機構を提案する。
LASAは、RGBおよびRAWベースの低照度拡張タスクにおいて、より少ないパラメータで既存のSOTA(State-of-the-art)手法よりも優れている。
論文 参考訳(メタデータ) (2022-01-22T08:44:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。