論文の概要: Learning Differential Pyramid Representation for Tone Mapping
- arxiv url: http://arxiv.org/abs/2412.01463v2
- Date: Wed, 22 Oct 2025 12:24:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:02.824953
- Title: Learning Differential Pyramid Representation for Tone Mapping
- Title(参考訳): トーンマッピングのための微分ピラミッド表現の学習
- Authors: Qirui Yang, Yinbo Li, Yihao Liu, Peng-Tao Jiang, Fangpu Zhang, Qihua Cheng, Huanjing Yue, Jingyu Yang,
- Abstract要約: 高忠実度トーンマッピングのためのエンドツーエンドフレームワークである差分ピラミッド表現ネットワーク(DPRNet)を提案する。
DPRNetは、ダウンサンプル入力で動作するグローバルトーン知覚とローカルトーンチューニングモジュールを組み込んでいる。
DPRNetは最先端の結果を達成し、4K HDR+データセットでは2.39dB、4K HDRI Havenデータセットでは3.01dB、PSNRは2.39dB向上した。
- 参考スコア(独自算出の注目度): 28.5712397307822
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing tone mapping methods operate on downsampled inputs and rely on handcrafted pyramids to recover high-frequency details. These designs typically fail to preserve fine textures and structural fidelity in complex HDR scenes. Furthermore, most methods lack an effective mechanism to jointly model global tone consistency and local contrast enhancement, leading to globally flat or locally inconsistent outputs such as halo artifacts. We present the Differential Pyramid Representation Network (DPRNet), an end-to-end framework for high-fidelity tone mapping. At its core is a learnable differential pyramid that generalizes traditional Laplacian and Difference-of-Gaussian pyramids through content-aware differencing operations across scales. This allows DPRNet to adaptively capture high-frequency variations under diverse luminance and contrast conditions. To enforce perceptual consistency, DPRNet incorporates global tone perception and local tone tuning modules operating on downsampled inputs, enabling efficient yet expressive tone adaptation. Finally, an iterative detail enhancement module progressively restores the full-resolution output in a coarse-to-fine manner, reinforcing structure and sharpness. Experiments show that DPRNet achieves state-of-the-art results, improving PSNR by 2.39 dB on the 4K HDR+ dataset and 3.01 dB on the 4K HDRI Haven dataset, while producing perceptually coherent, detail-preserving results. \textit{We provide an anonymous online demo at https://xxxxxxdprnet.github.io/DPRNet/.
- Abstract(参考訳): 既存のトーンマッピング手法は、ダウンサンプリングされた入力で動作し、高周波の詳細を復元するために手作りのピラミッドに依存している。
これらのデザインは通常、複雑なHDRシーンにおける微妙なテクスチャと構造的忠実さの維持に失敗する。
さらに、ほとんどの手法は、グローバルなトーン一貫性と局所的なコントラストの強化を共同でモデル化する効果的なメカニズムを欠いている。
高忠実度トーンマッピングのためのエンドツーエンドフレームワークである差分ピラミッド表現ネットワーク(DPRNet)を提案する。
その中核は学習可能な微分ピラミッドであり、スケールをまたいだ内容認識差分演算を通じて、伝統的なラプラシアピラミッドとガウスの差分ピラミッドを一般化する。
これにより、DPRNetは様々な輝度とコントラスト条件下で高周波の変動を適応的に捉えることができる。
知覚整合性を実現するため、DPRNetはグローバルトーン知覚と、ダウンサンプル入力で動作する局所トーンチューニングモジュールを導入し、効率的かつ表現力のあるトーン適応を可能にする。
最後に、繰り返し詳細拡張モジュールは、全解像度出力を粗大な方法で徐々に復元し、構造と鋭さを補強する。
実験の結果、DPRNetは最先端の結果を達成し、4K HDR+データセットでは2.39dB、4K HDRI Havenデータセットでは3.01dB改善し、知覚的に一貫性のある詳細な保存結果を生成する。
https://xxxxxxdprnet.github.io/DPRNet/で匿名のオンラインデモを提供している。
関連論文リスト
- Learning Multi-scale Spatial-frequency Features for Image Denoising [58.883244886588336]
本稿では,マルチスケール適応型デュアルドメインネットワーク(MADNet)を提案する。
画像ピラミッド入力を用いて低解像度画像からノイズのない結果を復元する。
高周波情報と低周波情報の相互作用を実現するために,適応型空間周波数学習ユニットを設計する。
論文 参考訳(メタデータ) (2025-06-19T13:28:09Z) - Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition [83.40450475728792]
本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号化に特化して設計されたトランスフォーマーベースのフレームワークである。
本手法は,モワールパターンを高周波数空間局在化テクスチャと低周波数スケールローバスト色歪みに明確に分割する有効な周波数分解を行う。
様々なデモアのベンチマーク実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-05-25T12:23:10Z) - GaussHDR: High Dynamic Range Gaussian Splatting via Learning Unified 3D and 2D Local Tone Mapping [17.42021596542516]
本稿では,3次元スプラッティングによる3次元局所トーンマッピングと2次元局所トーンマッピングを一体化するガウスについて述べる。
次に,3次元および2次元局所トーンマッピングのLDR結果の組み合わせを損失レベルで提案する。
論文 参考訳(メタデータ) (2025-03-13T08:07:43Z) - Semantic Aware Diffusion Inverse Tone Mapping [5.65968650127342]
逆トーンマッピングによる高ダイナミックレンジ(HDR)へのキャプチャー標準ダイナミックレンジ(SDR)画像のアップの試み
本稿では,SDR画像をHDRにマッピングする新たな逆トーンマッピング手法を提案する。
論文 参考訳(メタデータ) (2024-05-24T11:44:22Z) - Hi-Map: Hierarchical Factorized Radiance Field for High-Fidelity
Monocular Dense Mapping [51.739466714312805]
ニューラルラジアンス場(NeRF)に基づく新しいモノクリン高密度マッピング手法であるHi-Mapを導入する。
ハイマップは、RGB入力のみを用いた効率的かつ高忠実なマッピングを実現する能力において例外的である。
論文 参考訳(メタデータ) (2024-01-06T12:32:25Z) - Lookup Table meets Local Laplacian Filter: Pyramid Reconstruction
Network for Tone Mapping [35.47139372780014]
本稿では, 閉形式ラプラシアンピラミッドの分解と復元を利用して, グローバルおよびローカル演算子を統合する新しい戦略について検討する。
周波数情報の特徴を利用して低周波画像のトーンを操作するために,画像適応型3D LUTを用いた。
また、局所ラプラシアフィルタを用いて、高周波成分のエッジ詳細を適応的に洗練する。
論文 参考訳(メタデータ) (2023-10-26T07:05:38Z) - Pyramid Texture Filtering [86.15126028139736]
目立った構造を保ちながらテクスチャをスムーズにするための,シンプルだが効果的な手法を提案する。
ガウスピラミッドの粗いレベルは、しばしば自然にテクスチャを排除し、主要な画像構造を要約する。
本手法は, 異なるスケール, 局所的なコントラスト, 形状のテクスチャから構造を分離する上で, 構造劣化や視覚的アーティファクトの導入を伴わずに有効であることを示す。
論文 参考訳(メタデータ) (2023-05-11T02:05:30Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - FRIH: Fine-grained Region-aware Image Harmonization [49.420765789360836]
我々は,FRIH(Fentral-Aware Image Harmonization)のための新しいグローバルな2段階フレームワークを提案する。
提案アルゴリズムは,軽量モデルを用いて,iHarmony4データセット(PSNRは38.19dB)上で最高の性能を実現する。
論文 参考訳(メタデータ) (2022-05-13T04:50:26Z) - Uncovering the Over-smoothing Challenge in Image Super-Resolution: Entropy-based Quantification and Contrastive Optimization [67.99082021804145]
我々はDetail Enhanced Contrastive Loss (DECLoss)と呼ばれるCOO問題に対する明確な解決策を提案する。
DECLossはコントラスト学習のクラスタリング特性を利用して、潜在的な高分解能分布の分散を直接的に低減する。
我々は複数の超高解像度ベンチマーク上でDECLosを評価し,PSNR指向モデルの知覚品質を向上させることを実証した。
論文 参考訳(メタデータ) (2022-01-04T08:30:09Z) - Perceptually Optimized Deep High-Dynamic-Range Image Tone Mapping [44.00069411131762]
まず、HDR画像を正規化されたラプラシアンピラミッドに分解し、2つのディープニューラルネットワーク(DNN)を用いて、所望のトーンマップ画像のラプラシアンピラミッドを正規化された表現から推定する。
次に、正規化ラプラシアピラミッド距離を最小化することにより、HDR画像のデータベース上での手法全体をエンドツーエンドで最適化する。
論文 参考訳(メタデータ) (2021-09-01T04:17:31Z) - Generalizing Face Forgery Detection with High-frequency Features [63.33397573649408]
現在のCNNベースの検出器は、メソッド固有の色テクスチャに過度に適合するため、一般化に失敗する傾向にある。
フェースフォージェリ検出に高周波雑音を用いることを提案する。
1つは、複数のスケールで高周波ノイズを抽出するマルチスケールの高周波特徴抽出モジュールである。
2つ目は、低レベルRGB特徴抽出器を導く残差誘導空間注意モジュールで、新しい視点からフォージェリートレースにもっと集中する。
論文 参考訳(メタデータ) (2021-03-23T08:19:21Z) - Deep Reformulated Laplacian Tone Mapping [6.078183247169192]
広ダイナミックレンジ(WDR)画像は、一般的な画像と比較して、シーンの詳細とコントラストがより多く含まれている。
WDR画像の詳細は、トーンマッピングプロセス中に減少する可能性がある。
本研究では,新しいラプラシアンピラミッドと深層学習を組み合わせることで,この問題に対処する。
論文 参考訳(メタデータ) (2021-01-31T01:18:20Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。