論文の概要: Learning Differential Pyramid Representation for Tone Mapping
- arxiv url: http://arxiv.org/abs/2412.01463v2
- Date: Wed, 22 Oct 2025 12:24:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:02.824953
- Title: Learning Differential Pyramid Representation for Tone Mapping
- Title(参考訳): トーンマッピングのための微分ピラミッド表現の学習
- Authors: Qirui Yang, Yinbo Li, Yihao Liu, Peng-Tao Jiang, Fangpu Zhang, Qihua Cheng, Huanjing Yue, Jingyu Yang,
- Abstract要約: 高忠実度トーンマッピングのためのエンドツーエンドフレームワークである差分ピラミッド表現ネットワーク(DPRNet)を提案する。
DPRNetは、ダウンサンプル入力で動作するグローバルトーン知覚とローカルトーンチューニングモジュールを組み込んでいる。
DPRNetは最先端の結果を達成し、4K HDR+データセットでは2.39dB、4K HDRI Havenデータセットでは3.01dB、PSNRは2.39dB向上した。
- 参考スコア(独自算出の注目度): 28.5712397307822
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing tone mapping methods operate on downsampled inputs and rely on handcrafted pyramids to recover high-frequency details. These designs typically fail to preserve fine textures and structural fidelity in complex HDR scenes. Furthermore, most methods lack an effective mechanism to jointly model global tone consistency and local contrast enhancement, leading to globally flat or locally inconsistent outputs such as halo artifacts. We present the Differential Pyramid Representation Network (DPRNet), an end-to-end framework for high-fidelity tone mapping. At its core is a learnable differential pyramid that generalizes traditional Laplacian and Difference-of-Gaussian pyramids through content-aware differencing operations across scales. This allows DPRNet to adaptively capture high-frequency variations under diverse luminance and contrast conditions. To enforce perceptual consistency, DPRNet incorporates global tone perception and local tone tuning modules operating on downsampled inputs, enabling efficient yet expressive tone adaptation. Finally, an iterative detail enhancement module progressively restores the full-resolution output in a coarse-to-fine manner, reinforcing structure and sharpness. Experiments show that DPRNet achieves state-of-the-art results, improving PSNR by 2.39 dB on the 4K HDR+ dataset and 3.01 dB on the 4K HDRI Haven dataset, while producing perceptually coherent, detail-preserving results. \textit{We provide an anonymous online demo at https://xxxxxxdprnet.github.io/DPRNet/.
- Abstract(参考訳): 既存のトーンマッピング手法は、ダウンサンプリングされた入力で動作し、高周波の詳細を復元するために手作りのピラミッドに依存している。
これらのデザインは通常、複雑なHDRシーンにおける微妙なテクスチャと構造的忠実さの維持に失敗する。
さらに、ほとんどの手法は、グローバルなトーン一貫性と局所的なコントラストの強化を共同でモデル化する効果的なメカニズムを欠いている。
高忠実度トーンマッピングのためのエンドツーエンドフレームワークである差分ピラミッド表現ネットワーク(DPRNet)を提案する。
その中核は学習可能な微分ピラミッドであり、スケールをまたいだ内容認識差分演算を通じて、伝統的なラプラシアピラミッドとガウスの差分ピラミッドを一般化する。
これにより、DPRNetは様々な輝度とコントラスト条件下で高周波の変動を適応的に捉えることができる。
知覚整合性を実現するため、DPRNetはグローバルトーン知覚と、ダウンサンプル入力で動作する局所トーンチューニングモジュールを導入し、効率的かつ表現力のあるトーン適応を可能にする。
最後に、繰り返し詳細拡張モジュールは、全解像度出力を粗大な方法で徐々に復元し、構造と鋭さを補強する。
実験の結果、DPRNetは最先端の結果を達成し、4K HDR+データセットでは2.39dB、4K HDRI Havenデータセットでは3.01dB改善し、知覚的に一貫性のある詳細な保存結果を生成する。
https://xxxxxxdprnet.github.io/DPRNet/で匿名のオンラインデモを提供している。
関連論文リスト
- Edit2Perceive: Image Editing Diffusion Models Are Strong Dense Perceivers [55.15722080205737]
Edit2Perceiveは、深度、正規度、マッティングの編集モデルを適応させる統合拡散フレームワークである。
私たちの単一ステップの決定論的推論は、比較的小さなデータセットでトレーニングしながら、より高速なランタイムをもたらす。
論文 参考訳(メタデータ) (2025-11-24T01:13:51Z) - Scale-DiT: Ultra-High-Resolution Image Generation with Hierarchical Local Attention [50.391914489898774]
Scale-DiTは、階層的な局所的注意を低解像度のグローバルガイダンスで導入する新しい拡散フレームワークである。
軽量なLoRA適応は、デノナイズ中のグローバルパスとローカルパスをブリッジし、構造と詳細の整合性を確保する。
実験によると、Scale-DiTは2ドル以上の高速な推論とメモリ使用量の削減を実現している。
論文 参考訳(メタデータ) (2025-10-18T03:15:26Z) - High-resolution Photo Enhancement in Real-time: A Laplacian Pyramid Network [73.19214585791268]
本稿では,LLF-LUT++と呼ばれるピラミッドネットワークについて紹介する。
具体的には,ダウンサンプリング画像のグローバル音節特性を活かした画像適応型3D LUTを利用する。
LLF-LUT++は、HDR+データセット上でPSNRが2.64dB改善されただけでなく、4K解像度の画像を1つのGPUでわずか13msで処理することで、さらに削減されている。
論文 参考訳(メタデータ) (2025-10-13T16:52:32Z) - Learning Multi-scale Spatial-frequency Features for Image Denoising [58.883244886588336]
本稿では,マルチスケール適応型デュアルドメインネットワーク(MADNet)を提案する。
画像ピラミッド入力を用いて低解像度画像からノイズのない結果を復元する。
高周波情報と低周波情報の相互作用を実現するために,適応型空間周波数学習ユニットを設計する。
論文 参考訳(メタデータ) (2025-06-19T13:28:09Z) - Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition [83.40450475728792]
本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号化に特化して設計されたトランスフォーマーベースのフレームワークである。
本手法は,モワールパターンを高周波数空間局在化テクスチャと低周波数スケールローバスト色歪みに明確に分割する有効な周波数分解を行う。
様々なデモアのベンチマーク実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-05-25T12:23:10Z) - RealRep: Generalized SDR-to-HDR Conversion via Attribute-Disentangled Representation Learning [51.19027658873778]
WCG(High-Dynamic-Range Wide-Color-Gamut)技術が普及し,標準ダイナミックレンジ(SDR)コンテンツをHDRに変換する必要性が高まっている。
既存の方法は固定トーンマッピング演算子に依存しており、現実世界のSDRコンテンツに存在する様々な外観や劣化を扱うのに苦労している。
本稿では,構成不整合表現の学習により頑健性を高める一般化されたSDR-to- attributeフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-12T08:08:58Z) - GaussHDR: High Dynamic Range Gaussian Splatting via Learning Unified 3D and 2D Local Tone Mapping [17.42021596542516]
本稿では,3次元スプラッティングによる3次元局所トーンマッピングと2次元局所トーンマッピングを一体化するガウスについて述べる。
次に,3次元および2次元局所トーンマッピングのLDR結果の組み合わせを損失レベルで提案する。
論文 参考訳(メタデータ) (2025-03-13T08:07:43Z) - Learning Inverse Laplacian Pyramid for Progressive Depth Completion [18.977393635158048]
LP-Netは、ラプラシアンピラミッド分解に基づくマルチスケールでプログレッシブな予測パラダイムを実装する革新的なフレームワークである。
提出時点では、LP-Netは公式のKITTIリーダーボードで全ての査読された方法の中で第1位である。
論文 参考訳(メタデータ) (2025-02-11T06:21:42Z) - Semantic Aware Diffusion Inverse Tone Mapping [5.65968650127342]
逆トーンマッピングによる高ダイナミックレンジ(HDR)へのキャプチャー標準ダイナミックレンジ(SDR)画像のアップの試み
本稿では,SDR画像をHDRにマッピングする新たな逆トーンマッピング手法を提案する。
論文 参考訳(メタデータ) (2024-05-24T11:44:22Z) - CVT-xRF: Contrastive In-Voxel Transformer for 3D Consistent Radiance Fields from Sparse Inputs [65.80187860906115]
スパース入力によるNeRFの性能向上のための新しい手法を提案する。
まず, サンプル線が, 3次元空間内の特定のボクセルと交差することを保証するために, ボクセルを用いた放射線サンプリング戦略を採用する。
次に、ボクセル内の追加点をランダムにサンプリングし、トランスフォーマーを適用して各線上の他の点の特性を推測し、ボリュームレンダリングに組み込む。
論文 参考訳(メタデータ) (2024-03-25T15:56:17Z) - Hi-Map: Hierarchical Factorized Radiance Field for High-Fidelity
Monocular Dense Mapping [51.739466714312805]
ニューラルラジアンス場(NeRF)に基づく新しいモノクリン高密度マッピング手法であるHi-Mapを導入する。
ハイマップは、RGB入力のみを用いた効率的かつ高忠実なマッピングを実現する能力において例外的である。
論文 参考訳(メタデータ) (2024-01-06T12:32:25Z) - Lookup Table meets Local Laplacian Filter: Pyramid Reconstruction
Network for Tone Mapping [35.47139372780014]
本稿では, 閉形式ラプラシアンピラミッドの分解と復元を利用して, グローバルおよびローカル演算子を統合する新しい戦略について検討する。
周波数情報の特徴を利用して低周波画像のトーンを操作するために,画像適応型3D LUTを用いた。
また、局所ラプラシアフィルタを用いて、高周波成分のエッジ詳細を適応的に洗練する。
論文 参考訳(メタデータ) (2023-10-26T07:05:38Z) - Pyramid Texture Filtering [86.15126028139736]
目立った構造を保ちながらテクスチャをスムーズにするための,シンプルだが効果的な手法を提案する。
ガウスピラミッドの粗いレベルは、しばしば自然にテクスチャを排除し、主要な画像構造を要約する。
本手法は, 異なるスケール, 局所的なコントラスト, 形状のテクスチャから構造を分離する上で, 構造劣化や視覚的アーティファクトの導入を伴わずに有効であることを示す。
論文 参考訳(メタデータ) (2023-05-11T02:05:30Z) - Unsupervised HDR Image and Video Tone Mapping via Contrastive Learning [19.346284003982035]
教師なし画像とビデオトーンマッピングのための統合フレームワーク(IVTMNet)を提案する。
ビデオトーンマッピングでは,時間的相関を効率的に活用するための時間的特徴置換(TFR)モジュールを提案する。
実験結果から,本手法は最先端画像やビデオトーンマッピング法よりも優れていた。
論文 参考訳(メタデータ) (2023-03-13T17:45:39Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - FRIH: Fine-grained Region-aware Image Harmonization [49.420765789360836]
我々は,FRIH(Fentral-Aware Image Harmonization)のための新しいグローバルな2段階フレームワークを提案する。
提案アルゴリズムは,軽量モデルを用いて,iHarmony4データセット(PSNRは38.19dB)上で最高の性能を実現する。
論文 参考訳(メタデータ) (2022-05-13T04:50:26Z) - PINs: Progressive Implicit Networks for Multi-Scale Neural
Representations [68.73195473089324]
周波数符号化のインクリメンタルな集合に階層構造を露出するプログレッシブな位置符号化を提案する。
本モデルでは,広帯域のシーンを正確に再構成し,プログレッシブなディテールでシーン表現を学習する。
いくつかの2次元および3次元データセットの実験では、ベースラインと比較して、再構築精度、表現能力、トレーニング速度が改善されている。
論文 参考訳(メタデータ) (2022-02-09T20:33:37Z) - Uncovering the Over-smoothing Challenge in Image Super-Resolution: Entropy-based Quantification and Contrastive Optimization [67.99082021804145]
我々はDetail Enhanced Contrastive Loss (DECLoss)と呼ばれるCOO問題に対する明確な解決策を提案する。
DECLossはコントラスト学習のクラスタリング特性を利用して、潜在的な高分解能分布の分散を直接的に低減する。
我々は複数の超高解像度ベンチマーク上でDECLosを評価し,PSNR指向モデルの知覚品質を向上させることを実証した。
論文 参考訳(メタデータ) (2022-01-04T08:30:09Z) - Perceptually Optimized Deep High-Dynamic-Range Image Tone Mapping [44.00069411131762]
まず、HDR画像を正規化されたラプラシアンピラミッドに分解し、2つのディープニューラルネットワーク(DNN)を用いて、所望のトーンマップ画像のラプラシアンピラミッドを正規化された表現から推定する。
次に、正規化ラプラシアピラミッド距離を最小化することにより、HDR画像のデータベース上での手法全体をエンドツーエンドで最適化する。
論文 参考訳(メタデータ) (2021-09-01T04:17:31Z) - Generalizing Face Forgery Detection with High-frequency Features [63.33397573649408]
現在のCNNベースの検出器は、メソッド固有の色テクスチャに過度に適合するため、一般化に失敗する傾向にある。
フェースフォージェリ検出に高周波雑音を用いることを提案する。
1つは、複数のスケールで高周波ノイズを抽出するマルチスケールの高周波特徴抽出モジュールである。
2つ目は、低レベルRGB特徴抽出器を導く残差誘導空間注意モジュールで、新しい視点からフォージェリートレースにもっと集中する。
論文 参考訳(メタデータ) (2021-03-23T08:19:21Z) - Deep Reformulated Laplacian Tone Mapping [6.078183247169192]
広ダイナミックレンジ(WDR)画像は、一般的な画像と比較して、シーンの詳細とコントラストがより多く含まれている。
WDR画像の詳細は、トーンマッピングプロセス中に減少する可能性がある。
本研究では,新しいラプラシアンピラミッドと深層学習を組み合わせることで,この問題に対処する。
論文 参考訳(メタデータ) (2021-01-31T01:18:20Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。