論文の概要: LumaFlux: Lifting 8-Bit Worlds to HDR Reality with Physically-Guided Diffusion Transformers
- arxiv url: http://arxiv.org/abs/2604.02787v1
- Date: Fri, 03 Apr 2026 06:54:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.36206
- Title: LumaFlux: Lifting 8-Bit Worlds to HDR Reality with Physically-Guided Diffusion Transformers
- Title(参考訳): LumaFlux:物理誘導拡散変換器で8ビット世界からHDRリアリティーへ
- Authors: Shreshth Saini, Hakan Gedik, Neil Birkbeck, Yilin Wang, Balu Adsumilli, Alan C. Bovik,
- Abstract要約: 本稿では,SDR-to-Reconstructionのための第1の物理的および知覚的に誘導される変換器であるLumaFluxを紹介する。
ベンチマーク全体では、LumaFluxは最先端のベースラインよりも優れており、優れた輝度再構成と知覚的な色忠実性を実現している。
- 参考スコア(独自算出の注目度): 33.647308897653396
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid adoption of HDR-capable devices has created a pressing need to convert the 8-bit Standard Dynamic Range (SDR) content into perceptually and physically accurate 10-bit High Dynamic Range (HDR). Existing inverse tone-mapping (ITM) methods often rely on fixed tone-mapping operators that struggle to generalize to real-world degradations, stylistic variations, and camera pipelines, frequently producing clipped highlights, desaturated colors, or unstable tone reproduction. We introduce LumaFlux, a first physically and perceptually guided diffusion transformer (DiT) for SDR-to-HDR reconstruction by adapting a large pretrained DiT. Our LumaFlux introduces (1) a Physically-Guided Adaptation (PGA) module that injects luminance, spatial descriptors, and frequency cues into attention through low-rank residuals; (2) a Perceptual Cross-Modulation (PCM) layer that stabilizes chroma and texture via FiLM conditioning from vision encoder features; and (3) an HDR Residual Coupler that fuses physical and perceptual signals under a timestep- and layer-adaptive modulation schedule. Finally, a lightweight Rational-Quadratic Spline decoder reconstructs smooth, interpretable tone fields for highlight and exposure expansion, enhancing the output of the VAE decoder to generate HDR. To enable robust HDR learning, we curate the first large-scale SDR-HDR training corpus. For fair and reproducible comparison, we further establish a new evaluation benchmark, comprising HDR references and corresponding expert-graded SDR versions. Across benchmarks, LumaFlux outperforms state-of-the-art baselines, achieving superior luminance reconstruction and perceptual color fidelity with minimal additional parameters.
- Abstract(参考訳): HDR対応機器の急速な普及により、8ビット標準ダイナミックレンジ(SDR)コンテンツを知覚的かつ物理的に正確な10ビット高ダイナミックレンジ(HDR)に変換する必要性が高まっている。
既存の逆トーン・マッピング法(ITM)は、実世界の劣化、スタイリスティックなバリエーション、カメラ・パイプラインへの一般化に苦慮する固定トーン・マッピング演算子に依存し、しばしばクリップされたハイライト、不飽和色、不安定なトーン再生を生成する。
本稿では,SDR-HDR再構成のための第1の物理的および知覚的誘導拡散変換器であるLumaFluxを紹介する。
我々のLumaFluxは、(1)輝度、空間ディスクリプタ、および周波数キューを低ランク残差で注意に注入するPGAモジュール、(2)視覚エンコーダの特徴からFILM条件でクロマとテクスチャを安定化する知覚横断変調(PCM)層、(3)時間ステップおよび層適応変調スケジュールの下で物理信号と知覚信号を融合するHDRResidual Couplerを導入している。
最後に、軽量なRational-Quadratic Splineデコーダにより、ハイライトと露出拡大のためにスムーズで解釈可能なトーンフィールドを再構成し、VAEデコーダの出力を高めてHDRを生成する。
堅牢なHDR学習を実現するため、我々は最初の大規模SDR-HDRトレーニングコーパスをキュレートする。
公正かつ再現可能な比較のために、HDR参照とそれに対応するエキスパートグレードSDRバージョンを含む新しい評価ベンチマークを確立する。
ベンチマーク全体では、LumaFluxは最先端のベースラインよりも優れており、最小限の追加パラメータで優れた輝度再構成と知覚的な色の忠実さを実現している。
関連論文リスト
- Physically Inspired Gaussian Splatting for HDR Novel View Synthesis [40.99906396910274]
高ダイナミックレンジノベルビュー合成 (biased-NVS) は、マルチ露光低ダイナミックレンジ(LDR)ビューを融合することにより、ダイナミックディテールでシーンを再構築する。
トーンマップ結果の制約による暗黙的なHDR含量は,異常なHDR値の補正に失敗し,非露出領域におけるガウスの勾配が制限される。
本稿では,HDR-NVSフレームワークであるPhys-GSを紹介する。
論文 参考訳(メタデータ) (2026-03-30T04:27:39Z) - X2HDR: HDR Image Generation in a Perceptually Uniform Space [37.83280929526874]
高ダイナミックレンジフォーマットとディスプレイはますます普及しているが、最先端の画像生成装置は低ダイナミックレンジ(LDR)出力に限定されている。
既存の事前学習拡散モデルでは,スクラッチから再学習することなく,HDR生成に容易に適応できることを示す。
論文 参考訳(メタデータ) (2026-02-04T17:59:51Z) - GMODiff: One-Step Gain Map Refinement with Diffusion Priors for HDR Reconstruction [48.881484713994496]
マルチ露光HDR再構成のためのゲインマップ駆動1ステップ拡散フレームワークであるGMODiffを紹介する。
我々のGMOはいくつかの最先端手法に対して良好に動作し、従来のLCM方式よりも100倍高速である。
論文 参考訳(メタデータ) (2025-12-18T09:50:25Z) - Reconstructing 3D Scenes in Native High Dynamic Range [82.90064638813185]
本研究では,HDR観測を直接モデル化した3次元シーン再構成法を提案する。
bf Native High Dynamic Range 3D Gaussian Splatting (NH-3DGS)を提案する。
NH-3DGSは, 再構成品質と動的レンジ保存において, 既存の手法よりも有意に優れる合成多視点HDRデータセットと実HDRデータセットの両方を実証した。
論文 参考訳(メタデータ) (2025-11-17T02:33:31Z) - HDR-GS: Efficient High Dynamic Range Novel View Synthesis at 1000x Speed via Gaussian Splatting [76.5908492298286]
既存のHDR NVS法は主にNeRFに基づいている。
訓練時間は長く、推論速度は遅い。
我々は新しいフレームワークHigh Dynamic Range Gaussian Splatting (-GS)を提案する。
論文 参考訳(メタデータ) (2024-05-24T00:46:58Z) - Generating Content for HDR Deghosting from Frequency View [56.103761824603644]
近年の拡散モデル (DM) はHDRイメージング分野に導入されている。
DMは画像全体を推定するために大きなモデルで広範囲の反復を必要とする。
ゴーストフリーHDRイメージングのための低周波数対応拡散(LF-Diff)モデルを提案する。
論文 参考訳(メタデータ) (2024-04-01T01:32:11Z) - LAN-HDR: Luminance-based Alignment Network for High Dynamic Range Video
Reconstruction [20.911738532410766]
本稿では,LDRフレームを特徴空間に整列させ,その特徴をHDRフレームにマージする,エンドツーエンドのHDRビデオ合成フレームワークを提案する。
トレーニングでは、フレーム再構築損失に加えて時間的損失を採用し、時間的一貫性を高め、フリッカリングを低減する。
論文 参考訳(メタデータ) (2023-08-22T01:43:00Z) - Efficient HDR Reconstruction from Real-World Raw Images [16.54071503000866]
エッジデバイス上の高解像度スクリーンは、効率的な高ダイナミックレンジ(HDR)アルゴリズムに対する強い需要を刺激する。
多くの既存のHDRメソッドは不満足な結果をもたらすか、計算資源やメモリ資源を消費する。
本研究では,生画像から直接HDRを再構成し,新しいニューラルネットワーク構造を探索する優れた機会を見出した。
論文 参考訳(メタデータ) (2023-06-17T10:10:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。