論文の概要: GMODiff: One-Step Gain Map Refinement with Diffusion Priors for HDR Reconstruction
- arxiv url: http://arxiv.org/abs/2512.16357v1
- Date: Thu, 18 Dec 2025 09:50:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:32.00282
- Title: GMODiff: One-Step Gain Map Refinement with Diffusion Priors for HDR Reconstruction
- Title(参考訳): GMODiff : HDR再建のための拡散前駆体を用いた一段階ゲインマップ再構成
- Authors: Tao Hu, Weiyu Zhou, Yanjie Tu, Peng Wu, Wei Dong, Qingsen Yan, Yanning Zhang,
- Abstract要約: マルチ露光HDR再構成のためのゲインマップ駆動1ステップ拡散フレームワークであるGMODiffを紹介する。
我々のGMOはいくつかの最先端手法に対して良好に動作し、従来のLCM方式よりも100倍高速である。
- 参考スコア(独自算出の注目度): 48.881484713994496
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pre-trained Latent Diffusion Models (LDMs) have recently shown strong perceptual priors for low-level vision tasks, making them a promising direction for multi-exposure High Dynamic Range (HDR) reconstruction. However, directly applying LDMs to HDR remains challenging due to: (1) limited dynamic-range representation caused by 8-bit latent compression, (2) high inference cost from multi-step denoising, and (3) content hallucination inherent to generative nature. To address these challenges, we introduce GMODiff, a gain map-driven one-step diffusion framework for multi-exposure HDR reconstruction. Instead of reconstructing full HDR content, we reformulate HDR reconstruction as a conditionally guided Gain Map (GM) estimation task, where the GM encodes the extended dynamic range while retaining the same bit depth as LDR images. We initialize the denoising process from an informative regression-based estimate rather than pure noise, enabling the model to generate high-quality GMs in a single denoising step. Furthermore, recognizing that regression-based models excel in content fidelity while LDMs favor perceptual quality, we leverage regression priors to guide both the denoising process and latent decoding of the LDM, suppressing hallucinations while preserving structural accuracy. Extensive experiments demonstrate that our GMODiff performs favorably against several state-of-the-art methods and is 100 faster than previous LDM-based methods.
- Abstract(参考訳): 事前学習型潜時拡散モデル(LDMs)は近年,低レベルの視覚タスクに強い知覚的先行性を示し,マルチ露光高ダイナミックレンジ(HDR)再構築の有望な方向性を示している。
しかし, LDMをHDRに直接適用することは, 1) 8ビット遅延圧縮によるダイナミックレンジ表現の制限, (2)多段階復調による高い推論コスト, (3)生成性に固有のコンテンツ幻覚など,依然として困難である。
これらの課題に対処するために,マルチ露光HDR再構成のためのゲインマップ駆動1ステップ拡散フレームワークであるGMODiffを紹介する。
完全なHDRコンテンツを再構成する代わりに、HDR再構成を条件付きゲインマップ(GM)推定タスクとして再構成し、GMはLDR画像と同じビット深度を維持しながら拡張ダイナミックレンジを符号化する。
純粋な雑音ではなく情報レグレッションに基づく推定からデノナイジング過程を初期化し、モデルが1つのデノナイジングステップで高品質なGMを生成できるようにする。
さらに,レグレッションベースモデルが内容の忠実さに優れ,LDMが知覚品質を優先していることを認識し,レグレッション・プレッションを活用して,LDMの復調過程と潜時復号の両方をガイドし,構造的精度を維持しながら幻覚を抑制する。
GMODiff はいくつかの最先端手法に対して良好に動作し,従来の LDM 法より 100 倍高速であることを示す。
関連論文リスト
- AP-LDM: Attentive and Progressive Latent Diffusion Model for Training-Free High-Resolution Image Generation [12.564266865237343]
遅延拡散モデル(LDM)は、しばしば高分解能(HR)画像を直接生成する際に重要な構造歪みを経験する。
生成プロセスの高速化を図り,HR画像の品質向上を目的とした注意・進歩型LDM(Attentive and Progressive LDM)を提案する。
AP-LDM は LDM の分解過程を, (i) 注意的訓練分解性脱ノイズ, (ii) 進行性高分解能脱ノイズの2段階に分解する。
論文 参考訳(メタデータ) (2024-10-08T13:56:28Z) - Bracket Diffusion: HDR Image Generation by Consistent LDR Denoising [29.45922922270381]
複数のブラックボックス, 事前学習されたLDR画像拡散モデルの協調動作を用いたHDR画像の生成を実演する。
有効なHDR結果を生成する複数のLDRブラケットを生成するために,複数の復調処理を運用する。
現状未条件および条件回復型(LDR2)生成モデルの結果は,まだHDRでは示されていない。
論文 参考訳(メタデータ) (2024-05-23T08:24:22Z) - Generating Content for HDR Deghosting from Frequency View [56.103761824603644]
近年の拡散モデル (DM) はHDRイメージング分野に導入されている。
DMは画像全体を推定するために大きなモデルで広範囲の反復を必要とする。
ゴーストフリーHDRイメージングのための低周波数対応拡散(LF-Diff)モデルを提案する。
論文 参考訳(メタデータ) (2024-04-01T01:32:11Z) - Towards High-quality HDR Deghosting with Conditional Diffusion Models [88.83729417524823]
高ダイナミックレンジ(LDR)画像は、既存のディープニューラルネットワーク(DNN)技術により、複数の低ダイナミックレンジ(LDR)画像から復元することができる。
DNNは、LDR画像が飽和度と大きな動きを持つ場合、ゴーストアーティファクトを生成する。
拡散モデルの条件としてLDR特徴を利用する画像生成としてHDRデゴースト問題を定式化する。
論文 参考訳(メタデータ) (2023-11-02T01:53:55Z) - SMAE: Few-shot Learning for HDR Deghosting with Saturation-Aware Masked
Autoencoders [97.64072440883392]
そこで本研究では,SSHDRと呼ばれる2段階の訓練を通した短距離HDRイメージングを実現するための,新しい半教師付きアプローチを提案する。
以前の方法とは異なり、コンテンツを直接回復し、ゴーストを同時に除去することは、最適に達成することが難しい。
実験により、SSHDRは異なるデータセットの内外における定量的かつ定性的に最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-04-14T03:42:51Z) - Deep HDR Hallucination for Inverse Tone Mapping [7.310237013012436]
本研究は,LDR画像の被曝領域から欠落した情報を幻覚するGANに基づく手法を提案する。
これは、よく露出した領域に対して優れたダイナミックレンジ拡張と、飽和した領域と未露出の領域に対するプラウシブル幻覚を提供する。
論文 参考訳(メタデータ) (2021-06-17T13:35:40Z) - HDR-GAN: HDR Image Reconstruction from Multi-Exposed LDR Images with
Large Motions [62.44802076971331]
マルチ露光LDR画像からHDR画像を合成するための新しいGANモデルHDR-GANを提案する。
本手法は,敵対学習を取り入れることで,欠落したコンテンツのある領域に忠実な情報を生成することができる。
論文 参考訳(メタデータ) (2020-07-03T11:42:35Z) - Single-Image HDR Reconstruction by Learning to Reverse the Camera
Pipeline [100.5353614588565]
本稿では,LDR画像形成パイプラインの領域知識をモデルに組み込むことを提案する。
我々は,HDRto-LDR画像形成パイプラインを(1)ダイナミックレンジクリッピング,(2)カメラ応答関数からの非線形マッピング,(3)量子化としてモデル化する。
提案手法は,最先端の単一画像HDR再構成アルゴリズムに対して良好に動作することを示す。
論文 参考訳(メタデータ) (2020-04-02T17:59:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。