論文の概要: HDR Video Generation via Latent Alignment with Logarithmic Encoding
- arxiv url: http://arxiv.org/abs/2604.11788v1
- Date: Mon, 13 Apr 2026 17:55:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.735094
- Title: HDR Video Generation via Latent Alignment with Logarithmic Encoding
- Title(参考訳): 対数符号化による潜在アライメントによるHDR映像生成
- Authors: Naomi Ken Korem, Mohamed Oumoumad, Harel Cain, Matan Ben Yosef, Urska Jelercic, Ofir Bibi, Yaron Inger, Or Patashnik, Daniel Cohen-Or,
- Abstract要約: 適応最小限の事前学習ビデオモデルを用いて,高品質なHDRビデオ生成を実演する。
その結果,HDRは画像形成機構が根本的に異なるにもかかわらず,生成モデルを再設計することなく効果的に処理できることが示唆された。
- 参考スコア(独自算出の注目度): 41.63873187838369
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High dynamic range (HDR) imagery offers a rich and faithful representation of scene radiance, but remains challenging for generative models due to its mismatch with the bounded, perceptually compressed data on which these models are trained. A natural solution is to learn new representations for HDR, which introduces additional complexity and data requirements. In this work, we show that HDR generation can be achieved in a much simpler way by leveraging the strong visual priors already captured by pretrained generative models. We observe that a logarithmic encoding widely used in cinematic pipelines maps HDR imagery into a distribution that is naturally aligned with the latent space of these models, enabling direct adaptation via lightweight fine-tuning without retraining an encoder. To recover details that are not directly observable in the input, we further introduce a training strategy based on camera-mimicking degradations that encourages the model to infer missing high dynamic range content from its learned priors. Combining these insights, we demonstrate high-quality HDR video generation using a pretrained video model with minimal adaptation, achieving strong results across diverse scenes and challenging lighting conditions. Our results indicate that HDR, despite representing a fundamentally different image formation regime, can be handled effectively without redesigning generative models, provided that the representation is chosen to align with their learned priors.
- Abstract(参考訳): 高ダイナミックレンジ(HDR)画像は、シーンの放射率を豊かかつ忠実に表現するが、これらのモデルが訓練された有界、知覚的に圧縮されたデータとのミスマッチのため、生成モデルでは依然として困難である。
自然な解決策は、さらなる複雑さとデータ要求をもたらすHDRの新しい表現を学ぶことである。
本研究では、事前学習された生成モデルによって既に捉えられている強い視覚的先行性を活用することにより、より単純な方法でHDR生成を実現することができることを示す。
撮影パイプラインで広く使われている対数符号化は、HDR画像をこれらのモデルの潜在空間に自然に整合した分布にマッピングし、エンコーダをリトレーニングすることなく、軽量な微調整による直接適応を可能にする。
入力で直接観測できない細部を復元するため,カメラ・マイメーキング劣化に基づくトレーニング戦略を導入する。
これらの知見を組み合わせることで、トレーニング済みのビデオモデルによる高品質なHDRビデオ生成を最小限の適応で実現し、多様なシーンにまたがって強力な結果が得られ、照明条件に挑戦することを示す。
以上の結果から,HDRは画像形成機構が根本的に異なるにもかかわらず,生成モデルを再設計することなく効果的に処理できることが示唆された。
関連論文リスト
- HDR Image Reconstruction using an Unsupervised Fusion Model [0.0]
高ダイナミックレンジ(露光)イメージングは、自然界に存在する幅広い明るさレベルを再現することを目的としている。
本稿では,HDR画像生成のための深層学習に基づくマルチ露光融合手法を提案する。
論文 参考訳(メタデータ) (2025-10-21T17:43:22Z) - LuxDiT: Lighting Estimation with Video Diffusion Transformer [66.60450792095901]
単一の画像やビデオからシーンライティングを推定することは、コンピュータビジョンとグラフィックスにおいて長年の課題である。
本稿では,映像拡散変換器を微調整し,視覚入力を前提としたHDR環境マップを生成するLuxDiTを提案する。
論文 参考訳(メタデータ) (2025-09-03T19:59:20Z) - LEDiff: Latent Exposure Diffusion for HDR Generation [11.669442066168244]
LEDiffは、遅延空間露光融合技術により、HDRコンテンツを生成する生成モデルを実現する方法である。
また、LDR-to-fusionコンバータとしても機能し、既存の低ダイナミックレンジ画像のダイナミックレンジを拡張する。
論文 参考訳(メタデータ) (2024-12-19T02:15:55Z) - Adapting Pretrained Networks for Image Quality Assessment on High Dynamic Range Displays [0.0]
従来の画像品質指標(IQMs)は、知覚的に均一なガンマ符号化されたピクセル値のために設計されている。
利用可能なデータセットのほとんどは、標準およびおそらく制御されていない観測条件で収集された標準ダイナミックレンジ(SDR)イメージで構成されている。
一般的なトレーニング済みニューラルネットワークもSDR入力を意図しており、HDRコンテンツへの直接適用を制限している。
本研究では,HDRデータに基づく画像品質評価(IQA)のための深層学習モデル学習のための,より効果的なアプローチについて検討する。
論文 参考訳(メタデータ) (2024-05-01T17:57:12Z) - Generating Content for HDR Deghosting from Frequency View [56.103761824603644]
近年の拡散モデル (DM) はHDRイメージング分野に導入されている。
DMは画像全体を推定するために大きなモデルで広範囲の反復を必要とする。
ゴーストフリーHDRイメージングのための低周波数対応拡散(LF-Diff)モデルを提案する。
論文 参考訳(メタデータ) (2024-04-01T01:32:11Z) - SMAE: Few-shot Learning for HDR Deghosting with Saturation-Aware Masked
Autoencoders [97.64072440883392]
そこで本研究では,SSHDRと呼ばれる2段階の訓練を通した短距離HDRイメージングを実現するための,新しい半教師付きアプローチを提案する。
以前の方法とは異なり、コンテンツを直接回復し、ゴーストを同時に除去することは、最適に達成することが難しい。
実験により、SSHDRは異なるデータセットの内外における定量的かつ定性的に最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-04-14T03:42:51Z) - GlowGAN: Unsupervised Learning of HDR Images from LDR Images in the Wild [74.52723408793648]
そこで本研究では,HDR画像の生成モデルを構築するための第1の手法について述べる。
鍵となる考え方は、GAN(Generative Adversarial Network)を訓練して、様々な露光下でLDRに投影された場合、実際のLDR画像と区別できないHDR画像を生成することである。
実験の結果,GlowGANはランドスケープ,雷,窓など多くの難題において,光現実的HDR画像を合成できることがわかった。
論文 参考訳(メタデータ) (2022-11-22T15:42:08Z) - Self-supervised HDR Imaging from Motion and Exposure Cues [14.57046548797279]
本稿では,学習可能なHDR推定のための新たな自己教師型アプローチを提案する。
実験の結果,提案手法を用いて訓練したHDRモデルは,全監督下で訓練したモデルと性能の競争力を発揮することがわかった。
論文 参考訳(メタデータ) (2022-03-23T10:22:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。