論文の概要: Single-Shot HDR Recovery via a Video Diffusion Prior
- arxiv url: http://arxiv.org/abs/2605.11628v1
- Date: Tue, 12 May 2026 06:54:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.644612
- Title: Single-Shot HDR Recovery via a Video Diffusion Prior
- Title(参考訳): ビデオ拡散による単一ショットHDR再生
- Authors: Chinmay Talegaonkar, Jinshi He, Christopher McKenna, Nicholas Antipa,
- Abstract要約: 単一ショットHDR再構成を条件付きビデオ生成として再キャストし,生成したフレームをHDR画像に融合する。
いくつかの再現指標において、モデルキャパシティと同等のモデルキャパシティで、最先端のジェネレーティブベースラインを上回ります。
この入力条件付きシーケンス生成および融合フレームワークは、HDRを超えて他の画像再構成タスクに拡張する。
- 参考スコア(独自算出の注目度): 1.7499351967216341
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent generative methods for single-shot high dynamic range (HDR) image reconstruction show promising results, but often struggle with preserving fidelity to the input image. They require separate models to handle highlights and shadows, or sacrifice interpretability by directly predicting the final HDR image. We address these limitations by re-casting single-shot HDR reconstruction as conditional video generation and fusing the generated frames into an HDR image. We finetune a video diffusion model to generate an exposure bracket, conditioned on a low dynamic range (LDR) input. We fuse this image bracket using per-pixel weights predicted by a light-weight UNet. This formulation is simple, interpretable, and effective. Rather than directly hallucinating an HDR image, it explicitly reconstructs the intermediate exposure stack and fuses it into the final output. Our method eliminates the need for separate models across exposure regimes and produces HDR reconstructions with high input fidelity. On quantitative benchmarks, we outperform state-of-the-art generative baselines with comparable model capacity on several reconstruction metrics. Human evaluators further prefer our results in 72% of pairwise comparisons against existing methods. Finally, we show that this input-conditioned sequence generation and fusion framework extends beyond HDR to other image reconstruction tasks, such as all-in-focus image recovery from a single defocus-blurred input.
- Abstract(参考訳): 単一ショット高ダイナミックレンジ(HDR)画像再構成のための最近の生成法は,有望な結果を示すが,入力画像に対する忠実さの維持に苦慮することが多い。
ハイライトとシャドウを処理するために別々のモデルが必要であり、最終HDRイメージを直接予測することで解釈性を犠牲にする。
これらの制約に対処するため、単一ショットHDR再構成を条件付きビデオ生成として再キャストし、生成したフレームをHDR画像に融合する。
低ダイナミックレンジ(LDR)入力で条件付き露光ブラケットを生成するために、ビデオ拡散モデルを微調整する。
軽量UNetによって予測される画素単位の重みを使って,この画像ブラケットを融合する。
この定式化は単純で解釈可能で効果的である。
HDR画像を直接幻覚させるのではなく、中間露光スタックを明示的に再構成し、最終的な出力に融合させる。
提案手法では, 露光系間での分離モデルの必要性を排除し, 高入力忠実度でHDR再構成を行う。
定量的なベンチマークでは、いくつかの再現指標において、モデル容量に匹敵する精度で、最先端の生成ベースラインを上回ります。
人間の評価者は、既存の方法と比較して72%のペア比較で、我々の結果の方が好ましい。
最後に、この入力条件付きシーケンス生成と融合フレームワークがHDRを超えて、単一デフォーカスブル入力からのオールインフォーカス画像の復元など、他の画像再構成タスクに拡張されていることを示す。
関連論文リスト
- LatentHDR: Decoupling Exposure from Diffusion via Conditional Latent-to-Latent Mapping for Text/Image-to-Panoramic HDR [7.699676653195592]
Latentは、潜在空間における露光モデリングからシーン生成を分離するフレームワークである。
事前訓練された拡散バックボーンは、単一のコヒーレントなシーン表現を生成し、条件付き遅延 to-latent は、それを露光特有の表現にマッピングする。
論文 参考訳(メタデータ) (2026-05-11T18:24:04Z) - InstantHDR: Single-forward Gaussian Splatting for High Dynamic Range 3D Reconstruction [48.64335106961342]
既存のHDRパイプラインは、既知のカメラのポーズ、よく校正された高密度ポイントクラウド、シーンごとの時間的最適化に依存している。
現在のフィードフォワード代替品は、露出イン外観を仮定してHDR問題を見落としている。
フィードフォワードネットワークであるInstantを提案する。これは、1つのフォワードパスで非校正多重露光LDRコレクションから3次元HDRシーンを再構成する。
論文 参考訳(メタデータ) (2026-03-11T20:51:47Z) - iHDR: Iterative HDR Imaging with Arbitrary Number of Exposures [1.9686770963118383]
高ダイナミックレンジ(LDR)画像は、複数の低ダイナミックレンジ(LDR)画像からの情報を融合して高品質なHDR画像を得る。
我々のフレームワークはゴーストフリーのデュアルインプット・フュージョン・ネットワーク(Di)と物理ベースのドメインマッピング・ネットワーク(ToneNet)で構成されている。
Diは中間HDR画像を推定し、ToneNetはそれを非線形領域にマッピングし、次のペア融合の基準として機能する。
論文 参考訳(メタデータ) (2025-05-29T01:20:31Z) - Diffusion-Promoted HDR Video Reconstruction [45.73396977607666]
高ダイナミックレンジ(LDR)ビデオ再構成は、低ダイナミックレンジ(LDR)フレームから交互に露出したHDRビデオを生成することを目的としている。
既存の作品の多くは回帰に基づくパラダイムにのみ依存しており、ゴーストのアーティファクトや飽和した地域での詳細の欠如といった悪影響につながっている。
本稿では,HDR-V-Diffと呼ばれるHDR映像再構成のための拡散促進手法を提案する。
論文 参考訳(メタデータ) (2024-06-12T13:38:10Z) - Bracket Diffusion: HDR Image Generation by Consistent LDR Denoising [29.45922922270381]
複数のブラックボックス, 事前学習されたLDR画像拡散モデルの協調動作を用いたHDR画像の生成を実演する。
有効なHDR結果を生成する複数のLDRブラケットを生成するために,複数の復調処理を運用する。
現状未条件および条件回復型(LDR2)生成モデルの結果は,まだHDRでは示されていない。
論文 参考訳(メタデータ) (2024-05-23T08:24:22Z) - Generating Content for HDR Deghosting from Frequency View [56.103761824603644]
近年の拡散モデル (DM) はHDRイメージング分野に導入されている。
DMは画像全体を推定するために大きなモデルで広範囲の反復を必要とする。
ゴーストフリーHDRイメージングのための低周波数対応拡散(LF-Diff)モデルを提案する。
論文 参考訳(メタデータ) (2024-04-01T01:32:11Z) - Self-Supervised High Dynamic Range Imaging with Multi-Exposure Images in
Dynamic Scenes [58.66427721308464]
Selfは、訓練中にダイナミックなマルチ露光画像のみを必要とする自己教師型再構成手法である。
Selfは最先端の自己管理手法に対して優れた結果を出し、教師付き手法に匹敵するパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-10-03T07:10:49Z) - HDR-GAN: HDR Image Reconstruction from Multi-Exposed LDR Images with
Large Motions [62.44802076971331]
マルチ露光LDR画像からHDR画像を合成するための新しいGANモデルHDR-GANを提案する。
本手法は,敵対学習を取り入れることで,欠落したコンテンツのある領域に忠実な情報を生成することができる。
論文 参考訳(メタデータ) (2020-07-03T11:42:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。