論文の概要: HDR Environment Map Estimation with Latent Diffusion Models
- arxiv url: http://arxiv.org/abs/2507.21261v1
- Date: Mon, 28 Jul 2025 18:30:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:55.174084
- Title: HDR Environment Map Estimation with Latent Diffusion Models
- Title(参考訳): 潜時拡散モデルによるHDR環境マップの推定
- Authors: Jack Hilliard, Adrian Hilton, Jean-Yves Guillemaut,
- Abstract要約: 我々は、Latent Diffusion Modelを用いて、ミラー反射面を可視的に軽量にできる高品質な環境マップを作成する。
ERP表現を使用する場合の一般的な問題は、ポールの歪みと環境マップの側面のシームである。
提案するPanoDiTネットワークは,ERP歪みやアーチファクトを低減させるが,画質と可視性は犠牲である。
- 参考スコア(独自算出の注目度): 21.393389135740712
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We advance the field of HDR environment map estimation from a single-view image by establishing a novel approach leveraging the Latent Diffusion Model (LDM) to produce high-quality environment maps that can plausibly light mirror-reflective surfaces. A common issue when using the ERP representation, the format used by the vast majority of approaches, is distortions at the poles and a seam at the sides of the environment map. We remove the border seam artefact by proposing an ERP convolutional padding in the latent autoencoder. Additionally, we investigate whether adapting the diffusion network architecture to the ERP format can improve the quality and accuracy of the estimated environment map by proposing a panoramically-adapted Diffusion Transformer architecture. Our proposed PanoDiT network reduces ERP distortions and artefacts, but at the cost of image quality and plausibility. We evaluate with standard benchmarks to demonstrate that our models estimate high-quality environment maps that perform competitively with state-of-the-art approaches in both image quality and lighting accuracy.
- Abstract(参考訳): 我々は、Latent Diffusion Model (LDM) を利用して、ミラー反射面を可視的に軽視できる高品質な環境マップを作成する新しいアプローチを確立することにより、単一視点画像からのHDR環境マップ推定の分野を前進させる。
ERP表現を使用する場合の一般的な問題は、ほとんどのアプローチで使用されるフォーマットは、ポールの歪みと環境マップの側面の縫い目である。
我々は,潜伏オートエンコーダにおけるERP畳み込みパディングを提案することにより,境界シームアーティファクトを除去する。
さらに、拡散ネットワークアーキテクチャをERP形式に適応させることで、パノラマ適応拡散変換器アーキテクチャを提案することにより、推定環境マップの品質と精度を向上させることができるかどうかを検討する。
提案するPanoDiTネットワークは,ERP歪みやアーチファクトを低減させるが,画質と可視性は犠牲である。
我々は,画像品質と照明精度の両面で最先端のアプローチと競合する高品質な環境マップを,標準ベンチマークで評価した。
関連論文リスト
- Data Augmentation and Resolution Enhancement using GANs and Diffusion Models for Tree Segmentation [49.13393683126712]
都市森林は、環境の質を高め、都市における生物多様性を支援する上で重要な役割を担っている。
複雑な地形と異なる衛星センサーやUAV飛行高度による画像解像度の変化により、正確に木を検知することは困難である。
低解像度空中画像の品質を高めるため,GANと拡散モデルとドメイン適応を統合した新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2025-05-21T03:57:10Z) - 360U-Former: HDR Illumination Estimation with Panoramic Adapted Vision Transformers [21.393389135740712]
我々はGANとして360U-Formerを訓練し、限られた視野低ダイナミックレンジ画像(LDRI)からHDRIを生成する。
提案手法は,現在の照明推定プロトコルとデータセットを用いて評価する。
論文 参考訳(メタデータ) (2024-10-17T14:03:53Z) - Deep Learning based Optical Image Super-Resolution via Generative Diffusion Models for Layerwise in-situ LPBF Monitoring [4.667646675144656]
我々は,ビルドプレートの低解像度画像とビルドプレートの詳細な高解像度光学画像とを関連付けるために,生成的深層学習モデルを実装した。
低解像度Webカメラ画像からビルドプレートの現実的な高解像度画像を生成するために,条件付き潜在確率拡散モデルを訓練した。
また, 印刷部の3次元形状を再現し, 復元した試料の表面粗さを解析する枠組みを設計した。
論文 参考訳(メタデータ) (2024-09-20T02:59:25Z) - Enhancing Low-light Light Field Images with A Deep Compensation Unfolding Network [52.77569396659629]
本稿では,低光環境下で撮像した光場(LF)画像の復元に,DCUNet(Deep compensation network openfolding)を提案する。
このフレームワークは、中間拡張結果を使用して照明マップを推定し、展開プロセスで新しい拡張結果を生成する。
本稿では,LF画像の特徴を適切に活用するために,擬似明示的特徴相互作用モジュールを提案する。
論文 参考訳(メタデータ) (2023-08-10T07:53:06Z) - Single-View Height Estimation with Conditional Diffusion Probabilistic
Models [1.8782750537161614]
我々は、マルコフ連鎖として光学画像とDSM画像の連成分布を学習するために、生成拡散モデルを訓練する。
これは、音源画像に条件付けされたままの復調スコアマッチング目標を最小化して、現実的な高解像度3次元表面を生成する。
本稿では,1枚のリモートセンシング画像から高度推定を行う条件付き拡散確率モデル(DDPM)を実験する。
論文 参考訳(メタデータ) (2023-04-26T00:37:05Z) - SurfaceNet: Adversarial SVBRDF Estimation from a Single Image [13.614038825719724]
SurfaceNetは、空間的に変化する双方向反射率分布関数(SVBRDF)を単一画像から推定するアプローチである。
本稿では,高品質で高分解能な表面反射率マップを作成可能な,パッチベースの新たな生成対向ネットワーク(GAN)を提案する。
論文 参考訳(メタデータ) (2021-07-23T15:18:54Z) - Light Field Reconstruction via Deep Adaptive Fusion of Hybrid Lenses [67.01164492518481]
本稿では,ハイブリットレンズを用いた高分解能光場(LF)画像の再構成問題について検討する。
本稿では,入力の特徴を包括的に活用できる新しいエンドツーエンド学習手法を提案する。
我々のフレームワークは、高解像度なLFデータ取得のコストを削減し、LFデータストレージと送信の恩恵を受ける可能性がある。
論文 参考訳(メタデータ) (2021-02-14T06:44:47Z) - PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and
Localization [64.39761523935613]
本稿では,画像中の異常を同時検出・ローカライズするPatch Distribution Modeling, PaDiMを提案する。
PaDiMは、パッチの埋め込みに事前訓練された畳み込みニューラルネットワーク(CNN)を使用している。
また、CNNの異なるセマンティックレベル間の相関を利用して、異常のローカライズも改善している。
論文 参考訳(メタデータ) (2020-11-17T17:29:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。