論文の概要: UniLight: A Unified Representation for Lighting
- arxiv url: http://arxiv.org/abs/2512.04267v1
- Date: Wed, 03 Dec 2025 21:16:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:45.884525
- Title: UniLight: A Unified Representation for Lighting
- Title(参考訳): UniLight: ライトの統一表現
- Authors: Zitian Zhang, Iliyan Georgiev, Michael Fischer, Yannick Hold-Geoffroy, Jean-François Lalonde, Valentin Deschaintre,
- Abstract要約: 照明表現としての連立潜在空間UniLightを提案する。
私たちの表現は、一貫性があり、転送可能な照明の特徴を捉え、モジュール間のフレキシブルな操作を可能にします。
- 参考スコア(独自算出の注目度): 30.172652970553887
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Lighting has a strong influence on visual appearance, yet understanding and representing lighting in images remains notoriously difficult. Various lighting representations exist, such as environment maps, irradiance, spherical harmonics, or text, but they are incompatible, which limits cross-modal transfer. We thus propose UniLight, a joint latent space as lighting representation, that unifies multiple modalities within a shared embedding. Modality-specific encoders for text, images, irradiance, and environment maps are trained contrastively to align their representations, with an auxiliary spherical-harmonics prediction task reinforcing directional understanding. Our multi-modal data pipeline enables large-scale training and evaluation across three tasks: lighting-based retrieval, environment-map generation, and lighting control in diffusion-based image synthesis. Experiments show that our representation captures consistent and transferable lighting features, enabling flexible manipulation across modalities.
- Abstract(参考訳): ライティングは視覚的外観に強い影響を与えるが、画像中のライティングを理解し、表現することは、依然として非常に難しい。
環境マップ、照度、球面調和、テキストなど、様々な照明表現が存在するが、それらは互換性がなく、モダル間の移動を制限する。
そこで我々は,共有埋め込み内で複数のモードを統一する照明表現として,共用ラテント空間UniLightを提案する。
テキスト,画像,照度,環境マップのモダリティ固有のエンコーダを対照的に訓練し,それらの表現を整列させる。
我々のマルチモーダルデータパイプラインは、照明に基づく検索、環境マップ生成、拡散に基づく画像合成における照明制御という3つのタスクにわたる大規模なトレーニングと評価を可能にする。
実験により、我々の表現は、一貫性があり、転送可能な照明特性を捉え、モジュラリティ間の柔軟な操作を可能にすることが示された。
関連論文リスト
- PractiLight: Practical Light Control Using Foundational Diffusion Models [78.75949075070595]
PractiLightは、生成された画像における光制御の実践的なアプローチである。
私たちの重要な洞察は、画像内のライティング関係は、自己注意層におけるトークンの相互作用と本質的に類似しているということです。
我々は,パラメータとデータ効率が証明された品質と制御の観点から,最先端の性能を実証する。
論文 参考訳(メタデータ) (2025-09-01T23:38:40Z) - UniRelight: Learning Joint Decomposition and Synthesis for Video Relighting [85.27994475113056]
我々はアルベドを共同で推定し、単一のパスで信頼出力を合成する汎用的アプローチを導入する。
本モデルは,多様な領域にまたがる強力な一般化を示し,視覚的忠実度と時間的整合性の両方において,従来の手法を超越している。
論文 参考訳(メタデータ) (2025-06-18T17:56:45Z) - DreamLight: Towards Harmonious and Consistent Image Relighting [41.90032795389507]
ユニバーサル・イメージ・リライティングのためのDreamLightというモデルを導入する。
照明や色調の美的均一性を保ちつつ、被験者をシームレスに新しい背景に合成することができる。
論文 参考訳(メタデータ) (2025-06-17T14:05:24Z) - ReCap: Better Gaussian Relighting with Cross-Environment Captures [51.2614945509044]
ReCapは、目に見えない環境で正確な3Dオブジェクトのリライトを行うマルチタスクシステムである。
具体的には、ReCapは共通の属性のセットを共有する複数の照明表現を共同で最適化する。
これにより、相互の材料属性を囲むコヒーレントな照明表現の集合が自然に調和し、様々な物体の外観の共通点と相違点を利用する。
合理化されたシェーディング機能と効果的な後処理とともに、ReCapは、拡張されたリライトベンチマークにおいて、主要な競合企業すべてを上回っている。
論文 参考訳(メタデータ) (2024-12-10T14:15:32Z) - DifFRelight: Diffusion-Based Facial Performance Relighting [12.909429637057343]
拡散に基づく画像から画像への変換を用いた,自由視点顔の表情のリライティングのための新しいフレームワークを提案する。
我々は、正確な照明制御のための拡散モデルを訓練し、フラットライト入力からの顔画像の高忠実度化を可能にする。
このモデルは、目の反射、地表面散乱、自影、半透明といった複雑な照明効果を正確に再現する。
論文 参考訳(メタデータ) (2024-10-10T17:56:44Z) - Relightful Harmonization: Lighting-aware Portrait Background Replacement [23.19641174787912]
背景画像を用いた背景像に対する高度な照明効果をシームレスに調和させるライティング対応拡散モデルであるRelightful Harmonizationを導入する。
まず、拡散モデルを用いて、対象画像の背景から照明情報をエンコードする照明表現モジュールを導入する。
第2に、画像背景から学習した照明特徴と、パノラマ環境マップから学習した照明特徴とを整列するアライメントネットワークを導入する。
論文 参考訳(メタデータ) (2023-12-11T23:20:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。