論文の概要: PractiLight: Practical Light Control Using Foundational Diffusion Models
- arxiv url: http://arxiv.org/abs/2509.01837v1
- Date: Mon, 01 Sep 2025 23:38:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.861251
- Title: PractiLight: Practical Light Control Using Foundational Diffusion Models
- Title(参考訳): PractiLight:基礎拡散モデルを用いた実用的な光制御
- Authors: Yotam Erel, Rishabh Dabral, Vladislav Golyanik, Amit H. Bermano, Christian Theobalt,
- Abstract要約: PractiLightは、生成された画像における光制御の実践的なアプローチである。
私たちの重要な洞察は、画像内のライティング関係は、自己注意層におけるトークンの相互作用と本質的に類似しているということです。
我々は,パラメータとデータ効率が証明された品質と制御の観点から,最先端の性能を実証する。
- 参考スコア(独自算出の注目度): 78.75949075070595
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Light control in generated images is a difficult task, posing specific challenges, spanning over the entire image and frequency spectrum. Most approaches tackle this problem by training on extensive yet domain-specific datasets, limiting the inherent generalization and applicability of the foundational backbones used. Instead, PractiLight is a practical approach, effectively leveraging foundational understanding of recent generative models for the task. Our key insight is that lighting relationships in an image are similar in nature to token interaction in self-attention layers, and hence are best represented there. Based on this and other analyses regarding the importance of early diffusion iterations, PractiLight trains a lightweight LoRA regressor to produce the direct irradiance map for a given image, using a small set of training images. We then employ this regressor to incorporate the desired lighting into the generation process of another image using Classifier Guidance. This careful design generalizes well to diverse conditions and image domains. We demonstrate state-of-the-art performance in terms of quality and control with proven parameter and data efficiency compared to leading works over a wide variety of scenes types. We hope this work affirms that image lighting can feasibly be controlled by tapping into foundational knowledge, enabling practical and general relighting.
- Abstract(参考訳): 生成した画像の光制御は難しい課題であり、画像全体と周波数スペクトルにまたがる特定の課題に対処する。
ほとんどのアプローチでは、広範だがドメイン固有のデータセットをトレーニングすることでこの問題に対処し、使用する基本バックボーンの固有の一般化と適用性を制限している。
代わりにPractiLightは実践的なアプローチであり、タスクの最近の生成モデルの基本的な理解を効果的に活用する。
私たちのキーとなる洞察は、画像内のライティング関係は、本質的には自己注意層におけるトークンの相互作用と似ており、そのために最もよく表現されている、ということです。
初期の拡散イテレーションの重要性に関するその他の分析に基づいて、PractiLightは、少量のトレーニング画像を用いて、与えられた画像に対する直接照射マップを生成するために、軽量のLORA回帰器を訓練する。
次に、この回帰器を用いて、別の画像の生成プロセスに所望の照明を組み込む。
この注意深い設計は、様々な条件や画像領域によく当てはまる。
本研究では,様々な場面における先行作品と比較して,パラメータとデータ効率が証明された品質と制御の面での最先端性能を実証する。
この研究は、基礎知識を取り入れ、実用的で一般的なリライティングを可能にすることで、イメージライティングを確実に制御できることを願っている。
関連論文リスト
- UNICE: Training A Universal Image Contrast Enhancer [5.592360872268223]
既存の画像コントラスト強調法は、通常、露光下/露光補正、低照度、バックライト画像エンハンスメントなどの特定のタスクのために設計されている。
しかし、学習されたモデルは、特定のタスクの異なるデータセットでさえ、異なるタスクにわたって、低い一般化性能を示す。
提案手法,すなわちユニバーサル・コントラスト・エンハンサー (UNICE) は人為的なラベル付けが不要である。
既存の画像コントラスト拡張手法よりもはるかに強力な一般化性能を示し、また複数の非参照画像品質指標において、手動で作成したグランドトルースよりも優れていた。
論文 参考訳(メタデータ) (2025-07-23T02:43:09Z) - DreamLight: Towards Harmonious and Consistent Image Relighting [41.90032795389507]
ユニバーサル・イメージ・リライティングのためのDreamLightというモデルを導入する。
照明や色調の美的均一性を保ちつつ、被験者をシームレスに新しい背景に合成することができる。
論文 参考訳(メタデータ) (2025-06-17T14:05:24Z) - Leveraging Content and Context Cues for Low-Light Image Enhancement [25.97198463881292]
低照度条件はマシン認知に悪影響を及ぼし、現実のコンピュータビジョンシステムの性能を制限する。
本稿では、CLIPモデルを利用して、画像の先行と意味的ガイダンスの取得により、既存のゼロ参照低照度化を改善することを提案する。
提案手法は,画像のコントラストと色調の改善,背景背景の識別の改善に有効であることを示す。
論文 参考訳(メタデータ) (2024-12-10T17:32:09Z) - Zero-Reference Low-Light Enhancement via Physical Quadruple Priors [58.77377454210244]
本稿では,標準光画像のみをトレーニング可能な,ゼロ参照低光強調フレームワークを提案する。
このフレームワークは、画像にさかのぼる照明不変性を復元し、自動的に低照度化を実現します。
論文 参考訳(メタデータ) (2024-03-19T17:36:28Z) - Exposure Bracketing Is All You Need For A High-Quality Image [50.822601495422916]
マルチ露光画像は、デノイング、デブロアリング、高ダイナミックレンジイメージング、超解像において相補的である。
本研究では,これらの課題を組み合わせ,高品質な画像を得るために露光ブラケット写真を活用することを提案する。
特に時間変調リカレントネットワーク(TMRNet)と自己教師あり適応手法を提案する。
論文 参考訳(メタデータ) (2024-01-01T14:14:35Z) - Designing An Illumination-Aware Network for Deep Image Relighting [69.750906769976]
本稿では、階層的なサンプリングから1つの画像からシーンを段階的にリライトするためのガイダンスに従うイルミネーション・アウェア・ネットワーク(IAN)を提案する。
さらに、物理レンダリングプロセスの近似として、イルミネーション・アウェア・残留ブロック(IARB)が設計されている。
実験の結果,提案手法は従来の最先端手法よりも定量的,定性的な照準結果が得られることがわかった。
論文 参考訳(メタデータ) (2022-07-21T16:21:24Z) - Enhancing Low-Light Images in Real World via Cross-Image Disentanglement [58.754943762945864]
そこで本研究では,現実の汚職とミスアライメントされたトレーニング画像からなる,新しい低照度画像強調データセットを提案する。
本モデルでは,新たに提案したデータセットと,他の一般的な低照度データセットの両方に対して,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-01-10T03:12:52Z) - Enhance Images as You Like with Unpaired Learning [8.104571453311442]
本稿では,低照度から高照度の画像空間における一対多の関係を学習するために,軽量な一経路条件生成対向ネットワーク(cGAN)を提案する。
我々のネットワークは、様々な参照画像上に設定された所定の入力条件から、拡張された画像の集合を生成することを学習する。
我々のモデルは、ノイズとクリーンなデータセットの完全な教師付き手法と同等に競合する視覚的および定量的な結果を得る。
論文 参考訳(メタデータ) (2021-10-04T03:00:44Z) - Unsupervised Low-light Image Enhancement with Decoupled Networks [103.74355338972123]
我々は、実世界の低照度画像を教師なしで拡張する2段階のGANベースのフレームワークを学習する。
提案手法は,照度向上と雑音低減の両面から,最先端の教師なし画像強調法より優れる。
論文 参考訳(メタデータ) (2020-05-06T13:37:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。