論文の概要: Learning Illumination Control in Diffusion Models
- arxiv url: http://arxiv.org/abs/2604.24877v1
- Date: Mon, 27 Apr 2026 18:03:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.537765
- Title: Learning Illumination Control in Diffusion Models
- Title(参考訳): 拡散モデルにおける学習照明制御
- Authors: Nishit Anand, Manan Suri, Christopher Metzler, Dinesh Manocha, Ramani Duraiswami,
- Abstract要約: 拡散モデルにおける照明制御を学習するための,完全オープンソースかつ再現可能なパイプラインを提案する。
提案手法は,よく照らされた画像から,低照度な入力画像,自然言語照明命令,高照度な出力画像からなる教師付きトレーニングトレーレットへと変換するデータエンジンを構築する。
- 参考スコア(独自算出の注目度): 48.84125126501277
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Controlling illumination in images is essential for photography and visual content creation. While closed-source models have demonstrated impressive illumination control, open-source alternatives either require heavy control inputs like depth maps or do not release their data and code. We present a fully open-source and reproducible pipeline for learning illumination control in diffusion models. Our approach builds a data engine that transforms well-lit images into supervised training triplets consisting of a poorly-illuminated input image, a natural language lighting instruction, and a well-illuminated output image. We finetune a diffusion model on this data and demonstrate significant improvements over baseline SD 1.5, SDXL, and FLUX.1-dev models in perceptual similarity, structural similarity, and identity preservation. Our work provides a reproducible solution built entirely with open-source tools and publicly available data. We release all our code, data, and model weights publicly.
- Abstract(参考訳): 画像の照明を制御することは、写真や視覚コンテンツ作成に不可欠である。
クローズドソースモデルは印象的な照明制御を示しているが、オープンソースの代替手段は深度マップのような重い制御入力を必要とするか、あるいはデータやコードをリリースしない。
拡散モデルにおける照明制御を学習するための,完全オープンソースかつ再現可能なパイプラインを提案する。
提案手法は,よく照らされた画像から,低照度な入力画像,自然言語照明命令,高照度な出力画像からなる教師付きトレーニングトレーレットへと変換するデータエンジンを構築する。
このデータに基づいて拡散モデルを微調整し, ベースラインSD 1.5, SDXL, FLUX.1-devモデルよりも知覚的類似性, 構造的類似性, アイデンティティ保存性が向上したことを示す。
私たちの仕事は、オープンソースツールと公開データで完全に構築された再現可能なソリューションを提供します。
すべてのコード、データ、モデルの重み付けを公開しています。
関連論文リスト
- LightCtrl: Training-free Controllable Video Relighting [27.76869460641232]
制御可能な最初のビデオリライト方式であるLightCtrlを提案する。
ユーザが供給する光軌跡による映像照明の明示的な制御を可能にする。
実験によると、LightCtrlは様々な照明変化を伴う高品質なビデオを生成する。
論文 参考訳(メタデータ) (2026-03-28T02:03:13Z) - LGTM: Training-Free Light-Guided Text-to-Image Diffusion Model via Initial Noise Manipulation [7.432606687404551]
Initial Noise Manipulation を用いた学習自由光誘導型テキスト・画像拡散モデルを提案する。
拡散過程の初期潜音を操り、テキストプロンプトとユーザが特定した光方向で画像生成を誘導する。
画像の品質とテキストアライメントを保ちながら、ライトの一貫性において、プロンプトベースのベースラインを超える。
論文 参考訳(メタデータ) (2026-03-25T08:46:31Z) - PractiLight: Practical Light Control Using Foundational Diffusion Models [78.75949075070595]
PractiLightは、生成された画像における光制御の実践的なアプローチである。
私たちの重要な洞察は、画像内のライティング関係は、自己注意層におけるトークンの相互作用と本質的に類似しているということです。
我々は,パラメータとデータ効率が証明された品質と制御の観点から,最先端の性能を実証する。
論文 参考訳(メタデータ) (2025-09-01T23:38:40Z) - Ambient Diffusion Omni: Training Good Models with Bad Data [45.821861121026394]
拡散モデルの品質向上のために,低品質,合成,分布外画像の使い方を示す。
我々は、利用可能なすべての画像から信号を取り出すことができる拡散モデルを訓練するための原則的なフレームワークであるAmbient Omniを提案する。
論文 参考訳(メタデータ) (2025-06-10T22:37:39Z) - LightLab: Controlling Light Sources in Images with Diffusion Models [49.83835236202516]
画像中の光源を微細かつパラメトリックに制御する拡散法を提案する。
我々は、光の線形性を利用して、ターゲット光源または周囲照明の制御された光の変化を描写した画像対を合成する。
提案手法は, ユーザの好みに基づいて, 従来の方法よりも優れた光編集結果が得られることを示す。
論文 参考訳(メタデータ) (2025-05-14T17:57:27Z) - Improving Lens Flare Removal with General Purpose Pipeline and Multiple
Light Sources Recovery [69.71080926778413]
フレアアーティファクトは、画像の視覚的品質と下流のコンピュータビジョンタスクに影響を与える。
現在の方法では、画像信号処理パイプラインにおける自動露光やトーンマッピングは考慮されていない。
本稿では、ISPを再検討し、より信頼性の高い光源回収戦略を設計することで、レンズフレア除去性能を向上させるソリューションを提案する。
論文 参考訳(メタデータ) (2023-08-31T04:58:17Z) - DINOv2: Learning Robust Visual Features without Supervision [75.42921276202522]
この研究は、既存の事前学習手法、特に自己教師付き手法が、多様なソースから十分なキュレートされたデータで訓練すれば、そのような特徴を生み出すことができることを示している。
技術的な貢献の多くは、大規模なトレーニングを加速し、安定化することを目的としています。
データの観点からは、自己組織化されていないデータではなく、専用で多様でキュレートされた画像データセットを構築するための自動パイプラインを提案する。
論文 参考訳(メタデータ) (2023-04-14T15:12:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。