論文の概要: Inference-Time Loss-Guided Colour Preservation in Diffusion Sampling
- arxiv url: http://arxiv.org/abs/2601.17259v1
- Date: Sat, 24 Jan 2026 02:18:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:07.440177
- Title: Inference-Time Loss-Guided Colour Preservation in Diffusion Sampling
- Title(参考訳): 拡散サンプリングにおける推定時間損失誘導色保存
- Authors: Angad Singh Ahuja, Aarush Ram Anandh,
- Abstract要約: 本稿では,事前訓練した拡散モデルを用いて,追加のトレーニングを行わない推論時間,領域制約付き色保存法を提案する。
平均値のみのベースラインは、知覚的に健全な局所的障害を発生させながら、平均色制約を満たすことができることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Precise color control remains a persistent failure mode in text-to-image diffusion systems, particularly in design-oriented workflows where outputs must satisfy explicit, user-specified color targets. We present an inference-time, region-constrained color preservation method that steers a pretrained diffusion model without any additional training. Our approach combines (i) ROI-based inpainting for spatial selectivity, (ii) background-latent re-imposition to prevent color drift outside the ROI, and (iii) latent nudging via gradient guidance using a composite loss defined in CIE Lab and linear RGB. The loss is constructed to control not only the mean ROI color but also the tail of the pixelwise error distribution through CVaR-style and soft-maximum penalties, with a late-start gate and a time-dependent schedule to stabilize guidance across denoising steps. We show that mean-only baselines can satisfy average color constraints while producing perceptually salient local failures, motivating our distribution-aware objective. The resulting method provides a practical, training-free mechanism for targeted color adherence that can be integrated into standard Stable Diffusion inpainting pipelines.
- Abstract(参考訳): 正確な色制御は、テキストと画像の拡散システム、特に出力が明示的でユーザ指定のカラーターゲットを満足しなければならない設計指向のワークフローにおいて、永続的な失敗モードのままである。
本稿では,事前訓練した拡散モデルを用いて,追加のトレーニングを行わない推論時間,領域制約付き色保存法を提案する。
私たちのアプローチは組み合わさる
一 空間選択性のためのROIに基づく塗布
(II)ROI外における色漂うのを防ぐためのバックグラウンドラテント再配置、及び
3) CIEラボと線形RGBで定義された複合損失を用いた勾配誘導による潜時ヌード
この損失は、平均ROI色だけでなく、CVaR型およびソフトマックスペナルティによる画素方向誤差分布の尾部も制御するために構成され、遅延開始ゲートと時間依存スケジュールにより、復調ステップ間のガイダンスを安定化させる。
平均値のみのベースラインは平均色制約を満たすことができ、知覚的に健全な局所障害を発生させ、分布認識の目的を動機付ける。
結果として得られる方法は、標準の安定拡散塗装パイプラインに統合可能な、ターゲット色アテンデンスのための実用的な、トレーニング不要のメカニズムを提供する。
関連論文リスト
- Leveraging Semantic Attribute Binding for Free-Lunch Color Control in Diffusion Models [53.73253164099701]
拡散モデルにおいて、微調整なしで正確なRGBレベルの色制御を実現する、トレーニング不要なアプローチであるColorWaveを導入する。
我々は、カラーウェーブが、構造化された、色一貫性の拡散に基づく画像合成のための新しいパラダイムを確立することを実証した。
論文 参考訳(メタデータ) (2025-03-12T21:49:52Z) - Unlearning-based Neural Interpretations [51.99182464831169]
静的関数を用いて定義される現在のベースラインは、バイアスがあり、脆弱であり、操作可能であることを示す。
UNIは、学習不可能で、偏りがなく、適応的なベースラインを計算し、入力を最も急な上昇の未学習方向に向けて摂動させることを提案する。
論文 参考訳(メタデータ) (2024-10-10T16:02:39Z) - Diffusion in Diffusion: Cyclic One-Way Diffusion for Text-Vision-Conditioned Generation [11.80682025950519]
本研究では,拡散(機械学習)特性の拡散(物理学)について検討する。
拡散現象の方向を制御するために,循環一流拡散法(COW)を提案する。
本手法は,タスクニーズを理解するための新しい視点を提供し,より広い範囲のカスタマイズシナリオに適用可能である。
論文 参考訳(メタデータ) (2023-06-14T05:25:06Z) - Reflected Diffusion Models [93.26107023470979]
本稿では,データのサポートに基づいて進化する反射微分方程式を逆転する反射拡散モデルを提案する。
提案手法は,一般化されたスコアマッチング損失を用いてスコア関数を学習し,標準拡散モデルの主要成分を拡張する。
論文 参考訳(メタデータ) (2023-04-10T17:54:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。