論文の概要: Inference-Time Loss-Guided Colour Preservation in Diffusion Sampling
- arxiv url: http://arxiv.org/abs/2601.17259v1
- Date: Sat, 24 Jan 2026 02:18:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:07.440177
- Title: Inference-Time Loss-Guided Colour Preservation in Diffusion Sampling
- Title(参考訳): 拡散サンプリングにおける推定時間損失誘導色保存
- Authors: Angad Singh Ahuja, Aarush Ram Anandh,
- Abstract要約: 本稿では,事前訓練した拡散モデルを用いて,追加のトレーニングを行わない推論時間,領域制約付き色保存法を提案する。
平均値のみのベースラインは、知覚的に健全な局所的障害を発生させながら、平均色制約を満たすことができることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Precise color control remains a persistent failure mode in text-to-image diffusion systems, particularly in design-oriented workflows where outputs must satisfy explicit, user-specified color targets. We present an inference-time, region-constrained color preservation method that steers a pretrained diffusion model without any additional training. Our approach combines (i) ROI-based inpainting for spatial selectivity, (ii) background-latent re-imposition to prevent color drift outside the ROI, and (iii) latent nudging via gradient guidance using a composite loss defined in CIE Lab and linear RGB. The loss is constructed to control not only the mean ROI color but also the tail of the pixelwise error distribution through CVaR-style and soft-maximum penalties, with a late-start gate and a time-dependent schedule to stabilize guidance across denoising steps. We show that mean-only baselines can satisfy average color constraints while producing perceptually salient local failures, motivating our distribution-aware objective. The resulting method provides a practical, training-free mechanism for targeted color adherence that can be integrated into standard Stable Diffusion inpainting pipelines.
- Abstract(参考訳): 正確な色制御は、テキストと画像の拡散システム、特に出力が明示的でユーザ指定のカラーターゲットを満足しなければならない設計指向のワークフローにおいて、永続的な失敗モードのままである。
本稿では,事前訓練した拡散モデルを用いて,追加のトレーニングを行わない推論時間,領域制約付き色保存法を提案する。
私たちのアプローチは組み合わさる
一 空間選択性のためのROIに基づく塗布
(II)ROI外における色漂うのを防ぐためのバックグラウンドラテント再配置、及び
3) CIEラボと線形RGBで定義された複合損失を用いた勾配誘導による潜時ヌード
この損失は、平均ROI色だけでなく、CVaR型およびソフトマックスペナルティによる画素方向誤差分布の尾部も制御するために構成され、遅延開始ゲートと時間依存スケジュールにより、復調ステップ間のガイダンスを安定化させる。
平均値のみのベースラインは平均色制約を満たすことができ、知覚的に健全な局所障害を発生させ、分布認識の目的を動機付ける。
結果として得られる方法は、標準の安定拡散塗装パイプラインに統合可能な、ターゲット色アテンデンスのための実用的な、トレーニング不要のメカニズムを提供する。
関連論文リスト
- RAW-Flow: Advancing RGB-to-RAW Image Reconstruction with Deterministic Latent Flow Matching [55.03149221192589]
本稿では,RGBとRAW表現のギャップを埋めるためにRAW-Flowという新しいフレームワークを提案する。
また、階層的なRGB機能をフロー推定プロセスに注入する、大規模コンテキストガイダンスモジュールも導入する。
RAW-Flowは、定量的にも視覚的にも最先端のアプローチより優れている。
論文 参考訳(メタデータ) (2026-01-28T08:27:38Z) - Test-Time Anchoring for Discrete Diffusion Posterior Sampling [38.507644561076894]
後方サンプリングは、事前訓練された離散拡散基礎モデルにとって難しい問題である。
マスク拡散基礎モデルのためのAnchored Posterior Smpling (APS) を提案する。
本手法は線形および非線形逆問題に対する離散拡散サンプリング器の最先端性能を実現する。
論文 参考訳(メタデータ) (2025-10-02T17:58:37Z) - Leveraging Semantic Attribute Binding for Free-Lunch Color Control in Diffusion Models [53.73253164099701]
拡散モデルにおいて、微調整なしで正確なRGBレベルの色制御を実現する、トレーニング不要なアプローチであるColorWaveを導入する。
我々は、カラーウェーブが、構造化された、色一貫性の拡散に基づく画像合成のための新しいパラダイムを確立することを実証した。
論文 参考訳(メタデータ) (2025-03-12T21:49:52Z) - Unlearning-based Neural Interpretations [51.99182464831169]
静的関数を用いて定義される現在のベースラインは、バイアスがあり、脆弱であり、操作可能であることを示す。
UNIは、学習不可能で、偏りがなく、適応的なベースラインを計算し、入力を最も急な上昇の未学習方向に向けて摂動させることを提案する。
論文 参考訳(メタデータ) (2024-10-10T16:02:39Z) - Sparse Prior Is Not All You Need: When Differential Directionality Meets Saliency Coherence for Infrared Small Target Detection [15.605122893098981]
本研究では,Sparse Differential Directionality prior (SDD)フレームワークを提案する。
我々は、ターゲットの異なる方向特性を活用して、それらを背景と区別する。
さらに、サリエンシ・コヒーレンス・ストラテジーにより、目標検出性をさらに強化する。
近似交互最小化法(PAM)アルゴリズムは,提案したモデルを効率的に解く。
論文 参考訳(メタデータ) (2024-07-22T04:32:43Z) - GIFD: A Generative Gradient Inversion Method with Feature Domain
Optimization [52.55628139825667]
Federated Learning(FL)は、クライアントのプライバシを保護するための有望な分散機械学習フレームワークとして登場した。
近年の研究では、事前学習された生成逆ネットワーク(GAN)を事前知識として活用することにより、攻撃者が共有勾配を逆転し、FLシステムに対する機密データを回復できることが示されている。
textbfGradient textbfInversion over textbfFeature textbfDomains (GIFD)を提案する。
論文 参考訳(メタデータ) (2023-08-09T04:34:21Z) - Diffusion in Diffusion: Cyclic One-Way Diffusion for Text-Vision-Conditioned Generation [11.80682025950519]
本研究では,拡散(機械学習)特性の拡散(物理学)について検討する。
拡散現象の方向を制御するために,循環一流拡散法(COW)を提案する。
本手法は,タスクニーズを理解するための新しい視点を提供し,より広い範囲のカスタマイズシナリオに適用可能である。
論文 参考訳(メタデータ) (2023-06-14T05:25:06Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - Reflected Diffusion Models [93.26107023470979]
本稿では,データのサポートに基づいて進化する反射微分方程式を逆転する反射拡散モデルを提案する。
提案手法は,一般化されたスコアマッチング損失を用いてスコア関数を学習し,標準拡散モデルの主要成分を拡張する。
論文 参考訳(メタデータ) (2023-04-10T17:54:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。