論文の概要: Palette Aligned Image Diffusion
- arxiv url: http://arxiv.org/abs/2509.02000v1
- Date: Tue, 02 Sep 2025 06:26:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.925613
- Title: Palette Aligned Image Diffusion
- Title(参考訳): パレットアライメントによる画像拡散
- Authors: Elad Aharoni, Noy Porat, Dani Lischinski, Ariel Shamir,
- Abstract要約: パレット・アダプタ(Palette-Adapter)は、ユーザが指定したカラーパレット上でテキストから画像への拡散モデルを条件付ける新しい方法である。
ヒストグラムエントロピーとパレット-ヒストグラム距離の2つのスカラー制御パラメータを導入する。
本研究は,パレットの定着度と画質の両面において,既存のアプローチよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 31.91476258282606
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We introduce the Palette-Adapter, a novel method for conditioning text-to-image diffusion models on a user-specified color palette. While palettes are a compact and intuitive tool widely used in creative workflows, they introduce significant ambiguity and instability when used for conditioning image generation. Our approach addresses this challenge by interpreting palettes as sparse histograms and introducing two scalar control parameters: histogram entropy and palette-to-histogram distance, which allow flexible control over the degree of palette adherence and color variation. We further introduce a negative histogram mechanism that allows users to suppress specific undesired hues, improving adherence to the intended palette under the standard classifier-free guidance mechanism. To ensure broad generalization across the color space, we train on a carefully curated dataset with balanced coverage of rare and common colors. Our method enables stable, semantically coherent generation across a wide range of palettes and prompts. We evaluate our method qualitatively, quantitatively, and through a user study, and show that it consistently outperforms existing approaches in achieving both strong palette adherence and high image quality.
- Abstract(参考訳): Palette-Adapterは、ユーザが指定したカラーパレット上でテキストから画像への拡散モデルを条件付ける新しい方法である。
パレットは、クリエイティブワークフローで広く使われているコンパクトで直感的なツールであるが、画像生成の条件付けに使用する場合、かなりの曖昧さと不安定さを導入する。
提案手法では, パレットをスパースヒストグラムとして解釈し, ヒストグラムエントロピーとパレット-ヒストグラム距離の2つのスカラー制御パラメータを導入し, パレットの付着度や色の変化を柔軟に制御する。
さらに,特定の望ましくないヒューズを抑えるための負のヒストグラム機構を導入し,標準分類器フリー誘導機構の下で意図したパレットの付着性を改善する。
色空間全体の広範な一般化を保証するため、希少な色と一般的な色のバランスの取れたデータセットを慎重に訓練する。
提案手法は,幅広いパレットやプロンプトに対して安定かつセマンティックなコヒーレントな生成を可能にする。
提案手法を定性的に,定量的に,またユーザスタディを通じて評価し,強いパレットの付着性と高画質の両面において,既存の手法よりも一貫して優れていることを示す。
関連論文リスト
- Exploring Palette based Color Guidance in Diffusion Models [5.80330969550483]
そこで本研究では、カラーパレットをインシデント命令と並行して個別の誘導機構として統合することで、カラースキーム制御を強化する新しい手法を提案する。
この結果から,パレットガイダンスを取り入れることで,所望のカラースキームで画像を生成する能力が大幅に向上することが示唆された。
論文 参考訳(メタデータ) (2025-08-12T09:02:10Z) - Leveraging Semantic Attribute Binding for Free-Lunch Color Control in Diffusion Models [53.73253164099701]
拡散モデルにおいて、微調整なしで正確なRGBレベルの色制御を実現する、トレーニング不要なアプローチであるColorWaveを導入する。
我々は、カラーウェーブが、構造化された、色一貫性の拡散に基づく画像合成のための新しいパラダイムを確立することを実証した。
論文 参考訳(メタデータ) (2025-03-12T21:49:52Z) - ZePo: Zero-Shot Portrait Stylization with Faster Sampling [61.14140480095604]
本稿では,4つのサンプリングステップでコンテンツとスタイルの融合を実現する拡散モデルに基づく,インバージョンフリーなポートレートスタイリングフレームワークを提案する。
本稿では,一貫性機能における冗長な特徴をマージする機能統合戦略を提案し,注意制御の計算負荷を低減させる。
論文 参考訳(メタデータ) (2024-08-10T08:53:41Z) - SketchDeco: Decorating B&W Sketches with Colour [80.90808879991182]
本稿では,色彩の普遍的な幼児期活動に触発された,色彩のスケッチ化への新たなアプローチを紹介する。
精度と利便性のバランスを考慮し,地域マスクとカラーパレットを用いて直感的なユーザコントロールを実現する。
論文 参考訳(メタデータ) (2024-05-29T02:53:59Z) - Palette-based Color Transfer between Images [9.471264982229508]
そこで我々は,新しいカラースキームを自動生成できるパレットベースのカラートランスファー手法を提案する。
再設計されたパレットベースのクラスタリング手法により、色分布に応じて画素を異なるセグメントに分類することができる。
本手法は, 自然リアリズム, 色整合性, 一般性, 堅牢性の観点から, ピア法に対して有意な優位性を示す。
論文 参考訳(メタデータ) (2024-05-14T01:41:19Z) - Control Color: Multimodal Diffusion-based Interactive Image Colorization [81.68817300796644]
Control Color (Ctrl Color) は、事前訓練された安定拡散(SD)モデルを利用する多モードカラー化手法である。
ユーザのストロークをエンコードして、局所的な色操作を正確に行うための効果的な方法を提案する。
また、カラーオーバーフローと不正確な色付けの長年の問題に対処するために、自己注意に基づく新しいモジュールとコンテンツ誘導型変形可能なオートエンコーダを導入する。
論文 参考訳(メタデータ) (2024-02-16T17:51:13Z) - Diffusing Colors: Image Colorization with Text Guided Diffusion [11.727899027933466]
粒状テキストプロンプトを用いた画像拡散技術を利用した新しい画像カラー化フレームワークを提案する。
本手法は,視覚的品質とセマンティック・コヒーレンスの観点から,既存の技術よりも優れた自動化と制御のバランスを与える。
我々のアプローチは、特に色強調と歴史的イメージのカラー化の可能性を秘めている。
論文 参考訳(メタデータ) (2023-12-07T08:59:20Z) - Dequantization and Color Transfer with Diffusion Models [5.228564799458042]
量子化されたイメージは、パッチベースの編集とパレット転送を簡単に抽象化する。
提案モデルでは,ユーザが求めているカラーパレットを尊重する自然な画像を生成できることが示される。
本手法は,画像のテクスチャを尊重しながら,画像のパッチを塗り替えることによって,別の実用的な編集に拡張することができる。
論文 参考訳(メタデータ) (2023-07-06T00:07:32Z) - PalGAN: Image Colorization with Palette Generative Adversarial Networks [51.59276436217957]
そこで本研究では,パレット推定とカラーアテンションを統合した新しいGANベースのカラー化手法PalGANを提案する。
PalGANは、定量的評価と視覚比較において最先端の成果を上げ、顕著な多様性、コントラスト、およびエッジ保存の外観を提供する。
論文 参考訳(メタデータ) (2022-10-20T12:28:31Z) - Palette: Image-to-Image Diffusion Models [50.268441533631176]
我々は条件付き拡散モデルを用いた画像から画像への変換のためのシンプルで一般的なフレームワークであるPaletteを紹介する。
4つの困難な画像から画像への変換タスクにおいて、Paletteは強力なGANと回帰ベースラインを上回っている。
本稿では、FID、インセプションスコア、事前訓練されたResNet-50の分類精度、参照画像に対する知覚距離などのサンプル品質スコアについて報告する。
論文 参考訳(メタデータ) (2021-11-10T17:49:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。