論文の概要: The Latent Color Subspace: Emergent Order in High-Dimensional Chaos
- arxiv url: http://arxiv.org/abs/2603.12261v1
- Date: Thu, 12 Mar 2026 17:59:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:26.294599
- Title: The Latent Color Subspace: Emergent Order in High-Dimensional Chaos
- Title(参考訳): 潜在色部分空間:高次元カオスにおける創発順序
- Authors: Mateusz Pach, Jessica Bader, Quentin Bouniot, Serge Belongie, Zeynep Akata,
- Abstract要約: FLUX.1[Dev]の変分オートエンコーダ潜在空間における色表現の解釈を開発し,Hue,Saturation,Lightnessを反映した構造を明らかにする。
FLUXに完全トレーニングフリーの手法を導入し,色を予測・明示的に制御できることを実証し,LCSの解釈を検証する。
- 参考スコア(独自算出の注目度): 45.524887459115895
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-to-image generation models have advanced rapidly, yet achieving fine-grained control over generated images remains difficult, largely due to limited understanding of how semantic information is encoded. We develop an interpretation of the color representation in the Variational Autoencoder latent space of FLUX.1 [Dev], revealing a structure reflecting Hue, Saturation, and Lightness. We verify our Latent Color Subspace (LCS) interpretation by demonstrating that it can both predict and explicitly control color, introducing a fully training-free method in FLUX based solely on closed-form latent-space manipulation. Code is available at https://github.com/ExplainableML/LCS.
- Abstract(参考訳): テキスト・ツー・イメージ生成モデルは急速に進歩しているが、セマンティックな情報のエンコード方法の理解が限られているため、生成した画像のきめ細かい制御を実現することは依然として困難である。
FLUX.1[Dev]の変分オートエンコーダ潜在空間における色表現の解釈を開発し、Hue, Saturation, Lightnessを反映した構造を明らかにする。
我々は,Latent Color Subspace (LCS) の解釈を検証し,Lateent Color Subspace (LCS) が色を予測および明示的に制御できることを示した。
コードはhttps://github.com/ExplainableML/LCSで入手できる。
関連論文リスト
- Controllable-Continuous Color Editing in Diffusion Model via Color Mapping [73.62340517056619]
テキスト埋め込み空間と画像RGB値との対応性を明示的にモデル化するカラーマッピングモジュールを提案する。
ユーザーはターゲットのRGB範囲を指定することで、所望の範囲内で連続的な色の変化のある画像を生成することができる。
実験により,色の連続性と可制御性の観点から,本手法が良好に動作することを示した。
論文 参考訳(メタデータ) (2025-09-17T07:12:51Z) - Color Me Correctly: Bridging Perceptual Color Spaces and Text Embeddings for Improved Diffusion Generation [21.37070510103594]
既存のアプローチは、あいまいな色の記述を解決するために、クロスアテンション操作、参照画像、微調整に依存している。
本稿では,大規模言語モデル(LLM)を利用して色関連プロンプトを曖昧にすることで,色忠実度を高める訓練自由フレームワークを提案する。
提案手法はまず,テキストプロンプトにおけるあいまいな色条件を解決するために,大言語モデル(LLM)を用い,得られた色条件の空間的関係に基づいてテキスト埋め込みを洗練する。
論文 参考訳(メタデータ) (2025-09-12T08:44:22Z) - Training-Free Text-Guided Color Editing with Multi-Modal Diffusion Transformer [41.82610275115671]
トレーニング不要なカラー編集手法であるColorCtrlを提案する。
注目マップと値トークンを対象とする操作によって構造と色を分離することにより、精度と一貫性のある色編集を可能にする。
本手法は,FLUX.1 Kontext Max や GPT-4o Image Generation などの強力な商用モデルを上回る一貫性を持つ。
論文 参考訳(メタデータ) (2025-08-12T17:57:04Z) - Free-Lunch Color-Texture Disentanglement for Stylized Image Generation [62.215875006311876]
本稿では,タイマライズされたT2I生成において,フリーランチなカラーテクスチャ・ディコンタングルを実現するための,最初のチューニング自由アプローチを提案する。
Our Style Attributes Disentanglement approach (SADis)は、より正確でカスタマイズ可能な、スタイリングされた画像生成ソリューションを提供する。
WikiArtとStyleDropのデータセットの画像に対する実験は、SADisがDisIGタスクの最先端化方法を上回ることを実証している。
論文 参考訳(メタデータ) (2025-03-18T14:10:43Z) - Leveraging Semantic Attribute Binding for Free-Lunch Color Control in Diffusion Models [53.73253164099701]
拡散モデルにおいて、微調整なしで正確なRGBレベルの色制御を実現する、トレーニング不要なアプローチであるColorWaveを導入する。
我々は、カラーウェーブが、構造化された、色一貫性の拡散に基づく画像合成のための新しいパラダイムを確立することを実証した。
論文 参考訳(メタデータ) (2025-03-12T21:49:52Z) - Training-free Color-Style Disentanglement for Constrained Text-to-Image Synthesis [16.634138745034733]
そこで本研究では,参照画像から色とスタイル属性のテキスト・ツー・イメージを分離する,最初のトレーニングフリーでテスト時間のみの手法を提案する。
論文 参考訳(メタデータ) (2024-09-04T04:16:58Z) - Control Color: Multimodal Diffusion-based Interactive Image Colorization [81.68817300796644]
Control Color (Ctrl Color) は、事前訓練された安定拡散(SD)モデルを利用する多モードカラー化手法である。
ユーザのストロークをエンコードして、局所的な色操作を正確に行うための効果的な方法を提案する。
また、カラーオーバーフローと不正確な色付けの長年の問題に対処するために、自己注意に基づく新しいモジュールとコンテンツ誘導型変形可能なオートエンコーダを導入する。
論文 参考訳(メタデータ) (2024-02-16T17:51:13Z) - Improved Diffusion-based Image Colorization via Piggybacked Models [19.807766482434563]
既存の強力なT2I拡散モデルに基づく色付けモデルを提案する。
拡散誘導器は、潜伏拡散モデルの事前訓練された重みを組み込むように設計されている。
次に、輝度認識VQVAEは、所定のグレースケール画像に画素完全アライメントされた色付き結果を生成する。
論文 参考訳(メタデータ) (2023-04-21T16:23:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。