論文の概要: ColorFLUX: A Structure-Color Decoupling Framework for Old Photo Colorization
- arxiv url: http://arxiv.org/abs/2603.28162v1
- Date: Mon, 30 Mar 2026 08:29:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.304112
- Title: ColorFLUX: A Structure-Color Decoupling Framework for Old Photo Colorization
- Title(参考訳): ColorFLUX: 古い写真のカラー化のための構造化カラーデカップリングフレームワーク
- Authors: Bingchen Li, Zhixin Wang, Fan Li, Jiaqi Xu, Jiaming Guo, Renjing Pei, Xin Li, Zhibo Chen,
- Abstract要約: 生成拡散モデルFLUXに基づく新しいフォトカラー化フレームワークを提案する。
色復元から構造保存を分離し、古い写真の正確な色付けを可能にする構造カラーデカップリング戦略を導入する。
また、古い写真から直接きめ細かな意味情報を抽出し、古い写真に固有の色バイアスを除去する視覚意味プロンプトも導入する。
- 参考スコア(独自算出の注目度): 34.04054653090656
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Old photos preserve invaluable historical memories, making their restoration and colorization highly desirable. While existing restoration models can address some degradation issues like denoising and scratch removal, they often struggle with accurate colorization. This limitation arises from the unique degradation inherent in old photos, such as faded brightness and altered color hues, which are different from modern photo distributions, creating a substantial domain gap during colorization. In this paper, we propose a novel old photo colorization framework based on the generative diffusion model FLUX. Our approach introduces a structure-color decoupling strategy that separates structure preservation from color restoration, enabling accurate colorization of old photos while maintaining structural consistency. We further enhance the model with a progressive Direct Preference Optimization (Pro-DPO) strategy, which allows the model to learn subtle color preferences through coarse-to-fine transitions in color augmentation. Additionally, we address the limitations of text-based prompts by introducing visual semantic prompts, which extract fine-grained semantic information directly from old photos, helping to eliminate the color bias inherent in old photos. Experimental results on both synthetic and real datasets demonstrate that our approach outperforms existing state-of-the-art colorization methods, including closed-source commercial models, producing high-quality and vivid colorization.
- Abstract(参考訳): 古い写真は貴重な歴史的記憶を保存しており、その復元と彩色が極めて望ましい。
既存の修復モデルは、脱色やスクラッチ除去などの劣化問題に対処できるが、正確な色付けに苦慮することが多い。
この制限は、暗くした明るさや変色した色合いなど、古い写真に固有の独特の劣化から生じており、これは現代の写真分布とは異なるものであり、着色中にかなりの領域ギャップが生じる。
本稿では, 生成拡散モデルFLUXに基づく新しいフォトカラー化フレームワークを提案する。
本手法では, 色復元から構造保存を分離し, 構造整合性を維持しつつ, 古い画像の正確な色化を可能にする構造色疎結合方式を提案する。
さらに,色強調の粗い遷移を通じて微妙な色嗜好を学習できるプログレッシブ・ダイレクト・パラメータ・オプティマイズ(Pro-DPO)戦略により,モデルをさらに強化する。
さらに、古い写真から直接きめ細かな意味情報を抽出する視覚的セマンティック・プロンプトを導入することで、テキストベースのプロンプトの限界に対処し、古い写真に固有の色バイアスを解消する。
合成データと実データの両方を用いた実験結果から,我々の手法はクローズドソースの商用モデルを含む最先端のカラー化手法よりも優れており,高品質で鮮やかなカラー化を実現していることが示された。
関連論文リスト
- Structure-preserving Feature Alignment for Old Photo Colorization [19.011270929834495]
SFAC(Structure-serving Feature Alignment Colorizer)と呼ばれる新しいCNNベースのアルゴリズムを提案する。
SFACは、古い写真色付けのための2つの画像のみをトレーニングし、ビッグデータへの依存を排除している。
我々の主な目的は、2つの画像間のセマンティック対応を確立することであり、セマンティック関連オブジェクトが類似した色を持つことを保証することである。
論文 参考訳(メタデータ) (2025-08-18T02:10:40Z) - Free-Lunch Color-Texture Disentanglement for Stylized Image Generation [62.215875006311876]
本稿では,タイマライズされたT2I生成において,フリーランチなカラーテクスチャ・ディコンタングルを実現するための,最初のチューニング自由アプローチを提案する。
Our Style Attributes Disentanglement approach (SADis)は、より正確でカスタマイズ可能な、スタイリングされた画像生成ソリューションを提供する。
WikiArtとStyleDropのデータセットの画像に対する実験は、SADisがDisIGタスクの最先端化方法を上回ることを実証している。
論文 参考訳(メタデータ) (2025-03-18T14:10:43Z) - Leveraging Semantic Attribute Binding for Free-Lunch Color Control in Diffusion Models [53.73253164099701]
拡散モデルにおいて、微調整なしで正確なRGBレベルの色制御を実現する、トレーニング不要なアプローチであるColorWaveを導入する。
我々は、カラーウェーブが、構造化された、色一貫性の拡散に基づく画像合成のための新しいパラダイムを確立することを実証した。
論文 参考訳(メタデータ) (2025-03-12T21:49:52Z) - ColorFlow: Retrieval-Augmented Image Sequence Colorization [65.93834649502898]
産業用途における画像シーケンスのカラー化に適した3段階拡散に基づくフレームワークを提案する。
IDごとの微調整や明示的なID埋め込み抽出を必要とする既存の手法とは異なり、我々は新たにRetrieval Augmented Colorization Pipelineを提案する。
パイプラインには、カラーアイデンティティ抽出のためのブランチと、カラー化のためのブランチという、デュアルブランチ設計も備えています。
論文 参考訳(メタデータ) (2024-12-16T14:32:49Z) - Automatic Controllable Colorization via Imagination [55.489416987587305]
本稿では,反復的な編集と修正が可能な自動色付けフレームワークを提案する。
グレースケール画像内のコンテンツを理解することにより、トレーニング済みの画像生成モデルを用いて、同じコンテンツを含む複数の画像を生成する。
これらの画像は、人間の専門家の過程を模倣して、色付けの参考となる。
論文 参考訳(メタデータ) (2024-04-08T16:46:07Z) - DiffColor: Toward High Fidelity Text-Guided Image Colorization with
Diffusion Models [12.897939032560537]
そこで我々はDiffColorと呼ばれる新しい手法を提案し、プロンプトテキストに条件付けされた鮮やかな色を復元する。
私たちはまず、CLIPベースのコントラスト損失を用いて色付き画像を生成するために、事前訓練されたテキスト・ツー・イメージ・モデルを微調整する。
次に、色付き画像とテキストプロンプトを整列した最適化されたテキスト埋め込みと、高品質な画像再構成を可能にする微調整拡散モデルを得る。
提案手法は,複数回の反復で鮮やかな多彩な色を生成でき,その構造と背景をそのままに保ちつつ,対象言語指導に適合させる。
論文 参考訳(メタデータ) (2023-08-03T09:38:35Z) - Pik-Fix: Restoring and Colorizing Old Photo [24.366910102387344]
古い写真では、存在するがしばしば障害のある視覚記憶を復元し、塗り替えることは、興味深いが未解決の研究トピックである。
しかし、古い写真の大規模なデータセットが欠如しているため、この修復作業に対処するのが非常に難しい。
ここでは、古い画像や劣化画像の修復とカラー化を両立できる、新しい参照ベースのエンドツーエンド学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-04T05:46:43Z) - ROMNet: Renovate the Old Memories [25.41639794384076]
本稿では、劣化したレガシー画像の修復とカラー化を共同で行うための、新しい参照ベースのエンドツーエンド学習フレームワークを提案する。
また、私たちの知る限りでは、古い写真復元モデルを評価するために、ペア化された真実を持つ、最初の公開と現実世界の古い写真データセットも作成しています。
論文 参考訳(メタデータ) (2022-02-05T17:48:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。