論文の概要: Structure-preserving Feature Alignment for Old Photo Colorization
- arxiv url: http://arxiv.org/abs/2508.12570v1
- Date: Mon, 18 Aug 2025 02:10:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.942499
- Title: Structure-preserving Feature Alignment for Old Photo Colorization
- Title(参考訳): フォトカラー化のための構造保存機能アライメント
- Authors: Yingxue Pang, Xin Jin, Jun Fu, Zhibo Chen,
- Abstract要約: SFAC(Structure-serving Feature Alignment Colorizer)と呼ばれる新しいCNNベースのアルゴリズムを提案する。
SFACは、古い写真色付けのための2つの画像のみをトレーニングし、ビッグデータへの依存を排除している。
我々の主な目的は、2つの画像間のセマンティック対応を確立することであり、セマンティック関連オブジェクトが類似した色を持つことを保証することである。
- 参考スコア(独自算出の注目度): 19.011270929834495
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning techniques have made significant advancements in reference-based colorization by training on large-scale datasets. However, directly applying these methods to the task of colorizing old photos is challenging due to the lack of ground truth and the notorious domain gap between natural gray images and old photos. To address this issue, we propose a novel CNN-based algorithm called SFAC, i.e., Structure-preserving Feature Alignment Colorizer. SFAC is trained on only two images for old photo colorization, eliminating the reliance on big data and allowing direct processing of the old photo itself to overcome the domain gap problem. Our primary objective is to establish semantic correspondence between the two images, ensuring that semantically related objects have similar colors. We achieve this through a feature distribution alignment loss that remains robust to different metric choices. However, utilizing robust semantic correspondence to transfer color from the reference to the old photo can result in inevitable structure distortions. To mitigate this, we introduce a structure-preserving mechanism that incorporates a perceptual constraint at the feature level and a frozen-updated pyramid at the pixel level. Extensive experiments demonstrate the effectiveness of our method for old photo colorization, as confirmed by qualitative and quantitative metrics.
- Abstract(参考訳): ディープラーニング技術は、大規模なデータセットでトレーニングすることで、参照ベースの色付けを大幅に進歩させた。
しかし、これらの手法を古写真を色づけする作業に直接適用することは、地味な真実の欠如と、自然の灰色画像と古写真とのドメインギャップが悪名高いため、難しい。
この問題に対処するため、我々はSFACと呼ばれる新しいCNNベースのアルゴリズムを提案する。
SFACは、古い写真色付けのための2つの画像のみをトレーニングし、ビッグデータへの依存をなくし、古い写真自体を直接処理することで、ドメインギャップ問題を克服することができる。
我々の主な目的は、2つの画像間のセマンティック対応を確立することであり、セマンティック関連オブジェクトが類似した色を持つことを保証することである。
我々は、異なるメートル法選択に対して頑健な特徴分布アライメント損失によってこれを達成します。
しかし、古い写真への参照から色を転送するためにロバストな意味対応を利用すると、避けられない構造歪みが発生する可能性がある。
これを緩和するために,特徴レベルでの知覚的制約と画素レベルでの凍結更新ピラミッドを組み込んだ構造保存機構を導入する。
定性的および定量的な測定結果から,本手法の有効性を実証した。
関連論文リスト
- Free-Lunch Color-Texture Disentanglement for Stylized Image Generation [58.406368812760256]
本稿では,タイマライズされたT2I生成において,フリーランチなカラーテクスチャ・ディコンタングルを実現するための,最初のチューニング自由アプローチを提案する。
色とテクスチャの基準画像からCTE(Color-Texture Embeddings)を分離・抽出する技術を開発した。
生成した画像の色パレットが色基準と密接に一致していることを確認するため、白と彩色変換を適用する。
論文 参考訳(メタデータ) (2025-03-18T14:10:43Z) - Palette-based Color Transfer between Images [9.471264982229508]
そこで我々は,新しいカラースキームを自動生成できるパレットベースのカラートランスファー手法を提案する。
再設計されたパレットベースのクラスタリング手法により、色分布に応じて画素を異なるセグメントに分類することができる。
本手法は, 自然リアリズム, 色整合性, 一般性, 堅牢性の観点から, ピア法に対して有意な優位性を示す。
論文 参考訳(メタデータ) (2024-05-14T01:41:19Z) - Diffusing Colors: Image Colorization with Text Guided Diffusion [11.727899027933466]
粒状テキストプロンプトを用いた画像拡散技術を利用した新しい画像カラー化フレームワークを提案する。
本手法は,視覚的品質とセマンティック・コヒーレンスの観点から,既存の技術よりも優れた自動化と制御のバランスを与える。
我々のアプローチは、特に色強調と歴史的イメージのカラー化の可能性を秘めている。
論文 参考訳(メタデータ) (2023-12-07T08:59:20Z) - DARC: Distribution-Aware Re-Coloring Model for Generalizable Nucleus
Segmentation [68.43628183890007]
ドメインギャップは、異なるフォアグラウンド(核)-バックグラウンド比によっても引き起こされる可能性があると我々は主張する。
まず、異なる領域間の劇的な画像色変化を緩和する再カラー化手法を提案する。
次に,前景-背景比の変動に頑健な新しいインスタンス正規化手法を提案する。
論文 参考訳(メタデータ) (2023-09-01T01:01:13Z) - Pik-Fix: Restoring and Colorizing Old Photo [24.366910102387344]
古い写真では、存在するがしばしば障害のある視覚記憶を復元し、塗り替えることは、興味深いが未解決の研究トピックである。
しかし、古い写真の大規模なデータセットが欠如しているため、この修復作業に対処するのが非常に難しい。
ここでは、古い画像や劣化画像の修復とカラー化を両立できる、新しい参照ベースのエンドツーエンド学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-04T05:46:43Z) - Detecting Recolored Image by Spatial Correlation [60.08643417333974]
画像のリカラー化は、画像の色値を操作して新しいスタイルを与える、新たな編集技術である。
本稿では,空間相関の観点から,従来型と深層学習による再色検出の汎用的検出能力を示す解を探索する。
提案手法は,複数のベンチマークデータセット上での最先端検出精度を実現し,未知の種類の再色法を適切に一般化する。
論文 参考訳(メタデータ) (2022-04-23T01:54:06Z) - ROMNet: Renovate the Old Memories [25.41639794384076]
本稿では、劣化したレガシー画像の修復とカラー化を共同で行うための、新しい参照ベースのエンドツーエンド学習フレームワークを提案する。
また、私たちの知る限りでは、古い写真復元モデルを評価するために、ペア化された真実を持つ、最初の公開と現実世界の古い写真データセットも作成しています。
論文 参考訳(メタデータ) (2022-02-05T17:48:15Z) - Semantic-Sparse Colorization Network for Deep Exemplar-based
Colorization [23.301799487207035]
模範的なカラー化アプローチは、対象のグレースケール画像に対して可視色を提供するために、参照画像に依存する。
本研究では,グローバルな画像スタイルとセマンティックな色の両方をグレースケールに転送するセマンティック・スパースカラー化ネットワーク(SSCN)を提案する。
我々のネットワークは、あいまいなマッチング問題を緩和しつつ、グローバルカラーとローカルカラーのバランスを完全にとることができる。
論文 参考訳(メタデータ) (2021-12-02T15:35:10Z) - Instance-aware Image Colorization [51.12040118366072]
本稿では,インスタンス認識のカラー化を実現する手法を提案する。
我々のネットワークアーキテクチャは、市販のオブジェクト検出器を利用して、収穫されたオブジェクト画像を取得する。
類似したネットワークを用いて、フルイメージの特徴を抽出し、融合モジュールを適用して最終色を予測する。
論文 参考訳(メタデータ) (2020-05-21T17:59:23Z) - Learning to Structure an Image with Few Colors [59.34619548026885]
そこで,カラー量子化ネットワークであるColorCNNを提案する。
1ビットのカラースペース(すなわち2色)だけで、提案されたネットワークはCIFAR10データセット上で82.1%のトップ-1の精度を達成した。
アプリケーションの場合、PNGでエンコードされた場合、提案したカラー量子化は、極低ビットレート方式の他の画像圧縮方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-17T17:56:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。