論文の概要: Towards Vivid and Diverse Image Colorization with Generative Color Prior
- arxiv url: http://arxiv.org/abs/2108.08826v1
- Date: Thu, 19 Aug 2021 17:49:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-20 14:28:49.257958
- Title: Towards Vivid and Diverse Image Colorization with Generative Color Prior
- Title(参考訳): 生成色を優先した鮮明・多彩なカラー化に向けて
- Authors: Yanze Wu, Xintao Wang, Yu Li, Honglun Zhang, Xun Zhao, Ying Shan
- Abstract要約: 最近のディープラーニングベースの手法は、画像のカラー化を低コストで行うことができる。
我々は,事前学習されたGAN(Generative Adversarial Networks)にカプセル化されている,豊かで多様な色を活かして鮮やかな色を復元することを目的としている。
先進的なデザインと繊細なデザインの強力な生成色のおかげで、我々の手法は1つの前進パスで鮮やかな色を作り出すことができた。
- 参考スコア(独自算出の注目度): 17.087464490162073
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Colorization has attracted increasing interest in recent years. Classic
reference-based methods usually rely on external color images for plausible
results. A large image database or online search engine is inevitably required
for retrieving such exemplars. Recent deep-learning-based methods could
automatically colorize images at a low cost. However, unsatisfactory artifacts
and incoherent colors are always accompanied. In this work, we aim at
recovering vivid colors by leveraging the rich and diverse color priors
encapsulated in a pretrained Generative Adversarial Networks (GAN).
Specifically, we first "retrieve" matched features (similar to exemplars) via a
GAN encoder and then incorporate these features into the colorization process
with feature modulations. Thanks to the powerful generative color prior and
delicate designs, our method could produce vivid colors with a single forward
pass. Moreover, it is highly convenient to obtain diverse results by modifying
GAN latent codes. Our method also inherits the merit of interpretable controls
of GANs and could attain controllable and smooth transitions by walking through
GAN latent space. Extensive experiments and user studies demonstrate that our
method achieves superior performance than previous works.
- Abstract(参考訳): 近年は彩色への関心が高まっている。
古典的な参照ベースの手法は、通常、妥当な結果のために外部カラー画像に依存する。
大規模な画像データベースやオンライン検索エンジンは、必然的にそのような例の検索に必要である。
最近のディープラーニングベースの手法は、画像を自動的に低コストで着色することができる。
しかし、不満足なアーティファクトや一貫性のない色は常に伴っている。
本研究では,事前学習されたGAN(Generative Adversarial Networks)にカプセル化される多彩な色を活かし,鮮やかな色を復元することを目的とする。
具体的には、まずganエンコーダを介してマッチングされた特徴(exemplarsに似ている)を"リトリーブ"し、その特徴を特徴変調付きカラー化プロセスに組み込む。
従来型および繊細なデザインの強力な生成色により,1回のフォワードパスで鮮やかな色を生成できる。
また, GAN潜伏符号の修正により, 多様な結果が得られることが有用である。
また,本手法は,GANの解釈可能な制御の利点を継承し,GAN潜伏空間を歩くことで制御可能かつ滑らかな遷移を実現する。
広範な実験とユーザスタディにより,従来の手法よりも優れた性能が得られた。
関連論文リスト
- Transforming Color: A Novel Image Colorization Method [8.041659727964305]
本稿では,色変換器とGANを用いた画像カラー化手法を提案する。
提案手法は,グローバルな情報を取得するためのトランスフォーマーアーキテクチャと,視覚的品質を改善するためのGANフレームワークを統合する。
実験の結果,提案するネットワークは,他の最先端のカラー化技術よりも優れていた。
論文 参考訳(メタデータ) (2024-10-07T07:23:42Z) - Multimodal Semantic-Aware Automatic Colorization with Diffusion Prior [15.188673173327658]
色を可塑性意味論で合成する前に拡散の異常な生成能力を利用する。
モデルが画像の内容を理解し、飽和色を提供するのに役立つため、マルチモーダルなハイレベルセマンティクスを前もって採用する。
輝度対応デコーダは細部を復元し、全体的な視覚的品質を向上させるように設計されている。
論文 参考訳(メタデータ) (2024-04-25T15:28:22Z) - Control Color: Multimodal Diffusion-based Interactive Image Colorization [81.68817300796644]
Control Color (Ctrl Color) は、事前訓練された安定拡散(SD)モデルを利用する多モードカラー化手法である。
ユーザのストロークをエンコードして、局所的な色操作を正確に行うための効果的な方法を提案する。
また、カラーオーバーフローと不正確な色付けの長年の問題に対処するために、自己注意に基づく新しいモジュールとコンテンツ誘導型変形可能なオートエンコーダを導入する。
論文 参考訳(メタデータ) (2024-02-16T17:51:13Z) - DiffColor: Toward High Fidelity Text-Guided Image Colorization with
Diffusion Models [12.897939032560537]
そこで我々はDiffColorと呼ばれる新しい手法を提案し、プロンプトテキストに条件付けされた鮮やかな色を復元する。
私たちはまず、CLIPベースのコントラスト損失を用いて色付き画像を生成するために、事前訓練されたテキスト・ツー・イメージ・モデルを微調整する。
次に、色付き画像とテキストプロンプトを整列した最適化されたテキスト埋め込みと、高品質な画像再構成を可能にする微調整拡散モデルを得る。
提案手法は,複数回の反復で鮮やかな多彩な色を生成でき,その構造と背景をそのままに保ちつつ,対象言語指導に適合させる。
論文 参考訳(メタデータ) (2023-08-03T09:38:35Z) - DDColor: Towards Photo-Realistic Image Colorization via Dual Decoders [19.560271615736212]
DDColorは画像カラー化のためのデュアルデコーダを備えたエンドツーエンドの手法である。
我々のアプローチには、ピクセルデコーダとクエリベースのカラーデコーダが含まれる。
我々の2つのデコーダは、色とマルチスケールの意味表現の相関を確立するために協力する。
論文 参考訳(メタデータ) (2022-12-22T11:17:57Z) - Name Your Colour For the Task: Artificially Discover Colour Naming via
Colour Quantisation Transformer [62.75343115345667]
そこで本研究では,色空間を定量化しつつ,画像上での認識を維持しつつ,色空間を定量化する新しい色量子化変換器CQFormerを提案する。
人工色システムと人間の言語における基本色用語との一貫性のある進化パターンを観察する。
我々のカラー量子化法は、画像記憶を効果的に圧縮する効率的な量子化法も提供する。
論文 参考訳(メタデータ) (2022-12-07T03:39:18Z) - PalGAN: Image Colorization with Palette Generative Adversarial Networks [51.59276436217957]
そこで本研究では,パレット推定とカラーアテンションを統合した新しいGANベースのカラー化手法PalGANを提案する。
PalGANは、定量的評価と視覚比較において最先端の成果を上げ、顕著な多様性、コントラスト、およびエッジ保存の外観を提供する。
論文 参考訳(メタデータ) (2022-10-20T12:28:31Z) - BigColor: Colorization using a Generative Color Prior for Natural Images [28.42665080958172]
複雑な構造を持つ多彩な画像に対して鮮やかなカラー化を提供する,新しいカラー化手法であるBigColorを提案する。
提案手法は,単一前方通過における多様な入力に対するロバストなカラー化を可能にし,任意の入力解像度をサポートし,マルチモーダルカラー化結果を提供する。
論文 参考訳(メタデータ) (2022-07-20T06:36:46Z) - Detecting Recolored Image by Spatial Correlation [60.08643417333974]
画像のリカラー化は、画像の色値を操作して新しいスタイルを与える、新たな編集技術である。
本稿では,空間相関の観点から,従来型と深層学習による再色検出の汎用的検出能力を示す解を探索する。
提案手法は,複数のベンチマークデータセット上での最先端検出精度を実現し,未知の種類の再色法を適切に一般化する。
論文 参考訳(メタデータ) (2022-04-23T01:54:06Z) - HistoGAN: Controlling Colors of GAN-Generated and Real Images via Color
Histograms [52.77252727786091]
HistoGANは、GAN生成画像の色を制御するための色ヒストグラムに基づく方法である。
我々は、HistoGANを拡張して、実画像を再色する方法を示す。
論文 参考訳(メタデータ) (2020-11-23T21:14:19Z) - Instance-aware Image Colorization [51.12040118366072]
本稿では,インスタンス認識のカラー化を実現する手法を提案する。
我々のネットワークアーキテクチャは、市販のオブジェクト検出器を利用して、収穫されたオブジェクト画像を取得する。
類似したネットワークを用いて、フルイメージの特徴を抽出し、融合モジュールを適用して最終色を予測する。
論文 参考訳(メタデータ) (2020-05-21T17:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。