論文の概要: Multimodal Color Recommendation in Vector Graphic Documents
- arxiv url: http://arxiv.org/abs/2308.04118v1
- Date: Tue, 8 Aug 2023 08:17:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-09 13:34:51.329023
- Title: Multimodal Color Recommendation in Vector Graphic Documents
- Title(参考訳): ベクターグラフィック文書におけるマルチモーダルカラーレコメンデーション
- Authors: Qianru Qiu, Xueting Wang, Mayu Otani
- Abstract要約: 色とテキストのコンテキストを統合したマルチモーダルマスクカラーモデルを提案し、グラフィック文書のテキスト対応カラーレコメンデーションを提供する。
提案モデルは,複数のパレットにおける色間の関係をキャプチャする自己注意ネットワークと,色とCLIPに基づくテキスト表現を組み込んだ相互注意ネットワークから構成される。
- 参考スコア(独自算出の注目度): 14.287758028119788
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Color selection plays a critical role in graphic document design and requires
sufficient consideration of various contexts. However, recommending appropriate
colors which harmonize with the other colors and textual contexts in documents
is a challenging task, even for experienced designers. In this study, we
propose a multimodal masked color model that integrates both color and textual
contexts to provide text-aware color recommendation for graphic documents. Our
proposed model comprises self-attention networks to capture the relationships
between colors in multiple palettes, and cross-attention networks that
incorporate both color and CLIP-based text representations. Our proposed method
primarily focuses on color palette completion, which recommends colors based on
the given colors and text. Additionally, it is applicable for another color
recommendation task, full palette generation, which generates a complete color
palette corresponding to the given text. Experimental results demonstrate that
our proposed approach surpasses previous color palette completion methods on
accuracy, color distribution, and user experience, as well as full palette
generation methods concerning color diversity and similarity to the ground
truth palettes.
- Abstract(参考訳): カラー選択はグラフィック文書設計において重要な役割を担い、様々な文脈を十分に考慮する必要がある。
しかし、ドキュメント内の他の色やテキストコンテキストと調和する適切な色を推奨することは、経験豊富なデザイナーにとっても難しい課題である。
本研究では,色とテクストのコンテキストを統合したマルチモーダルマスクカラーモデルを提案し,グラフィック文書のテキスト対応カラーレコメンデーションを提案する。
提案モデルは,複数のパレットにおける色間の関係をキャプチャする自己注意ネットワークと,色とCLIPに基づくテキスト表現を組み込んだ相互注意ネットワークから構成される。
提案手法は主に色とテキストに基づいて色を推奨するカラーパレット補完に焦点を当てている。
また、与えられたテキストに対応する完全なカラーパレットを生成するフルパレット生成という別のカラーレコメンデーションタスクにも適用可能である。
実験結果から,提案手法は従来のカラーパレット完成法よりも精度,色分布,ユーザエクスペリエンスを上回り,色多様性と地味パレットとの類似性について完全なパレット生成法が得られた。
関連論文リスト
- Control Color: Multimodal Diffusion-based Interactive Image Colorization [81.68817300796644]
Control Color (Ctrl Color) は、事前訓練された安定拡散(SD)モデルを利用する多モードカラー化手法である。
ユーザのストロークをエンコードして、局所的な色操作を正確に行うための効果的な方法を提案する。
また、カラーオーバーフローと不正確な色付けの長年の問題に対処するために、自己注意に基づく新しいモジュールとコンテンツ誘導型変形可能なオートエンコーダを導入する。
論文 参考訳(メタデータ) (2024-02-16T17:51:13Z) - Language-based Photo Color Adjustment for Graphic Designs [38.43984897069872]
画像のリカラー化のための対話型言語ベースのアプローチを提案する。
本モデルでは,ソース色と対象領域を予測し,与えられた言語に基づく指示に基づいて,対象領域をソース色で再色することができる。
論文 参考訳(メタデータ) (2023-08-06T08:53:49Z) - DiffColor: Toward High Fidelity Text-Guided Image Colorization with
Diffusion Models [12.897939032560537]
そこで我々はDiffColorと呼ばれる新しい手法を提案し、プロンプトテキストに条件付けされた鮮やかな色を復元する。
私たちはまず、CLIPベースのコントラスト損失を用いて色付き画像を生成するために、事前訓練されたテキスト・ツー・イメージ・モデルを微調整する。
次に、色付き画像とテキストプロンプトを整列した最適化されたテキスト埋め込みと、高品質な画像再構成を可能にする微調整拡散モデルを得る。
提案手法は,複数回の反復で鮮やかな多彩な色を生成でき,その構造と背景をそのままに保ちつつ,対象言語指導に適合させる。
論文 参考訳(メタデータ) (2023-08-03T09:38:35Z) - L-CAD: Language-based Colorization with Any-level Descriptions using
Diffusion Priors [62.80068955192816]
我々は,任意のレベルの記述で言語ベースの色付けを行う統一モデルを提案する。
我々は、その頑健な言語理解と豊かな色優先のために、事前訓練されたモダリティ生成モデルを活用する。
提案した新しいサンプリング戦略により,多様な複雑なシナリオにおいて,インスタンス認識のカラー化を実現する。
論文 参考訳(メタデータ) (2023-05-24T14:57:42Z) - BiSTNet: Semantic Image Prior Guided Bidirectional Temporal Feature
Fusion for Deep Exemplar-based Video Colorization [70.14893481468525]
本稿では,参照例の色を探索し,映像のカラー化を支援するために有効なBiSTNetを提案する。
まず、各フレームと参照例間の深い特徴空間における意味的対応を確立し、参照例からの色情報を探究する。
我々は,フレームのオブジェクト境界をモデル化するための意味情報を抽出する混合専門家ブロックを開発した。
論文 参考訳(メタデータ) (2022-12-05T13:47:15Z) - PalGAN: Image Colorization with Palette Generative Adversarial Networks [51.59276436217957]
そこで本研究では,パレット推定とカラーアテンションを統合した新しいGANベースのカラー化手法PalGANを提案する。
PalGANは、定量的評価と視覚比較において最先端の成果を上げ、顕著な多様性、コントラスト、およびエッジ保存の外観を提供する。
論文 参考訳(メタデータ) (2022-10-20T12:28:31Z) - Color Recommendation for Vector Graphic Documents based on Multi-Palette
Representation [12.71266194474117]
グラフィック文書中の各視覚要素から複数の色パレットを抽出し、それらをカラーシーケンスに結合する。
このモデルをトレーニングし,ベクトルグラフィック文書の大規模データセット上にカラーレコメンデーションシステムを構築する。
論文 参考訳(メタデータ) (2022-09-22T07:06:17Z) - Generating Compositional Color Representations from Text [3.141061579698638]
画像検索エンジン上のユーザクエリのかなりの部分が(属性、オブジェクト)構造に従っているという事実に触発され、このような大局的な色プロファイルを生成する生成逆ネットワークを提案する。
コンポジションを学ぶためにパイプラインを設計します - 見た属性とオブジェクトを、目に見えないペアに組み合わせる機能です。
論文 参考訳(メタデータ) (2021-09-22T01:37:13Z) - Image Colorization: A Survey and Dataset [78.89573261114428]
本稿では,最先端の深層学習に基づく画像着色技術に関する包括的調査を行う。
既存の着色技法を7つのクラスに分類し、その性能を規定する重要な要因について論じる。
既存のデータセットと新しいデータセットを用いて、既存の画像のカラー化手法を広範囲に実験的に評価する。
論文 参考訳(メタデータ) (2020-08-25T01:22:52Z) - Deep Line Art Video Colorization with a Few References [49.7139016311314]
そこで本稿では,対象の参照画像と同一のカラースタイルでラインアートビデオを自動的に色付けする深層アーキテクチャを提案する。
本フレームワークはカラートランスフォーメーションネットワークと時間制約ネットワークから構成される。
本モデルでは,少量のサンプルでパラメータを微調整することで,より優れたカラー化を実現することができる。
論文 参考訳(メタデータ) (2020-03-24T06:57:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。