Fugu-MT 論文翻訳(概要): Multimodal Color Recommendation in Vector Graphic Documents

論文の概要: Multimodal Color Recommendation in Vector Graphic Documents

arxiv url: http://arxiv.org/abs/2308.04118v1
Date: Tue, 8 Aug 2023 08:17:39 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-09 13:34:51.329023
Title: Multimodal Color Recommendation in Vector Graphic Documents
Title（参考訳）: ベクターグラフィック文書におけるマルチモーダルカラーレコメンデーション
Authors: Qianru Qiu, Xueting Wang, Mayu Otani
Abstract要約: 色とテキストのコンテキストを統合したマルチモーダルマスクカラーモデルを提案し、グラフィック文書のテキスト対応カラーレコメンデーションを提供する。提案モデルは,複数のパレットにおける色間の関係をキャプチャする自己注意ネットワークと,色とCLIPに基づくテキスト表現を組み込んだ相互注意ネットワークから構成される。
参考スコア（独自算出の注目度）: 14.287758028119788
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Color selection plays a critical role in graphic document design and requires sufficient consideration of various contexts. However, recommending appropriate colors which harmonize with the other colors and textual contexts in documents is a challenging task, even for experienced designers. In this study, we propose a multimodal masked color model that integrates both color and textual contexts to provide text-aware color recommendation for graphic documents. Our proposed model comprises self-attention networks to capture the relationships between colors in multiple palettes, and cross-attention networks that incorporate both color and CLIP-based text representations. Our proposed method primarily focuses on color palette completion, which recommends colors based on the given colors and text. Additionally, it is applicable for another color recommendation task, full palette generation, which generates a complete color palette corresponding to the given text. Experimental results demonstrate that our proposed approach surpasses previous color palette completion methods on accuracy, color distribution, and user experience, as well as full palette generation methods concerning color diversity and similarity to the ground truth palettes.
Abstract（参考訳）: カラー選択はグラフィック文書設計において重要な役割を担い、様々な文脈を十分に考慮する必要がある。しかし、ドキュメント内の他の色やテキストコンテキストと調和する適切な色を推奨することは、経験豊富なデザイナーにとっても難しい課題である。本研究では,色とテクストのコンテキストを統合したマルチモーダルマスクカラーモデルを提案し,グラフィック文書のテキスト対応カラーレコメンデーションを提案する。提案モデルは,複数のパレットにおける色間の関係をキャプチャする自己注意ネットワークと,色とCLIPに基づくテキスト表現を組み込んだ相互注意ネットワークから構成される。提案手法は主に色とテキストに基づいて色を推奨するカラーパレット補完に焦点を当てている。また、与えられたテキストに対応する完全なカラーパレットを生成するフルパレット生成という別のカラーレコメンデーションタスクにも適用可能である。実験結果から,提案手法は従来のカラーパレット完成法よりも精度,色分布,ユーザエクスペリエンスを上回り,色多様性と地味パレットとの類似性について完全なパレット生成法が得られた。

関連論文リスト

MangaNinja: Line Art Colorization with Precise Reference Following [84.2001766692797]
MangaNinjiaは、ラインアートのカラー化に特化している。文字の詳細を正確に書き起こすために、2つの思慮深い設計を取り入れる。基準カラー画像と対象ラインアートとの対応学習を容易にするパッチシャッフルモジュールと、きめ細かい色マッチングを可能にするポイント駆動制御スキームとを備える。
論文参考訳（メタデータ） (2025-01-14T18:59:55Z)
Paint Bucket Colorization Using Anime Character Color Design Sheets [72.66788521378864]
ネットワークがセグメント間の関係を理解することができる包摂的マッチングを導入する。ネットワークのトレーニングパイプラインは、カラー化と連続フレームカラー化の両方のパフォーマンスを著しく向上させる。ネットワークのトレーニングをサポートするために、PaintBucket-Characterというユニークなデータセットを開発しました。
論文参考訳（メタデータ） (2024-10-25T09:33:27Z)
SketchDeco: Decorating B&W Sketches with Colour [80.90808879991182]
本稿では,色彩の普遍的な幼児期活動に触発された,色彩のスケッチ化への新たなアプローチを紹介する。精度と利便性のバランスを考慮し,地域マスクとカラーパレットを用いて直感的なユーザコントロールを実現する。
論文参考訳（メタデータ） (2024-05-29T02:53:59Z)
Palette-based Color Transfer between Images [9.471264982229508]
そこで我々は,新しいカラースキームを自動生成できるパレットベースのカラートランスファー手法を提案する。再設計されたパレットベースのクラスタリング手法により、色分布に応じて画素を異なるセグメントに分類することができる。本手法は, 自然リアリズム, 色整合性, 一般性, 堅牢性の観点から, ピア法に対して有意な優位性を示す。
論文参考訳（メタデータ） (2024-05-14T01:41:19Z)
Learning Inclusion Matching for Animation Paint Bucket Colorization [76.4507878427755]
ネットワークにセグメント間の包摂関係を理解するための,学習に基づく新たな包摂的マッチングパイプラインを導入する。提案手法では,粗いカラーワープモジュールと包括的マッチングモジュールを統合した2段階のパイプラインを特徴とする。ネットワークのトレーニングを容易にするため,PaintBucket-Characterと呼ばれるユニークなデータセットも開発した。
論文参考訳（メタデータ） (2024-03-27T08:32:48Z)
Control Color: Multimodal Diffusion-based Interactive Image Colorization [81.68817300796644]
Control Color (Ctrl Color) は、事前訓練された安定拡散(SD)モデルを利用する多モードカラー化手法である。ユーザのストロークをエンコードして、局所的な色操作を正確に行うための効果的な方法を提案する。また、カラーオーバーフローと不正確な色付けの長年の問題に対処するために、自己注意に基づく新しいモジュールとコンテンツ誘導型変形可能なオートエンコーダを導入する。
論文参考訳（メタデータ） (2024-02-16T17:51:13Z)
Language-based Photo Color Adjustment for Graphic Designs [38.43984897069872]
画像のリカラー化のための対話型言語ベースのアプローチを提案する。本モデルでは,ソース色と対象領域を予測し,与えられた言語に基づく指示に基づいて,対象領域をソース色で再色することができる。
論文参考訳（メタデータ） (2023-08-06T08:53:49Z)
BiSTNet: Semantic Image Prior Guided Bidirectional Temporal Feature Fusion for Deep Exemplar-based Video Colorization [70.14893481468525]
本稿では,参照例の色を探索し,映像のカラー化を支援するために有効なBiSTNetを提案する。まず、各フレームと参照例間の深い特徴空間における意味的対応を確立し、参照例からの色情報を探究する。我々は,フレームのオブジェクト境界をモデル化するための意味情報を抽出する混合専門家ブロックを開発した。
論文参考訳（メタデータ） (2022-12-05T13:47:15Z)
PalGAN: Image Colorization with Palette Generative Adversarial Networks [51.59276436217957]
そこで本研究では,パレット推定とカラーアテンションを統合した新しいGANベースのカラー化手法PalGANを提案する。 PalGANは、定量的評価と視覚比較において最先端の成果を上げ、顕著な多様性、コントラスト、およびエッジ保存の外観を提供する。
論文参考訳（メタデータ） (2022-10-20T12:28:31Z)
Color Recommendation for Vector Graphic Documents based on Multi-Palette Representation [12.71266194474117]
グラフィック文書中の各視覚要素から複数の色パレットを抽出し、それらをカラーシーケンスに結合する。このモデルをトレーニングし,ベクトルグラフィック文書の大規模データセット上にカラーレコメンデーションシステムを構築する。
論文参考訳（メタデータ） (2022-09-22T07:06:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。