論文の概要: Text-Guided Vector Graphics Customization
- arxiv url: http://arxiv.org/abs/2309.12302v1
- Date: Thu, 21 Sep 2023 17:59:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-22 13:49:42.158526
- Title: Text-Guided Vector Graphics Customization
- Title(参考訳): テキスト誘導ベクターグラフィックスのカスタマイズ
- Authors: Peiying Zhang, Nanxuan Zhao, Jing Liao
- Abstract要約: テキストのプロンプトに基づいて高品質なベクトルグラフィックスを生成する新しいパイプラインを提案する。
提案手法は,大規模な事前学習されたテキスト・ツー・イメージ・モデルの能力を利用する。
我々は,ベクトルレベル,画像レベル,テキストレベルの観点から,複数の指標を用いて評価を行った。
- 参考スコア(独自算出の注目度): 31.41266632288932
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vector graphics are widely used in digital art and valued by designers for
their scalability and layer-wise topological properties. However, the creation
and editing of vector graphics necessitate creativity and design expertise,
leading to a time-consuming process. In this paper, we propose a novel pipeline
that generates high-quality customized vector graphics based on textual prompts
while preserving the properties and layer-wise information of a given exemplar
SVG. Our method harnesses the capabilities of large pre-trained text-to-image
models. By fine-tuning the cross-attention layers of the model, we generate
customized raster images guided by textual prompts. To initialize the SVG, we
introduce a semantic-based path alignment method that preserves and transforms
crucial paths from the exemplar SVG. Additionally, we optimize path parameters
using both image-level and vector-level losses, ensuring smooth shape
deformation while aligning with the customized raster image. We extensively
evaluate our method using multiple metrics from vector-level, image-level, and
text-level perspectives. The evaluation results demonstrate the effectiveness
of our pipeline in generating diverse customizations of vector graphics with
exceptional quality. The project page is
https://intchous.github.io/SVGCustomization.
- Abstract(参考訳): ベクトルグラフィックスはデジタルアートで広く使われており、設計者によってそのスケーラビリティと層ワイドなトポロジ特性で評価されている。
しかし、ベクトルグラフィックスの作成と編集は創造性と設計の専門知識を必要とし、時間がかかります。
本稿では,与えられたexemplar svgの特性と層別情報を保存しつつ,テキストプロンプトに基づく高品質なカスタマイズベクターグラフィックスを生成する新しいパイプラインを提案する。
本手法は,事前学習した大規模テキスト対画像モデルの能力を活用する。
モデルのクロスアテンション層を微調整することにより、テキストプロンプトでガイドされたカスタマイズされたラスタ画像を生成する。
SVGを初期化するために,既存のSVGから重要な経路を保存・変換する意味に基づく経路アライメント手法を提案する。
さらに、画像レベルとベクトルレベルの両方の損失を用いて経路パラメータを最適化し、カスタマイズしたラスタ画像と整合しながら滑らかな形状変形を確保する。
我々は,ベクトルレベル,画像レベル,テキストレベルの観点から,複数の指標を用いた手法を広く評価した。
評価結果は,ベクトルグラフィックスの様々なカスタマイズを異常な品質で生成する上で,パイプラインの有効性を示す。
プロジェクトページはhttps://intchous.github.io/SVGCustomization。
関連論文リスト
- Vector Grimoire: Codebook-based Shape Generation under Raster Image Supervision [20.325246638505714]
本稿では,GRIMOIREというテキスト誘導型生成モデルを紹介し,画像をベクトル形状に再構成して離散コードブックにマッピングする方法を提案する。
データから直接の監視を必要とする既存のモデルとは異なり、GRIMOIREはベクトル生成モデリングをはるかに多くのデータに開放するイメージ監督のみを使用して学習する。
論文 参考訳(メタデータ) (2024-10-08T12:41:31Z) - SuperSVG: Superpixel-based Scalable Vector Graphics Synthesis [66.44553285020066]
SuperSVGは、高速かつ高精度な画像ベクトル化を実現するスーパーピクセルベースのベクトル化モデルである。
本稿では,2段階の自己学習フレームワークを提案する。そこでは,粗い段階モデルを用いて主構造を再構築し,細部を充実させるために改良段階モデルを用いる。
再現精度と推定時間の観点から, 最先端手法と比較して, 提案手法の優れた性能を示す実験を行った。
論文 参考訳(メタデータ) (2024-06-14T07:43:23Z) - Text-to-Vector Generation with Neural Path Representation [27.949704002538944]
本稿では,シーケンスと画像の両モードから経路潜在空間を学習するニューラルパス表現を提案する。
第1段階では、事前訓練されたテキスト・ツー・イメージ拡散モデルにより、複雑なベクトルグラフィックスの初期生成が導かれる。
第2段階では、レイヤワイズ画像ベクトル化戦略を用いてグラフィクスを洗練し、より明確な要素と構造を実現する。
論文 参考訳(メタデータ) (2024-05-16T17:59:22Z) - StrokeNUWA: Tokenizing Strokes for Vector Graphic Synthesis [112.25071764647683]
StrokeNUWAはベクターグラフィックスにおけるより良い視覚表現'ストロークトークン'を探求する先駆的な研究である。
ストロークトークンを備えたStrokeNUWAは、従来のLCMベースの最適化ベースのメソッドを大幅に上回ることができる。
StrokeNUWAは、SVGコード圧縮比が6.9%の従来の手法よりも94倍のスピードアップを達成している。
論文 参考訳(メタデータ) (2024-01-30T15:20:26Z) - SAMVG: A Multi-stage Image Vectorization Model with the Segment-Anything
Model [59.40189857428461]
画像をSVG(Scalable Vector Graphics)にベクトル化する多段階モデルを提案する。
第一に、SAMVGはSegment-Anything Modelによって提供される一般的な画像セグメンテーションを使い、新しいフィルタリング手法を用いて画像全体の最も高密度なセグメンテーションマップを識別する。
次に、SAMVGは欠落したコンポーネントを特定し、SVGにより詳細なコンポーネントを追加する。
論文 参考訳(メタデータ) (2023-11-09T11:11:56Z) - VectorFusion: Text-to-SVG by Abstracting Pixel-Based Diffusion Models [82.93345261434943]
画像の画素表現に基づいて訓練されたテキスト条件付き拡散モデルを用いて,SVG-exportable vector graphicsを生成する。
近年のテキスト・ツー・3D研究に触発されて,Score Distillation Smpling を用いたキャプションと整合したSVGを学習した。
実験では、以前の作品よりも品質が向上し、ピクセルアートやスケッチを含む様々なスタイルが示されている。
論文 参考訳(メタデータ) (2022-11-21T10:04:27Z) - Towards Layer-wise Image Vectorization [57.26058135389497]
画像をSVGに変換し,画像トポロジを同時に維持するためのレイヤワイズ画像ベクトル化(LIVE)を提案する。
Liveは、人間の視点にセマンティックに整合した階層構造を持つコンパクトなフォームを生成する。
Liveは、デザイナの両方のために編集可能なSVGを起動し、他のアプリケーションで使用することができる。
論文 参考訳(メタデータ) (2022-06-09T17:55:02Z) - DeepSVG: A Hierarchical Generative Network for Vector Graphics Animation [217.86315551526235]
本稿では,複雑なSVGアイコンの生成と操作のために,DeepSVGと呼ばれる新しい階層型生成ネットワークを提案する。
我々のアーキテクチャは、その形状自体をエンコードする低レベルのコマンドから、効果的に高レベルの形状を分離します。
我々のネットワークは、多様なベクトルグラフィックスを正確に再構築し、強力なアニメーションツールとして機能することを実証する。
論文 参考訳(メタデータ) (2020-07-22T09:36:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。