論文の概要: Recognizing Vector Graphics without Rasterization
- arxiv url: http://arxiv.org/abs/2111.03281v1
- Date: Fri, 5 Nov 2021 06:16:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-08 23:26:11.889905
- Title: Recognizing Vector Graphics without Rasterization
- Title(参考訳): ラスタ化のないベクトルグラフの認識
- Authors: Xinyang Jiang, Lu Liu, Caihua Shan, Yifei Shen, Xuanyi Dong, Dongsheng
Li
- Abstract要約: 画像の異なるデータフォーマットについて考察する。
画像認識で広く使われているグラフィックスとは対照的に、ベクトルグラフィックスはエイリアスや情報損失なしに任意の解像度にスケールアップまたは縮小することができる。
YOLaTは、ベクトルの構造情報と空間情報をモデル化するマルチグラフを構築し、グラフからオブジェクトを検出するために、デュアルストリームグラフニューラルネットワークを提案する。
- 参考スコア(独自算出の注目度): 36.31813939087549
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we consider a different data format for images: vector
graphics. In contrast to raster graphics which are widely used in image
recognition, vector graphics can be scaled up or down into any resolution
without aliasing or information loss, due to the analytic representation of the
primitives in the document. Furthermore, vector graphics are able to give extra
structural information on how low-level elements group together to form high
level shapes or structures. These merits of graphic vectors have not been fully
leveraged in existing methods. To explore this data format, we target on the
fundamental recognition tasks: object localization and classification. We
propose an efficient CNN-free pipeline that does not render the graphic into
pixels (i.e. rasterization), and takes textual document of the vector graphics
as input, called YOLaT (You Only Look at Text). YOLaT builds multi-graphs to
model the structural and spatial information in vector graphics, and a
dual-stream graph neural network is proposed to detect objects from the graph.
Our experiments show that by directly operating on vector graphics, YOLaT
out-performs raster-graphic based object detection baselines in terms of both
average precision and efficiency.
- Abstract(参考訳): 本稿では,ベクトルグラフィックスという,画像の異なるデータ形式について考察する。
画像認識で広く使われているラスターグラフィックスとは対照的に、ベクトルグラフィックスは文書のプリミティブの解析的表現のため、エイリアスや情報損失なしに任意の解像度にスケールアップまたは縮小することができる。
さらに、ベクターグラフィックスは、低レベル要素がどのようにグループ化され、ハイレベルな形状や構造を形成するかに関する追加の構造情報を提供することができる。
これらのグラフィックベクトルの利点は、既存の手法では十分に活用されていない。
このデータフォーマットを探索するために、オブジェクトのローカライゼーションと分類という基本的な認識タスクを対象とする。
本稿では,グラフィックをピクセル(ラスタライゼーション)にレンダリングしない効率的なCNNフリーパイプラインを提案し,ベクトルグラフィックスのテキスト文書を入力として,YOLaT(You Only Look at Text)と呼ぶ。
YOLaTは、ベクトルグラフィックスにおける構造情報と空間情報をモデル化するマルチグラフを構築し、グラフからオブジェクトを検出するために、デュアルストリームグラフニューラルネットワークを提案する。
実験では,ベクトルグラフィックスを直接操作することで,平均精度と効率の両面でラスタグラフィックに基づく物体検出ベースラインを上回ることを示した。
関連論文リスト
- Vector Grimoire: Codebook-based Shape Generation under Raster Image Supervision [20.325246638505714]
本稿では,GRIMOIREというテキスト誘導型生成モデルを紹介し,画像をベクトル形状に再構成して離散コードブックにマッピングする方法を提案する。
データから直接の監視を必要とする既存のモデルとは異なり、GRIMOIREはベクトル生成モデリングをはるかに多くのデータに開放するイメージ監督のみを使用して学習する。
論文 参考訳(メタデータ) (2024-10-08T12:41:31Z) - SuperSVG: Superpixel-based Scalable Vector Graphics Synthesis [66.44553285020066]
SuperSVGは、高速かつ高精度な画像ベクトル化を実現するスーパーピクセルベースのベクトル化モデルである。
本稿では,2段階の自己学習フレームワークを提案する。そこでは,粗い段階モデルを用いて主構造を再構築し,細部を充実させるために改良段階モデルを用いる。
再現精度と推定時間の観点から, 最先端手法と比較して, 提案手法の優れた性能を示す実験を行った。
論文 参考訳(メタデータ) (2024-06-14T07:43:23Z) - Text-Guided Vector Graphics Customization [31.41266632288932]
テキストのプロンプトに基づいて高品質なベクトルグラフィックスを生成する新しいパイプラインを提案する。
提案手法は,大規模な事前学習されたテキスト・ツー・イメージ・モデルの能力を利用する。
我々は,ベクトルレベル,画像レベル,テキストレベルの観点から,複数の指標を用いて評価を行った。
論文 参考訳(メタデータ) (2023-09-21T17:59:01Z) - VectorFusion: Text-to-SVG by Abstracting Pixel-Based Diffusion Models [82.93345261434943]
画像の画素表現に基づいて訓練されたテキスト条件付き拡散モデルを用いて,SVG-exportable vector graphicsを生成する。
近年のテキスト・ツー・3D研究に触発されて,Score Distillation Smpling を用いたキャプションと整合したSVGを学習した。
実験では、以前の作品よりも品質が向上し、ピクセルアートやスケッチを含む様々なスタイルが示されている。
論文 参考訳(メタデータ) (2022-11-21T10:04:27Z) - Learning to Generate Scene Graph from Natural Language Supervision [52.18175340725455]
シーングラフと呼ばれる画像内の局所化オブジェクトとその関係をグラフィカルに表現するために,画像と文のペアから学習する最初の方法の1つを提案する。
既製のオブジェクト検出器を利用してオブジェクトのインスタンスを識別し、ローカライズし、検出された領域のラベルとキャプションから解析された概念をマッチングし、シーングラフを学習するための"擬似ラベル"を作成する。
論文 参考訳(メタデータ) (2021-09-06T03:38:52Z) - Im2Vec: Synthesizing Vector Graphics without Vector Supervision [31.074606918245298]
ベクトルグラフィックスはフォント、ロゴ、デジタルアートワーク、グラフィックデザインを表現するために広く使われている。
入力グラフィックを常に調整し、画像ベースの生成アプローチを利用することができる。
訓練時のベクトル表現の明示的な監督を必要とする現在のモデルは、入手が困難である。
様々なトポロジを持つ複雑なベクトルグラフを生成するニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T18:39:45Z) - Promoting Graph Awareness in Linearized Graph-to-Text Generation [72.83863719868364]
局所グラフ構造を符号化する線形化モデルの能力を検討する。
本研究は,モデルの暗黙のグラフ符号化の品質を高めるための解法である。
これらの消音足場は、低リソース設定における下流生成の大幅な改善につながることが分かりました。
論文 参考訳(メタデータ) (2020-12-31T18:17:57Z) - DeepSVG: A Hierarchical Generative Network for Vector Graphics Animation [217.86315551526235]
本稿では,複雑なSVGアイコンの生成と操作のために,DeepSVGと呼ばれる新しい階層型生成ネットワークを提案する。
我々のアーキテクチャは、その形状自体をエンコードする低レベルのコマンドから、効果的に高レベルの形状を分離します。
我々のネットワークは、多様なベクトルグラフィックスを正確に再構築し、強力なアニメーションツールとして機能することを実証する。
論文 参考訳(メタデータ) (2020-07-22T09:36:31Z) - Which way? Direction-Aware Attributed Graph Embedding [2.429993132301275]
グラフ埋め込みアルゴリズムは連続ベクトル空間内のグラフを効率的に表現するために用いられる。
しばしば見落とされがちな側面の1つは、グラフが向き付けられたかどうかである。
本研究は,DIAGRAMという,テキストに富んだ方向認識アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-30T13:08:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。