論文の概要: VectorArk: Learning Practical Image Vectorization with Rounded Polygon Representation
- arxiv url: http://arxiv.org/abs/2605.24398v1
- Date: Sat, 23 May 2026 04:53:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.03265
- Title: VectorArk: Learning Practical Image Vectorization with Rounded Polygon Representation
- Title(参考訳): VectorArk: 円形ポリゴン表現による実用的な画像ベクトル化の学習
- Authors: Tarun Gehlaut, Difan Liu, Charu Bansal, Krutik Malani, Souymodip Chakraborty, Ankit Phogat, Matthew Fisher, Vineet Batra,
- Abstract要約: 本稿では、画像ベクトル化のための堅牢で実用的なモデルであるVectorArkを紹介する。
実験の結果,VectorArkは複数のデータセットにまたがって優れた幾何学的完全性とアーティファクト抑圧を実現することがわかった。
- 参考スコア(独自算出の注目度): 16.74960700300166
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent vision-language model (VLM)-based approaches have achieved impressive results on image vectorization tasks. However, they are typically evaluated on synthetic benchmarks, where clean SVGs are rasterized at high resolution and then re-vectorized. As a result, these methods generalize poorly to real-world scenarios, such as images with unknown rasterization methods or those generated by text-to-image models. We introduce VectorArk, a new VLM-based model designed for robust and practical image vectorization. VectorArk employs a novel rounded polygon representation that simplifies the learning process while naturally producing smooth, visually appealing primitives. We also propose a degradation model that enhances robustness across diverse and imperfect inputs. Our experiments show that, in contrast to previous methods, VectorArk achieves superior geometric completeness and artifact suppression across multiple datasets, with comprehensive ablations validating the contribution of each component.
- Abstract(参考訳): 近年の視覚言語モデル (VLM) に基づくアプローチは画像ベクトル化タスクにおいて顕著な成果を上げている。
しかし、それらは一般的に合成ベンチマークで評価され、クリーンなSVGは高解像度でラスタ化され、その後再ベクトル化される。
その結果、未知のラスタライズ手法を用いた画像やテキスト・ツー・イメージ・モデルで生成された画像など、現実のシナリオに乏しい手法が一般化された。
本稿では,VectorArkについて紹介する。VectorArkは,ロバストで実用的な画像ベクトル化のための新しいVLMモデルである。
VectorArkは、スムーズで視覚的に魅力的なプリミティブを自然に生成しながら、学習プロセスを単純化する新しい丸いポリゴン表現を採用している。
また,多種多様な不完全な入力に対するロバスト性を向上させる分解モデルを提案する。
従来の手法とは対照的に,VectorArkは複数のデータセットにまたがる優れた幾何学的完全性とアーティファクトの抑制を実現し,各コンポーネントの寄与を総合的に検証した。
関連論文リスト
- HORT: Monocular Hand-held Objects Reconstruction with Transformers [61.36376511119355]
モノクロ画像から手持ちの物体を3Dで再構成することは、コンピュータビジョンにおいて重要な課題である。
ハンドヘルドオブジェクトの高密度な3次元点群を効率的に再構成するトランスフォーマーモデルを提案する。
提案手法は,高速な推測速度で最先端の精度を達成し,画像の幅を最適化する。
論文 参考訳(メタデータ) (2025-03-27T09:45:09Z) - NeuralSVG: An Implicit Representation for Text-to-Vector Generation [54.4153300455889]
本稿では,テキストプロンプトからベクトルグラフィックスを生成する暗黙的なニューラル表現であるNeuralSVGを提案する。
生成したSVGの層構造を促進するために,ドロップアウトに基づく正規化手法を導入する。
ニューラルSVGは、構造化された柔軟なSVGを生成する際に、既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-01-07T18:50:06Z) - SVGDreamer++: Advancing Editability and Diversity in Text-Guided SVG Generation [31.76771064173087]
既存の手法の限界に対処する新しいテキスト誘導ベクトルグラフィックス合成法を提案する。
本稿では,階層型イメージベクタライゼーション(HIVE)フレームワークについて紹介する。
また、SVGの多様性を向上させるために、ベクトル化粒子を用いたスコア蒸留(VPSD)手法を提案する。
論文 参考訳(メタデータ) (2024-11-26T19:13:38Z) - Segmentation-guided Layer-wise Image Vectorization with Gradient Fills [6.037332707968933]
そこで本稿では,画像を勾配を埋め込んだ簡潔なベクトルグラフに変換するためのセグメンテーション誘導ベクトル化フレームワークを提案する。
組込み勾配認識セグメンテーションの指導により, 段階的に勾配を埋め込んだB'ezierパスを出力に付加する。
論文 参考訳(メタデータ) (2024-08-28T12:08:25Z) - Learning High-resolution Vector Representation from Multi-Camera Images for 3D Object Detection [60.11588003015481]
本稿では,高分解能ベクトル表現を用いたカメラベースの3次元物体検出器VectorFormerを提案する。
提案した高分解能ベクトル表現は、低分解能BEV表現と組み合わせて、ベクトル散乱と集光という2つの新しいモジュールを通して、高分解能のマルチカメラ画像から3次元幾何学を効率的に活用する。
論文 参考訳(メタデータ) (2024-07-22T03:51:18Z) - SuperSVG: Superpixel-based Scalable Vector Graphics Synthesis [66.44553285020066]
SuperSVGは、高速かつ高精度な画像ベクトル化を実現するスーパーピクセルベースのベクトル化モデルである。
本稿では,2段階の自己学習フレームワークを提案する。そこでは,粗い段階モデルを用いて主構造を再構築し,細部を充実させるために改良段階モデルを用いる。
再現精度と推定時間の観点から, 最先端手法と比較して, 提案手法の優れた性能を示す実験を行った。
論文 参考訳(メタデータ) (2024-06-14T07:43:23Z) - Layered Image Vectorization via Semantic Simplification [45.55066618943338]
本研究は, セマンティック・アライン・マクロ構造からより細部まで, 階層的ベクトルとしてイメージを再構成するプログレッシブ・イメージ・ベクター化手法を提案する。
そこで本研究では,Score Distillation Smpling 機構における特徴平均化効果を利用した画像単純化手法を提案する。
生成されたベクトルは、対象画像の明示的で暗黙的なセマンティック構造とよく一致している。
論文 参考訳(メタデータ) (2024-06-08T08:54:35Z) - Extracting Triangular 3D Models, Materials, and Lighting From Images [59.33666140713829]
多視点画像観測による材料と照明の協調最適化手法を提案する。
従来のグラフィックスエンジンにデプロイ可能な,空間的に変化する材料と環境を備えたメッシュを活用します。
論文 参考訳(メタデータ) (2021-11-24T13:58:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。