論文の概要: Hierarchical SVG Tokenization: Learning Compact Visual Programs for Scalable Vector Graphics Modeling
- arxiv url: http://arxiv.org/abs/2604.05072v1
- Date: Mon, 06 Apr 2026 18:18:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.435216
- Title: Hierarchical SVG Tokenization: Learning Compact Visual Programs for Scalable Vector Graphics Modeling
- Title(参考訳): 階層型SVGトークン化:スケーラブルベクトルグラフィックスモデリングのためのコンパクトなビジュアルプログラムの学習
- Authors: Ximing Xing, Ziteng Xue, Zhenxi Li, Weicong Liang, Linqing Wang, Zhantao Yang, Tiankai Hang, Zijin Yin, Qinglin Lu, Chunyu Wang, Qian Yu,
- Abstract要約: HiVGは自己回帰ベクトルグラフィックス生成に適した階層的なSVGトークン化フレームワークである。
テキスト間SVGタスクと画像間SVGタスクの両方の実験により、生成の忠実度、空間的一貫性、シーケンス効率が改善された。
- 参考スコア(独自算出の注目度): 26.78519241779487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent large language models have shifted SVG generation from differentiable rendering optimization to autoregressive program synthesis. However, existing approaches still rely on generic byte-level tokenization inherited from natural language processing, which poorly reflects the geometric structure of vector graphics. Numerical coordinates are fragmented into discrete symbols, destroying spatial relationships and introducing severe token redundancy, often leading to coordinate hallucination and inefficient long-sequence generation. To address these challenges, we propose HiVG, a hierarchical SVG tokenization framework tailored for autoregressive vector graphics generation. HiVG decomposes raw SVG strings into structured \textit{atomic tokens} and further compresses executable command--parameter groups into geometry-constrained \textit{segment tokens}, substantially improving sequence efficiency while preserving syntactic validity. To further mitigate spatial mismatch, we introduce a Hierarchical Mean--Noise (HMN) initialization strategy that injects numerical ordering signals and semantic priors into new token embeddings. Combined with a curriculum training paradigm that progressively increases program complexity, HiVG enables more stable learning of executable SVG programs. Extensive experiments on both text-to-SVG and image-to-SVG tasks demonstrate improved generation fidelity, spatial consistency, and sequence efficiency compared with conventional tokenization schemes.
- Abstract(参考訳): 近年の大規模言語モデルでは、SVG生成を微分可能なレンダリング最適化から自己回帰型プログラム合成に移行している。
しかし、既存のアプローチは、ベクトルグラフィックスの幾何学的構造をよく反映していない自然言語処理から継承された一般的なバイトレベルのトークン化に依存している。
数値座標は離散的なシンボルに断片化され、空間的関係を破壊し、深刻なトークン冗長性を導入し、しばしば幻覚と非効率的な長列生成をもたらす。
これらの課題に対処するために,自己回帰ベクトルグラフィックス生成に適した階層的SVGトークン化フレームワークであるHiVGを提案する。
HiVGは生のSVG文字列を構造化された \textit{atomic tokens} に分解し、さらに実行可能なコマンドパラメータ群を幾何学的に制約された \textit{segment tokens} に圧縮し、構文的妥当性を維持しながらシーケンス効率を大幅に改善する。
空間的ミスマッチをさらに緩和するために,数値順序付け信号とセマンティック先行情報を新しいトークン埋め込みに注入する階層的平均ノイズ初期化戦略を導入する。
プログラムの複雑さを徐々に増大させるカリキュラムトレーニングパラダイムと組み合わせることで、HiVGは実行可能なSVGプログラムをより安定した学習を可能にする。
テキスト間SVGタスクと画像間SVGタスクの両方に対する大規模な実験により、従来のトークン化方式と比較して、生成の忠実度、空間的一貫性、シーケンス効率が改善された。
関連論文リスト
- Reliable Reasoning in SVG-LLMs via Multi-Task Multi-Reward Reinforcement Learning [15.21004381065588]
本稿では,SVG生成時のモデル推論プロセスを公開する統一的なフレームワークであるSVGのためのChain-of-Thought-Reinforcement Learningを提案する。
SVGモデルをトレーニングしてグループレベルのコードを生成することにより、構造的コヒーレンスと視覚的忠実度を大幅に改善する。
提案手法は,全体の生成能力を体系的に向上し,タスク成功率の向上,SVGのコード品質の向上,視覚的忠実度の向上を実現している。
論文 参考訳(メタデータ) (2026-03-17T07:16:30Z) - IntroSVG: Learning from Rendering Feedback for Text-to-SVG Generation via an Introspective Generator-Critic Framework [20.964700751378547]
既存のテキスト間SVG生成法では、最終的なレンダリング画像の視覚的認識は組み込まれていない。
本稿では,イントロスペクティブSVG生成フレームワーク(IntroSVG)を提案する。
提案手法は,いくつかの重要な評価指標にまたがって,最先端の性能を実現する。
論文 参考訳(メタデータ) (2026-03-10T07:44:51Z) - VecGlypher: Unified Vector Glyph Generation with Language Models [49.18215716168074]
VecGlypherはテキスト記述や画像例から直接、高忠実度ベクトルグリフを生成する。
VecGlypherはSVGパストークンを自動回帰的に出力し、中間文字とターゲット文字を避ける。
論文 参考訳(メタデータ) (2026-02-25T00:27:23Z) - From Tokens to Numbers: Continuous Number Modeling for SVG Generation [17.597559308984042]
連続数モデリング(Continuous Number Modeling, CNM)は、離散トークンではなく、数値を直接一級連続値としてモデル化する手法である。
我々の定式化は、代替手法に比べて高い忠実性を保ちながら、トレーニング速度を30%以上改善する。
論文 参考訳(メタデータ) (2026-02-02T21:20:38Z) - SVGThinker: Instruction-Aligned and Reasoning-Driven Text-to-SVG Generation [47.390332111383294]
本稿では,SVGコードの生成を可視化プロセスと整合させる推論駆動型フレームワークであるSVGThinkerを紹介する。
パイプラインはまず各プリミティブをシーケンスでレンダリングし、マルチモーダルモデルを使用して画像とコードを注釈付けします。
最先端のベースラインに対する実験では、SVGThinkerはより安定し、編集可能で、高品質なSVGを生成する。
論文 参考訳(メタデータ) (2025-09-29T05:25:00Z) - SVGen: Interpretable Vector Graphics Generation with Large Language Models [61.62816031675714]
本稿では,自然言語記述と組み合わせた高品質なSVGの大規模データセットであるSVG-1Mを紹介する。
我々は、セマンティックガイダンスを強化するために、Chain of Thoughtアノテーション付きのサブセットを含む、SVGトレーニングペアに整合したテキストを作成する。
このデータセットに基づいて,自然言語入力からSVGコードを生成するエンド・ツー・エンド・モデルであるSVGenを提案する。
論文 参考訳(メタデータ) (2025-08-06T15:00:24Z) - OmniSVG: A Unified Scalable Vector Graphics Generation Model [69.59073636922287]
我々は、エンドツーエンドのマルチモーダルSVG生成に事前訓練されたビジョンランゲージモデルを活用する統一フレームワークであるOmniSVGを提案する。
SVGコマンドと座標を離散トークンにパラメタ化することにより、OmniSVGは複雑なSVG構造の合成を維持しながら、低レベルの幾何学から構造論理を分離し、効率的なトレーニングを行う。
本稿では,200万の注釈付きSVGアセットを持つマルチモーダルデータセットMMSVG-2Mと,条件付きSVG生成タスクの標準化された評価プロトコルを紹介する。
論文 参考訳(メタデータ) (2025-04-08T17:59:49Z) - NeuralSVG: An Implicit Representation for Text-to-Vector Generation [54.4153300455889]
本稿では,テキストプロンプトからベクトルグラフィックスを生成する暗黙的なニューラル表現であるNeuralSVGを提案する。
生成したSVGの層構造を促進するために,ドロップアウトに基づく正規化手法を導入する。
ニューラルSVGは、構造化された柔軟なSVGを生成する際に、既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-01-07T18:50:06Z) - SVGDreamer++: Advancing Editability and Diversity in Text-Guided SVG Generation [31.76771064173087]
既存の手法の限界に対処する新しいテキスト誘導ベクトルグラフィックス合成法を提案する。
本稿では,階層型イメージベクタライゼーション(HIVE)フレームワークについて紹介する。
また、SVGの多様性を向上させるために、ベクトル化粒子を用いたスコア蒸留(VPSD)手法を提案する。
論文 参考訳(メタデータ) (2024-11-26T19:13:38Z) - SVGDreamer: Text Guided SVG Generation with Diffusion Model [31.76771064173087]
SVGDreamerと呼ばれる新しいテキスト誘導ベクトルグラフィックス合成法を提案する。
SIVEプロセスは、前景オブジェクトと背景への合成の分解を可能にする。
VPSDアプローチは、形状の平滑化、彩度の過飽和、多様性の制限、収束の遅い問題に対処する。
論文 参考訳(メタデータ) (2023-12-27T08:50:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。