論文の概要: SVGauge: Towards Human-Aligned Evaluation for SVG Generation
- arxiv url: http://arxiv.org/abs/2509.07127v1
- Date: Mon, 08 Sep 2025 18:28:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-10 14:38:27.078674
- Title: SVGauge: Towards Human-Aligned Evaluation for SVG Generation
- Title(参考訳): SVGauge:SVG生成のためのヒューマンアライメント評価に向けて
- Authors: Leonardo Zini, Elia Frigieri, Sebastiano Aloscari, Marcello Generali, Lorenzo Dodi, Robert Dosen, Lorenzo Baraldi,
- Abstract要約: 本稿では,テキスト・ツー・SVG生成のための,最初のヒューマン・アライン・リファレンス・ベース・メトリックであるSVGaugeを紹介する。
SVGaugeは、SigLIP画像の埋め込みを抽出し、PCAで精製し、ドメインアライメントのために白化することで得られる視覚的忠実度を測定した。
提案したSHEベンチマークによる評価は,SVGaugeが人間の判断と最も相関していることを示している。
- 参考スコア(独自算出の注目度): 5.565553009801627
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generated Scalable Vector Graphics (SVG) images demand evaluation criteria tuned to their symbolic and vectorial nature: criteria that existing metrics such as FID, LPIPS, or CLIPScore fail to satisfy. In this paper, we introduce SVGauge, the first human-aligned, reference based metric for text-to-SVG generation. SVGauge jointly measures (i) visual fidelity, obtained by extracting SigLIP image embeddings and refining them with PCA and whitening for domain alignment, and (ii) semantic consistency, captured by comparing BLIP-2-generated captions of the SVGs against the original prompts in the combined space of SBERT and TF-IDF. Evaluation on the proposed SHE benchmark shows that SVGauge attains the highest correlation with human judgments and reproduces system-level rankings of eight zero-shot LLM-based generators more faithfully than existing metrics. Our results highlight the necessity of vector-specific evaluation and provide a practical tool for benchmarking future text-to-SVG generation models.
- Abstract(参考訳): Generated Scalable Vector Graphics (SVG) 画像は、その象徴的かつベクトル的な性質に合わせた評価基準を要求する: FID、LPIPS、CLIPScoreのような既存のメトリクスが満足できないという基準。
本稿では,テキスト・ツー・SVG生成のための,最初のヒューマン・アライン・リファレンス・ベース・メトリックであるSVGaugeを紹介する。
SVGauge 共同測度
i)SigLIP画像埋め込みを抽出し,PCAで精製し,ドメインアライメントのために白化することにより得られる視覚的忠実度
(II)SBERTとTF-IDFの組み合わせ空間において,SVGのBLIP-2生成キャプションと元のプロンプトとのセマンティック一貫性を比較した。
提案したSHEベンチマークでは,SVGaugeが人間の判断と最も高い相関性を示し,既存の指標よりも忠実に8つのゼロショットLCMベースのジェネレータのシステムレベルランキングを再現している。
本結果は,ベクトル固有評価の必要性を強調し,将来のテキスト-SVG生成モデルのベンチマークを行うための実用的なツールを提供する。
関連論文リスト
- SVGen: Interpretable Vector Graphics Generation with Large Language Models [61.62816031675714]
本稿では,自然言語記述と組み合わせた高品質なSVGの大規模データセットであるSVG-1Mを紹介する。
我々は、セマンティックガイダンスを強化するために、Chain of Thoughtアノテーション付きのサブセットを含む、SVGトレーニングペアに整合したテキストを作成する。
このデータセットに基づいて,自然言語入力からSVGコードを生成するエンド・ツー・エンド・モデルであるSVGenを提案する。
論文 参考訳(メタデータ) (2025-08-06T15:00:24Z) - OmniSVG: A Unified Scalable Vector Graphics Generation Model [69.59073636922287]
我々は、エンドツーエンドのマルチモーダルSVG生成に事前訓練されたビジョンランゲージモデルを活用する統一フレームワークであるOmniSVGを提案する。
SVGコマンドと座標を離散トークンにパラメタ化することにより、OmniSVGは複雑なSVG構造の合成を維持しながら、低レベルの幾何学から構造論理を分離し、効率的なトレーニングを行う。
本稿では,200万の注釈付きSVGアセットを持つマルチモーダルデータセットMMSVG-2Mと,条件付きSVG生成タスクの標準化された評価プロトコルを紹介する。
論文 参考訳(メタデータ) (2025-04-08T17:59:49Z) - NeuralSVG: An Implicit Representation for Text-to-Vector Generation [54.4153300455889]
本稿では,テキストプロンプトからベクトルグラフィックスを生成する暗黙的なニューラル表現であるNeuralSVGを提案する。
生成したSVGの層構造を促進するために,ドロップアウトに基づく正規化手法を導入する。
ニューラルSVGは、構造化された柔軟なSVGを生成する際に、既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-01-07T18:50:06Z) - Visually Descriptive Language Model for Vector Graphics Reasoning [76.42082386029206]
低レベル視覚知覚と高レベル言語推論のギャップを埋めるための視覚記述型言語モデル(VDLM)を提案する。
VDLMは,様々なマルチモーダル認識および推論タスクにおいて,GPT-4oのような最先端のLMMを大幅に改善することを示す。
論文 参考訳(メタデータ) (2024-04-09T17:30:18Z) - SVGDreamer: Text Guided SVG Generation with Diffusion Model [31.76771064173087]
SVGDreamerと呼ばれる新しいテキスト誘導ベクトルグラフィックス合成法を提案する。
SIVEプロセスは、前景オブジェクトと背景への合成の分解を可能にする。
VPSDアプローチは、形状の平滑化、彩度の過飽和、多様性の制限、収束の遅い問題に対処する。
論文 参考訳(メタデータ) (2023-12-27T08:50:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。