論文の概要: Structural Evaluation Metrics for SVG Generation via Leave-One-Out Analysis
- arxiv url: http://arxiv.org/abs/2604.08809v1
- Date: Thu, 09 Apr 2026 22:50:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.604901
- Title: Structural Evaluation Metrics for SVG Generation via Leave-One-Out Analysis
- Title(参考訳): 残余1アウト解析によるSVG生成のための構造評価指標
- Authors: Haonan Zhu, Adrienne Deganutti, Elad Hirsch, Purvanshi Mehta,
- Abstract要約: 従来のジャックニフェ推定器にインスパイアされた要素レベルのLeft-one-out (LOO)分析を導入する。
LOOスコアは、ゼロショットアーティファクト検出を可能にするLOOスコアによって要素毎にスコアされる。
5世代のシステムと3つの複雑性レベルにわたる19,000以上の編集(5タイプ)で、これらのメトリクスを検証する。
- 参考スコア(独自算出の注目度): 7.246398319376824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scalable Vector Graphics (SVG) represent visual content as structured, editable code. Each element (path, shape, or text node) can be individually inspected, transformed, or removed. This structural editability is a main motivation for SVG generation, yet prevailing evaluation protocols primarily reduce the output to a single similarity score against a reference image or input texts, measuring how faithfully the result reproduces an image or follows the instructions, but not how well it preserves the structural properties that make SVG valuable. In particular, existing metrics cannot determine which generated elements contribute positively to overall visual quality, how visual concepts map to specific parts of the code, or whether the generated output supports meaningful downstream editing. We introduce element-level leave-one-out (LOO) analysis, inspired by the classic jackknife estimator. The procedure renders the SVG with and without each element, measures the resulting visual change, and derives a suite of structural quality metrics. Despite its simplicity, the jackknife's capacity to decompose an aggregate statistic into per-sample contributions translates directly to this setting. From a single mechanism, we obtain: (1) quality scores per element through LOO scoring that enable zero-shot artifact detection; (2) concept-element attribution that maps each element to the visual concept it serves; and (3) four structural metrics, purity, coverage, compactness, and locality, that quantify SVG modularity from complementary perspectives. We validate these metrics on over 19,000 edits (5 types) across 5 generation systems and 3 complexity tiers.
- Abstract(参考訳): スケーラブルベクトルグラフィックス(SVG)は、ビジュアルコンテンツを構造化され編集可能なコードとして表現する。
各要素(パス、形状、テキストノード)は個別に検査、変換、削除できる。
この構造的編集性はSVG生成の主要な動機であるが、評価プロトコルは、主に参照画像や入力テキストに対して出力を単一の類似度スコアに減らし、結果がどれだけ忠実に画像を再現するか、あるいは指示に従うかを測定するが、SVGを価値ある構造的特性をいかに保存するかは明らかにしない。
特に、既存のメトリクスでは、どの生成要素が全体的な視覚的品質に肯定的に寄与するか、どのように視覚的概念がコードの特定の部分にマップされるか、あるいは生成された出力が意味のある下流編集をサポートするかどうかを判断できない。
従来のジャックニフェ推定器にインスパイアされた要素レベルのLeft-one-out (LOO)分析を導入する。
このプロシージャはSVGを各要素と無関係にレンダリングし、その結果の視覚的変化を測定し、一連の構造的品質指標を導出する。
その単純さにもかかわらず、集計統計をサンプルごとのコントリビューションに分解するジャックナイフの能力は、この設定に直接変換される。
1つのメカニズムから,(1)ゼロショットのアーティファクト検出を可能にするLOOスコア,(2)各要素を視覚的概念にマッピングする概念的要素属性,(3)4つの構造的指標,純粋性,カバレッジ,コンパクト性,局所性によりSVGのモジュラリティを相補的な視点から定量化する。
5世代のシステムと3つの複雑性レベルにわたる19,000以上の編集(5タイプ)で、これらのメトリクスを検証する。
関連論文リスト
- Multimodal OCR: Parse Anything from Documents [72.69545534962234]
dots.mocrは、チャート、ダイアグラム、テーブル、アイコンなどのビジュアル要素を第一級解析ターゲットとして扱う。
テキストとグラフィックの両方を構造化出力として再構築し、より忠実なドキュメント再構築を可能にする。
不均一なドキュメント要素に対するエンドツーエンドのトレーニングをサポートする。
論文 参考訳(メタデータ) (2026-03-13T14:42:21Z) - SVG360: Multi-View SVG Generation with Geometric and Color Consistency from a Single SVG [1.558477573183958]
本稿では,単一のSVG入力から多視点一貫したSVGを生成する3段階のフレームワークを提案する。
結果として得られたSVGは、ビュー間で強い色の一貫性を示し、冗長なパスを著しく低減し、微細な構造的詳細を保持する。
この作業は生成的モデリングと構造化ベクトル表現を橋渡しし、単一の入力とオブジェクトレベルのマルチビュー生成へのスケーラブルなルートを提供する。
論文 参考訳(メタデータ) (2025-11-20T19:33:57Z) - SVGauge: Towards Human-Aligned Evaluation for SVG Generation [5.565553009801627]
本稿では,テキスト・ツー・SVG生成のための,最初のヒューマン・アライン・リファレンス・ベース・メトリックであるSVGaugeを紹介する。
SVGaugeは、SigLIP画像の埋め込みを抽出し、PCAで精製し、ドメインアライメントのために白化することで得られる視覚的忠実度を測定した。
提案したSHEベンチマークによる評価は,SVGaugeが人間の判断と最も相関していることを示している。
論文 参考訳(メタデータ) (2025-09-08T18:28:31Z) - SVGen: Interpretable Vector Graphics Generation with Large Language Models [61.62816031675714]
本稿では,自然言語記述と組み合わせた高品質なSVGの大規模データセットであるSVG-1Mを紹介する。
我々は、セマンティックガイダンスを強化するために、Chain of Thoughtアノテーション付きのサブセットを含む、SVGトレーニングペアに整合したテキストを作成する。
このデータセットに基づいて,自然言語入力からSVGコードを生成するエンド・ツー・エンド・モデルであるSVGenを提案する。
論文 参考訳(メタデータ) (2025-08-06T15:00:24Z) - OmniSVG: A Unified Scalable Vector Graphics Generation Model [69.59073636922287]
我々は、エンドツーエンドのマルチモーダルSVG生成に事前訓練されたビジョンランゲージモデルを活用する統一フレームワークであるOmniSVGを提案する。
SVGコマンドと座標を離散トークンにパラメタ化することにより、OmniSVGは複雑なSVG構造の合成を維持しながら、低レベルの幾何学から構造論理を分離し、効率的なトレーニングを行う。
本稿では,200万の注釈付きSVGアセットを持つマルチモーダルデータセットMMSVG-2Mと,条件付きSVG生成タスクの標準化された評価プロトコルを紹介する。
論文 参考訳(メタデータ) (2025-04-08T17:59:49Z) - NeuralSVG: An Implicit Representation for Text-to-Vector Generation [54.4153300455889]
本稿では,テキストプロンプトからベクトルグラフィックスを生成する暗黙的なニューラル表現であるNeuralSVGを提案する。
生成したSVGの層構造を促進するために,ドロップアウトに基づく正規化手法を導入する。
ニューラルSVGは、構造化された柔軟なSVGを生成する際に、既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-01-07T18:50:06Z) - SVGCraft: Beyond Single Object Text-to-SVG Synthesis with Comprehensive Canvas Layout [14.824205628841158]
この研究は、テキスト記述からシーン全体を描写したベクトルグラフィックスを作成するための新しいエンドツーエンドフレームワークを導入する。
SVGCraftは、訓練済みエンコーダと不透明度変調によるLPIPS損失を使って最適化され、類似性を最大化する。
抽象化、認識可能性、細部において、以前の作品を上回ることが示されている。
論文 参考訳(メタデータ) (2024-03-30T16:43:40Z) - Beyond Pixels: Exploring Human-Readable SVG Generation for Simple Images
with Vision Language Models [19.145503353922038]
本稿では,Simple-SVG-Generation (Stextsuperscript2VGtextsuperscript2)を提案する。
本手法は,正確かつ簡便なSVGの生成と,人間の可読性と理解の整合性に重点を置いている。
その結果,従来のSVG生成手法よりも明らかに改善された結果が得られた。
論文 参考訳(メタデータ) (2023-11-27T05:20:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。