論文の概要: LayerPeeler: Autoregressive Peeling for Layer-wise Image Vectorization
- arxiv url: http://arxiv.org/abs/2505.23740v1
- Date: Thu, 29 May 2025 17:58:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:08.071233
- Title: LayerPeeler: Autoregressive Peeling for Layer-wise Image Vectorization
- Title(参考訳): LayerPeeler: レイヤワイドイメージベクタライゼーションのための自動回帰ピーリング
- Authors: Ronghuan Wu, Wanchao Su, Jing Liao,
- Abstract要約: 本稿では,新しいレイヤワイド画像ベクトル化手法であるLayerPeelerを紹介する。
最上位の非閉塞層を識別・除去することにより、完全な経路とコヒーレントな層構造を持つベクトルグラフを生成する。
本手法は視覚言語モデルを利用して,要素間の関係をキャプチャする層グラフを構築する。
- 参考スコア(独自算出の注目度): 14.917583676464266
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image vectorization is a powerful technique that converts raster images into vector graphics, enabling enhanced flexibility and interactivity. However, popular image vectorization tools struggle with occluded regions, producing incomplete or fragmented shapes that hinder editability. While recent advancements have explored rule-based and data-driven layer-wise image vectorization, these methods face limitations in vectorization quality and flexibility. In this paper, we introduce LayerPeeler, a novel layer-wise image vectorization approach that addresses these challenges through a progressive simplification paradigm. The key to LayerPeeler's success lies in its autoregressive peeling strategy: by identifying and removing the topmost non-occluded layers while recovering underlying content, we generate vector graphics with complete paths and coherent layer structures. Our method leverages vision-language models to construct a layer graph that captures occlusion relationships among elements, enabling precise detection and description for non-occluded layers. These descriptive captions are used as editing instructions for a finetuned image diffusion model to remove the identified layers. To ensure accurate removal, we employ localized attention control that precisely guides the model to target regions while faithfully preserving the surrounding content. To support this, we contribute a large-scale dataset specifically designed for layer peeling tasks. Extensive quantitative and qualitative experiments demonstrate that LayerPeeler significantly outperforms existing techniques, producing vectorization results with superior path semantics, geometric regularity, and visual fidelity.
- Abstract(参考訳): 画像ベクトル化は、ラスタ画像をベクトルグラフィックスに変換する強力な技術であり、柔軟性と相互作用性を向上させる。
しかし、一般的な画像ベクトル化ツールは隠蔽された領域に苦しむため、編集性を妨げる不完全または断片化された形状を生成する。
近年、ルールベースおよびデータ駆動型階層画像ベクトル化の研究が進んでいるが、これらの手法はベクトル化の品質と柔軟性の限界に直面している。
本稿では,レイヤワイド画像ベクトル化手法であるLayerPeelerを紹介する。
LayerPeelerの成功の鍵は、自己回帰的な剥離戦略にある: 基盤となるコンテンツを回復しながら、最上位の非閉塞層を特定し、取り除くことで、完全なパスとコヒーレントなレイヤ構造を持つベクトルグラフィックスを生成する。
本手法は視覚言語モデルを用いて,要素間の閉塞関係を捕捉し,非閉塞層に対する正確な検出と記述を可能にする層グラフを構築する。
これらの記述キャプションは、識別された層を除去するための微調整画像拡散モデルの編集命令として使用される。
正確な削除を確実にするために、我々は、周辺コンテンツを忠実に保存しながら、モデルをターゲット領域に正確に誘導する局所的注意制御を用いる。
これをサポートするために、我々は層剥離タスクに特化した大規模データセットを寄贈する。
広汎な定量的および定性的実験により、LayerPeelerは既存の手法を著しく上回り、より優れた経路意味論、幾何学的正則性、視覚的忠実度を持つベクトル化結果を生成する。
関連論文リスト
- ART: Anonymous Region Transformer for Variable Multi-Layer Transparent Image Generation [108.69315278353932]
可変多層透明画像の直接生成を容易にするAnonymous Region Transformer(ART)を導入する。
正確な制御とスケーラブルなレイヤ生成を可能にすることで、ARTはインタラクティブなコンテンツ作成のための新しいパラダイムを確立します。
論文 参考訳(メタデータ) (2025-02-25T16:57:04Z) - Generative Image Layer Decomposition with Visual Effects [49.75021036203426]
LayerDecompは、イメージ層分解のための生成フレームワークである。
清潔な背景と、忠実に保存された視覚効果を持つ高品質な透明な前景を作り出す。
本手法は,オブジェクト除去や空間編集作業において,既存の手法よりも優れた分解特性を実現する。
論文 参考訳(メタデータ) (2024-11-26T20:26:49Z) - DeepIcon: A Hierarchical Network for Layer-wise Icon Vectorization [12.82009632507056]
近年,イメージをベクトル形式に変換する学習ベース手法では,不完全形状,冗長な経路予測,オリジナルコンテンツのセマンティクスの保存における精度の欠如が頻発している。
本稿では,画像入力に基づいて可変長アイコングラフを生成する階層型画像ベクトル化ネットワークDeepIconを提案する。
論文 参考訳(メタデータ) (2024-10-21T08:20:19Z) - Segmentation-guided Layer-wise Image Vectorization with Gradient Fills [6.037332707968933]
そこで本稿では,画像を勾配を埋め込んだ簡潔なベクトルグラフに変換するためのセグメンテーション誘導ベクトル化フレームワークを提案する。
組込み勾配認識セグメンテーションの指導により, 段階的に勾配を埋め込んだB'ezierパスを出力に付加する。
論文 参考訳(メタデータ) (2024-08-28T12:08:25Z) - Layered Image Vectorization via Semantic Simplification [45.55066618943338]
本研究は, セマンティック・アライン・マクロ構造からより細部まで, 階層的ベクトルとしてイメージを再構成するプログレッシブ・イメージ・ベクター化手法を提案する。
そこで本研究では,Score Distillation Smpling 機構における特徴平均化効果を利用した画像単純化手法を提案する。
生成されたベクトルは、対象画像の明示的で暗黙的なセマンティック構造とよく一致している。
論文 参考訳(メタデータ) (2024-06-08T08:54:35Z) - LayerDiff: Exploring Text-guided Multi-layered Composable Image Synthesis via Layer-Collaborative Diffusion Model [70.14953942532621]
層共同拡散モデルであるLayerDiffは、テキスト誘導、多層化、構成可能な画像合成のために設計されている。
本モデルでは,従来の全画像生成手法に匹敵する性能で,高品質な多層画像を生成することができる。
LayerDiffは、レイヤ固有の画像編集やスタイル転送など、幅広いコントロール可能な生成アプリケーションを可能にする。
論文 参考訳(メタデータ) (2024-03-18T16:28:28Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - Learning to See Through Obstructions with Layered Decomposition [117.77024641706451]
移動画像から不要な障害を取り除くための学習に基づくアプローチを提案する。
本手法は背景要素と閉塞要素の運動差を利用して両方の層を復元する。
本研究では,合成データから得られた提案手法が実画像に対して良好に動作することを示す。
論文 参考訳(メタデータ) (2020-08-11T17:59:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。