Fugu-MT 論文翻訳(概要): Layered Image Vectorization via Semantic Simplification

論文の概要: Layered Image Vectorization via Semantic Simplification

arxiv url: http://arxiv.org/abs/2406.05404v2
Date: Fri, 07 Mar 2025 23:43:43 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-11 20:09:43.68327
Title: Layered Image Vectorization via Semantic Simplification
Title（参考訳）: 意味的単純化による層状画像ベクトル化
Authors: Zhenyu Wang, Jianxi Huang, Zhida Sun, Yuanhao Gong, Daniel Cohen-Or, Min Lu,
Abstract要約: 本研究は, セマンティック・アライン・マクロ構造からより細部まで, 階層的ベクトルとしてイメージを再構成するプログレッシブ・イメージ・ベクター化手法を提案する。そこで本研究では,Score Distillation Smpling 機構における特徴平均化効果を利用した画像単純化手法を提案する。生成されたベクトルは、対象画像の明示的で暗黙的なセマンティック構造とよく一致している。
参考スコア（独自算出の注目度）: 45.55066618943338
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This work presents a progressive image vectorization technique that reconstructs the raster image as layer-wise vectors from semantic-aligned macro structures to finer details. Our approach introduces a new image simplification method leveraging the feature-average effect in the Score Distillation Sampling mechanism, achieving effective visual abstraction from the detailed to coarse. Guided by the sequence of progressive simplified images, we propose a two-stage vectorization process of structural buildup and visual refinement, constructing the vectors in an organized and manageable manner. The resulting vectors are layered and well-aligned with the target image's explicit and implicit semantic structures. Our method demonstrates high performance across a wide range of images. Comparative analysis with existing vectorization methods highlights our technique's superiority in creating vectors with high visual fidelity, and more importantly, achieving higher semantic alignment and more compact layered representation. The project homepage is https://szuviz.github.io/layered_vectorization/.
Abstract（参考訳）: 本研究では,ラスタ画像を階層的ベクトルとして,セマンティックなマクロ構造から細部まで再構成するプログレッシブな画像ベクトル化手法を提案する。提案手法では, 精細度から粗度まで効果的に視覚的抽象化を実現するため, Score Distillation Smpling 機構における特徴平均効果を利用した新しい画像単純化手法を提案する。そこで本研究では, 構造的構築と視覚的洗練の2段階ベクター化プロセスを提案し, ベクトルを組織的かつ管理可能な方法で構築する。生成されたベクトルは、対象画像の明示的で暗黙的なセマンティック構造とよく一致している。提案手法は,幅広い画像にまたがって高い性能を示す。既存のベクトル化法との比較分析は、高い視覚的忠実度を持つベクトルの作成において、我々の技術が優れていることを強調し、さらに重要なことは、より高い意味的アライメントとよりコンパクトな層表現を実現することである。プロジェクトのホームページはhttps://szuviz.github.io/layered_vectorization/である。

関連論文リスト

Clair Obscur: an Illumination-Aware Method for Real-World Image Vectorization [12.638057671088148]
COVec は、Clair-Obscur の光陰性コントラスト原理に着想を得た照明対応ベクトル化フレームワークである。ベクトル領域に固有の画像分解を導入し、イメージをアルベド、シェード、ライト層に分離する。
論文参考訳（メタデータ） (2025-11-25T08:01:04Z)
Seg4Diff: Unveiling Open-Vocabulary Segmentation in Text-to-Image Diffusion Transformers [56.76198904599581]
テキストと画像の拡散モデルは、言語翻訳において優れているため、モーダル間の注意機構を通じて暗黙的に概念を基礎づける。近年のマルチモーダル拡散トランスフォーマーでは, 共用画像とテキストトークンを導入し, よりリッチでスケーラブルなクロスモーダルアライメントを実現している。 MM-DiTの注意構造を分析するための体系的フレームワークであるSeg4Diffを導入し,テキストから画像への意味情報の伝達方法に着目した。
論文参考訳（メタデータ） (2025-09-22T17:59:54Z)
LayerPeeler: Autoregressive Peeling for Layer-wise Image Vectorization [14.917583676464266]
本稿では,新しいレイヤワイド画像ベクトル化手法であるLayerPeelerを紹介する。最上位の非閉塞層を識別・除去することにより、完全な経路とコヒーレントな層構造を持つベクトルグラフを生成する。本手法は視覚言語モデルを利用して,要素間の関係をキャプチャする層グラフを構築する。
論文参考訳（メタデータ） (2025-05-29T17:58:03Z)
DeepIcon: A Hierarchical Network for Layer-wise Icon Vectorization [12.82009632507056]
近年,イメージをベクトル形式に変換する学習ベース手法では,不完全形状,冗長な経路予測,オリジナルコンテンツのセマンティクスの保存における精度の欠如が頻発している。本稿では,画像入力に基づいて可変長アイコングラフを生成する階層型画像ベクトル化ネットワークDeepIconを提案する。
論文参考訳（メタデータ） (2024-10-21T08:20:19Z)
Segmentation-guided Layer-wise Image Vectorization with Gradient Fills [6.037332707968933]
そこで本稿では,画像を勾配を埋め込んだ簡潔なベクトルグラフに変換するためのセグメンテーション誘導ベクトル化フレームワークを提案する。組込み勾配認識セグメンテーションの指導により, 段階的に勾配を埋め込んだB'ezierパスを出力に付加する。
論文参考訳（メタデータ） (2024-08-28T12:08:25Z)
SuperSVG: Superpixel-based Scalable Vector Graphics Synthesis [66.44553285020066]
SuperSVGは、高速かつ高精度な画像ベクトル化を実現するスーパーピクセルベースのベクトル化モデルである。本稿では,2段階の自己学習フレームワークを提案する。そこでは,粗い段階モデルを用いて主構造を再構築し,細部を充実させるために改良段階モデルを用いる。再現精度と推定時間の観点から, 最先端手法と比較して, 提案手法の優れた性能を示す実験を行った。
論文参考訳（メタデータ） (2024-06-14T07:43:23Z)
VectorPainter: A Novel Approach to Stylized Vector Graphics Synthesis with Vectorized Strokes [17.222592006593057]
本稿では,ベクトルグラフ合成のための新しい手法であるVectorPainterを提案する。テキストプロンプトと参照スタイルのイメージが与えられた後、VectorPainterは、テキストプロンプトとコンテンツが一致し、スタイルが参照イメージに忠実なベクターグラフィックを生成する。
論文参考訳（メタデータ） (2024-05-05T15:01:29Z)
Texture, Shape and Order Matter: A New Transformer Design for Sequential DeepFake Detection [57.100891917805086]
シーケンシャルディープフェイク検出は、順番に操作シーケンスを予測する新しいタスクである。本稿では, テクスチャ, 形状, 操作順序の3つの視点を探索し, TSOM と呼ばれる新しいトランスフォーマーの設計について述べる。
論文参考訳（メタデータ） (2024-04-22T04:47:52Z)
Generalizable Entity Grounding via Assistance of Large Language Model [77.07759442298666]
本稿では,長いキャプションから密接な視覚的実体を抽出する手法を提案する。本研究では,意味代名詞の抽出に大規模なマルチモーダルモデル,エンティティレベルのセグメンテーションを生成するクラス-aセグメンテーションモデル,および各セグメンテーション名詞と対応するセグメンテーションマスクを関連付けるマルチモーダル特徴融合モジュールを利用する。
論文参考訳（メタデータ） (2024-02-04T16:06:05Z)
StrokeNUWA: Tokenizing Strokes for Vector Graphic Synthesis [112.25071764647683]
StrokeNUWAはベクターグラフィックスにおけるより良い視覚表現'ストロークトークン'を探求する先駆的な研究である。ストロークトークンを備えたStrokeNUWAは、従来のLCMベースの最適化ベースのメソッドを大幅に上回ることができる。 StrokeNUWAは、SVGコード圧縮比が6.9%の従来の手法よりも94倍のスピードアップを達成している。
論文参考訳（メタデータ） (2024-01-30T15:20:26Z)
Optimize and Reduce: A Top-Down Approach for Image Vectorization [12.998637003026273]
高速かつドメインに依存しないベクトル化へのトップダウンアプローチであるOptimize & Reduce (O&R)を提案する。 O&Rの目的は、B'ezier曲線パラメータを反復的に最適化することで、入力画像のコンパクトな表現を実現することである。提案手法はドメインに依存しないものであり,固定された形状に対する再現性および知覚的品質の両方において,既存の作品よりも優れることを示す。
論文参考訳（メタデータ） (2023-12-18T16:41:03Z)
Improving Image Tracing with Convolutional Autoencoders by High-Pass Filter Preprocessing [0.6367279911825442]
本研究では,画像の抽象表現を抽出するために,ハイパスフィルタリング,オートエンコーディング,ベクトル化などの処理手法を検討する。結果によると、オートエンコーダで画像を再構築し、ハイパスフィルタリングし、ベクター化することで、ベクター化プロセスの有効性を高めながら、画像をより抽象的に表現することができる。
論文参考訳（メタデータ） (2023-06-15T10:59:29Z)
Towards Layer-wise Image Vectorization [57.26058135389497]
画像をSVGに変換し,画像トポロジを同時に維持するためのレイヤワイズ画像ベクトル化(LIVE)を提案する。 Liveは、人間の視点にセマンティックに整合した階層構造を持つコンパクトなフォームを生成する。 Liveは、デザイナの両方のために編集可能なSVGを起動し、他のアプリケーションで使用することができる。
論文参考訳（メタデータ） (2022-06-09T17:55:02Z)
Bi-level Feature Alignment for Versatile Image Translation and Manipulation [88.5915443957795]
GAN(Generative Adversarial Network)は画像翻訳と操作において大きな成功を収めている。忠実なスタイル制御を備えた高忠実な画像生成は、コンピュータビジョンにおいて依然として大きな課題である。本稿では,高精度なセマンティック・スタイル・ガイダンスを実現する多機能な画像翻訳・操作フレームワークを提案する。
論文参考訳（メタデータ） (2021-07-07T05:26:29Z)
Progressive Encoding for Neural Optimization [92.55503085245304]
メッシュ転送におけるppe層の能力と,そのアドバンテージを,現代の表面マッピング技術と比較した。最も重要な点は, パラメタライズフリーな手法であり, 様々な対象形状表現に適用可能であることである。
論文参考訳（メタデータ） (2021-04-19T08:22:55Z)
Learning to Compose Hypercolumns for Visual Correspondence [57.93635236871264]
本稿では,画像に条件付けされた関連レイヤを活用することで,動的に効率的な特徴を構成する視覚対応手法を提案する。提案手法はダイナミックハイパーピクセルフロー(Dynamic Hyperpixel Flow)と呼ばれ,深層畳み込みニューラルネットワークから少数の関連層を選択することにより,高速にハイパーカラム機能を構成することを学習する。
論文参考訳（メタデータ） (2020-07-21T04:03:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。