論文の概要: Does Synthetic Layered Design Data Benefit Layered Design Decomposition?
- arxiv url: http://arxiv.org/abs/2605.15167v1
- Date: Thu, 14 May 2026 17:55:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-16 00:43:04.139935
- Title: Does Synthetic Layered Design Data Benefit Layered Design Decomposition?
- Title(参考訳): 合成層設計データは層状設計に相応しいか?
- Authors: Kam Man Wu, Haolin Yang, Qingyu Chen, Yihu Tang, Jingye Chen, Qifeng Chen,
- Abstract要約: ポスト世代編集は依然として困難であり、実用的なユーザビリティに向けた最後の1マイルのギャップが明らかになっている。
既存のアプローチは、ほとんど独自の階層化された資産に依存しているか、あるいは制限された構造上の前提から部分的に合成データを構築するかのいずれかである。
純粋な合成層データによってグラフィック設計の分解が向上するかどうかを考察する。
- 参考スコア(独自算出の注目度): 45.73478137196826
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in image generation have made it easy to produce high-quality images. However, these outputs are inherently flattened, entangling foreground elements, background, and text within a fixed canvas. As a result, flexible post-generation editing remains challenging, revealing a clear last-mile gap toward practical usability. Existing approaches either rely on scarce proprietary layered assets or construct partially synthetic data from limited structural priors. However, both strategies face fundamental challenges in scalability. In this work, we investigate whether pure synthetic layered data can improve graphic design decomposition. We make the assumption that, in graphic design, effective decomposition does not require modeling inter-layer dependencies as precisely as in natural-image composition, since design elements are often intentionally arranged as modular and semantically separable components. Concretely, we conduct a data-centric study based on CLD baseline, which is a state-of-the-art layer decomposition framework. Based on the baseline, we construct our own synthetic dataset, SynLayers, generate textual supervision using vision language models, and automate inference inputs with VLM-predicted bounding boxes. Our study reveals three key findings: (1) even training with purely synthetic data can outperform non-scalable alternatives such as the widely used PrismLayersPro dataset, demonstrating its viability as a scalable and effective substitute; (2) performance consistently improves with increased training data scale, while gains begin to saturate at around 50K samples; and (3) synthetic data enables balanced control over layer-count distributions, avoiding the layer-count imbalance commonly observed in real-world datasets. We hope this data-centric study encourages broader adoption of synthetic data as a practical foundation for layered design editing systems.
- Abstract(参考訳): 画像生成の進歩により、高品質な画像を容易に作成できるようになった。
しかし、これらの出力は本質的に平坦であり、固定されたキャンバス内の前景要素、背景、テキストを絡み合わせる。
その結果、フレキシブルなポストジェネレーションは依然として困難であり、実用的なユーザビリティに向けた最後の1マイルのギャップが明らかになっている。
既存のアプローチは、ほとんど独自の階層化された資産に依存しているか、あるいは制限された構造上の前提から部分的に合成データを構築するかのいずれかである。
しかし、どちらの戦略もスケーラビリティの根本的な課題に直面している。
本研究では, 純粋な合成層データによってグラフィック設計の分解が向上するかどうかを考察する。
図形設計では、設計要素はモジュール的で意味的に分離可能なコンポーネントとして意図的に配置されることが多いため、実効的な分解は、自然なイメージ構成のように層間依存関係を正確にモデル化する必要がなくなると仮定する。
具体的には、最先端の層分解フレームワークであるCLDベースラインに基づくデータ中心の研究を行う。
ベースラインに基づいて、我々は独自の合成データセット、SynLayersを構築し、視覚言語モデルを用いてテキスト監視を生成し、VLM予測境界ボックスによる推論入力を自動化する。
そこで本研究では,(1)広く使用されているPrismLayersProデータセットのように,純粋な合成データを用いたトレーニングであっても,拡張性や効果的な代替手段として,非スケーリング可能な代替品よりも優れた性能を発揮すること,(2)トレーニングデータのスケールを継続的に向上させると同時に,約50Kのサンプルを飽和させ始めること,(3)実世界のデータセットで一般的に見られるレイヤ数不均衡を回避することによって,階層数分布のバランス制御を可能にすること,の3つの重要な知見を明らかにした。
このデータ中心の研究は、階層化されたデザイン編集システムの実践的基盤として、より広範な合成データの採用を促進することを願っている。
関連論文リスト
- A Real-Calibrated Synthetic-First Data Engine [0.0]
Real-Calibrated Synthetic-First Data Engineは、コントロール可能な拡散生成と、統一パイプライン内でのマルチステージキュレーション/フィルタリングを組み合わせた、モジュラーデータエンジニアリングフレームワークである。
合成データを用いて, 実際のアンカーに付随して, ほぼゼロの人為的アノテーションによる拡張を行うと, 実際のデータベースラインが向上する一方で, 合成専用トレーニングは実データのみの性能よりもかなり低いままであることを示す。
論文 参考訳(メタデータ) (2026-05-10T18:34:43Z) - Understanding the Influence of Synthetic Data for Text Embedders [52.04771455432998]
まず,Wangらによって提案された合成データの再生と公開を行った。
合成データがモデル一般化をどのように改善するかを批判的に検討する。
本研究は, 汎用インバータ構築における, 現在の合成データ手法の限界を浮き彫りにしたものである。
論文 参考訳(メタデータ) (2025-09-07T19:28:52Z) - Scaling Laws of Synthetic Data for Language Models [125.41600201811417]
プレトレーニングコーパスを多種多様な高品質な合成データセットに変換するスケーラブルなフレームワークであるSynthLLMを紹介した。
提案手法は,グラフアルゴリズムを用いて複数の文書にまたがるハイレベルな概念を自動的に抽出し,再結合することで実現している。
論文 参考訳(メタデータ) (2025-03-25T11:07:12Z) - ContraNeRF: Generalizable Neural Radiance Fields for Synthetic-to-real
Novel View Synthesis via Contrastive Learning [102.46382882098847]
まず,合成から現実への新規な視点合成における合成データの影響について検討した。
本稿では,幾何制約を伴う多視点一貫した特徴を学習するために,幾何対応のコントラスト学習を導入することを提案する。
提案手法は,PSNR,SSIM,LPIPSの点で,既存の一般化可能な新規ビュー合成手法よりも高い画質で精細な画像を描画することができる。
論文 参考訳(メタデータ) (2023-03-20T12:06:14Z) - A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2398858786125]
コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文 参考訳(メタデータ) (2023-03-16T09:03:52Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。