論文の概要: SEGA: A Stepwise Evolution Paradigm for Content-Aware Layout Generation with Design Prior
- arxiv url: http://arxiv.org/abs/2510.15749v1
- Date: Fri, 17 Oct 2025 15:36:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-20 20:17:34.685855
- Title: SEGA: A Stepwise Evolution Paradigm for Content-Aware Layout Generation with Design Prior
- Title(参考訳): SEGA: 設計優先のコンテンツ対応レイアウト生成のための段階的な進化パラダイム
- Authors: Haoran Wang, Bo Zhao, Jinghui Wang, Hanzhang Wang, Huan Yang, Wei Ji, Hao Liu, Xinyan Xiao,
- Abstract要約: コンテンツ対応レイアウト生成のためのステップワイド進化パラダイムSEGAを紹介する。
人間の思考の体系的なモードにインスパイアされたSEGAは、粗大な戦略を持つ階層的推論フレームワークを採用している。
我々は、豊富なメタ情報アノテーションを備えた新しい大規模ポスターデータセットであるGenPoster-100Kを提案する。
- 参考スコア(独自算出の注目度): 30.770509440256973
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we study the content-aware layout generation problem, which aims to automatically generate layouts that are harmonious with a given background image. Existing methods usually deal with this task with a single-step reasoning framework. The lack of a feedback-based self-correction mechanism leads to their failure rates significantly increasing when faced with complex element layout planning. To address this challenge, we introduce SEGA, a novel Stepwise Evolution Paradigm for Content-Aware Layout Generation. Inspired by the systematic mode of human thinking, SEGA employs a hierarchical reasoning framework with a coarse-to-fine strategy: first, a coarse-level module roughly estimates the layout planning results; then, another refining module performs fine-level reasoning regarding the coarse planning results. Furthermore, we incorporate layout design principles as prior knowledge into the model to enhance its layout planning ability. Besides, we present GenPoster-100K that is a new large-scale poster dataset with rich meta-information annotation. The experiments demonstrate the effectiveness of our approach by achieving the state-of-the-art results on multiple benchmark datasets. Our project page is at: https://brucew91.github.io/SEGA.github.io/
- Abstract(参考訳): 本稿では,背景画像と調和したレイアウトを自動的に生成することを目的とした,コンテンツ認識レイアウト生成問題について検討する。
既存のメソッドは通常、このタスクを単一ステップの推論フレームワークで処理します。
フィードバックベースの自己補正機構の欠如は、複雑な要素のレイアウト計画に直面した場合、その失敗率を著しく向上させる。
この課題に対処するために、コンテンツ対応レイアウト生成のためのステップワイド進化パラダイムであるSEGAを紹介します。
まず、粗いレベルのモジュールがレイアウト計画結果を大まかに推定し、次に、別の再精製モジュールが粗い計画結果に関する細かなレベルの推論を行う。
さらに、レイアウト設計の原則を事前知識としてモデルに組み込んで、レイアウト計画能力を向上する。
さらに、豊富なメタ情報アノテーションを備えた新しい大規模ポスターデータセットであるGenPoster-100Kを提案する。
実験では、複数のベンチマークデータセット上で最先端の結果を達成し、提案手法の有効性を実証した。
プロジェクトページは以下の通り。 https://brucew91.github.io/SEGA.github.io/
関連論文リスト
- PosterLlama: Bridging Design Ability of Langauge Model to Contents-Aware Layout Generation [6.855409699832414]
PosterLlamaは、視覚的およびテキスト的に一貫性のあるレイアウトを生成するように設計されたネットワークである。
評価の結果,PosterLlamaは,信頼性とコンテンツ対応レイアウトの生成において,既存の手法よりも優れていることがわかった。
これは、非条件のレイアウト生成、要素条件のレイアウト生成、レイアウトの完了など、非常に汎用性の高いユーザー操作ツールとして機能するなど、非パラレルな範囲の条件をサポートする。
論文 参考訳(メタデータ) (2024-04-01T08:46:35Z) - Enhancing Visually-Rich Document Understanding via Layout Structure
Modeling [91.07963806829237]
レイアウトの知識をモデルに注入する新しい文書理解モデルであるGraphLMを提案する。
我々は、FUNSD、XFUND、CORDなど様々なベンチマークでモデルを評価し、最先端の結果を得た。
論文 参考訳(メタデータ) (2023-08-15T13:53:52Z) - PosterLayout: A New Benchmark and Approach for Content-aware
Visual-Textual Presentation Layout [62.12447593298437]
コンテンツ対応視覚テキスト提示レイアウトは,所定のキャンバス上の空間空間を予め定義された要素にアレンジすることを目的としている。
本稿では,設計過程を模倣するためにレイアウトの要素を再編成する設計シーケンス形成(DSF)を提案する。
CNN-LSTMに基づく新しい条件生成対向ネットワーク(GAN)を提示し、適切なレイアウトを生成する。
論文 参考訳(メタデータ) (2023-03-28T12:48:36Z) - LayoutDiffusion: Improving Graphic Layout Generation by Discrete
Diffusion Probabilistic Models [50.73105631853759]
レイアウト自動生成のための新しい生成モデルLayoutDiffusionを提案する。
このプロセスでは,前方ステップの成長に伴うレイアウトの混乱が増している。
これにより、プラグアンドプレイ方式で2つの条件付きレイアウト生成タスクを再トレーニングすることなく実現し、既存の方法よりも優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-03-21T04:41:02Z) - LayoutDETR: Detection Transformer Is a Good Multimodal Layout Designer [80.61492265221817]
グラフィックレイアウトデザインは視覚コミュニケーションにおいて重要な役割を担っている。
しかし、手作りのレイアウトデザインは、スキルを要求し、時間がかかり、バッチプロダクションではスケールできない。
ジェネレーティブモデルは、設計自動化をスケーラブルにするために出現するが、デザイナの欲求に沿うデザインを作成することは、未だに容易ではない。
論文 参考訳(メタデータ) (2022-12-19T21:57:35Z) - ERNIE-Layout: Layout Knowledge Enhanced Pre-training for Visually-rich
Document Understanding [52.3895498789521]
レイアウト知識を向上した新しい文書事前学習ソリューションであるERNIEを提案する。
まず、直列化段階で入力シーケンスを並べ替え、相関的な事前学習タスクを示し、順序予測を行い、文書の適切な読み順序を学習する。
実験の結果、ERNIEは様々な下流タスクにおいて優れた性能を示し、キー情報に新たな最先端設定、文書質問応答を実現している。
論文 参考訳(メタデータ) (2022-10-12T12:59:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。