論文の概要: iPoster: Content-Aware Layout Generation for Interactive Poster Design via Graph-Enhanced Diffusion Models
- arxiv url: http://arxiv.org/abs/2603.29469v1
- Date: Tue, 31 Mar 2026 09:14:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.44181
- Title: iPoster: Content-Aware Layout Generation for Interactive Poster Design via Graph-Enhanced Diffusion Models
- Title(参考訳): iPoster:グラフ拡張拡散モデルによるインタラクティブなポスターデザインのためのコンテンツ対応レイアウト生成
- Authors: Xudong Zhou, Jinyuan Liang, Qiuyi Guo, Guozheng Li,
- Abstract要約: iPosterを使うと、ユーザはインテントモジュール内で部分的なインテントを指定できる。
生成モジュールは、即座にコンテキストに敏感なレイアウトを生成する。
iPosterは最先端のレイアウト品質を達成する。
- 参考スコア(独自算出の注目度): 6.654503571647595
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present iPoster, an interactive layout generation framework that empowers users to guide content-aware poster layout design by specifying flexible constraints. iPoster enables users to specify partial intentions within the intention module, such as element categories, sizes, positions, or coarse initial drafts. Then, the generation module instantly generates refined, context-sensitive layouts that faithfully respect these constraints. iPoster employs a unified graph-enhanced diffusion architecture that supports various design tasks under user-specified constraints. These constraints are enforced through masking strategies that precisely preserve user input at every denoising step. A cross content-aware attention module aligns generated elements with salient regions of the canvas, ensuring visual coherence. Extensive experiments show that iPoster not only achieves state-of-the-art layout quality, but offers a responsive and controllable framework for poster layout design with constraints.
- Abstract(参考訳): iPosterは、ユーザが柔軟な制約を指定して、コンテンツ対応のポスターレイアウト設計をガイドできるようにする、インタラクティブなレイアウト生成フレームワークである。
iPosterでは,要素カテゴリやサイズ,位置,あるいは粗い初期ドラフトなど,意図的なモジュール内の部分的な意図を指定することができる。
次に、生成モジュールは、これらの制約を忠実に尊重する洗練され、コンテキストに敏感なレイアウトを即座に生成する。
iPosterは、ユーザが指定した制約の下で様々なデザインタスクをサポートする、統一的なグラフ強化拡散アーキテクチャを採用している。
これらの制約は、特定ステップ毎にユーザの入力を正確に保存するマスキング戦略によって実施される。
クロスコンテント対応アテンションモジュールは、生成された要素をキャンバスの健全な領域と整列させ、視覚的コヒーレンスを確保する。
大規模な実験によると、iPosterは最先端のレイアウト品質を達成するだけでなく、制約のあるレイアウト設計のための応答性と制御可能なフレームワークを提供する。
関連論文リスト
- PosterO: Structuring Layout Trees to Enable Language Models in Generalized Content-Aware Layout Generation [38.53781264480452]
PosterOは、不愉快な目的のためにポスターを作成するためのレイアウト中心のアプローチである。
SVG言語のツリーとしてのデータセットからのレイアウトを、普遍的な形状、設計意図のベクトル化、階層的なノード表現によって構成する。
与えられた画像に対して視覚的に魅力的なレイアウトを生成することができ、様々なベンチマークで新しい最先端のパフォーマンスを達成することができる。
論文 参考訳(メタデータ) (2025-05-06T18:42:24Z) - POSTA: A Go-to Framework for Customized Artistic Poster Generation [87.16343612086959]
POSTAは、カスタマイズされた芸術ポスター生成のためのモジュラーフレームワークである。
background Diffusionはユーザ入力に基づいてテーマ付きバックグラウンドを生成する。
設計MLLMはレイアウトとタイポグラフィー要素を生成し、背景スタイルと整合し補完する。
ArtText Diffusionはキーテキスト要素にスタイリングを追加する。
論文 参考訳(メタデータ) (2025-03-19T05:22:38Z) - GLDesigner: Leveraging Multi-Modal LLMs as Designer for Enhanced Aesthetic Text Glyph Layouts [53.568057283934714]
本稿では,コンテンツ対応のテキストロゴレイアウトを生成するVLM(Vision-Language Model)ベースのフレームワークを提案する。
本稿では,複数のグリフ画像を同時に処理するための計算コストを削減する2つのモデル手法を提案する。
本モデルでは,既存の公開データセットの5倍の広義のテキストロゴデータセットを2つ構築する。
論文 参考訳(メタデータ) (2024-11-18T10:04:10Z) - PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.67882997399021]
本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。
データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。
我々は,ユーザのデザイン意図に基づいて編集可能なポスターを生成する自動テキスト投稿システムを開発した。
論文 参考訳(メタデータ) (2024-06-05T03:05:52Z) - PosterLlama: Bridging Design Ability of Langauge Model to Contents-Aware Layout Generation [6.855409699832414]
PosterLlamaは、視覚的およびテキスト的に一貫性のあるレイアウトを生成するように設計されたネットワークである。
評価の結果,PosterLlamaは,信頼性とコンテンツ対応レイアウトの生成において,既存の手法よりも優れていることがわかった。
これは、非条件のレイアウト生成、要素条件のレイアウト生成、レイアウトの完了など、非常に汎用性の高いユーザー操作ツールとして機能するなど、非パラレルな範囲の条件をサポートする。
論文 参考訳(メタデータ) (2024-04-01T08:46:35Z) - PosterLayout: A New Benchmark and Approach for Content-aware
Visual-Textual Presentation Layout [62.12447593298437]
コンテンツ対応視覚テキスト提示レイアウトは,所定のキャンバス上の空間空間を予め定義された要素にアレンジすることを目的としている。
本稿では,設計過程を模倣するためにレイアウトの要素を再編成する設計シーケンス形成(DSF)を提案する。
CNN-LSTMに基づく新しい条件生成対向ネットワーク(GAN)を提示し、適切なレイアウトを生成する。
論文 参考訳(メタデータ) (2023-03-28T12:48:36Z) - LayoutDETR: Detection Transformer Is a Good Multimodal Layout Designer [80.61492265221817]
グラフィックレイアウトデザインは視覚コミュニケーションにおいて重要な役割を担っている。
しかし、手作りのレイアウトデザインは、スキルを要求し、時間がかかり、バッチプロダクションではスケールできない。
ジェネレーティブモデルは、設計自動化をスケーラブルにするために出現するが、デザイナの欲求に沿うデザインを作成することは、未だに容易ではない。
論文 参考訳(メタデータ) (2022-12-19T21:57:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。