論文の概要: CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation
- arxiv url: http://arxiv.org/abs/2506.10890v1
- Date: Thu, 12 Jun 2025 16:54:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 15:37:22.851601
- Title: CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation
- Title(参考訳): CreatiPoster: 編集可能で制御可能な多層グラフィックデザイン生成を目指して
- Authors: Zhao Zhang, Yutao Cheng, Dexiang Hong, Maoke Yang, Gonglei Shi, Lei Ma, Hui Zhang, Jie Shao, Xinglong Wu,
- Abstract要約: CreatiPosterは、任意の自然言語命令やアセットから編集可能な多層合成を生成するフレームワークである。
さらなる研究のために、我々は10万の多層設計の著作権フリーコーパスをリリースする。
- 参考スコア(独自算出の注目度): 13.354283356097563
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Graphic design plays a crucial role in both commercial and personal contexts, yet creating high-quality, editable, and aesthetically pleasing graphic compositions remains a time-consuming and skill-intensive task, especially for beginners. Current AI tools automate parts of the workflow, but struggle to accurately incorporate user-supplied assets, maintain editability, and achieve professional visual appeal. Commercial systems, like Canva Magic Design, rely on vast template libraries, which are impractical for replicate. In this paper, we introduce CreatiPoster, a framework that generates editable, multi-layer compositions from optional natural-language instructions or assets. A protocol model, an RGBA large multimodal model, first produces a JSON specification detailing every layer (text or asset) with precise layout, hierarchy, content and style, plus a concise background prompt. A conditional background model then synthesizes a coherent background conditioned on this rendered foreground layers. We construct a benchmark with automated metrics for graphic-design generation and show that CreatiPoster surpasses leading open-source approaches and proprietary commercial systems. To catalyze further research, we release a copyright-free corpus of 100,000 multi-layer designs. CreatiPoster supports diverse applications such as canvas editing, text overlay, responsive resizing, multilingual adaptation, and animated posters, advancing the democratization of AI-assisted graphic design. Project homepage: https://github.com/graphic-design-ai/creatiposter
- Abstract(参考訳): グラフィックデザインは、商業的、個人的両方の文脈において重要な役割を担っているが、高品質で、編集可能、美的なグラフィック構成を作成することは、特に初心者にとって、時間を要する、スキル集約的な作業である。
現在のAIツールはワークフローの一部を自動化しているが、ユーザの供給する資産を正確に組み入れ、編集性を維持し、専門的な視覚的魅力を達成するのに苦労している。
Canva Magic Designのような商用システムは、大規模なテンプレートライブラリに依存しており、複製には実用的ではない。
本稿では,任意の自然言語命令やアセットから編集可能な多層合成を生成するフレームワークであるCreativePosterを紹介する。
RGBAの大規模マルチモーダルモデルであるプロトコルモデルは、まず、正確なレイアウト、階層、コンテンツ、スタイルと簡潔なバックグラウンドプロンプトを備えたすべてのレイヤ(テキストまたはアセット)を詳述したJSON仕様を生成する。
条件付き背景モデルは、このレンダリングされた前景層に条件付きコヒーレントな背景を合成する。
グラフィックデザイン生成のための自動メトリクスを用いたベンチマークを構築し、CreliPosterが主要なオープンソースアプローチやプロプライエタリな商用システムを上回っていることを示す。
さらなる研究を促進するため、我々は10万の多層設計の著作権フリーコーパスをリリースする。
CreatiPosterは、キャンバス編集、テキストオーバーレイ、レスポンシブリサイズ、多言語適応、アニメーションポスターなどの多様なアプリケーションをサポートし、AI支援グラフィックデザインの民主化を推進している。
プロジェクトホームページ:https://github.com/graphic-design-ai/creatiposter
関連論文リスト
- GLDesigner: Leveraging Multi-Modal LLMs as Designer for Enhanced Aesthetic Text Glyph Layouts [53.568057283934714]
コンテンツ対応のテキストロゴレイアウトを生成するVLMベースのフレームワークを提案する。
本稿では,複数のグリフ画像の同時処理における計算量を削減するための2つのモデル手法を提案する。
アウトモデルのインストラクションチューニングを支援するために,既存の公開データセットよりも5倍大きい2つの拡張テキストロゴデータセットを構築した。
論文 参考訳(メタデータ) (2024-11-18T10:04:10Z) - PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.67882997399021]
本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。
データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。
我々は,ユーザのデザイン意図に基づいて編集可能なポスターを生成する自動テキスト投稿システムを開発した。
論文 参考訳(メタデータ) (2024-06-05T03:05:52Z) - COLE: A Hierarchical Generation Framework for Multi-Layered and Editable Graphic Design [39.809852329070466]
本稿では,これらの課題に対処するために設計された階層型生成フレームワークであるCOLEシステムを紹介する。
このCOLEシステムは、曖昧な意図のプロンプトを高品質な多層グラフィック設計に変換すると同時に、ユーザ入力に基づく柔軟な編集をサポートする。
論文 参考訳(メタデータ) (2023-11-28T17:22:17Z) - LayoutDETR: Detection Transformer Is a Good Multimodal Layout Designer [80.61492265221817]
グラフィックレイアウトデザインは視覚コミュニケーションにおいて重要な役割を担っている。
しかし、手作りのレイアウトデザインは、スキルを要求し、時間がかかり、バッチプロダクションではスケールできない。
ジェネレーティブモデルは、設計自動化をスケーラブルにするために出現するが、デザイナの欲求に沿うデザインを作成することは、未だに容易ではない。
論文 参考訳(メタデータ) (2022-12-19T21:57:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。