Fugu-MT 論文翻訳(概要): CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation

論文の概要: CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation

arxiv url: http://arxiv.org/abs/2506.10890v1
Date: Thu, 12 Jun 2025 16:54:39 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-13 15:37:22.851601
Title: CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation
Title（参考訳）: CreatiPoster: 編集可能で制御可能な多層グラフィックデザイン生成を目指して
Authors: Zhao Zhang, Yutao Cheng, Dexiang Hong, Maoke Yang, Gonglei Shi, Lei Ma, Hui Zhang, Jie Shao, Xinglong Wu,
Abstract要約: CreatiPosterは、任意の自然言語命令やアセットから編集可能な多層合成を生成するフレームワークである。さらなる研究のために、我々は10万の多層設計の著作権フリーコーパスをリリースする。
参考スコア（独自算出の注目度）: 13.354283356097563
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Graphic design plays a crucial role in both commercial and personal contexts, yet creating high-quality, editable, and aesthetically pleasing graphic compositions remains a time-consuming and skill-intensive task, especially for beginners. Current AI tools automate parts of the workflow, but struggle to accurately incorporate user-supplied assets, maintain editability, and achieve professional visual appeal. Commercial systems, like Canva Magic Design, rely on vast template libraries, which are impractical for replicate. In this paper, we introduce CreatiPoster, a framework that generates editable, multi-layer compositions from optional natural-language instructions or assets. A protocol model, an RGBA large multimodal model, first produces a JSON specification detailing every layer (text or asset) with precise layout, hierarchy, content and style, plus a concise background prompt. A conditional background model then synthesizes a coherent background conditioned on this rendered foreground layers. We construct a benchmark with automated metrics for graphic-design generation and show that CreatiPoster surpasses leading open-source approaches and proprietary commercial systems. To catalyze further research, we release a copyright-free corpus of 100,000 multi-layer designs. CreatiPoster supports diverse applications such as canvas editing, text overlay, responsive resizing, multilingual adaptation, and animated posters, advancing the democratization of AI-assisted graphic design. Project homepage: https://github.com/graphic-design-ai/creatiposter
Abstract（参考訳）: グラフィックデザインは、商業的、個人的両方の文脈において重要な役割を担っているが、高品質で、編集可能、美的なグラフィック構成を作成することは、特に初心者にとって、時間を要する、スキル集約的な作業である。現在のAIツールはワークフローの一部を自動化しているが、ユーザの供給する資産を正確に組み入れ、編集性を維持し、専門的な視覚的魅力を達成するのに苦労している。 Canva Magic Designのような商用システムは、大規模なテンプレートライブラリに依存しており、複製には実用的ではない。本稿では,任意の自然言語命令やアセットから編集可能な多層合成を生成するフレームワークであるCreativePosterを紹介する。 RGBAの大規模マルチモーダルモデルであるプロトコルモデルは、まず、正確なレイアウト、階層、コンテンツ、スタイルと簡潔なバックグラウンドプロンプトを備えたすべてのレイヤ(テキストまたはアセット)を詳述したJSON仕様を生成する。条件付き背景モデルは、このレンダリングされた前景層に条件付きコヒーレントな背景を合成する。グラフィックデザイン生成のための自動メトリクスを用いたベンチマークを構築し、CreliPosterが主要なオープンソースアプローチやプロプライエタリな商用システムを上回っていることを示す。さらなる研究を促進するため、我々は10万の多層設計の著作権フリーコーパスをリリースする。 CreatiPosterは、キャンバス編集、テキストオーバーレイ、レスポンシブリサイズ、多言語適応、アニメーションポスターなどの多様なアプリケーションをサポートし、AI支援グラフィックデザインの民主化を推進している。プロジェクトホームページ:https://github.com/graphic-design-ai/creatiposter

関連論文リスト

IGD: Instructional Graphic Design with Multimodal Layer Generation [83.31320209596991]
レイアウト生成に大きく依存する2段階の手法は創造性とインテリジェンスに欠けており、グラフィックデザインは依然として労働集約的である。自然言語命令のみで編集可能な柔軟性を持つマルチモーダル層を高速に生成するインストラクショナルグラフィックデザイナ(IGD)を提案する。
論文参考訳（メタデータ） (2025-07-14T04:31:15Z)
Rethinking Layered Graphic Design Generation with a Top-Down Approach [76.33538798060326]
図形デザインは、アイデアやメッセージを伝えるのに不可欠である。デザイナーは通常、編集を簡単にするために、オブジェクト、背景、ベクトル化されたテキスト層に作業を整理する。 GenAI方式の登場により、ピクセルフォーマットにおける高品質なグラフィックデザインの無限の供給がよりアクセスしやすくなってきた。これにもかかわらず、非層型設計は人間の設計を刺激し、レイアウトやテキストスタイルの選択に影響を与え、最終的に層型設計を導いた。本稿では,AI生成したデザインを編集可能な階層化設計に変換する最初の試みとして,グラフィックデザイン生成フレームワークであるAccordionを提案する。
論文参考訳（メタデータ） (2025-07-08T02:26:08Z)
GLDesigner: Leveraging Multi-Modal LLMs as Designer for Enhanced Aesthetic Text Glyph Layouts [53.568057283934714]
コンテンツ対応のテキストロゴレイアウトを生成するVLMベースのフレームワークを提案する。本稿では,複数のグリフ画像の同時処理における計算量を削減するための2つのモデル手法を提案する。アウトモデルのインストラクションチューニングを支援するために,既存の公開データセットよりも5倍大きい2つの拡張テキストロゴデータセットを構築した。
論文参考訳（メタデータ） (2024-11-18T10:04:10Z)
PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.67882997399021]
本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。我々は,ユーザのデザイン意図に基づいて編集可能なポスターを生成する自動テキスト投稿システムを開発した。
論文参考訳（メタデータ） (2024-06-05T03:05:52Z)
COLE: A Hierarchical Generation Framework for Multi-Layered and Editable Graphic Design [39.809852329070466]
本稿では,これらの課題に対処するために設計された階層型生成フレームワークであるCOLEシステムを紹介する。このCOLEシステムは、曖昧な意図のプロンプトを高品質な多層グラフィック設計に変換すると同時に、ユーザ入力に基づく柔軟な編集をサポートする。
論文参考訳（メタデータ） (2023-11-28T17:22:17Z)
PosterLayout: A New Benchmark and Approach for Content-aware Visual-Textual Presentation Layout [62.12447593298437]
コンテンツ対応視覚テキスト提示レイアウトは,所定のキャンバス上の空間空間を予め定義された要素にアレンジすることを目的としている。本稿では,設計過程を模倣するためにレイアウトの要素を再編成する設計シーケンス形成(DSF)を提案する。 CNN-LSTMに基づく新しい条件生成対向ネットワーク(GAN)を提示し、適切なレイアウトを生成する。
論文参考訳（メタデータ） (2023-03-28T12:48:36Z)
LayoutDETR: Detection Transformer Is a Good Multimodal Layout Designer [80.61492265221817]
グラフィックレイアウトデザインは視覚コミュニケーションにおいて重要な役割を担っている。しかし、手作りのレイアウトデザインは、スキルを要求し、時間がかかり、バッチプロダクションではスケールできない。ジェネレーティブモデルは、設計自動化をスケーラブルにするために出現するが、デザイナの欲求に沿うデザインを作成することは、未だに容易ではない。
論文参考訳（メタデータ） (2022-12-19T21:57:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。