論文の概要: PosterVerse: A Full-Workflow Framework for Commercial-Grade Poster Generation with HTML-Based Scalable Typography
- arxiv url: http://arxiv.org/abs/2601.03993v1
- Date: Wed, 07 Jan 2026 15:04:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 02:15:23.666618
- Title: PosterVerse: A Full-Workflow Framework for Commercial-Grade Poster Generation with HTML-Based Scalable Typography
- Title(参考訳): PosterVerse: HTMLベースのスケーラブルなタイポグラフィによる商用Poster生成のためのフルワークフローフレームワーク
- Authors: Junle Liu, Peirong Zhang, Yuyi Zhang, Pengyu Yan, Hui Zhou, Xinyue Zhou, Fengjun Guo, Lianwen Jin,
- Abstract要約: PosterVerseは、フルワークフロー、商用グレードのポスター生成方法である。
PosterVerseはプロ向けデザインを3つの重要なステージで再現する。
PosterDNAは商用グレードのHTMLベースのデータセットである。
- 参考スコア(独自算出の注目度): 44.93712206658515
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Commercial-grade poster design demands the seamless integration of aesthetic appeal with precise, informative content delivery. Current automated poster generation systems face significant limitations, including incomplete design workflows, poor text rendering accuracy, and insufficient flexibility for commercial applications. To address these challenges, we propose PosterVerse, a full-workflow, commercial-grade poster generation method that seamlessly automates the entire design process while delivering high-density and scalable text rendering. PosterVerse replicates professional design through three key stages: (1) blueprint creation using fine-tuned LLMs to extract key design elements from user requirements, (2) graphical background generation via customized diffusion models to create visually appealing imagery, and (3) unified layout-text rendering with an MLLM-powered HTML engine to guarantee high text accuracy and flexible customization. In addition, we introduce PosterDNA, a commercial-grade, HTML-based dataset tailored for training and validating poster design models. To the best of our knowledge, PosterDNA is the first Chinese poster generation dataset to introduce HTML typography files, enabling scalable text rendering and fundamentally solving the challenges of rendering small and high-density text. Experimental results demonstrate that PosterVerse consistently produces commercial-grade posters with appealing visuals, accurate text alignment, and customizable layouts, making it a promising solution for automating commercial poster design. The code and model are available at https://github.com/wuhaer/PosterVerse.
- Abstract(参考訳): 商業グレードのポスターデザインでは、美的魅力と正確な情報的コンテンツ配信をシームレスに統合する必要がある。
現在の自動ポスター生成システムは、不完全な設計ワークフロー、テキストレンダリングの精度の低下、商用アプリケーションに対する柔軟性の不足など、重大な制限に直面している。
これらの課題に対処するため、我々は、高密度でスケーラブルなテキストレンダリングを提供しながら、設計プロセス全体をシームレスに自動化する、フルワークフローで商用レベルのポスター生成方法であるPosterVerseを提案する。
PosterVerse は,(1) 微調整 LLM を用いて,ユーザ要求から重要なデザイン要素を抽出するための青写真生成,(2) 視覚的に魅力的な画像を作成するためのカスタマイズされた拡散モデルによるグラフィカルな背景生成,(3) MLLM を利用した HTML エンジンによるレイアウトテキストレンダリングにより,高いテキスト精度とフレキシブルなカスタマイズを保証する。
また、ポスターデザインモデルのトレーニングと検証に適した商用グレードのHTMLベースのデータセットであるPosterDNAについても紹介する。
われわれの知る限り、PosterDNAはHTMLタイポグラフィファイルを導入した最初の中国のポスター生成データセットであり、スケーラブルなテキストレンダリングを可能にし、小さくて高密度なテキストのレンダリングという課題を根本的に解決している。
実験の結果、PosterVerseは、魅力的なビジュアル、正確なテキストアライメント、カスタマイズ可能なレイアウトを備えた商業用ポスターを一貫して製造しており、商業用ポスターデザインを自動化するための有望なソリューションであることが示された。
コードとモデルはhttps://github.com/wuhaer/PosterVerse.comで公開されている。
関連論文リスト
- IGD: Instructional Graphic Design with Multimodal Layer Generation [83.31320209596991]
レイアウト生成に大きく依存する2段階の手法は創造性とインテリジェンスに欠けており、グラフィックデザインは依然として労働集約的である。
自然言語命令のみで編集可能な柔軟性を持つマルチモーダル層を高速に生成するインストラクショナルグラフィックデザイナ(IGD)を提案する。
論文 参考訳(メタデータ) (2025-07-14T04:31:15Z) - Rethinking Layered Graphic Design Generation with a Top-Down Approach [76.33538798060326]
図形デザインは、アイデアやメッセージを伝えるのに不可欠である。デザイナーは通常、編集を簡単にするために、オブジェクト、背景、ベクトル化されたテキスト層に作業を整理する。
GenAI方式の登場により、ピクセルフォーマットにおける高品質なグラフィックデザインの無限の供給がよりアクセスしやすくなってきた。
これにもかかわらず、非層型設計は人間の設計を刺激し、レイアウトやテキストスタイルの選択に影響を与え、最終的に層型設計を導いた。
本稿では,AI生成したデザインを編集可能な階層化設計に変換する最初の試みとして,グラフィックデザイン生成フレームワークであるAccordionを提案する。
論文 参考訳(メタデータ) (2025-07-08T02:26:08Z) - PosterMaker: Towards High-Quality Product Poster Generation with Accurate Text Rendering [50.76106125697899]
テーマ、シーン、テキストを統合したプロダクトポスターは、顧客を引き付けるための重要なプロモーションツールである。
主な課題はテキストを正確にレンダリングすることであり、特に1万文字以上を含む中国語のような複雑な書記システムではそうである。
テキストレンダリング精度が90%を超えるTextRenderNetを開発した。
TextRenderNetとSceneGenNetをベースに、エンドツーエンド生成フレームワークであるPosterMakerを紹介します。
論文 参考訳(メタデータ) (2025-04-09T07:13:08Z) - POSTA: A Go-to Framework for Customized Artistic Poster Generation [87.16343612086959]
POSTAは、カスタマイズされた芸術ポスター生成のためのモジュラーフレームワークである。
background Diffusionはユーザ入力に基づいてテーマ付きバックグラウンドを生成する。
設計MLLMはレイアウトとタイポグラフィー要素を生成し、背景スタイルと整合し補完する。
ArtText Diffusionはキーテキスト要素にスタイリングを追加する。
論文 参考訳(メタデータ) (2025-03-19T05:22:38Z) - GlyphDraw2: Automatic Generation of Complex Glyph Posters with Diffusion Models and Large Language Models [7.152732507491591]
LLMを利用したテキストレンダリング機能を備えた自動ポスター生成フレームワークを提案する。
このフレームワークは、詳細な背景の中で正確なポスターテキストを作成することを目的としている。
解像度が1024ピクセルを超える高解像度フォントデータセットとポスターデータセットを導入する。
論文 参考訳(メタデータ) (2024-07-02T13:17:49Z) - PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.67882997399021]
本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。
データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。
我々は,ユーザのデザイン意図に基づいて編集可能なポスターを生成する自動テキスト投稿システムを開発した。
論文 参考訳(メタデータ) (2024-06-05T03:05:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。