論文の概要: DreamPoster: A Unified Framework for Image-Conditioned Generative Poster Design
- arxiv url: http://arxiv.org/abs/2507.04218v1
- Date: Sun, 06 Jul 2025 03:06:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.07
- Title: DreamPoster: A Unified Framework for Image-Conditioned Generative Poster Design
- Title(参考訳): DreamPoster:イメージ定義のジェネレータ設計のための統一フレームワーク
- Authors: Xiwei Hu, Haokun Chen, Zhongqi Qi, Hui Zhang, Dexiang Hong, Jie Shao, Xinglong Wu,
- Abstract要約: ユーザが提供する画像やテキストプロンプトから高品質なポスターをインテリジェントに合成するテキスト・ツー・イメージ生成フレームワークであるDreamPosterを紹介する。
データセット構築のために,テキストコンテンツとタイポグラフィ階層情報を正確にアノテートする体系的なデータアノテーションパイプラインを提案する。
我々は、高品質な生成を維持しつつ、階層的にマルチタスク生成能力を得られるプログレッシブトレーニング戦略を実装した。
- 参考スコア(独自算出の注目度): 8.913908898296626
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We present DreamPoster, a Text-to-Image generation framework that intelligently synthesizes high-quality posters from user-provided images and text prompts while maintaining content fidelity and supporting flexible resolution and layout outputs. Specifically, DreamPoster is built upon our T2I model, Seedream3.0 to uniformly process different poster generating types. For dataset construction, we propose a systematic data annotation pipeline that precisely annotates textual content and typographic hierarchy information within poster images, while employing comprehensive methodologies to construct paired datasets comprising source materials (e.g., raw graphics/text) and their corresponding final poster outputs. Additionally, we implement a progressive training strategy that enables the model to hierarchically acquire multi-task generation capabilities while maintaining high-quality generation. Evaluations on our testing benchmarks demonstrate DreamPoster's superiority over existing methods, achieving a high usability rate of 88.55\%, compared to GPT-4o (47.56\%) and SeedEdit3.0 (25.96\%). DreamPoster will be online in Jimeng and other Bytedance Apps.
- Abstract(参考訳): ユーザが提供する画像やテキストプロンプトから高品質なポスターをインテリジェントに合成し、コンテンツの忠実さを維持し、フレキシブルな解像度とレイアウト出力をサポートするテキスト・ツー・イメージ生成フレームワークであるDreamPosterを提案する。
具体的には、DreamPosterは私たちのT2IモデルであるSeedream3.0の上に構築され、異なるポスター生成タイプを均一に処理します。
データセット構築のために,ポスター画像中のテキスト内容とタイポグラフィ階層情報を正確に注釈付けする体系的なデータアノテーションパイプラインを提案するとともに,ソース素材(例えば,生グラフィックス/テキスト)と対応する最終ポスター出力からなるペアデータセットを構築するための包括的手法を用いる。
さらに、高品質な生成を維持しつつ、階層的にマルチタスク生成能力を得られるプログレッシブトレーニング戦略を実装した。
テストベンチマークでは,GPT-4o (47.56\%) やSeedEdit3.0 (25.96\%) と比較して,DreamPosterが既存手法よりも優れていることを示す。
DreamPosterは、Jimengや他のBytedance Appsでオンラインになる。
関連論文リスト
- Seedream 3.0 Technical Report [62.85849652170507]
Seedream 3.0は、高性能な中国語と英語のバイリンガル画像生成基盤モデルである。
Seedream 2.0の既存の課題に対処するために、いくつかの技術的改善を開発しています。
Seedream 3.0はネイティブな高解像度の出力(最大2K)を提供し、高画質の画像を生成する。
論文 参考訳(メタデータ) (2025-04-15T16:19:07Z) - PosterMaker: Towards High-Quality Product Poster Generation with Accurate Text Rendering [50.76106125697899]
テーマ、シーン、テキストを統合したプロダクトポスターは、顧客を引き付けるための重要なプロモーションツールである。
主な課題はテキストを正確にレンダリングすることであり、特に1万文字以上を含む中国語のような複雑な書記システムではそうである。
テキストレンダリング精度が90%を超えるTextRenderNetを開発した。
TextRenderNetとSceneGenNetをベースに、エンドツーエンド生成フレームワークであるPosterMakerを紹介します。
論文 参考訳(メタデータ) (2025-04-09T07:13:08Z) - GlyphDraw2: Automatic Generation of Complex Glyph Posters with Diffusion Models and Large Language Models [7.152732507491591]
LLMを利用したテキストレンダリング機能を備えた自動ポスター生成フレームワークを提案する。
このフレームワークは、詳細な背景の中で正確なポスターテキストを作成することを目的としている。
解像度が1024ピクセルを超える高解像度フォントデータセットとポスターデータセットを導入する。
論文 参考訳(メタデータ) (2024-07-02T13:17:49Z) - Kandinsky: an Improved Text-to-Image Synthesis with Image Prior and
Latent Diffusion [50.59261592343479]
本稿では、潜伏拡散アーキテクチャの新しい探索であるKandinsky1を紹介する。
提案したモデルは、CLIPのイメージ埋め込みにテキスト埋め込みをマッピングするために別々に訓練されている。
また,テキスト・ツー・イメージ生成,画像融合,テキスト・画像融合,画像のバリエーション生成,テキスト・インペイント/アウトペイントなど,多様な生成モードをサポートするユーザフレンドリーなデモシステムも展開した。
論文 参考訳(メタデータ) (2023-10-05T12:29:41Z) - TextPainter: Multimodal Text Image Generation with Visual-harmony and
Text-comprehension for Poster Design [50.8682912032406]
本研究では,テキスト画像を生成するための新しいマルチモーダルアプローチであるTextPainterを紹介する。
TextPainterは、グローバルなローカル背景画像をスタイルのヒントとして取り、テキスト画像生成を視覚調和でガイドする。
約80Kのポスターに文レベルのバウンディングボックスとテキストの内容が付加されたPosterT80Kデータセットを構築した。
論文 参考訳(メタデータ) (2023-08-09T06:59:29Z) - Text2Poster: Laying out Stylized Texts on Retrieved Images [32.466518932018175]
ポスター生成は広範囲のアプリケーションにとって重要なタスクであり、しばしば時間がかかり、手作業による編集や芸術的な経験を必要とする。
我々は,テキスト情報から視覚効果のあるポスターを自動的に生成する,textitText2Posterという新しいデータ駆動フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-06T04:06:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。