論文の概要: PosterGen: Aesthetic-Aware Paper-to-Poster Generation via Multi-Agent LLMs
- arxiv url: http://arxiv.org/abs/2508.17188v1
- Date: Sun, 24 Aug 2025 02:25:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.392098
- Title: PosterGen: Aesthetic-Aware Paper-to-Poster Generation via Multi-Agent LLMs
- Title(参考訳): PosterGen: マルチエージェントLCMによる美的紙と郵便のジェネレーション
- Authors: Zhilin Zhang, Xiang Zhang, Jiaqi Wei, Yiwei Xu, Chenyu You,
- Abstract要約: PosterGenはプロのポスターデザイナーのワークフローを反映したマルチエージェントフレームワークである。
意味的に根拠があり、視覚的に魅力的であるポスターを制作する。
実験の結果,PosterGenはコンテントの忠実度に一貫して一致し,ビジュアルデザインの既存手法よりも優れていた。
- 参考スコア(独自算出の注目度): 16.62052847270255
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent systems built upon large language models (LLMs) have demonstrated remarkable capabilities in tackling complex compositional tasks. In this work, we apply this paradigm to the paper-to-poster generation problem, a practical yet time-consuming process faced by researchers preparing for conferences. While recent approaches have attempted to automate this task, most neglect core design and aesthetic principles, resulting in posters that require substantial manual refinement. To address these design limitations, we propose PosterGen, a multi-agent framework that mirrors the workflow of professional poster designers. It consists of four collaborative specialized agents: (1) Parser and Curator agents extract content from the paper and organize storyboard; (2) Layout agent maps the content into a coherent spatial layout; (3) Stylist agents apply visual design elements such as color and typography; and (4) Renderer composes the final poster. Together, these agents produce posters that are both semantically grounded and visually appealing. To evaluate design quality, we introduce a vision-language model (VLM)-based rubric that measures layout balance, readability, and aesthetic coherence. Experimental results show that PosterGen consistently matches in content fidelity, and significantly outperforms existing methods in visual designs, generating posters that are presentation-ready with minimal human refinements.
- Abstract(参考訳): 大規模言語モデル(LLM)上に構築されたマルチエージェントシステムは,複雑な構成課題に対処する際,顕著な能力を示した。
本研究では,このパラダイムを,会議の準備をする研究者が直面している実践的かつ時間を要する論文・ポスター生成問題に適用する。
近年のアプローチでは、このタスクの自動化が試みられているが、ほとんどの場合、コアデザインと美学の原則を無視し、実質的な手作業による改善を必要とするポスターを生み出している。
この制約に対処するため,プロのポスターデザイナーのワークフローを反映したマルチエージェントフレームワークであるPosterGenを提案する。
1)紙からコンテンツを抽出し、ストーリーボードを整理するパーサーとキュレーターエージェント,(2)レイアウトエージェント,(3)カラーやタイポグラフィーなどのビジュアルデザイン要素を適用するスタイリストエージェント,(4)レンダーは最終ポスターを構成する。
これらのエージェントは、意味的に根拠があり、視覚的に魅力的であるポスターを作成する。
設計品質を評価するため,レイアウトバランス,可読性,美的コヒーレンスを計測する視覚言語モデル(VLM)を導入した。
実験の結果,PosterGenはコンテントの忠実度に一貫して一致し,ビジュアルデザインにおける既存の手法よりも優れており,最小限の人間の精細度でプレゼンテーション可能なポスターを生成することがわかった。
関連論文リスト
- Paper2Poster: Towards Multimodal Poster Automation from Scientific Papers [11.186078920251754]
ポストジェネレーションは科学コミュニケーションにおいて不可欠だが難しい課題である。
ポスター生成のための最初のベンチマークとメトリクススイートを紹介する。
PosterAgentはトップダウンのビジュアルインザループマルチエージェントパイプラインである。
論文 参考訳(メタデータ) (2025-05-27T17:58:49Z) - P2P: Automated Paper-to-Poster Generation and Fine-Grained Benchmark [27.57464219790922]
高品質なHTMLレンダリングの学術ポスターを生成するLLMベースのマルチエージェントフレームワークであるP2Pを紹介する。
P2Pは、ビジュアル要素処理、コンテンツ生成、および専用のチェッカーモジュールと統合された最後のポスターアセンブリーの3つの特殊エージェントを使用している。
P2PEvalは121枚の紙とポストのペアと2つの評価手法を組み合わせた総合的なベンチマークである。
論文 参考訳(メタデータ) (2025-05-21T09:06:05Z) - PosterMaker: Towards High-Quality Product Poster Generation with Accurate Text Rendering [50.76106125697899]
テーマ、シーン、テキストを統合したプロダクトポスターは、顧客を引き付けるための重要なプロモーションツールである。
主な課題はテキストを正確にレンダリングすることであり、特に1万文字以上を含む中国語のような複雑な書記システムではそうである。
テキストレンダリング精度が90%を超えるTextRenderNetを開発した。
TextRenderNetとSceneGenNetをベースに、エンドツーエンド生成フレームワークであるPosterMakerを紹介します。
論文 参考訳(メタデータ) (2025-04-09T07:13:08Z) - POSTA: A Go-to Framework for Customized Artistic Poster Generation [87.16343612086959]
POSTAは、カスタマイズされた芸術ポスター生成のためのモジュラーフレームワークである。
background Diffusionはユーザ入力に基づいてテーマ付きバックグラウンドを生成する。
設計MLLMはレイアウトとタイポグラフィー要素を生成し、背景スタイルと整合し補完する。
ArtText Diffusionはキーテキスト要素にスタイリングを追加する。
論文 参考訳(メタデータ) (2025-03-19T05:22:38Z) - Compose Your Aesthetics: Empowering Text-to-Image Models with the Principles of Art [61.28133495240179]
本稿では,ユーザが特定した美学をT2I生成出力と整合させることを目的とした,美学アライメントの新しい課題を提案する。
アートワークが美学にアプローチするための貴重な視点を提供する方法にインスパイアされた私たちは、構成的枠組みのアーティストが採用する視覚的美学を定式化した。
我々は,T2I DMが,ユーザが特定したPoA条件により10の合成制御を効果的に提供することを実証した。
論文 参考訳(メタデータ) (2025-03-15T06:58:09Z) - PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides [51.88536367177796]
そこで本研究では,人案に触発された2段階の編集手法を提案し,プレゼンテーションを自動的に生成する。
PWTAgentはまず参照を分析し、スライドレベルの関数型とコンテンツスキーマを抽出し、選択した参照スライドに基づいて編集アクションを生成する。
PWTAgentは、既存の3次元のプレゼンテーション生成方法よりも大幅に優れています。
論文 参考訳(メタデータ) (2025-01-07T16:53:01Z) - GLDesigner: Leveraging Multi-Modal LLMs as Designer for Enhanced Aesthetic Text Glyph Layouts [53.568057283934714]
本稿では,コンテンツ対応のテキストロゴレイアウトを生成するVLM(Vision-Language Model)ベースのフレームワークを提案する。
本稿では,複数のグリフ画像を同時に処理するための計算コストを削減する2つのモデル手法を提案する。
本モデルでは,既存の公開データセットの5倍の広義のテキストロゴデータセットを2つ構築する。
論文 参考訳(メタデータ) (2024-11-18T10:04:10Z) - AutoPoster: A Highly Automatic and Content-aware Design System for
Advertising Poster Generation [14.20790443380675]
本稿では,広告ポスター作成のための高度に自動化されたコンテンツ認識システムであるAutoPosterを紹介する。
AutoPosterはプロダクトイメージとタイトルのみを入力として、異なるサイズのポスターを4つのキーステージを通じて自動的に生成する。
76k以上のポスターに対する視覚属性アノテーションを含む最初のポスター生成データセットを提案する。
論文 参考訳(メタデータ) (2023-08-02T11:58:43Z) - PosterLayout: A New Benchmark and Approach for Content-aware
Visual-Textual Presentation Layout [62.12447593298437]
コンテンツ対応視覚テキスト提示レイアウトは,所定のキャンバス上の空間空間を予め定義された要素にアレンジすることを目的としている。
本稿では,設計過程を模倣するためにレイアウトの要素を再編成する設計シーケンス形成(DSF)を提案する。
CNN-LSTMに基づく新しい条件生成対向ネットワーク(GAN)を提示し、適切なレイアウトを生成する。
論文 参考訳(メタデータ) (2023-03-28T12:48:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。