論文の概要: AutoPP: Towards Automated Product Poster Generation and Optimization
- arxiv url: http://arxiv.org/abs/2512.21921v1
- Date: Fri, 26 Dec 2025 08:30:32 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-29 11:52:51.052065
- Title: AutoPP: Towards Automated Product Poster Generation and Optimization
- Title(参考訳): AutoPP: 自動製品ポスター生成と最適化を目指して
- Authors: Jiahao Fan, Yuxin Qin, Wei Feng, Yanyin Chen, Yaoyu Li, Ao Ma, Yixiu Li, Li Zhuang, Haoyi Bian, Zheng Zhang, Jingjing Lv, Junjie Shen, Ching Law,
- Abstract要約: プロダクトのポスター生成と最適化のための自動パイプラインであるAutoPPを紹介します。
ジェネレータは、ポスター(背景、テキスト、レイアウト)の3つのキー要素を結合出力に統合する。
生成されたポスターに基づいて、CTRはClick-Through Rate (CTR)を強化し、オンラインフィードバックを活用する。
- 参考スコア(独自算出の注目度): 18.137798180459654
- License:
- Abstract: Product posters blend striking visuals with informative text to highlight the product and capture customer attention. However, crafting appealing posters and manually optimizing them based on online performance is laborious and resource-consuming. To address this, we introduce AutoPP, an automated pipeline for product poster generation and optimization that eliminates the need for human intervention. Specifically, the generator, relying solely on basic product information, first uses a unified design module to integrate the three key elements of a poster (background, text, and layout) into a cohesive output. Then, an element rendering module encodes these elements into condition tokens, efficiently and controllably generating the product poster. Based on the generated poster, the optimizer enhances its Click-Through Rate (CTR) by leveraging online feedback. It systematically replaces elements to gather fine-grained CTR comparisons and utilizes Isolated Direct Preference Optimization (IDPO) to attribute CTR gains to isolated elements. Our work is supported by AutoPP1M, the largest dataset specifically designed for product poster generation and optimization, which contains one million high-quality posters and feedback collected from over one million users. Experiments demonstrate that AutoPP achieves state-of-the-art results in both offline and online settings. Our code and dataset are publicly available at: https://github.com/JD-GenX/AutoPP
- Abstract(参考訳): プロダクトポスターは、印象的なビジュアルと情報的なテキストを混ぜ合わせて、製品をハイライトし、顧客の注意を引き付ける。
しかし、魅力的なポスターを制作し、オンラインのパフォーマンスに基づいて手動で最適化することは、手間がかかり資源が消費される。
これを解決するために,人間の介入を不要にする製品ポスター生成と最適化のための自動パイプラインであるAutoPPを導入する。
具体的には、ジェネレータは基本的な製品情報のみに依存し、まず統一デザインモジュールを使用してポスター(背景、テキスト、レイアウト)の3つのキー要素を結合出力に統合する。
そして、要素レンダリングモジュールがこれらの要素を条件トークンにエンコードし、プロダクトポスターを効率的にかつ制御的に生成する。
生成されたポスターに基づいて、オプティマイザはClick-Through Rate(CTR)を強化し、オンラインフィードバックを活用する。
要素を体系的に置き換えて細粒度のCTR比較を収集し、分離された要素にCTRゲインを割り当てるために分離された直接選好最適化(IDPO)を利用する。
当社の作業は,100万人以上のユーザから収集された100万以上の高品質なポスターとフィードバックを含む,プロダクトのポスター生成と最適化に特化した,最大のデータセットであるAutoPP1Mによってサポートされています。
実験によると、AutoPPはオフラインとオンラインの両方で最先端の結果を達成する。
私たちのコードとデータセットは、https://github.com/JD-GenX/AutoPPで公開されています。
関連論文リスト
- Iterative Critique-Refine Framework for Enhancing LLM Personalization [67.77803308645511]
PerFineは、パーソナライズされたテキスト生成のための、統一的でトレーニング不要な批判修正フレームワークである。
各イテレーションにおいて、LLMジェネレータは、検索されたプロファイルに条件付きドラフトを生成し、同じプロファイルに条件付きである批評家のLLMは、トーン、語彙、文構造、話題性に関する構造化されたフィードバックを提供する。
Yelp、Goodreads、Amazonのデータセット全体で、PerFineはPGraphRAGに対するパーソナライゼーションを一貫して改善している。
論文 参考訳(メタデータ) (2025-10-28T14:36:22Z) - PosterMaker: Towards High-Quality Product Poster Generation with Accurate Text Rendering [50.76106125697899]
テーマ、シーン、テキストを統合したプロダクトポスターは、顧客を引き付けるための重要なプロモーションツールである。
主な課題はテキストを正確にレンダリングすることであり、特に1万文字以上を含む中国語のような複雑な書記システムではそうである。
テキストレンダリング精度が90%を超えるTextRenderNetを開発した。
TextRenderNetとSceneGenNetをベースに、エンドツーエンド生成フレームワークであるPosterMakerを紹介します。
論文 参考訳(メタデータ) (2025-04-09T07:13:08Z) - POSTA: A Go-to Framework for Customized Artistic Poster Generation [87.16343612086959]
POSTAは、カスタマイズされた芸術ポスター生成のためのモジュラーフレームワークである。
background Diffusionはユーザ入力に基づいてテーマ付きバックグラウンドを生成する。
設計MLLMはレイアウトとタイポグラフィー要素を生成し、背景スタイルと整合し補完する。
ArtText Diffusionはキーテキスト要素にスタイリングを追加する。
論文 参考訳(メタデータ) (2025-03-19T05:22:38Z) - CTR-Driven Advertising Image Generation with Multimodal Large Language Models [53.40005544344148]
本稿では,Click-Through Rate (CTR) を主目的とし,マルチモーダル大言語モデル(MLLM)を用いた広告画像の生成について検討する。
生成した画像のCTRをさらに改善するため、強化学習(RL)を通して事前学習したMLLMを微調整する新たな報酬モデルを提案する。
本手法は,オンラインとオフラインの両方で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-02-05T09:06:02Z) - Spatio-Temporal Side Tuning Pre-trained Foundation Models for Video-based Pedestrian Attribute Recognition [58.79807861739438]
既存の歩行者認識アルゴリズム(PAR)は主に静的画像に基づいて開発されている。
本稿では,時間的情報を完全に活用できるビデオフレームを用いて,人間の属性を理解することを提案する。
論文 参考訳(メタデータ) (2024-04-27T14:43:32Z) - Planning and Rendering: Towards Product Poster Generation with Diffusion Models [21.45855580640437]
P&Rという拡散モデルに基づく新しい製品ポスター生成フレームワークを提案する。
計画段階では、製品やその他のビジュアルコンポーネントのレイアウトを生成するためのPlanNetを提案する。
レンダリング段階では、生成したレイアウトを考慮しつつ、製品の背景を生成するRenderNetを提案する。
提案手法は, PPG30k上での最先端の製品ポスター生成手法よりも優れていた。
論文 参考訳(メタデータ) (2023-12-14T11:11:50Z) - AutoPoster: A Highly Automatic and Content-aware Design System for
Advertising Poster Generation [14.20790443380675]
本稿では,広告ポスター作成のための高度に自動化されたコンテンツ認識システムであるAutoPosterを紹介する。
AutoPosterはプロダクトイメージとタイトルのみを入力として、異なるサイズのポスターを4つのキーステージを通じて自動的に生成する。
76k以上のポスターに対する視覚属性アノテーションを含む最初のポスター生成データセットを提案する。
論文 参考訳(メタデータ) (2023-08-02T11:58:43Z) - Personalized Abstractive Summarization by Tri-agent Generation Pipeline [69.38358552893762]
出力パーソナライゼーションを強化するために,ジェネレータ,インストラクター,エディタからなる三エージェント生成パイプラインを提案する。
生成装置は、初期出力を生成し、インストラクターは、ユーザの好みに基づいて編集命令を自動的に生成し、編集者は、それらの好みに合わせて出力を洗練する。
我々は,大規模編集者モデルからのフィードバックを活かし,教師の指導力を高めるために,編集者による強化学習を用いて指導を行う。
論文 参考訳(メタデータ) (2023-05-04T01:12:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。