論文の概要: GAN-based Domain Adaptation for Image-aware Layout Generation in Advertising Poster Design
- arxiv url: http://arxiv.org/abs/2604.07409v1
- Date: Wed, 08 Apr 2026 11:52:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.456243
- Title: GAN-based Domain Adaptation for Image-aware Layout Generation in Advertising Poster Design
- Title(参考訳): 広告ポスターデザインにおける画像認識レイアウト生成のためのGANに基づくドメイン適応
- Authors: Chenchen Xu, Min Zhou, Tiezheng Ge, Weiwei Xu,
- Abstract要約: 本稿では、画像に条件付けされたGANモデルを用いて、広告ポスターのグラフィックレイアウトを生成することに焦点を当てる。
図形要素と画像コンテンツの間の複雑な関係を抽出するモデルの能力を評価するために,3つの新しいコンテンツ認識メトリクスを提案する。
- 参考スコア(独自算出の注目度): 31.116845792750052
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Layout plays a crucial role in graphic design and poster generation. Recently, the application of deep learning models for layout generation has gained significant attention. This paper focuses on using a GAN-based model conditioned on images to generate advertising poster graphic layouts, requiring a dataset of paired product images and layouts. To address this task, we introduce the Content-aware Graphic Layout Dataset (CGL-Dataset), consisting of 60,548 paired inpainted posters with annotations and 121,000 clean product images. The inpainting artifacts introduce a domain gap between the inpainted posters and clean images. To bridge this gap, we design two GAN-based models. The first model, CGL-GAN, uses Gaussian blur on the inpainted regions to generate layouts. The second model combines unsupervised domain adaptation by introducing a GAN with a pixel-level discriminator (PD), abbreviated as PDA-GAN, to generate image-aware layouts based on the visual texture of input images. The PD is connected to shallow-level feature maps and computes the GAN loss for each input-image pixel. Additionally, we propose three novel content-aware metrics to assess the model's ability to capture the intricate relationships between graphic elements and image content. Quantitative and qualitative evaluations demonstrate that PDA-GAN achieves state-of-the-art performance and generates high-quality image-aware layouts.
- Abstract(参考訳): レイアウトはグラフィックデザインとポスター生成において重要な役割を果たしている。
近年,レイアウト生成へのディープラーニングモデルの適用が注目されている。
本稿では、画像に条件付けされたGANモデルを用いて、広告ポスターのグラフィックレイアウトを生成し、ペア化された製品イメージとレイアウトのデータセットを必要とすることに焦点を当てる。
この課題に対処するために、60,548枚のインペイントされたポスターと121,000枚のクリーンな製品イメージからなる、コンテンツ対応のグラフィックレイアウトデータセット(CGL-Dataset)を紹介した。
塗工品は、塗工ポスターと清潔な画像の間に領域ギャップを生じさせる。
このギャップを埋めるために、2つのGANベースのモデルを設計する。
最初のモデルであるCGL-GANは、塗装された領域にガウスのぼかしを使ってレイアウトを生成する。
第2のモデルは、GANとPDA-GAN(PDA-GAN)と呼ばれる画素レベルの識別器(PD)を導入して教師なし領域適応を組み合わせ、入力画像の視覚的テクスチャに基づいて画像認識レイアウトを生成する。
PDは浅層特徴写像に接続され、各入力画像画素のGAN損失を算出する。
さらに、図形要素と画像コンテンツの間の複雑な関係をキャプチャするモデルの能力を評価するために、3つの新しいコンテンツ認識メトリクスを提案する。
PDA-GANは最先端の性能を実現し,高品質な画像認識レイアウトを生成する。
関連論文リスト
- IGD: Instructional Graphic Design with Multimodal Layer Generation [83.31320209596991]
レイアウト生成に大きく依存する2段階の手法は創造性とインテリジェンスに欠けており、グラフィックデザインは依然として労働集約的である。
自然言語命令のみで編集可能な柔軟性を持つマルチモーダル層を高速に生成するインストラクショナルグラフィックデザイナ(IGD)を提案する。
論文 参考訳(メタデータ) (2025-07-14T04:31:15Z) - Planning and Rendering: Towards Product Poster Generation with Diffusion Models [21.45855580640437]
P&Rという拡散モデルに基づく新しい製品ポスター生成フレームワークを提案する。
計画段階では、製品やその他のビジュアルコンポーネントのレイアウトを生成するためのPlanNetを提案する。
レンダリング段階では、生成したレイアウトを考慮しつつ、製品の背景を生成するRenderNetを提案する。
提案手法は, PPG30k上での最先端の製品ポスター生成手法よりも優れていた。
論文 参考訳(メタデータ) (2023-12-14T11:11:50Z) - Kandinsky: an Improved Text-to-Image Synthesis with Image Prior and
Latent Diffusion [50.59261592343479]
本稿では、潜伏拡散アーキテクチャの新しい探索であるKandinsky1を紹介する。
提案したモデルは、CLIPのイメージ埋め込みにテキスト埋め込みをマッピングするために別々に訓練されている。
また,テキスト・ツー・イメージ生成,画像融合,テキスト・画像融合,画像のバリエーション生成,テキスト・インペイント/アウトペイントなど,多様な生成モードをサポートするユーザフレンドリーなデモシステムも展開した。
論文 参考訳(メタデータ) (2023-10-05T12:29:41Z) - PosterLayout: A New Benchmark and Approach for Content-aware
Visual-Textual Presentation Layout [62.12447593298437]
コンテンツ対応視覚テキスト提示レイアウトは,所定のキャンバス上の空間空間を予め定義された要素にアレンジすることを目的としている。
本稿では,設計過程を模倣するためにレイアウトの要素を再編成する設計シーケンス形成(DSF)を提案する。
CNN-LSTMに基づく新しい条件生成対向ネットワーク(GAN)を提示し、適切なレイアウトを生成する。
論文 参考訳(メタデータ) (2023-03-28T12:48:36Z) - Unsupervised Domain Adaption with Pixel-level Discriminator for
Image-aware Layout Generation [24.625282719753915]
本稿では、画像コンテンツに条件付けされたGANモデルを用いて、広告ポスターのグラフィックレイアウトを生成することに焦点を当てる。
教師なしのドメイン技術と、PDA-GANと呼ばれる新しいピクセルレベルの識別器(PD)を組み合わせることで、画像の内容に応じてグラフィックレイアウトを生成する。
定量的および定性的な評価はPDA-GANが最先端の性能を達成できることを証明している。
論文 参考訳(メタデータ) (2023-03-25T06:50:22Z) - LayoutDETR: Detection Transformer Is a Good Multimodal Layout Designer [80.61492265221817]
グラフィックレイアウトデザインは視覚コミュニケーションにおいて重要な役割を担っている。
しかし、手作りのレイアウトデザインは、スキルを要求し、時間がかかり、バッチプロダクションではスケールできない。
ジェネレーティブモデルは、設計自動化をスケーラブルにするために出現するが、デザイナの欲求に沿うデザインを作成することは、未だに容易ではない。
論文 参考訳(メタデータ) (2022-12-19T21:57:35Z) - Geometry Aligned Variational Transformer for Image-conditioned Layout
Generation [38.747175229902396]
画像中の様々なレイアウトを自動回帰的に生成するICVT(Image-Conditioned Variational Transformer)を提案する。
まず、レイアウト要素内のコンテキスト関係をモデル化するために自己認識機構を採用し、一方、クロスアテンション機構は条件付き画像の視覚情報を融合するために使用される。
広告ポスターレイアウト設計データセットを大規模に構築し,微妙なレイアウトと鮮度マップアノテーションを付加する。
論文 参考訳(メタデータ) (2022-09-02T07:19:12Z) - Composition-aware Graphic Layout GAN for Visual-textual Presentation
Designs [24.29890251913182]
与えられた画像に対して高品質な視覚テキスト提示設計を行う際のグラフィックレイアウト生成問題について検討する。
入力画像のグローバルおよび空間的視覚的内容に基づいてレイアウトを合成するために,合成対応グラフィックレイアウトGAN (CGL-GAN) と呼ばれる深層生成モデルを提案する。
論文 参考訳(メタデータ) (2022-04-30T16:42:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。