論文の概要: BLT: Bidirectional Layout Transformer for Controllable Layout Generation
- arxiv url: http://arxiv.org/abs/2112.05112v1
- Date: Thu, 9 Dec 2021 18:49:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-10 14:55:27.323298
- Title: BLT: Bidirectional Layout Transformer for Controllable Layout Generation
- Title(参考訳): BLT:制御可能なレイアウト生成用双方向レイアウト変換器
- Authors: Xiang Kong, Lu Jiang, Huiwen Chang, Han Zhang, Yuan Hao, Haifeng Gong,
Irfan Essa
- Abstract要約: 条件付きレイアウト生成のための双方向レイアウト変換器であるBLTを導入する。
提案手法は, 各種忠実度指標を用いた複数のベンチマークで検証する。
以上の結果から,最新のレイアウトトランスモデルに対する2つの重要な進歩が示された。
- 参考スコア(独自算出の注目度): 27.239276265955954
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Creating visual layouts is an important step in graphic design. Automatic
generation of such layouts is important as we seek scale-able and diverse
visual designs. Prior works on automatic layout generation focus on
unconditional generation, in which the models generate layouts while neglecting
user needs for specific problems. To advance conditional layout generation, we
introduce BLT, a bidirectional layout transformer. BLT differs from
autoregressive decoding as it first generates a draft layout that satisfies the
user inputs and then refines the layout iteratively. We verify the proposed
model on multiple benchmarks with various fidelity metrics. Our results
demonstrate two key advances to the state-of-the-art layout transformer models.
First, our model empowers layout transformers to fulfill controllable layout
generation. Second, our model slashes the linear inference time in
autoregressive decoding into a constant complexity, thereby achieving 4x-10x
speedups in generating a layout at inference time.
- Abstract(参考訳): ビジュアルレイアウトの作成はグラフィックデザインの重要なステップです。
このようなレイアウトの自動生成は、スケール可能で多様なビジュアルデザインを求めるときに重要です。
事前には、自動レイアウト生成の作業は、特定の問題に対するユーザのニーズを無視しながら、モデルがレイアウトを生成する非条件生成に焦点を当てている。
条件付きレイアウト生成を促進するために,双方向レイアウトトランスであるBLTを導入する。
BLTは、ユーザが入力を満足し、レイアウトを反復的に洗練するドラフトレイアウトを生成するため、自動回帰デコーディングとは異なる。
様々な忠実度指標を用いて,複数のベンチマークで提案モデルを検証する。
本稿では,最先端のレイアウトトランスフォーマモデルにおける2つの重要な進歩を示す。
まず,制御可能なレイアウト生成を実現するために,レイアウトトランスフォーマティブを付与する。
第2に、自動回帰復号における線形推論時間を一定の複雑さに削減し、4x-10倍の高速化を実現した。
関連論文リスト
- PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.67882997399021]
本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。
データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。
我々は、大規模な実験を行い、パブリックなマルチモーダルレイアウト生成ベンチマーク上で、最先端(SOTA)性能を達成した。
論文 参考訳(メタデータ) (2024-06-05T03:05:52Z) - Desigen: A Pipeline for Controllable Design Template Generation [69.51563467689795]
Desigenは、背景画像と背景上のレイアウト要素を生成する自動テンプレート生成パイプラインである。
背景生成過程において,サリエンシ分布を制限し,所望領域の注意重みを低減させる2つの手法を提案する。
実験により、提案したパイプラインは人間の設計に匹敵する高品質なテンプレートを生成することが示された。
論文 参考訳(メタデータ) (2024-03-14T04:32:28Z) - Towards Aligned Layout Generation via Diffusion Model with Aesthetic Constraints [53.66698106829144]
広い範囲のレイアウト生成タスクを処理する統一モデルを提案する。
このモデルは連続拡散モデルに基づいている。
実験結果から,LACEは高品質なレイアウトを生成することがわかった。
論文 参考訳(メタデータ) (2024-02-07T11:12:41Z) - Retrieval-Augmented Layout Transformer for Content-Aware Layout Generation [30.101562738257588]
コンテンツ対応グラフィックレイアウト生成は、Eコマース製品イメージなどの所定のコンテンツとともに、視覚要素を自動的に配置することを目的としている。
単純な検索拡張により生成品質が大幅に向上することを示す。
Retrieval-Augmented Layout Transformer (RALF) と呼ばれる我々のモデルは、入力画像に基づいて近接したレイアウト例を検索し、これらの結果を自己回帰生成器に供給する。
論文 参考訳(メタデータ) (2023-11-22T18:59:53Z) - Diagnostic Benchmark and Iterative Inpainting for Layout-Guided Image Generation [147.81509219686419]
本研究では,空間制御の4つの分野(数,位置,サイズ,形状)について,レイアウト誘導画像生成のための診断ベンチマークを提案する。
次に,新しいベースラインであるIterInpaintを提案する。
本研究はIterInpaintに関する総合的アブレーション研究である。
論文 参考訳(メタデータ) (2023-04-13T16:58:33Z) - LayoutDiffusion: Improving Graphic Layout Generation by Discrete
Diffusion Probabilistic Models [50.73105631853759]
レイアウト自動生成のための新しい生成モデルLayoutDiffusionを提案する。
このプロセスでは,前方ステップの成長に伴うレイアウトの混乱が増している。
これにより、プラグアンドプレイ方式で2つの条件付きレイアウト生成タスクを再トレーニングすることなく実現し、既存の方法よりも優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-03-21T04:41:02Z) - Diverse Multimedia Layout Generation with Multi Choice Learning [27.542940346258916]
通常の予測タスクとは対照的に、ユーザの好みに依存する許容範囲のレイアウトが存在する。
既存の機械学習モデルは、レイアウトを単一の選択予測問題として扱う。
自動回帰ニューラルネットワークアーキテクチャであるLayoutMCLを提案する。
論文 参考訳(メタデータ) (2023-01-16T22:53:55Z) - LayoutDETR: Detection Transformer Is a Good Multimodal Layout Designer [80.61492265221817]
グラフィックレイアウトデザインは視覚コミュニケーションにおいて重要な役割を担っている。
しかし、手作りのレイアウトデザインは、スキルを要求し、時間がかかり、バッチプロダクションではスケールできない。
ジェネレーティブモデルは、設計自動化をスケーラブルにするために出現するが、デザイナの欲求に沿うデザインを作成することは、未だに容易ではない。
論文 参考訳(メタデータ) (2022-12-19T21:57:35Z) - Constrained Graphic Layout Generation via Latent Optimization [17.05026043385661]
ユーザによって暗黙的に、あるいは明示的に、デザインセマンティクスを柔軟に組み込むことができるグラフィックレイアウトを生成します。
提案手法はトランスフォーマーアーキテクチャに基づく生成的レイアウトモデルに基づいており,レイアウト生成を制約付き最適化問題として定式化している。
実験では,1つのモデルを用いて,制約付きタスクと制約なしタスクの両方において,現実的なレイアウトを生成することができることを示す。
論文 参考訳(メタデータ) (2021-08-02T13:04:11Z) - Generative Layout Modeling using Constraint Graphs [37.78500605563527]
レイアウト生成のための新しい生成モデルを提案する。
まず、レイアウトグラフのノードとしてレイアウト要素を生成する。
次に、レイアウトグラフのエッジとしてレイアウト要素間の制約を計算する。
第三に、制約付き最適化を用いて最終レイアウトを解く。
論文 参考訳(メタデータ) (2020-11-26T18:18:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。