Fugu-MT 論文翻訳(概要): BLT: Bidirectional Layout Transformer for Controllable Layout Generation

論文の概要: BLT: Bidirectional Layout Transformer for Controllable Layout Generation

arxiv url: http://arxiv.org/abs/2112.05112v1
Date: Thu, 9 Dec 2021 18:49:28 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-10 14:55:27.323298
Title: BLT: Bidirectional Layout Transformer for Controllable Layout Generation
Title（参考訳）: BLT:制御可能なレイアウト生成用双方向レイアウト変換器
Authors: Xiang Kong, Lu Jiang, Huiwen Chang, Han Zhang, Yuan Hao, Haifeng Gong, Irfan Essa
Abstract要約: 条件付きレイアウト生成のための双方向レイアウト変換器であるBLTを導入する。提案手法は, 各種忠実度指標を用いた複数のベンチマークで検証する。以上の結果から,最新のレイアウトトランスモデルに対する2つの重要な進歩が示された。
参考スコア（独自算出の注目度）: 27.239276265955954
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Creating visual layouts is an important step in graphic design. Automatic generation of such layouts is important as we seek scale-able and diverse visual designs. Prior works on automatic layout generation focus on unconditional generation, in which the models generate layouts while neglecting user needs for specific problems. To advance conditional layout generation, we introduce BLT, a bidirectional layout transformer. BLT differs from autoregressive decoding as it first generates a draft layout that satisfies the user inputs and then refines the layout iteratively. We verify the proposed model on multiple benchmarks with various fidelity metrics. Our results demonstrate two key advances to the state-of-the-art layout transformer models. First, our model empowers layout transformers to fulfill controllable layout generation. Second, our model slashes the linear inference time in autoregressive decoding into a constant complexity, thereby achieving 4x-10x speedups in generating a layout at inference time.
Abstract（参考訳）: ビジュアルレイアウトの作成はグラフィックデザインの重要なステップです。このようなレイアウトの自動生成は、スケール可能で多様なビジュアルデザインを求めるときに重要です。事前には、自動レイアウト生成の作業は、特定の問題に対するユーザのニーズを無視しながら、モデルがレイアウトを生成する非条件生成に焦点を当てている。条件付きレイアウト生成を促進するために,双方向レイアウトトランスであるBLTを導入する。 BLTは、ユーザが入力を満足し、レイアウトを反復的に洗練するドラフトレイアウトを生成するため、自動回帰デコーディングとは異なる。様々な忠実度指標を用いて,複数のベンチマークで提案モデルを検証する。本稿では,最先端のレイアウトトランスフォーマモデルにおける2つの重要な進歩を示す。まず,制御可能なレイアウト生成を実現するために,レイアウトトランスフォーマティブを付与する。第2に、自動回帰復号における線形推論時間を一定の複雑さに削減し、4x-10倍の高速化を実現した。

関連論文リスト

CreatiLayout: Siamese Multimodal Diffusion Transformer for Creative Layout-to-Image Generation [78.21134311493303]
拡散モデルは、視覚的に魅力的であるだけでなく、芸術的品質の高い画像を生成する能力で認識されている。従来の手法は主にUNetベースのモデル(SD1.5やSDXLなど)に重点を置いており、限られた努力でMM-DiT(Multimodal Diffusion Transformer)を探索している。 MM-DiTの利点を継承して、画像とテキストのモダリティを処理するために、別々の集合ネットワーク重みを用いる。大規模なレイアウトデータセットであるLayoutSAMには、270万のイメージテキストペアと1070万のエンティティが含まれています。
論文参考訳（メタデータ） (2024-12-05T04:09:47Z)
PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.67882997399021]
本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。我々は、大規模な実験を行い、パブリックなマルチモーダルレイアウト生成ベンチマーク上で、最先端(SOTA)性能を達成した。
論文参考訳（メタデータ） (2024-06-05T03:05:52Z)
Desigen: A Pipeline for Controllable Design Template Generation [69.51563467689795]
Desigenは、背景画像と背景上のレイアウト要素を生成する自動テンプレート生成パイプラインである。背景生成過程において,サリエンシ分布を制限し,所望領域の注意重みを低減させる2つの手法を提案する。実験により、提案したパイプラインは人間の設計に匹敵する高品質なテンプレートを生成することが示された。
論文参考訳（メタデータ） (2024-03-14T04:32:28Z)
Towards Aligned Layout Generation via Diffusion Model with Aesthetic Constraints [53.66698106829144]
広い範囲のレイアウト生成タスクを処理する統一モデルを提案する。このモデルは連続拡散モデルに基づいている。実験結果から,LACEは高品質なレイアウトを生成することがわかった。
論文参考訳（メタデータ） (2024-02-07T11:12:41Z)
Retrieval-Augmented Layout Transformer for Content-Aware Layout Generation [30.101562738257588]
コンテンツ対応グラフィックレイアウト生成は、Eコマース製品イメージなどの所定のコンテンツとともに、視覚要素を自動的に配置することを目的としている。単純な検索拡張により生成品質が大幅に向上することを示す。 Retrieval-Augmented Layout Transformer (RALF) と呼ばれる我々のモデルは、入力画像に基づいて近接したレイアウト例を検索し、これらの結果を自己回帰生成器に供給する。
論文参考訳（メタデータ） (2023-11-22T18:59:53Z)
Diagnostic Benchmark and Iterative Inpainting for Layout-Guided Image Generation [147.81509219686419]
本研究では,空間制御の4つの分野(数,位置,サイズ,形状)について,レイアウト誘導画像生成のための診断ベンチマークを提案する。次に,新しいベースラインであるIterInpaintを提案する。本研究はIterInpaintに関する総合的アブレーション研究である。
論文参考訳（メタデータ） (2023-04-13T16:58:33Z)
LayoutDiffusion: Improving Graphic Layout Generation by Discrete Diffusion Probabilistic Models [50.73105631853759]
レイアウト自動生成のための新しい生成モデルLayoutDiffusionを提案する。このプロセスでは,前方ステップの成長に伴うレイアウトの混乱が増している。これにより、プラグアンドプレイ方式で2つの条件付きレイアウト生成タスクを再トレーニングすることなく実現し、既存の方法よりも優れたパフォーマンスを実現する。
論文参考訳（メタデータ） (2023-03-21T04:41:02Z)
Diverse Multimedia Layout Generation with Multi Choice Learning [27.542940346258916]
通常の予測タスクとは対照的に、ユーザの好みに依存する許容範囲のレイアウトが存在する。既存の機械学習モデルは、レイアウトを単一の選択予測問題として扱う。自動回帰ニューラルネットワークアーキテクチャであるLayoutMCLを提案する。
論文参考訳（メタデータ） (2023-01-16T22:53:55Z)
LayoutDETR: Detection Transformer Is a Good Multimodal Layout Designer [80.61492265221817]
グラフィックレイアウトデザインは視覚コミュニケーションにおいて重要な役割を担っている。しかし、手作りのレイアウトデザインは、スキルを要求し、時間がかかり、バッチプロダクションではスケールできない。ジェネレーティブモデルは、設計自動化をスケーラブルにするために出現するが、デザイナの欲求に沿うデザインを作成することは、未だに容易ではない。
論文参考訳（メタデータ） (2022-12-19T21:57:35Z)
Constrained Graphic Layout Generation via Latent Optimization [17.05026043385661]
ユーザによって暗黙的に、あるいは明示的に、デザインセマンティクスを柔軟に組み込むことができるグラフィックレイアウトを生成します。提案手法はトランスフォーマーアーキテクチャに基づく生成的レイアウトモデルに基づいており,レイアウト生成を制約付き最適化問題として定式化している。実験では,1つのモデルを用いて,制約付きタスクと制約なしタスクの両方において,現実的なレイアウトを生成することができることを示す。
論文参考訳（メタデータ） (2021-08-02T13:04:11Z)
Generative Layout Modeling using Constraint Graphs [37.78500605563527]
レイアウト生成のための新しい生成モデルを提案する。まず、レイアウトグラフのノードとしてレイアウト要素を生成する。次に、レイアウトグラフのエッジとしてレイアウト要素間の制約を計算する。第三に、制約付き最適化を用いて最終レイアウトを解く。
論文参考訳（メタデータ） (2020-11-26T18:18:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。