論文の概要: UniLayout: Taming Unified Sequence-to-Sequence Transformers for Graphic
Layout Generation
- arxiv url: http://arxiv.org/abs/2208.08037v1
- Date: Wed, 17 Aug 2022 02:43:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-18 12:50:38.199185
- Title: UniLayout: Taming Unified Sequence-to-Sequence Transformers for Graphic
Layout Generation
- Title(参考訳): unilayout: グラフィックレイアウト生成のための統一シーケンス列変換器
- Authors: Zhaoyun Jiang, Huayu Deng, Zhongkai Wu, Jiaqi Guo, Shizhao Sun, Vuksan
Mijovic, Zijiang Yang, Jian-Guang Lou, Dongmei Zhang
- Abstract要約: 図形レイアウト生成のための異なるサブタスクを統一的に処理するUniを提案する。
まず、トークンのシーケンスとしてサブタスクの多様な入力と出力を均一に表現する。
統一シーケンスフォーマットに基づいて、異なるサブタスクに対してTransformerと同一のエンコーダデコーダアーキテクチャを自然に活用する。
- 参考スコア(独自算出の注目度): 40.14176140624405
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To satisfy various user needs, different subtasks of graphic layout
generation have been explored intensively in recent years. Existing studies
usually propose task-specific methods with diverse input-output formats,
dedicated model architectures, and different learning methods. However, those
specialized approaches make the adaption to unseen subtasks difficult, hinder
the knowledge sharing between different subtasks, and are contrary to the trend
of devising general-purpose models. In this work, we propose UniLayout, which
handles different subtasks for graphic layout generation in a unified manner.
First, we uniformly represent diverse inputs and outputs of subtasks as the
sequences of tokens. Then, based on the unified sequence format, we naturally
leverage an identical encoder-decoder architecture with Transformers for
different subtasks. Moreover, based on the above two kinds of unification, we
further develop a single model that supports all subtasks concurrently.
Experiments on two public datasets demonstrate that while simple, UniLayout
significantly outperforms the previous task-specific methods.
- Abstract(参考訳): 様々なユーザニーズを満たすため,近年,グラフィックレイアウト生成のサブタスクが深く研究されている。
既存の研究は通常、様々な入力出力形式、専用モデルアーキテクチャ、異なる学習方法を備えたタスク固有の手法を提案する。
しかし、これらの専門的なアプローチは、目に見えないサブタスクへの適応を困難にし、異なるサブタスク間の知識共有を妨げるとともに、汎用モデルを考案する傾向に反する。
本稿では,グラフィックレイアウト生成のための異なるサブタスクを統一的に処理するunilayoutを提案する。
まず、トークンのシーケンスとしてサブタスクの多様な入力と出力を均一に表現する。
そして、統一シーケンス形式に基づいて、異なるサブタスクに対してトランスフォーマーを持つ同一エンコーダデコーダアーキテクチャを自然に活用する。
さらに、上記の2種類の統合に基づき、全てのサブタスクを同時にサポートする1つのモデルをさらに開発する。
2つの公開データセットの実験では、UniLayoutは単純なものの、以前のタスク固有のメソッドよりも大幅に優れていた。
関連論文リスト
- GLDesigner: Leveraging Multi-Modal LLMs as Designer for Enhanced Aesthetic Text Glyph Layouts [53.568057283934714]
コンテンツ対応のテキストロゴレイアウトを生成するVLMベースのフレームワークを提案する。
本稿では,複数のグリフ画像の同時処理における計算量を削減するための2つのモデル手法を提案する。
アウトモデルのインストラクションチューニングを支援するために,既存の公開データセットよりも5倍大きい2つの拡張テキストロゴデータセットを構築した。
論文 参考訳(メタデータ) (2024-11-18T10:04:10Z) - CoLay: Controllable Layout Generation through Multi-conditional Latent Diffusion [21.958752304572553]
既存のモデルは、実践における採用を制限する2つの大きな課題に直面します。
既存のモデルのほとんどはラベルと座標の生成に重点を置いており、実際のレイアウトには様々なスタイルの特性が含まれている。
本稿では,複数の条件タイプを統合し,多様なスタイル特性を持つ複雑なレイアウトを生成する新しいフレームワークであるCoLayを提案する。
論文 参考訳(メタデータ) (2024-05-18T17:30:48Z) - Towards Aligned Layout Generation via Diffusion Model with Aesthetic Constraints [53.66698106829144]
広い範囲のレイアウト生成タスクを処理する統一モデルを提案する。
このモデルは連続拡散モデルに基づいている。
実験結果から,LACEは高品質なレイアウトを生成することがわかった。
論文 参考訳(メタデータ) (2024-02-07T11:12:41Z) - A Parse-Then-Place Approach for Generating Graphic Layouts from Textual
Descriptions [50.469491454128246]
我々は、図形レイアウト、すなわちテキストからラベルへのレイアウトを作成するためのガイダンスとしてテキストを使用し、設計障壁を低くすることを目的としています。
テキストからラベルへの変換は、テキストからの暗黙的、複合的、不完全な制約を考慮する必要があるため、難しい作業である。
この問題に対処するための2段階のアプローチとして,パース・セイン・プレース(parse-then-place)を提案する。
論文 参考訳(メタデータ) (2023-08-24T10:37:00Z) - LayoutDiffusion: Improving Graphic Layout Generation by Discrete
Diffusion Probabilistic Models [50.73105631853759]
レイアウト自動生成のための新しい生成モデルLayoutDiffusionを提案する。
このプロセスでは,前方ステップの成長に伴うレイアウトの混乱が増している。
これにより、プラグアンドプレイ方式で2つの条件付きレイアウト生成タスクを再トレーニングすることなく実現し、既存の方法よりも優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-03-21T04:41:02Z) - COFS: Controllable Furniture layout Synthesis [40.68096097121981]
多くの既存手法は、レイアウトの要素に特定の順序を課すシーケンス生成問題としてこの問題に対処している。
言語モデリングから標準トランスフォーマーアーキテクチャブロックに基づくアーキテクチャであるCOFSを提案する。
我々のモデルは、定量的評価によって検証する他の方法よりも一貫して優れている。
論文 参考訳(メタデータ) (2022-05-29T13:31:18Z) - Constrained Graphic Layout Generation via Latent Optimization [17.05026043385661]
ユーザによって暗黙的に、あるいは明示的に、デザインセマンティクスを柔軟に組み込むことができるグラフィックレイアウトを生成します。
提案手法はトランスフォーマーアーキテクチャに基づく生成的レイアウトモデルに基づいており,レイアウト生成を制約付き最適化問題として定式化している。
実験では,1つのモデルを用いて,制約付きタスクと制約なしタスクの両方において,現実的なレイアウトを生成することができることを示す。
論文 参考訳(メタデータ) (2021-08-02T13:04:11Z) - Generative Layout Modeling using Constraint Graphs [37.78500605563527]
レイアウト生成のための新しい生成モデルを提案する。
まず、レイアウトグラフのノードとしてレイアウト要素を生成する。
次に、レイアウトグラフのエッジとしてレイアウト要素間の制約を計算する。
第三に、制約付き最適化を用いて最終レイアウトを解く。
論文 参考訳(メタデータ) (2020-11-26T18:18:37Z) - ORCSolver: An Efficient Solver for Adaptive GUI Layout with
OR-Constraints [63.59902335363947]
ORCrは、分岐とバウンドのアプローチに基づく適応ORCレイアウトのための新しい解法である。
ORCrは実行時にORCの仕様を単純化し,提案手法はORCのレイアウトの仕様をほぼ対話的に効率的に解決できることを実証する。
論文 参考訳(メタデータ) (2020-02-23T15:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。