論文の概要: A Parse-Then-Place Approach for Generating Graphic Layouts from Textual
Descriptions
- arxiv url: http://arxiv.org/abs/2308.12700v1
- Date: Thu, 24 Aug 2023 10:37:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-25 14:27:10.831802
- Title: A Parse-Then-Place Approach for Generating Graphic Layouts from Textual
Descriptions
- Title(参考訳): テキスト記述からグラフィックレイアウトを生成するparse-then-placeアプローチ
- Authors: Jiawei Lin, Jiaqi Guo, Shizhao Sun, Weijiang Xu, Ting Liu, Jian-Guang
Lou, Dongmei Zhang
- Abstract要約: 我々は、図形レイアウト、すなわちテキストからラベルへのレイアウトを作成するためのガイダンスとしてテキストを使用し、設計障壁を低くすることを目的としています。
テキストからラベルへの変換は、テキストからの暗黙的、複合的、不完全な制約を考慮する必要があるため、難しい作業である。
この問題に対処するための2段階のアプローチとして,パース・セイン・プレース(parse-then-place)を提案する。
- 参考スコア(独自算出の注目度): 50.469491454128246
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Creating layouts is a fundamental step in graphic design. In this work, we
propose to use text as the guidance to create graphic layouts, i.e.,
Text-to-Layout, aiming to lower the design barriers. Text-to-Layout is a
challenging task, because it needs to consider the implicit, combined, and
incomplete layout constraints from text, each of which has not been studied in
previous work. To address this, we present a two-stage approach, named
parse-then-place. The approach introduces an intermediate representation (IR)
between text and layout to represent diverse layout constraints. With IR,
Text-to-Layout is decomposed into a parse stage and a place stage. The parse
stage takes a textual description as input and generates an IR, in which the
implicit constraints from the text are transformed into explicit ones. The
place stage generates layouts based on the IR. To model combined and incomplete
constraints, we use a Transformer-based layout generation model and carefully
design a way to represent constraints and layouts as sequences. Besides, we
adopt the pretrain-then-finetune strategy to boost the performance of the
layout generation model with large-scale unlabeled layouts. To evaluate our
approach, we construct two Text-to-Layout datasets and conduct experiments on
them. Quantitative results, qualitative analysis, and user studies demonstrate
the effectiveness of our approach.
- Abstract(参考訳): レイアウトの作成はグラフィックデザインの基本的なステップである。
そこで本研究では,図形レイアウト,すなわちText-to-Layoutを作成するためのガイダンスとしてテキストを使うことを提案する。
Text-to-Layoutは、テキストからの暗黙的、複合的、不完全なレイアウト制約を考慮する必要があるため、難しいタスクである。
そこで我々は,parse-then-placeという2段階のアプローチを提案する。
このアプローチでは、テキストとレイアウトの間の中間表現(IR)を導入し、多様なレイアウト制約を表現している。
IRでは、Text-to-Layoutはパースステージとプレースステージに分解される。
パースステージはテキスト記述を入力として取り、IRを生成し、テキストからの暗黙の制約を明示的な制約に変換する。
プレースステージは、IRに基づいてレイアウトを生成する。
複合制約と不完全な制約をモデル化するために、トランスフォーマティブベースのレイアウト生成モデルを使用し、制約やレイアウトをシーケンスとして表現する方法を慎重に設計する。
また,大規模非ラベルレイアウトによるレイアウト生成モデルの性能向上のために,プリトレイン・ザン・フィニチューン戦略を採用している。
提案手法を評価するために,2つのText-to-Layoutデータセットを構築し,実験を行った。
定量的結果,質的分析,ユーザ研究により,本手法の有効性が示された。
関連論文リスト
- LayoutGPT: Compositional Visual Planning and Generation with Large
Language Models [98.81962282674151]
大規模言語モデル(LLM)は、テキスト条件からレイアウトを生成することで視覚的なプランナーとして機能する。
本稿では,スタイルシート言語におけるコンテキスト内視覚的デモンストレーションを構成する手法であるLayoutGPTを提案する。
論文 参考訳(メタデータ) (2023-05-24T17:56:16Z) - Text Reading Order in Uncontrolled Conditions by Sparse Graph
Segmentation [71.40119152422295]
テキストの読み出し順序を識別するための軽量でスケーラブルで一般化可能なアプローチを提案する。
モデルは言語に依存しず、多言語データセットで効果的に実行される。
モバイルデバイスを含むあらゆるプラットフォームにデプロイできるほど小さい。
論文 参考訳(メタデータ) (2023-05-04T06:21:00Z) - PosterLayout: A New Benchmark and Approach for Content-aware
Visual-Textual Presentation Layout [62.12447593298437]
コンテンツ対応視覚テキスト提示レイアウトは,所定のキャンバス上の空間空間を予め定義された要素にアレンジすることを目的としている。
本稿では,設計過程を模倣するためにレイアウトの要素を再編成する設計シーケンス形成(DSF)を提案する。
CNN-LSTMに基づく新しい条件生成対向ネットワーク(GAN)を提示し、適切なレイアウトを生成する。
論文 参考訳(メタデータ) (2023-03-28T12:48:36Z) - SceneComposer: Any-Level Semantic Image Synthesis [80.55876413285587]
任意の精度のセマンティックレイアウトから条件付き画像合成のための新しいフレームワークを提案する。
このフレームワークは、形状情報のない最低レベルのテキスト・トゥ・イメージ(T2I)に自然に還元され、最高レベルのセグメンテーション・トゥ・イメージ(S2I)となる。
本稿では,この新たなセットアップの課題に対処する,新しいテクニックをいくつか紹介する。
論文 参考訳(メタデータ) (2022-11-21T18:59:05Z) - Geometry Aligned Variational Transformer for Image-conditioned Layout
Generation [38.747175229902396]
画像中の様々なレイアウトを自動回帰的に生成するICVT(Image-Conditioned Variational Transformer)を提案する。
まず、レイアウト要素内のコンテキスト関係をモデル化するために自己認識機構を採用し、一方、クロスアテンション機構は条件付き画像の視覚情報を融合するために使用される。
広告ポスターレイアウト設計データセットを大規模に構築し,微妙なレイアウトと鮮度マップアノテーションを付加する。
論文 参考訳(メタデータ) (2022-09-02T07:19:12Z) - Layout-Bridging Text-to-Image Synthesis [20.261873143881573]
我々は、テキスト・ツー・イメージ生成とレイアウト・ツー・イメージ合成の両方において効果的なモデリングを推し進める。
入力テキストをレイアウト・ツー・イメージ合成プロセスに正確に組み込むために,レイアウト中のオブジェクトごとのテキスト・視覚的セマンティックアライメントを学習することに注力する。
論文 参考訳(メタデータ) (2022-08-12T08:21:42Z) - Constrained Graphic Layout Generation via Latent Optimization [17.05026043385661]
ユーザによって暗黙的に、あるいは明示的に、デザインセマンティクスを柔軟に組み込むことができるグラフィックレイアウトを生成します。
提案手法はトランスフォーマーアーキテクチャに基づく生成的レイアウトモデルに基づいており,レイアウト生成を制約付き最適化問題として定式化している。
実験では,1つのモデルを用いて,制約付きタスクと制約なしタスクの両方において,現実的なレイアウトを生成することができることを示す。
論文 参考訳(メタデータ) (2021-08-02T13:04:11Z) - LayoutTransformer: Layout Generation and Completion with Self-attention [105.21138914859804]
画像やモバイルアプリケーション,ドキュメント,3Dオブジェクトなど,さまざまな領域におけるシーンレイアウト生成の問題に対処する。
レイアウト要素間のコンテキスト的関係を学習するために,自己意識を活用する新しいフレームワークであるLayoutTransformerを提案する。
私たちのフレームワークでは、空のセットから、あるいはプリミティブの最初のシードセットから、新しいレイアウトを生成することができ、レイアウト毎に任意のプリミティブをサポートするために簡単にスケールすることができます。
論文 参考訳(メタデータ) (2020-06-25T17:56:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。