論文の概要: LayoutRAG: Retrieval-Augmented Model for Content-agnostic Conditional Layout Generation
- arxiv url: http://arxiv.org/abs/2506.02697v1
- Date: Tue, 03 Jun 2025 09:47:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:35.579791
- Title: LayoutRAG: Retrieval-Augmented Model for Content-agnostic Conditional Layout Generation
- Title(参考訳): LayoutRAG:Retrieval-Augmented Model for Content-Agnostic Conditional Layout Generation
- Authors: Yuxuan Wu, Le Wang, Sanping Zhou, Mengnan Liu, Gang Hua, Haoxiang Li,
- Abstract要約: 制御可能なレイアウト生成は、グラフィックデザイン内で要素境界ボックスの可視的な配置を作成することを目的としている。
本稿では,条件と参照誘導生成によるレイアウト生成を提案する。
提案手法は,与えられた条件を満たし,既存の最先端モデルより優れた高品質なレイアウトを生成する。
- 参考スコア(独自算出の注目度): 34.39449499558055
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Controllable layout generation aims to create plausible visual arrangements of element bounding boxes within a graphic design according to certain optional constraints, such as the type or position of a specific component. While recent diffusion or flow-matching models have achieved considerable advances in multifarious conditional generation tasks, there remains considerable room for generating optimal arrangements under given conditions. In this work, we propose to carry out layout generation through retrieving by conditions and reference-guided generation. Specifically, we retrieve appropriate layout templates according to given conditions as references. The references are then utilized to guide the denoising or flow-based transport process. By retrieving layouts compatible with the given conditions, we can uncover the potential information not explicitly provided in the given condition. Such an approach offers more effective guidance to the model during the generation process, in contrast to previous models that feed the condition to the model and let the model infer the unprovided layout attributes directly. Meanwhile, we design a condition-modulated attention that selectively absorbs retrieval knowledge, adapting to the difference between retrieved templates and given conditions. Extensive experiment results show that our method successfully produces high-quality layouts that meet the given conditions and outperforms existing state-of-the-art models. Code will be released upon acceptance.
- Abstract(参考訳): 制御可能なレイアウト生成は、特定のコンポーネントのタイプや位置などの特定のオプション制約に従って、グラフィックデザイン内で要素境界ボックスの可視的な配置を作成することを目的としている。
近年の拡散モデルや流れマッチングモデルは、多言語条件生成タスクにおいてかなりの進歩を遂げているが、与えられた条件下で最適な配置を生成する余地は残されている。
本研究では,条件と参照誘導生成によるレイアウト生成を提案する。
具体的には、所定の条件に従って適切なレイアウトテンプレートを参照として検索する。
参照は、デノナイジングまたはフローベースのトランスポートプロセスのガイドに使用される。
与えられた条件と整合性のあるレイアウトを検索することで、与えられた条件に明示的に規定されていない潜在的な情報を明らかにすることができる。
このようなアプローチは、モデルに条件を供給し、未提供のレイアウト属性を直接推論する以前のモデルとは対照的に、生成プロセス中にモデルに対してより効果的なガイダンスを提供する。
一方,検索の知識を選択的に吸収し,検索したテンプレートと与えられた条件との差に適応する条件変調された注意を設計する。
実験結果から,提案手法は与えられた条件を満たし,既存の最先端モデルよりも優れた高品質なレイアウトを実現することができた。
コードは受理時にリリースされる。
関連論文リスト
- Diffusion Models with Double Guidance: Generate with aggregated datasets [18.0878149546412]
高性能な生成モデルをトレーニングするための大規模なデータセットは、特に関連する属性やアノテーションを提供する必要がある場合、しばしば違法に高価である。
これは、複数の属性を条件として共同で使用する場合、条件生成モデリングにおいて重要な課題となる。
そこで本研究では,訓練サンプルが全条件を同時に含まない場合でも,正確な条件生成を可能にする,二重誘導拡散モデルを提案する。
論文 参考訳(メタデータ) (2025-05-19T14:59:35Z) - Towards Aligned Layout Generation via Diffusion Model with Aesthetic Constraints [53.66698106829144]
広い範囲のレイアウト生成タスクを処理する統一モデルを提案する。
このモデルは連続拡散モデルに基づいている。
実験結果から,LACEは高品質なレイアウトを生成することがわかった。
論文 参考訳(メタデータ) (2024-02-07T11:12:41Z) - Steered Diffusion: A Generalized Framework for Plug-and-Play Conditional
Image Synthesis [62.07413805483241]
Steered Diffusionは、無条件生成のために訓練された拡散モデルを用いたゼロショット条件画像生成のためのフレームワークである。
塗装,着色,テキスト誘導セマンティック編集,画像超解像などのタスクに対して,ステアリング拡散を用いた実験を行った。
論文 参考訳(メタデータ) (2023-09-30T02:03:22Z) - Conditional Generation from Unconditional Diffusion Models using
Denoiser Representations [94.04631421741986]
本稿では,学習したデノイザネットワークの内部表現を用いて,事前学習した非条件拡散モデルを新しい条件に適用することを提案する。
提案手法により生成した合成画像を用いたTiny ImageNetトレーニングセットの強化により,ResNetベースラインの分類精度が最大8%向上することを示す。
論文 参考訳(メタデータ) (2023-06-02T20:09:57Z) - LayoutDM: Discrete Diffusion Model for Controllable Layout Generation [27.955214767628107]
制御可能なレイアウト生成は、任意の制約で要素境界ボックスの妥当な配置を合成することを目的としている。
本研究では、離散状態空間拡散モデルに基づく単一モデルにおいて、幅広いレイアウト生成タスクを解くことを試みる。
我々のモデルはLayoutDMと呼ばれ、離散表現の構造化レイアウトデータを自然に処理し、初期入力からノイズレスレイアウトを段階的に推測することを学ぶ。
論文 参考訳(メタデータ) (2023-03-14T17:59:47Z) - Unifying Layout Generation with a Decoupled Diffusion Model [26.659337441975143]
これは、出版物、文書、ユーザーインターフェース(UI)などのフォーマットされたシーンに対する重厚なグラフィックデザイン作業の負担を軽減するための重要なタスクである。
単一分離拡散モデルでそのような統一を実現するためのレイアウト拡散生成モデル(LDGM)を提案する。
提案するLDGMは,任意の属性に対してスクラッチあるいは条件付きでレイアウトを生成することができる。
論文 参考訳(メタデータ) (2023-03-09T05:53:32Z) - GRIT: Generative Role-filler Transformers for Document-level Event
Entity Extraction [134.5580003327839]
本稿では、文書レベルでコンテキストをモデル化するための生成トランスフォーマーベースのエンコーダデコーダフレームワーク(GRIT)を紹介する。
我々は,MUC-4データセットに対する我々のアプローチを評価し,我々のモデルが先行作業よりもかなり優れていることを示す。
論文 参考訳(メタデータ) (2020-08-21T01:07:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。