論文の概要: ReLayout: Versatile and Structure-Preserving Design Layout Editing via Relation-Aware Design Reconstruction
- arxiv url: http://arxiv.org/abs/2602.01046v1
- Date: Sun, 01 Feb 2026 06:05:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.557024
- Title: ReLayout: Versatile and Structure-Preserving Design Layout Editing via Relation-Aware Design Reconstruction
- Title(参考訳): ReLayout:リレーショナル・アウェア・デザイン・リコンストラクションによるVersatile and Structure-Preserving Design LayoutEditing
- Authors: Jiawei Lin, Shizhao Sun, Danqing Huang, Ting Liu, Ji Li, Jiang Bian,
- Abstract要約: 設計レイアウト編集という基本的な再設計作業に着目する。
4つの基本的な重要な編集操作を導入し、編集操作の形式を標準化する。
本稿では,3重データを必要としない多目的構造認識設計編集のための新しいフレームワークReを提案する。
- 参考スコア(独自算出の注目度): 26.78568275114657
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Automated redesign without manual adjustments marks a key step forward in the design workflow. In this work, we focus on a foundational redesign task termed design layout editing, which seeks to autonomously modify the geometric composition of a design based on user intents. To overcome the ambiguity of user needs expressed in natural language, we introduce four basic and important editing actions and standardize the format of editing operations. The underexplored task presents a unique challenge: satisfying specified editing operations while simultaneously preserving the layout structure of unedited elements. Besides, the scarcity of triplet (original design, editing operation, edited design) samples poses another formidable challenge. To this end, we present ReLayout, a novel framework for versatile and structure-preserving design layout editing that operates without triplet data. Specifically, ReLayout first introduces the relation graph, which contains the position and size relationships among unedited elements, as the constraint for layout structure preservation. Then, relation-aware design reconstruction (RADR) is proposed to bypass the data challenge. By learning to reconstruct a design from its elements, a relation graph, and a synthesized editing operation, RADR effectively emulates the editing process in a self-supervised manner. A multi-modal large language model serves as the backbone for RADR, unifying multiple editing actions within a single model and thus achieving versatile editing after fine-tuning. Qualitative, quantitative results and user studies show that ReLayout significantly outperforms the baseline models in terms of editing quality, accuracy, and layout structure preservation.
- Abstract(参考訳): 手作業による調整なしに再設計を自動化することは、設計ワークフローにおいて重要な一歩となる。
本研究では,ユーザ意図に基づく設計の幾何学的構成を自律的に修正することを目的とした,設計レイアウト編集という基本的な再設計作業に焦点を当てる。
自然言語で表現されるユーザニーズのあいまいさを克服するため,4つの基本的な重要な編集操作を導入し,編集操作の形式を標準化する。
未探索タスクは、未編集要素のレイアウト構造を同時に保存しながら、特定の編集操作を満たすという、ユニークな課題を提示する。
さらに、トリプレット(元のデザイン、編集作業、編集作業)の欠如は、もう一つの深刻な課題である。
この目的のためにReLayoutを提案する。ReLayoutは3重データなしで動作する多目的で構造を保った設計レイアウト編集のための新しいフレームワークである。
具体的には、ReLayout氏はまず、レイアウト構造保存の制約として、未編集要素の位置とサイズの関係を含む関係グラフを紹介した。
そして、データチャレンジを回避すべく、リレーショナル・アウェア・デザイン・再構築(RADR)を提案する。
RADRは、その要素、関係グラフ、および合成編集操作から設計を再構築することを学び、編集プロセスを自己管理的に効果的にエミュレートする。
マルチモーダルな大規模言語モデルはRADRのバックボーンとして機能し、単一のモデル内で複数の編集動作を統合することにより、微調整後の多目的編集を実現する。
質的かつ定量的な結果とユーザスタディにより、ReLayoutは、編集品質、精度、レイアウト構造保存の点で、ベースラインモデルよりも大幅に優れていることが示されている。
関連論文リスト
- FlowDC: Flow-Based Decoupling-Decay for Complex Image Editing [52.54102743380658]
本稿では,複雑な編集を複数のサブ編集エフェクトに分離し,編集プロセス中に並列に重畳するFlowDCを提案する。
FlowDCは既存の方法に比べて優れた結果を示した。
論文 参考訳(メタデータ) (2025-12-12T09:08:39Z) - ReLayout: Integrating Relation Reasoning for Content-aware Layout Generation with Multi-modal Large Language Models [7.288330685534444]
我々はReを導入する。ReはRelation-CoTを利用してより合理的で一貫性のあるレイアウトを生成する新しい手法である。
具体的には、要素間の領域、完全性、マージンといった明示的な関係定義を導入することで、レイアウトアノテーションを強化する。
また、3次元にわたるレイアウトプロトタイプ機能を定義し、異なるレイアウトスタイルを定量化するレイアウトプロトタイプサンプルも導入する。
論文 参考訳(メタデータ) (2025-07-08T01:13:43Z) - Image Editing As Programs with Diffusion Models [69.05164729625052]
本稿では,Diffusion Transformer (DiT) アーキテクチャ上に構築された統合画像編集フレームワークである IEAP (Image Editing As Programs) を紹介する。
IEAPは、複雑な編集命令を原子操作のシーケンスに分解して、リダミストレンズによる命令編集にアプローチする。
我々のフレームワークは、特に複雑なマルチステップ命令に対して、より優れた精度とセマンティック忠実度を提供する。
論文 参考訳(メタデータ) (2025-06-04T16:57:24Z) - Improving Editability in Image Generation with Layer-wise Memory [23.004027029130953]
現在の編集アプローチは、主に単一オブジェクトの修正用に設計されており、シーケンシャルな編集に苦労している。
新しい要素を自然に統合しながら、既存のコンテンツを保存する粗いマスク入力を実現することを提案する。
我々のフレームワークはレイヤワイドメモリによってこれを実現し、遅延表現を格納し、以前の編集からの埋め込みを促す。
論文 参考訳(メタデータ) (2025-05-02T07:36:49Z) - SPICE: A Synergistic, Precise, Iterative, and Customizable Image Editing Workflow [13.815228931600236]
任意の解像度とアスペクト比を受け入れ、ユーザの要求を正確に追従し、100以上の編集ステップで画像品質を一貫して改善する、トレーニング不要のワークフローであるSPICEを紹介する。
挑戦的なリアルなイメージ編集データセットでは、SPICEは最先端のベースラインを定量的に上回り、人間のアノテータに一貫して好まれる。
論文 参考訳(メタデータ) (2025-04-13T19:13:04Z) - Task-Oriented Diffusion Inversion for High-Fidelity Text-based Editing [60.730661748555214]
textbfTask-textbfOriented textbfDiffusion textbfInversion (textbfTODInv) は、特定の編集タスクに適した実際の画像を反転して編集する新しいフレームワークである。
ToDInvは相互最適化によってインバージョンと編集をシームレスに統合し、高い忠実さと正確な編集性を保証する。
論文 参考訳(メタデータ) (2024-08-23T22:16:34Z) - Customize your NeRF: Adaptive Source Driven 3D Scene Editing via
Local-Global Iterative Training [61.984277261016146]
テキスト記述や参照画像を編集プロンプトとして統合するCustomNeRFモデルを提案する。
最初の課題に取り組むために,前景領域編集とフルイメージ編集を交互に行うローカル・グローバル反復編集(LGIE)トレーニング手法を提案する。
第2の課題として、生成モデル内のクラス事前を利用して、一貫性の問題を緩和するクラス誘導正規化を設計する。
論文 参考訳(メタデータ) (2023-12-04T06:25:06Z) - Optimisation-Based Multi-Modal Semantic Image Editing [58.496064583110694]
本稿では,複数の編集命令型に対応するために,推論時編集の最適化を提案する。
各損失関数の影響を調整することで、ユーザの好みに合わせてフレキシブルな編集ソリューションを構築することができる。
本手法は,テキスト,ポーズ,スクリブルといった編集条件を用いて評価し,複雑な編集を行う能力を強調した。
論文 参考訳(メタデータ) (2023-11-28T15:31:11Z) - Learning Structural Edits via Incremental Tree Transformations [102.64394890816178]
構造化データのインクリメンタルな編集(すなわち「構造的編集」)のための汎用モデルを提案する。
我々の編集者は、反復的にツリー編集(例えば、サブツリーの削除や追加)を生成し、部分的に編集されたデータに適用することを学びます。
提案したエディタを2つのソースコード編集データセットで評価した結果,提案する編集エンコーダでは,従来よりも精度が向上していることがわかった。
論文 参考訳(メタデータ) (2021-01-28T16:11:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。