論文の概要: LayerEdit: Disentangled Multi-Object Editing via Conflict-Aware Multi-Layer Learning
- arxiv url: http://arxiv.org/abs/2511.08251v1
- Date: Wed, 12 Nov 2025 01:48:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.721588
- Title: LayerEdit: Disentangled Multi-Object Editing via Conflict-Aware Multi-Layer Learning
- Title(参考訳): LayerEdit: 競合認識型多層学習による分散多対象編集
- Authors: Fengyi Fu, Mengqi Huang, Lei Zhang, Zhendong Mao,
- Abstract要約: トレーニング不要な多層不整合編集フレームワークであるLayerEditを提案する。
正確なオブジェクト層分解とコヒーレント融合によって、コンフリクトフリーなオブジェクト層編集を可能にする。
実験では、既存の方法よりもLayerEditの方が優れており、前例のないオブジェクト内制御性とオブジェクト間コヒーレンスを示す。
- 参考スコア(独自算出の注目度): 34.08955594341648
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text-driven multi-object image editing which aims to precisely modify multiple objects within an image based on text descriptions, has recently attracted considerable interest. Existing works primarily follow the localize-editing paradigm, focusing on independent object localization and editing while neglecting critical inter-object interactions. However, this work points out that the neglected attention entanglements in inter-object conflict regions, inherently hinder disentangled multi-object editing, leading to either inter-object editing leakage or intra-object editing constraints. We thereby propose a novel multi-layer disentangled editing framework LayerEdit, a training-free method which, for the first time, through precise object-layered decomposition and coherent fusion, enables conflict-free object-layered editing. Specifically, LayerEdit introduces a novel "decompose-editingfusion" framework, consisting of: (1) Conflict-aware Layer Decomposition module, which utilizes an attention-aware IoU scheme and time-dependent region removing, to enhance conflict awareness and suppression for layer decomposition. (2) Object-layered Editing module, to establish coordinated intra-layer text guidance and cross-layer geometric mapping, achieving disentangled semantic and structural modifications. (3) Transparency-guided Layer Fusion module, to facilitate structure-coherent inter-object layer fusion through precise transparency guidance learning. Extensive experiments verify the superiority of LayerEdit over existing methods, showing unprecedented intra-object controllability and inter-object coherence in complex multi-object scenarios. Codes are available at: https://github.com/fufy1024/LayerEdit.
- Abstract(参考訳): テキスト記述に基づいて画像内の複数のオブジェクトを正確に修正することを目的としたテキスト駆動型マルチオブジェクト画像編集は,近年注目されている。
既存の作業は主にローカライズ・編集のパラダイムに従っており、重要なオブジェクト間の相互作用を無視しながら、独立したオブジェクトのローカライゼーションと編集に重点を置いている。
しかし,本研究は,物体間衝突領域における無視された注意の絡み合いが,本来は多対象編集を阻害し,物体間編集の漏れや物体内編集の制約につながることを指摘する。
そこで我々は, オブジェクト層分解とコヒーレント融合により, コンフリクトフリーなオブジェクト層編集を可能にする, トレーニング不要な新しい多層非整合編集フレームワークLayerEditを提案する。
具体的には、(1) 注意を意識したIoUスキームと時間に依存した領域削除を利用して、レイヤ分解に対するコンフリクト認識と抑制を強化する。
2) オブジェクト層編集モジュールは, 階層内テキストガイダンスと層間幾何マッピングを確立し, 絡み合った意味的・構造的な修正を実現する。
(3)透明誘導型層融合モジュールは、精密な透明誘導学習を通して、構造コヒーレントなオブジェクト間層融合を容易にする。
大規模な実験により、複雑な多目的シナリオにおいて、既往のオブジェクト内制御性とオブジェクト間コヒーレンスを示す、既存のメソッドよりもLayerEditの方が優れていることが検証された。
コードは、https://github.com/fufy1024/LayerEditで入手できる。
関連論文リスト
- O-DisCo-Edit: Object Distortion Control for Unified Realistic Video Editing [88.93410369258203]
O-DisCo-Editは、新しいオブジェクト歪み制御(O-DisCo)を組み込んだ統合フレームワークである
この信号はランダムノイズと適応ノイズに基づいて、単一の表現内に幅広い編集キューを柔軟にカプセル化する。
O-DisCo-Editは、効果的なトレーニングパラダイムによる効率的な高忠実な編集を可能にする。
論文 参考訳(メタデータ) (2025-09-01T16:29:39Z) - Image Editing As Programs with Diffusion Models [69.05164729625052]
本稿では,Diffusion Transformer (DiT) アーキテクチャ上に構築された統合画像編集フレームワークである IEAP (Image Editing As Programs) を紹介する。
IEAPは、複雑な編集命令を原子操作のシーケンスに分解して、リダミストレンズによる命令編集にアプローチする。
我々のフレームワークは、特に複雑なマルチステップ命令に対して、より優れた精度とセマンティック忠実度を提供する。
論文 参考訳(メタデータ) (2025-06-04T16:57:24Z) - MDE-Edit: Masked Dual-Editing for Multi-Object Image Editing via Diffusion Models [10.798205956644317]
我々は,MDE-Edit と呼ばれる複雑な多目的シーンにおいて,高精度な局所化画像操作を可能にする,トレーニング不要な推論ステージ最適化手法を提案する。
大規模な実験により、MDE-Editは、編集精度と視覚的品質において最先端の手法よりも優れており、複雑な多目的画像操作タスクに対する堅牢なソリューションを提供する。
論文 参考訳(メタデータ) (2025-05-08T10:01:14Z) - InteractEdit: Zero-Shot Editing of Human-Object Interactions in Images [42.8116807595149]
ゼロショット・ヒューマン・オブジェクト・インタラクション(HOI)編集のための新しいフレームワークであるInteractEditを提案する。
画像内の既存のインタラクションを、対象と対象のアイデンティティを保持しながら、新しい望ましいインタラクションに変換する。
実験の結果,InteractEditは既存の手法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-03-12T07:40:45Z) - BrushEdit: All-In-One Image Inpainting and Editing [76.93556996538398]
BrushEditは、インペイントベースの命令誘導画像編集パラダイムである。
本研究では,MLLMとデュアルブランチ画像の描画モデルを統合することで,自由形式の命令編集を可能にするシステムを提案する。
本フレームワークは,MLLMとインパインティングモデルを効果的に組み合わせ,7つの指標で優れた性能を実現する。
論文 参考訳(メタデータ) (2024-12-13T17:58:06Z) - DesignEdit: Multi-Layered Latent Decomposition and Fusion for Unified & Accurate Image Editing [22.855660721387167]
本研究では,空間認識画像編集タスクを2つのサブタスク,多層ラテント分解と多層ラテント融合の組合せに変換する。
提案手法は,自己ガイドやDiffEditorなど,最新の空間編集手法を一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2024-03-21T15:35:42Z) - LoMOE: Localized Multi-Object Editing via Multi-Diffusion [8.90467024388923]
本稿では,ゼロショットローカライズされたマルチオブジェクト編集のための新しいフレームワークを提案する。
提案手法は, 前景マスクとそれに対応する簡単なテキストプロンプトを利用して, 対象領域に局所的な影響を与える。
ラテント空間内のクロスアテンションとバックグラウンドロスの組み合わせにより、編集対象の特性が保存される。
論文 参考訳(メタデータ) (2024-03-01T10:46:47Z) - PAIR-Diffusion: A Comprehensive Multimodal Object-Level Image Editor [135.17302411419834]
PAIR Diffusionは、画像内の各オブジェクトの構造と外観を制御する拡散モデルを可能にする汎用フレームワークである。
画像中の各オブジェクトのプロパティを制御できることが、包括的な編集機能に繋がることを示す。
我々のフレームワークは、参照画像ベースの外観編集、自由形形状編集、オブジェクトの追加、バリエーションなど、実際の画像に対する様々なオブジェクトレベルの編集操作を可能にする。
論文 参考訳(メタデータ) (2023-03-30T17:13:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。