論文の概要: Edit-GRPO: A Locality-Preserving Policy Optimization Framework for Image Editing
- arxiv url: http://arxiv.org/abs/2605.16951v1
- Date: Sat, 16 May 2026 12:05:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.313909
- Title: Edit-GRPO: A Locality-Preserving Policy Optimization Framework for Image Editing
- Title(参考訳): Edit-GRPO:画像編集のための局所性保存ポリシー最適化フレームワーク
- Authors: Shaodong Xu, Zexian Li, Zhendong Wang, Litong Gong, Tiezheng Ge, Wengang Zhou, Bo Zheng, Houqiang Li,
- Abstract要約: 画像編集を最適化しながら局所性を保存する編集-GRPOを提案する。
編集領域と非編集領域に領域固有の最適化信号を割り当てることで、Edit-GRPOはポリシー更新を編集タスクの空間構造と整合させる。
この設計は、コンテキスト歪みや境界の不整合といった共通成果物を効果的に抑制する。
- 参考スコア(独自算出の注目度): 95.29911956874389
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A fundamental challenge in image editing lies in preserving spatial locality: edits should improve targeted content without inadvertently altering surrounding regions. However, most optimization-based editing approaches treat images as holistic entities, causing global policy updates that undermine locality and introduce undesired context changes. We observe that this issue stems from a mismatch between localized editing intent and globally applied optimization signals. Motivated by this insight, we propose Edit-GRPO, preserving Locality while optimizing image editing, a locality-preserving policy optimization framework that explicitly decouples editing and preservation objectives. By assigning region-specific optimization signals to edit and non-edit areas, Edit-GRPO aligns policy updates with the spatial structure of editing tasks, enabling localized improvements while maintaining global visual coherence. This design effectively suppresses common artifacts such as context distortion and boundary inconsistency. Extensive experiments across diverse image editing scenarios demonstrate that Edit-GRPO significantly improves locality preservation while maintaining strong editing performance compared to existing optimization-based methods, validating the generality and effectiveness of the proposed framework.
- Abstract(参考訳): 画像編集の根本的な課題は、空間的局所性を保存することである。
しかし、ほとんどの最適化ベースの編集アプローチは、画像を全体論的実体として扱い、局所性を損なう世界的なポリシー更新を引き起こし、望ましくないコンテキスト変化をもたらす。
この問題は、局所的な編集意図とグローバルに応用された最適化信号のミスマッチに起因する。
画像編集を最適化しながら局所性を保存するための編集-GRPO, 編集と保存の目的を明確に分離する局所性保存ポリシー最適化フレームワークを提案する。
編集領域と非編集領域に領域固有の最適化信号を割り当てることで、Edit-GRPOは、ポリシー更新を編集タスクの空間構造と整合させ、グローバルな視覚的一貫性を維持しながら、局所的な改善を可能にする。
この設計は、コンテキスト歪みや境界の不整合といった共通成果物を効果的に抑制する。
多様な画像編集シナリオにわたる大規模な実験により,編集-GRPOは,既存の最適化手法と比較して編集性能を高く保ちながら,局所性保持を著しく改善し,提案フレームワークの汎用性と有効性を検証した。
関連論文リスト
- HierEdit: Region-Aware Hierarchical Diffusion for Efficient High-Resolution Editing [83.1290629939693]
プロやクリエイティブなアプリケーションには高解像度の画像編集が不可欠である。
現在のアプローチでは、イメージキャンバス全体を冗長に処理するか、大規模な高解像度データセットに依存している。
高速かつスケーラブルな高解像度画像編集のための領域対応階層拡散フレームワークであるHierEditを紹介する。
論文 参考訳(メタデータ) (2026-05-17T07:14:15Z) - Rethinking Where to Edit: Task-Aware Localization for Instruction-Based Image Editing [30.23368654238746]
教示に基づく画像編集のための訓練不要でタスク対応の編集ローカライズフレームワークを提案する。
我々のフレームワークは、強い命令追従性能を維持しながら、非編集領域の一貫性を一貫して改善する。
論文 参考訳(メタデータ) (2026-04-22T07:08:01Z) - Region-Constrained Group Relative Policy Optimization for Flow-Based Image Editing [2.096755686662369]
本稿では,領域制約付きGRPOポストトレーニングフレームワークであるRC-GRPO-Editingを提案する。
バックグラウンド誘起ニュアンス分散を抑制して、よりクリーンなローカライズされたクレジット割り当てを可能にし、地域命令の順守を改善し、非ターゲットコンテンツを保存する。
CompBenchの実験では、編集領域の命令順守と非ターゲット保存が一貫した改善が見られた。
論文 参考訳(メタデータ) (2026-04-10T14:58:15Z) - LocateEdit-Bench: A Benchmark for Instruction-Based Editing Localization [21.62979058692505]
フォージェリローカライゼーション手法をベンチマークするために,231ドルの編集画像からなる大規模データセットを提案する。
データセットには、4つの最先端編集モデルと3つの一般的な編集タイプが組み込まれている。
我々の研究は、画像編集の進化する状況に追従する基盤を確立し、将来の偽のローカライゼーションのための効果的な手法の開発を容易にする。
論文 参考訳(メタデータ) (2026-02-05T12:01:09Z) - EditMGT: Unleashing Potentials of Masked Generative Transformers in Image Editing [84.7089707244905]
Masked Generative Transformers (MGT) は、編集プロセス中に非関連領域を保存するために固有の能力を持つローカライズされたデコードパラダイムを示す。
本稿では,MGT ベースの画像編集フレームワーク EditMGT を紹介する。
EditMGTのクロスアテンションマップは、編集関連領域をローカライズするための情報的ローカライズ信号を提供する。
また、低アテンション領域におけるトークンのフリップを制限する領域ホールドサンプリングを導入し、急激な編集を抑える。
論文 参考訳(メタデータ) (2025-12-12T16:51:19Z) - LORE: Latent Optimization for Precise Semantic Control in Rectified Flow-based Image Editing [0.276240219662896]
トレーニング不要で効率的な画像編集手法であるLOREを紹介する。
LOREは逆ノイズを直接最適化し、既存のアプローチの一般化と制御可能性の限界に対処する。
実験の結果,LOREはセマンティックアライメント,画像品質,背景忠実度において,強いベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2025-08-05T06:45:04Z) - DCEdit: Dual-Level Controlled Image Editing via Precisely Localized Semantics [71.78350994830885]
拡散モデルを用いたテキスト誘導画像編集における新しい手法を提案する。
本手法は,視覚的・テキスト的自己注意を用いて横断的意識マップを向上し,編集性能を向上させるための地域的手がかりとして機能する。
提案手法を他のDiTベースのアプローチと完全に比較するため,高解像度画像,長い記述テキスト,実世界の画像,新しいテキスト編集タスクを特徴とするRW-800ベンチマークを構築した。
論文 参考訳(メタデータ) (2025-03-21T02:14:03Z) - Customize your NeRF: Adaptive Source Driven 3D Scene Editing via
Local-Global Iterative Training [61.984277261016146]
テキスト記述や参照画像を編集プロンプトとして統合するCustomNeRFモデルを提案する。
最初の課題に取り組むために,前景領域編集とフルイメージ編集を交互に行うローカル・グローバル反復編集(LGIE)トレーニング手法を提案する。
第2の課題として、生成モデル内のクラス事前を利用して、一貫性の問題を緩和するクラス誘導正規化を設計する。
論文 参考訳(メタデータ) (2023-12-04T06:25:06Z) - Optimisation-Based Multi-Modal Semantic Image Editing [58.496064583110694]
本稿では,複数の編集命令型に対応するために,推論時編集の最適化を提案する。
各損失関数の影響を調整することで、ユーザの好みに合わせてフレキシブルな編集ソリューションを構築することができる。
本手法は,テキスト,ポーズ,スクリブルといった編集条件を用いて評価し,複雑な編集を行う能力を強調した。
論文 参考訳(メタデータ) (2023-11-28T15:31:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。