論文の概要: ACE-LoRA: Adaptive Orthogonal Decoupling for Continual Image Editing
- arxiv url: http://arxiv.org/abs/2605.14948v1
- Date: Thu, 14 May 2026 15:20:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.90758
- Title: ACE-LoRA: Adaptive Orthogonal Decoupling for Continual Image Editing
- Title(参考訳): ACE-LoRA:連続画像編集のための適応直交デカップリング
- Authors: Yuehao Liu, Weijia Zhang, Xuanming Shang, Zhizhou Chen, Yanhao Ge, Shanyan Guan, Chao Ma,
- Abstract要約: 現実世界のアプリケーションは、学習済みの知識を維持しながら、新しいタスクへの継続的な適応を必要とする。
連続画像編集のための動的正規化フレームワークACE-LoRAを提案する。
また、この領域で最初の包括的なベンチマークであるCIE-Benchを紹介します。
- 参考スコア(独自算出の注目度): 12.389799494244235
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State-of-the-art diffusion models often rely on parameter-efficient fine-tuning to perform specialized image editing tasks. However, real-world applications require continual adaptation to new tasks while preserving previously learned knowledge. Despite the practical necessity, continual learning for image editing remains largely underexplored. We propose ACE-LoRA, a dynamic regularization framework for continual image editing that effectively mitigates catastrophic forgetting. ACE-LoRA leverages Adaptive Orthogonal Decoupling to identify and orthogonalize task interference, and introduces a Rank-Invariant Historical Information Compression strategy to address scalability issues in continual updates. To facilitate continual learning in image editing and provide a standardized evaluation protocol, we introduce CIE-Bench, the first comprehensive benchmark in this domain. CIE-Bench encompasses diverse and practically relevant image editing scenarios with a balanced level of difficulty to effectively expose limitations of existing models while remaining compatible with parameter-efficient fine-tuning. Extensive experiments demonstrate that our method consistently outperforms existing baselines in terms of instruction fidelity, visual realism, and robustness to forgetting, establishing a strong foundation for continual learning in image editing.
- Abstract(参考訳): 最先端拡散モデルは、しばしばパラメータ効率の良い微調整に頼り、特殊な画像編集タスクを実行する。
しかし、現実世界のアプリケーションは、学習済みの知識を保ちながら、新しいタスクへの継続的な適応を必要とする。
現実的な必要性にもかかわらず、画像編集の継続的な学習はいまだに過小評価されている。
本稿では,画像編集のための動的正規化フレームワークであるACE-LoRAを提案する。
ACE-LoRAはAdaptive Orthogonal Decouplingを活用してタスク干渉を特定し、直交する。
画像編集における連続的な学習を容易にし、標準化された評価プロトコルを提供するため、この領域で最初の包括的なベンチマークであるCIE-Benchを導入する。
CIE-Benchは、パラメータ効率の良い微調整と互換性を保ちながら、既存のモデルの制約を効果的に露呈することの難しさがバランスのとれた、多様で実用的な画像編集シナリオを含んでいる。
広汎な実験により,提案手法は命令の忠実さ,視覚的リアリズム,忘れることへの頑健さにおいて,既存のベースラインを一貫して上回り,画像編集における継続的な学習の強力な基盤を確立した。
関連論文リスト
- Training-Free Multi-Concept Image Editing [14.75123947134721]
Concept Distillation Sampling (CDS)は、ターゲットレスマルチコンセプト画像編集のためのトレーニング不要のフレームワークである。
これは、高度に安定な蒸留バックボーンを統合することによって、従来の手法の言語的ボトルネックを克服する。
本手法は,所望の編集の参照サンプルを必要とせずに,インスタンスの忠実度を保存する。
論文 参考訳(メタデータ) (2026-02-24T12:27:51Z) - LORE: Latent Optimization for Precise Semantic Control in Rectified Flow-based Image Editing [0.276240219662896]
トレーニング不要で効率的な画像編集手法であるLOREを紹介する。
LOREは逆ノイズを直接最適化し、既存のアプローチの一般化と制御可能性の限界に対処する。
実験の結果,LOREはセマンティックアライメント,画像品質,背景忠実度において,強いベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2025-08-05T06:45:04Z) - Orthogonal Projection Subspace to Aggregate Online Prior-knowledge for Continual Test-time Adaptation [67.80294336559574]
連続テスト時間適応(CTTA)は、新しいシナリオに継続的に適応するために、ソース事前訓練されたモデルを必要とするタスクである。
我々は、OoPkと呼ばれるオンライン事前知識を集約する新しいパイプラインOrthogonal Projection Subspaceを提案する。
論文 参考訳(メタデータ) (2025-06-23T18:17:39Z) - CPAM: Context-Preserving Adaptive Manipulation for Zero-Shot Real Image Editing [24.68304617869157]
コンテキスト保存適応マニピュレーション(CPAM)は複雑な非厳密な実画像編集のための新しいフレームワークである。
我々は,オブジェクトと背景を効果的に保存し,独立に制御する自己認識機構を調整した保存適応モジュールを開発した。
また,多様な画像操作作業を簡易に行うためのマスク誘導戦略も導入した。
論文 参考訳(メタデータ) (2025-06-23T09:19:38Z) - AttentionDrag: Exploiting Latent Correlation Knowledge in Pre-trained Diffusion Models for Image Editing [33.74477787349966]
本研究では,AttentionDragという一段階のポイントベース画像編集手法を提案する。
このフレームワークは、大規模な再最適化や再トレーニングを必要とせずに、セマンティック一貫性と高品質な操作を可能にする。
以上の結果から,最先端の手法をはるかに高速に超越した性能を示す。
論文 参考訳(メタデータ) (2025-06-16T09:42:38Z) - UIP2P: Unsupervised Instruction-based Image Editing via Edit Reversibility Constraint [87.20985852686785]
本研究では,教師なし指導に基づく画像編集手法を提案する。
本稿では,編集可逆性制約 (ERC) と呼ばれる新しい編集機構を導入することで,これらの課題に対処する。
これにより、地道に編集されたイメージの必要性を回避し、実際のイメージキャプチャペアまたはイメージキャプチャインストラクショントリプルからなるデータセットで、初めてトレーニングをアンロックすることが可能になります。
論文 参考訳(メタデータ) (2024-12-19T18:59:58Z) - Uniform Attention Maps: Boosting Image Fidelity in Reconstruction and Editing [66.48853049746123]
構造的視点から再構築を解析し、従来の横断的注意を一様注意マップに置き換える新しいアプローチを提案する。
本手法は,ノイズ予測時のテキスト条件の変化による歪みを効果的に抑制する。
実験結果から,本手法は高忠実度画像再構成に優れるだけでなく,実際の画像合成や編集のシナリオにも頑健に機能することが示された。
論文 参考訳(メタデータ) (2024-11-29T12:11:28Z) - Towards Full-to-Empty Room Generation with Structure-Aware Feature
Encoding and Soft Semantic Region-Adaptive Normalization [67.64622529651677]
本稿では,ソフトセマンティックな領域適応正規化モジュール (softSEAN) ブロックを提案する。
我々のアプローチは、トレーニングの複雑さと非微分可能性の問題を緩和することの利点の他に、比較した手法を量的にも質的にも上回っている。
我々のSoftSEANブロックは、既存の識別および生成モデルのためのドロップインモジュールとして使用することができる。
論文 参考訳(メタデータ) (2021-12-10T09:00:13Z) - Enjoy Your Editing: Controllable GANs for Image Editing via Latent Space
Navigation [136.53288628437355]
コントロール可能なセマンティックイメージ編集により、ユーザーはクリック数回で画像属性全体を変更できる。
現在のアプローチでは、絡み合った属性編集、グローバルなイメージアイデンティティの変更、フォトリアリズムの低下に悩まされることが多い。
本稿では,主に定性評価に焦点を当てた先行研究とは異なり,制御可能な編集性能を測定するための定量的評価手法を提案する。
論文 参考訳(メタデータ) (2021-02-01T21:38:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。