論文の概要: Improving Diffusion-Based Image Editing Faithfulness via Guidance and Scheduling
- arxiv url: http://arxiv.org/abs/2506.21045v1
- Date: Thu, 26 Jun 2025 06:46:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:10.005085
- Title: Improving Diffusion-Based Image Editing Faithfulness via Guidance and Scheduling
- Title(参考訳): 誘導とスケジューリングによる拡散画像編集の改善
- Authors: Hansam Cho, Seoung Bum Kim,
- Abstract要約: 画像編集において2つの重要な側面は、修正の程度を決定する編集可能性と、修正されていない要素がどれだけよく保存されているかを反映する忠実性である。
本稿では,編集可能性に最小限の影響を伴って忠実度を高めるFGSを提案する。
実験結果から, FGSは編集性を維持しつつ, 良好な忠実性が得られることが示された。
- 参考スコア(独自算出の注目度): 1.8876415010297893
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-guided diffusion models have become essential for high-quality image synthesis, enabling dynamic image editing. In image editing, two crucial aspects are editability, which determines the extent of modification, and faithfulness, which reflects how well unaltered elements are preserved. However, achieving optimal results is challenging because of the inherent trade-off between editability and faithfulness. To address this, we propose Faithfulness Guidance and Scheduling (FGS), which enhances faithfulness with minimal impact on editability. FGS incorporates faithfulness guidance to strengthen the preservation of input image information and introduces a scheduling strategy to resolve misalignment between editability and faithfulness. Experimental results demonstrate that FGS achieves superior faithfulness while maintaining editability. Moreover, its compatibility with various editing methods enables precise, high-quality image edits across diverse tasks.
- Abstract(参考訳): テキスト誘導拡散モデルは高品質な画像合成に欠かせないものとなり、ダイナミックな画像編集が可能になった。
画像編集において2つの重要な側面は、修正の程度を決定する編集可能性と、修正されていない要素がどれだけよく保存されているかを反映する忠実性である。
しかし、編集性と忠実性の間に本質的にトレードオフがあるため、最適な結果を達成することは困難である。
これを解決するために、編集可能性に最小限の影響を伴って忠実度を高めるFGS(Fithfulness Guidance and Scheduling)を提案する。
FGSは、入力画像情報の保存を強化するために忠実ガイダンスを導入し、編集性と忠実性の相違を解決するためのスケジューリング戦略を導入する。
実験結果から,FGSは編集性を維持しながら良好な忠実性が得られることが示された。
さらに、様々な編集手法との互換性により、様々なタスクにまたがる高精度で高品質な画像編集が可能となる。
関連論文リスト
- Tuning-Free Image Editing with Fidelity and Editability via Unified Latent Diffusion Model [60.82962950960996]
拡散遅延最適化を行うチューニング不要なUnifyEditを導入する。
本研究では, 自己注意保持制約(SA)と相互注意アライメント制約(CA)の2つを開発し, テキストアライメントの強化を図る。
提案手法は,様々な編集作業における構造保存とテキストアライメントのバランスを保ち,他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2025-04-08T01:02:50Z) - Edicho: Consistent Image Editing in the Wild [90.42395533938915]
エディコは拡散モデルに基づく訓練なしの解を踏む。
これは、明示的な画像対応を使って直接編集する基本的な設計原理を特徴としている。
論文 参考訳(メタデータ) (2024-12-30T16:56:44Z) - Schedule Your Edit: A Simple yet Effective Diffusion Noise Schedule for Image Editing [42.45138713525929]
効率的な編集では、ソースイメージを潜在空間に反転させる必要があり、このプロセスはDDIMの反転に固有の予測エラーによってしばしば妨げられる。
特異性を排除し、インバージョン安定性を改善し、画像編集のためのより良いノイズ空間を提供する新しいノイズスケジュールであるロジスティックスケジュールを導入する。
提案手法では追加のトレーニングは必要とせず,既存の編集手法と互換性がある。
論文 参考訳(メタデータ) (2024-10-24T14:07:02Z) - Task-Oriented Diffusion Inversion for High-Fidelity Text-based Editing [60.730661748555214]
textbfTask-textbfOriented textbfDiffusion textbfInversion (textbfTODInv) は、特定の編集タスクに適した実際の画像を反転して編集する新しいフレームワークである。
ToDInvは相互最適化によってインバージョンと編集をシームレスに統合し、高い忠実さと正確な編集性を保証する。
論文 参考訳(メタデータ) (2024-08-23T22:16:34Z) - FlexiEdit: Frequency-Aware Latent Refinement for Enhanced Non-Rigid Editing [22.308638156328968]
DDIMはオリジナルのイメージのキー機能とレイアウトを維持するのに不可欠であり、制限に大きく貢献する。
DDIMラテントを精錬することでテキストプロンプト入力の忠実度を向上させるFlexiEditを導入する。
本手法は画像編集,特に複雑な非剛性編集における顕著な進歩を示す。
論文 参考訳(メタデータ) (2024-07-25T08:07:40Z) - Optimisation-Based Multi-Modal Semantic Image Editing [58.496064583110694]
本稿では,複数の編集命令型に対応するために,推論時編集の最適化を提案する。
各損失関数の影響を調整することで、ユーザの好みに合わせてフレキシブルな編集ソリューションを構築することができる。
本手法は,テキスト,ポーズ,スクリブルといった編集条件を用いて評価し,複雑な編集を行う能力を強調した。
論文 参考訳(メタデータ) (2023-11-28T15:31:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。