論文の概要: ResEdit: Residual embeddings for precise generative image editing
- arxiv url: http://arxiv.org/abs/2606.16457v1
- Date: Mon, 15 Jun 2026 09:30:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.273174
- Title: ResEdit: Residual embeddings for precise generative image editing
- Title(参考訳): ResEdit: 正確な生成画像編集のための残留埋め込み
- Authors: Ahmet Canberk Baykal, Valentin Deschaintre, Yannick Hold-Geoffroy, Michael Fischer, Anna Frühstück, Cengiz Öztireli, Iliyan Georgiev,
- Abstract要約: 条件拡散画像生成装置は、反転による編集のために再利用することができる。
残像符号化を付加条件として組み込むことで、アイデンティティの保存性が向上し、編集性が向上することが実証された。
- 参考スコア(独自算出の注目度): 23.52777212647601
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Conditional diffusion image generators can be repurposed for editing through inversion, without the need for large-scale paired fine-tuning data. However, producing high-quality, targeted edits while maintaining image identity and global consistency remains challenging, as weakly conditioned inversion often embeds conflicting image features into the noise. We demonstrate that incorporating a residual image encoding as additional conditioning enables both improved identity preservation and better editability. We optimize this residual encoding to provide a strong conditioning signal for reconstruction, thereby reducing the reliance on inversion and susceptibility to its aforementioned pitfalls. To ensure this residual does not interfere with desired edits, we incorporate a gradient reversal-based optimization strategy that disentangles the residual from the edited condition. We illustrate our method's ability to produce high-fidelity results across precise intrinsic-based editing and relighting, and show proof-of-concept text-guided manipulation.
- Abstract(参考訳): 条件付き拡散画像生成装置は、大規模なペア化された微調整データを必要とせずに、インバージョンによる編集に再利用することができる。
しかし、画像のアイデンティティとグローバルな一貫性を維持しつつ、高品質でターゲットとなる編集を生成することは依然として困難であり、弱い条件の逆転はしばしば競合する画像特徴をノイズに埋め込む。
残像符号化を付加条件として組み込むことで、アイデンティティの保存性が向上し、編集性が向上することが実証された。
この残留エンコーディングを最適化して、復元のための強い条件付け信号を提供することにより、上記の落とし穴に対する反転と感受性への依存を低減する。
この残差が所望の編集に干渉しないよう、我々は、残差を編集条件から切り離す勾配反転に基づく最適化戦略を取り入れた。
本稿では,本手法が本手法の精度の高い編集・リライトにまたがって高忠実度な結果が得られることを示すとともに,概念的テキスト誘導操作の実証を示す。
関連論文リスト
- ResetEdit: Precise Text-guided Editing of Generated Image via Resettable Starting Latent [45.3757356193519]
近年の拡散モデルにより高品質の画像生成が可能となり, ポストジェネレーションの需要が高まっている。
再生可能な潜伏情報を直接生成プロセスに埋め込むプロアクティブな拡散編集フレームワークであるResetEditを提案する。
安定拡散に基づいて構築されたResetEditは、既存のチューニング不要な編集メソッドとシームレスに統合され、制御性と視覚的忠実性の両方において、最先端のベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2026-04-28T02:05:08Z) - EditInfinity: Image Editing with Binary-Quantized Generative Models [64.05135380710749]
画像編集のためのバイナリ量子化生成モデルのパラメータ効率適応について検討する。
具体的には、画像編集のためのバイナリ量子化生成モデルであるEmphInfinityを適応させるEditInfinityを提案する。
テキストの修正と画像スタイルの保存を促進させる,効率的かつ効果的な画像反転機構を提案する。
論文 参考訳(メタデータ) (2025-10-23T05:06:24Z) - DCI: Dual-Conditional Inversion for Boosting Diffusion-Based Image Editing [73.12011187146481]
Diffusionモデル内のインバージョンは、実または生成された画像の潜時雑音表現を復元することを目的としている。
ほとんどの反転アプローチは、復元精度と編集の柔軟性の間の本質的にのトレードオフに悩まされている。
本稿ではDCI(Dual-Conditional Inversion)について紹介する。
論文 参考訳(メタデータ) (2025-06-03T07:46:44Z) - Tight Inversion: Image-Conditioned Inversion for Real Image Editing [47.445919355293896]
本稿では,入力画像自体の最も可能な条件を利用する変換手法であるTight Inversionを紹介する。
この厳密な条件は、モデルの出力の分布を狭め、再構築性と編集性の両方を高める。
論文 参考訳(メタデータ) (2025-02-27T18:51:16Z) - Uniform Attention Maps: Boosting Image Fidelity in Reconstruction and Editing [66.48853049746123]
構造的視点から再構築を解析し、従来の横断的注意を一様注意マップに置き換える新しいアプローチを提案する。
本手法は,ノイズ予測時のテキスト条件の変化による歪みを効果的に抑制する。
実験結果から,本手法は高忠実度画像再構成に優れるだけでなく,実際の画像合成や編集のシナリオにも頑健に機能することが示された。
論文 参考訳(メタデータ) (2024-11-29T12:11:28Z) - High-Fidelity GAN Inversion for Image Attribute Editing [61.966946442222735]
本稿では,画像固有の詳細をよく保存した属性編集を可能にする,GAN(High-fidelity Generative Adversarial Network)インバージョンフレームワークを提案する。
低ビットレートの遅延符号では、再構成された画像や編集された画像の高忠実度の詳細を保存することは困難である。
高忠実度復元のための基準として歪みマップを用いる歪みコンサルテーション手法を提案する。
論文 参考訳(メタデータ) (2021-09-14T11:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。