論文の概要: Reversible Inversion for Training-Free Exemplar-guided Image Editing
- arxiv url: http://arxiv.org/abs/2512.01382v1
- Date: Mon, 01 Dec 2025 07:56:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.751745
- Title: Reversible Inversion for Training-Free Exemplar-guided Image Editing
- Title(参考訳): 訓練不要な模擬画像編集のための可逆的インバージョン
- Authors: Yuke Li, Lianli Gao, Ji Zhang, Pengpeng Zeng, Lichuan Xiang, Hongkai Wen, Heng Tao Shen, Jingkuan Song,
- Abstract要約: 既存のアプローチでは、ソースと参照イメージの関係を学習するために大規模な事前学習が必要となることが多い。
標準の逆転はEIEの準最適であり、品質と非効率を損なう。
効率的なEIEのためのtextbfReversible Inversion (ReInversion) を導入する。
- 参考スコア(独自算出の注目度): 127.97756928865032
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Exemplar-guided Image Editing (EIE) aims to modify a source image according to a visual reference. Existing approaches often require large-scale pre-training to learn relationships between the source and reference images, incurring high computational costs. As a training-free alternative, inversion techniques can be used to map the source image into a latent space for manipulation. However, our empirical study reveals that standard inversion is sub-optimal for EIE, leading to poor quality and inefficiency. To tackle this challenge, we introduce \textbf{Reversible Inversion ({ReInversion})} for effective and efficient EIE. Specifically, ReInversion operates as a two-stage denoising process, which is first conditioned on the source image and subsequently on the reference. Besides, we introduce a Mask-Guided Selective Denoising (MSD) strategy to constrain edits to target regions, preserving the structural consistency of the background. Both qualitative and quantitative comparisons demonstrate that our ReInversion method achieves state-of-the-art EIE performance with the lowest computational overhead.
- Abstract(参考訳): Exemplar-guided Image Editing (EIE)は、画像参照に従ってソースイメージを変更することを目的としている。
既存のアプローチでは、しばしば、ソースと参照画像の関係を学習するために大規模な事前学習を必要とし、高い計算コストを発生させる。
トレーニング不要の代替手段として、インバージョン技術は、ソースイメージを潜在空間にマッピングして操作することができる。
しかし, 実証実験の結果, 標準逆転はEIEに準最適であることが明らかとなり, 品質や非効率性が低下することがわかった。
この課題に対処するために、有効かつ効率的なEIEのための \textbf{Reversible Inversion ({ReInversion}) を導入する。
具体的には、ReInversionは2段階のDenoisingプロセスとして動作し、まずソースイメージに、次に参照に条件付けされる。
さらに,MSD(Mask-Guided Selective Denoising)戦略を導入し,編集を対象領域に制限し,背景の構造的整合性を維持する。
定性的および定量的な比較は,我々のReInversion法が計算オーバーヘッドを最小に抑えながら最先端のEIE性能を実現することを示す。
関連論文リスト
- EditInfinity: Image Editing with Binary-Quantized Generative Models [64.05135380710749]
画像編集のためのバイナリ量子化生成モデルのパラメータ効率適応について検討する。
具体的には、画像編集のためのバイナリ量子化生成モデルであるEmphInfinityを適応させるEditInfinityを提案する。
テキストの修正と画像スタイルの保存を促進させる,効率的かつ効果的な画像反転機構を提案する。
論文 参考訳(メタデータ) (2025-10-23T05:06:24Z) - Training-Free Reward-Guided Image Editing via Trajectory Optimal Control [55.64204232819136]
トレーニング不要な報酬誘導画像編集のための新しいフレームワークを提案する。
提案手法は,既存のインバージョンベースのトレーニングフリーベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2025-09-30T06:34:37Z) - Accurate Latent Inversion for Generative Image Steganography via Rectified Flow [5.404219831398271]
拡散モデルに基づくステレオグラフィーは、高品質な画像を生成し、強靭性を示す能力によって注目されている。
我々は,新しい画像ステガノグラフィー手法である textbfRF-Stego を提案する。
RF-Stegoは, 抽出精度, 画質, 堅牢性, セキュリティ, 生成効率において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2025-08-01T08:46:32Z) - AttentionDrag: Exploiting Latent Correlation Knowledge in Pre-trained Diffusion Models for Image Editing [33.74477787349966]
本研究では,AttentionDragという一段階のポイントベース画像編集手法を提案する。
このフレームワークは、大規模な再最適化や再トレーニングを必要とせずに、セマンティック一貫性と高品質な操作を可能にする。
以上の結果から,最先端の手法をはるかに高速に超越した性能を示す。
論文 参考訳(メタデータ) (2025-06-16T09:42:38Z) - Tight Inversion: Image-Conditioned Inversion for Real Image Editing [47.445919355293896]
本稿では,入力画像自体の最も可能な条件を利用する変換手法であるTight Inversionを紹介する。
この厳密な条件は、モデルの出力の分布を狭め、再構築性と編集性の両方を高める。
論文 参考訳(メタデータ) (2025-02-27T18:51:16Z) - Learning Efficient and Effective Trajectories for Differential Equation-based Image Restoration [59.744840744491945]
本稿では, この手法の軌道最適化を改良し, 復元品質と効率の両立に焦点をあてる。
反復サンプリングに伴うかなりの計算負担を軽減するため,コストを考慮したトラジェクトリー蒸留法を提案する。
提案アルゴリズムを用いて基礎拡散モデル(FLUX)を12Bパラメータで微調整し、7種類の画像復元タスクを処理する統一的なフレームワークを作成する。
論文 参考訳(メタデータ) (2024-10-07T07:46:08Z) - Eta Inversion: Designing an Optimal Eta Function for Diffusion-based Real Image Editing [2.5602836891933074]
実際の画像を編集するための一般的な戦略は、拡散過程を反転させて元の画像のノイズ表現を得る。
拡散反転の現在の方法は、しばしば特定のテキストプロンプトに忠実で、ソースイメージによく似ている編集を生成するのに苦労する。
本稿では, DDIMサンプリング式における$eta$の役割を理論的に解析し, 編集性の向上を図った, 実画像編集のための新規かつ適応的な拡散インバージョン手法を提案する。
論文 参考訳(メタデータ) (2024-03-14T15:07:36Z) - EDICT: Exact Diffusion Inversion via Coupled Transformations [13.996171129586731]
拡散過程(反転と呼ばれる)に入力画像を生成する初期ノイズベクトルを見つけることは重要な問題である。
本稿では,アフィン結合層からインスピレーションを得るための逆変換法であるEDICT(Exact Diffusion Inversion)を提案する。
EDICTは、2つの結合ノイズベクトルを維持することにより、実画像とモデル生成画像の数学的に正確な逆変換を可能にする。
論文 参考訳(メタデータ) (2022-11-22T18:02:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。