Fugu-MT 論文翻訳(概要): Bridging the Manifold Gap: Riemannian Residual Line Search for One-Step Image Editing

論文の概要: Bridging the Manifold Gap: Riemannian Residual Line Search for One-Step Image Editing

arxiv url: http://arxiv.org/abs/2606.24844v1
Date: Tue, 23 Jun 2026 17:23:53 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-24 22:16:49.131879
Title: Bridging the Manifold Gap: Riemannian Residual Line Search for One-Step Image Editing
Title（参考訳）: マニフォールドギャップをブリッジする: ワンステップ画像編集のためのリーマン残差線探索
Authors: Hongzhu Yi, Zhongtian Luo, Tong Li, Yiyan Fan, Jungang Xu,
Abstract要約: 1ステップの拡散エディタは、反転と反復最適化を避けるため、高速である。単一のトランスポート更新は、ターゲットのプロンプトを実現するのに十分なアグレッシブで、ソースイメージを保存するのに十分な保守的でなければならない。提案手法は,プロンプトデルタ場の局所時間曲率を推定することにより,より強力な編集を行う。
参考スコア（独自算出の注目度）: 9.026779521768024
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: One-step diffusion editors are fast because they avoid inversion and iterative optimization, but a single transport update must be aggressive enough to realize the target prompt and conservative enough to preserve the source image--and no fixed update strength satisfies both demands across edit types. We treat this tension as a post-hoc candidate-selection problem on top of energy-field transport rather than as a new editing model. Our proposed method, Riemannian Residual Line Search, first builds a stronger edit by estimating the local time curvature of the prompt-delta field and projecting the corrected direction back onto the update norm of the original first-order energy-field transport estimation. It then forms a small residual path from the source image to this strong edit, retains the original first-order output as one candidate, and picks the final image by maximizing target-prompt CLIP alignment. On a 700-sample PIE-Bench++ evaluation across 10 edit type IDs, our method achieves state-of-the-art (SOTA) performance among current one-step update algorithms.
Abstract（参考訳）: インバージョンと反復最適化を避けるため、ワンステップの拡散エディタは高速だが、単一のトランスポート更新はターゲットのプロンプトを実現するのに十分なアグレッシブで、ソースイメージを保存するのに十分な保守的でなければならない。我々は、この緊張を新しい編集モデルとしてではなく、エネルギー-電界輸送上のポストホック候補選択問題として扱う。提案手法であるRiemannian Residual Line Searchは、まず、プロンプトデルタ場の局所時間曲率を推定し、補正された方向を元の1次エネルギー場輸送推定の更新基準に投影することにより、より強力な編集を行う。その後、ソースイメージからこの強い編集までの小さな残留経路を形成し、元の1次出力を1つの候補として保持し、ターゲットプロンプトCLIPアライメントを最大化して最終イメージを選択する。 700サンプルのPIE-Bench++を10個の編集型IDで評価し,現在の1ステップ更新アルゴリズムでSOTA(State-of-the-art)性能を実現する。

関連論文リスト

DirectEdit: Step-Level Accurate Inversion for Flow-Based Image Editing [51.56484100374058]
我々は、事前訓練されたテキスト・ツー・イメージ(T2I)モデルのトレーニング不要な編集方法であるDirectEditを提案する。 DirectEditは、追加の神経機能評価(NFE)を導入することなく、固有の再構成エラーを除去する実験により、DirectEditは効率よく正確な画像編集を実現し、最先端の手法よりも優れたパフォーマンスを提供することが示された。
論文参考訳（メタデータ） (2026-05-04T10:09:18Z)
ChordEdit: One-Step Low-Energy Transport for Image Editing [8.517302920663932]
ChordEditは、高忠実度ワンステップ編集を容易にするモデル非依存、トレーニング不要、反転不要な方法である。我々は、ソースとターゲットの分布間の転送問題として編集をリキャストし、ソースとターゲットのテキストプロンプトで定義する。理論的に基礎と実験的に検証されたアプローチにより、ChordEditは高速で軽量で正確な編集を行うことができる。
論文参考訳（メタデータ） (2026-02-22T07:40:50Z)
Reversible Inversion for Training-Free Exemplar-guided Image Editing [127.97756928865032]
既存のアプローチでは、ソースと参照イメージの関係を学習するために大規模な事前学習が必要となることが多い。標準の逆転はEIEの準最適であり、品質と非効率を損なう。効率的なEIEのためのtextbfReversible Inversion (ReInversion) を導入する。
論文参考訳（メタデータ） (2025-12-01T07:56:06Z)
EditInfinity: Image Editing with Binary-Quantized Generative Models [64.05135380710749]
画像編集のためのバイナリ量子化生成モデルのパラメータ効率適応について検討する。具体的には、画像編集のためのバイナリ量子化生成モデルであるEmphInfinityを適応させるEditInfinityを提案する。テキストの修正と画像スタイルの保存を促進させる,効率的かつ効果的な画像反転機構を提案する。
論文参考訳（メタデータ） (2025-10-23T05:06:24Z)
PostEdit: Posterior Sampling for Efficient Zero-Shot Image Editing [63.38854614997581]
拡散サンプリングプロセスを制御するために後続のスキームを組み込んだPostEditを導入する。提案したPostEditは、未編集領域を正確に保存しながら、最先端の編集性能を実現する。インバージョンもトレーニングも不要で、約1.5秒と18GBのGPUメモリを必要とするため、高品質な結果が得られる。
論文参考訳（メタデータ） (2024-10-07T09:04:50Z)
Eliminating Contextual Prior Bias for Semantic Image Editing via Dual-Cycle Diffusion [35.95513392917737]
Dual-Cycle Diffusionと呼ばれる新しいアプローチは、画像編集をガイドするアンバイアスマスクを生成する。提案手法の有効性を実証し,D-CLIPスコアを0.272から0.283に改善した。
論文参考訳（メタデータ） (2023-02-05T14:30:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。