論文の概要: SteerFlow: Steering Rectified Flows for Faithful Inversion-Based Image Editing
- arxiv url: http://arxiv.org/abs/2604.01715v1
- Date: Thu, 02 Apr 2026 07:26:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.587567
- Title: SteerFlow: Steering Rectified Flows for Faithful Inversion-Based Image Editing
- Title(参考訳): SteerFlow: 忠実なインバージョンベースの画像編集のためのステアリング整流
- Authors: Thinh Dao, Zhen Wang, Kien T. Pham, Long Chen,
- Abstract要約: SteerFlowはモデルに依存しない編集フレームワークで、ソースの忠実性に関する強力な理論的保証がある。
本稿では,ターゲット編集速度とソース再構成速度を適応的にブレンドして,編集軌道をソースに固定するトラジェクトリ補間法を提案する。
FLUX.1-devとStable Diffusion 3.5 Mediumの実験では、SteerFlowは既存の方法よりも優れた編集品質を実現している。
- 参考スコア(独自算出の注目度): 9.343095346668665
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in flow-based generative models have enabled training-free, text-guided image editing by inverting an image into its latent noise and regenerating it under a new target conditional guidance. However, existing methods struggle to preserve source fidelity: higher-order solvers incur additional model inferences, truncated inversion constrains editability, and feature injection methods lack architectural transferability. To address these limitations, we propose SteerFlow, a model-agnostic editing framework with strong theoretical guarantees on source fidelity. In the forward process, we introduce an Amortized Fixed-Point Solver that implicitly straightens the forward trajectory by enforcing velocity consistency across consecutive timesteps, yielding a high-fidelity inverted latent. In the backward process, we introduce Trajectory Interpolation, which adaptively blends target-editing and source-reconstruction velocities to keep the editing trajectory anchored to the source. To further improve background preservation, we introduce an Adaptive Masking mechanism that spatially constrains the editing signal with concept-guided segmentation and source-target velocity differences. Extensive experiments on FLUX.1-dev and Stable Diffusion 3.5 Medium demonstrate that SteerFlow consistently achieves better editing quality than existing methods. Finally, we show that SteerFlow extends naturally to a complex multi-turn editing paradigm without accumulating drift.
- Abstract(参考訳): 近年のフローベース生成モデルの進歩により、画像を潜在雑音に反転させ、新たな目標条件下で再生することにより、トレーニング不要でテキストガイド付き画像編集が可能になった。
しかし、既存のメソッドはソースの忠実性を維持するのに苦労している。高階のソルバは追加のモデル推論、切り詰められた反転制約の編集可能性、そして機能注入メソッドはアーキテクチャの転送性に欠ける。
このような制約に対処するため,モデルに依存しない編集フレームワークであるSteerFlowを提案する。
前処理では、連続する時間ステップ間で速度の整合性を強制することにより、前方軌道を暗黙的に整列させ、高忠実度逆潜子を生じるアモルティフィック固定点ソルバーを導入する。
逆方向のプロセスでは、ターゲット編集とソース再構成の速度を適応的にブレンドして、編集路をソースに固定するトラジェクトリ補間を導入する。
背景保存をさらに改善するため,空間的に編集信号に概念誘導セグメンテーションとソース目標速度差を制約するアダプティブ・マスキング機構を導入する。
FLUX.1-devとStable Diffusion 3.5 Mediumの大規模な実験は、SteerFlowが既存の方法よりも優れた編集品質を一貫して達成していることを示している。
最後に,SteerFlowはドリフトを蓄積することなく,複雑なマルチターン編集パラダイムに自然に拡張可能であることを示す。
関連論文リスト
- FlowBypass: Rectified Flow Trajectory Bypass for Training-Free Image Editing [10.304374060580828]
トレーニング不要の画像編集は、その効率性とトレーニングデータからの独立性に注目が集まっている。
この問題に対処する以前の試みでは、一般的にバックボーン固有の機能操作を採用し、一般的な適用性を制限していた。
本稿では, インバージョンと再構成軌道を直接接続するバイパスを構成する, 整形流れを基盤とした, 新規かつ解析的なフレームワークであるFlowBypassを提案する。
論文 参考訳(メタデータ) (2026-02-02T08:37:00Z) - On Exact Editing of Flow-Based Diffusion Models [97.0633397035926]
本研究では,フローベース編集を既知ソースによって駆動される分散変換問題として再構成する条件付き速度補正(CVC)を提案する。
CVCは、双対パースペクティブな速度変換機構を導入することにより、分配間変換における速度の役割を再考する。
我々は,CVCが優れた忠実度,セマンティックアライメント,多種多様なタスクに対する信頼性の高い編集動作を一貫して達成していることを示す。
論文 参考訳(メタデータ) (2025-12-30T06:29:20Z) - FlowAlign: Trajectory-Regularized, Inversion-Free Flow-based Image Editing [47.908940130654535]
FlowAlignは、最適な制御ベースの軌道制御による一貫した画像編集のためのインバージョンフリーなフローベースフレームワークである。
我々の終点正規化は、編集プロンプトとのセマンティックアライメントのバランスと、軌道に沿ったソース画像との構造的整合性を示す。
FlowAlignは、ソース保存と編集の制御性の両方において、既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2025-05-29T06:33:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。