論文の概要: FlowAlign: Trajectory-Regularized, Inversion-Free Flow-based Image Editing
- arxiv url: http://arxiv.org/abs/2505.23145v1
- Date: Thu, 29 May 2025 06:33:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.713761
- Title: FlowAlign: Trajectory-Regularized, Inversion-Free Flow-based Image Editing
- Title(参考訳): FlowAlign: Trajectory-regularized, Inversion-free Flow-based ImageEditing
- Authors: Jeongsol Kim, Yeobin Hong, Jong Chul Ye,
- Abstract要約: 本稿では,一貫した画像編集のためのフローベースフレームワークであるFlowAlignを提案する。
FlowAlignは、ODE軌跡を単純に反転させることで、逆編集をサポートする。
ソース保存性と編集性の両方において既存の手法よりも優れています。
- 参考スコア(独自算出の注目度): 51.99765487172328
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent inversion-free, flow-based image editing methods such as FlowEdit leverages a pre-trained noise-to-image flow model such as Stable Diffusion 3, enabling text-driven manipulation by solving an ordinary differential equation (ODE). While the lack of exact latent inversion is a core advantage of these methods, it often results in unstable editing trajectories and poor source consistency. To address this limitation, we propose FlowAlign, a novel inversion-free flow-based framework for consistent image editing with principled trajectory control. FlowAlign introduces a flow-matching loss as a regularization mechanism to promote smoother and more stable trajectories during the editing process. Notably, the flow-matching loss is shown to explicitly balance semantic alignment with the edit prompt and structural consistency with the source image along the trajectory. Furthermore, FlowAlign naturally supports reverse editing by simply reversing the ODE trajectory, highlighting the reversible and consistent nature of the transformation. Extensive experiments demonstrate that FlowAlign outperforms existing methods in both source preservation and editing controllability.
- Abstract(参考訳): 近年のインバージョンフリーなフローベース画像編集手法であるFlowEditでは、Stable Diffusion 3のような事前訓練されたノイズ対イメージフローモデルを活用し、通常の微分方程式(ODE)を解くことでテキスト駆動の操作を可能にする。
正確な潜伏反転の欠如はこれらの手法のコア・アドバンテージであるが、しばしば不安定な編集軌道とソースの整合性が低下する。
本研究では,この制限に対処するため,一貫した画像編集と軌道制御を行う新しいインバージョンフリーなフローベースフレームワークであるFlowAlignを提案する。
FlowAlignは、フローマッチング損失を正規化メカニズムとして導入し、編集プロセス中によりスムーズで安定した軌跡を促進する。
特に、フローマッチング損失は、編集プロンプトとのセマンティックアライメントと、軌道に沿ったソースイメージとの構造的整合性を明示的にバランスさせることが示される。
さらにFlowAlignは、ODE軌跡を単純に反転させることで、変換の可逆性と一貫性のある性質を強調することで、リバース編集を自然にサポートする。
大規模な実験では、FlowAlignはソースの保存性と編集性の両方において既存のメソッドよりも優れています。
関連論文リスト
- FlowEdit: Inversion-Free Text-Based Editing Using Pre-Trained Flow Models [20.46531356084352]
事前訓練されたテキスト・トゥ・イメージ(T2I)拡散/フローモデルを用いて実際の画像を編集する場合、しばしば画像が対応するノイズマップに逆転する。
本稿では、インバージョンフリー、最適化フリー、モデル非依存のT2Iフローモデルのテキストベースの編集方法であるFlowEditを紹介する。
論文 参考訳(メタデータ) (2024-12-11T18:50:29Z) - Unveil Inversion and Invariance in Flow Transformer for Versatile Image Editing [43.97960454977206]
本稿では,フロートランスを用いた拡散インバージョンと分散制御について解析する。
本稿では,まず速度推定を洗練し,残り誤差を補償する2段階逆転法を提案する。
この機構は、剛性および非剛性操作を許容しながら、非ターゲット内容の同時保存を可能にする。
論文 参考訳(メタデータ) (2024-11-24T13:48:16Z) - Stable Flow: Vital Layers for Training-Free Image Editing [74.52248787189302]
拡散モデルはコンテンツ合成と編集の分野に革命をもたらした。
最近のモデルでは、従来のUNetアーキテクチャをDiffusion Transformer (DiT)に置き換えている。
画像形成に欠かせないDiT内の「硝子層」を自動同定する手法を提案する。
次に、実画像編集を可能にするために、フローモデルのための改良された画像反転手法を提案する。
論文 参考訳(メタデータ) (2024-11-21T18:59:51Z) - Taming Rectified Flow for Inversion and Editing [57.3742655030493]
FLUXやOpenSoraのような定流拡散変換器は、画像生成やビデオ生成の分野で優れた性能を発揮している。
その堅牢な生成能力にもかかわらず、これらのモデルは不正確さに悩まされることが多い。
本研究では,修正流の逆流過程における誤差を軽減し,インバージョン精度を効果的に向上する訓練自由サンプリング器RF-rを提案する。
論文 参考訳(メタデータ) (2024-11-07T14:29:02Z) - Rolling Shutter Correction with Intermediate Distortion Flow Estimation [55.59359977619609]
本稿では,グローバルシャッタ(GS)からRSへの歪み流を直接推定することにより,ローリングシャッタ(RS)歪み画像を補正することを提案する。
既存の手法は通常、RSからGSへの非歪流を用いて補正を行う。
本稿では,歪み流を直接推定し,後方ワープ操作でRS像を補正する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-09T14:40:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。