論文の概要: Delta Velocity Rectified Flow for Text-to-Image Editing
- arxiv url: http://arxiv.org/abs/2509.05342v1
- Date: Mon, 01 Sep 2025 21:51:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.444173
- Title: Delta Velocity Rectified Flow for Text-to-Image Editing
- Title(参考訳): テキスト・画像編集のためのデルタ速度整流流
- Authors: Gaspard Beaudouin, Minghan Li, Jaeyeon Kim, Sunghoon Yoon, Mengyu Wang,
- Abstract要約: 本稿では,テキストから画像への編集のための新しいインバージョンフリーなパス認識編集フレームワークであるDelta Velocity Rectified Flow (DVRF)を提案する。
実験結果から,DVRFは編集品質,忠実度,制御性に優れ,設計上の変更は不要であることが示唆された。
- 参考スコア(独自算出の注目度): 15.665085495430313
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose Delta Velocity Rectified Flow (DVRF), a novel inversion-free, path-aware editing framework within rectified flow models for text-to-image editing. DVRF is a distillation-based method that explicitly models the discrepancy between the source and target velocity fields in order to mitigate over-smoothing artifacts rampant in prior distillation sampling approaches. We further introduce a time-dependent shift term to push noisy latents closer to the target trajectory, enhancing the alignment with the target distribution. We theoretically demonstrate that when this shift is disabled, DVRF reduces to Delta Denoising Score, thereby bridging score-based diffusion optimization and velocity-based rectified-flow optimization. Moreover, when the shift term follows a linear schedule under rectified-flow dynamics, DVRF generalizes the Inversion-free method FlowEdit and provides a principled theoretical interpretation for it. Experimental results indicate that DVRF achieves superior editing quality, fidelity, and controllability while requiring no architectural modifications, making it efficient and broadly applicable to text-to-image editing tasks. Code is available at https://github.com/gaspardbd/DeltaVelocityRectifiedFlow.
- Abstract(参考訳): 本稿では,テキスト・ツー・イメージ編集のための修正フローモデル内に,新しいインバージョンフリーでパス対応の編集フレームワークであるDelta Velocity Rectified Flow (DVRF)を提案する。
DVRF (DVRF) は, 原点と目標速度場の差を明示的にモデル化した蒸留法であり, 従来の蒸留サンプリング手法において, 過度に平滑なアーティファクトを緩和する。
さらに、雑音のある潜伏剤を目標軌道に近づける時間依存シフト項を導入し、目標分布との整合性を高める。
理論的には、このシフトが無効になると、DVRF は Delta Denoising Score に還元され、スコアベース拡散最適化と速度ベース整流最適化がブリッジされる。
さらに、シフト項が整流力学の下で線形スケジュールに従えば、DVRFはインバージョンフリーなFlowEditを一般化し、原理化された理論解釈を提供する。
実験結果から,DVRFの編集品質,忠実度,可制御性は向上するが,アーキテクチャ変更は不要であり,テキスト・画像編集作業に効率よく広く適用可能であることが示された。
コードはhttps://github.com/gaspardbd/DeltaVelocityRectifiedFlowで公開されている。
関連論文リスト
- FlowAlign: Trajectory-Regularized, Inversion-Free Flow-based Image Editing [47.908940130654535]
FlowAlignは、最適な制御ベースの軌道制御による一貫した画像編集のためのインバージョンフリーなフローベースフレームワークである。
我々の終点正規化は、編集プロンプトとのセマンティックアライメントのバランスと、軌道に沿ったソース画像との構造的整合性を示す。
FlowAlignは、ソース保存と編集の制御性の両方において、既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2025-05-29T06:33:16Z) - Taming Rectified Flow for Inversion and Editing [57.3742655030493]
FLUXやOpenSoraのような定流拡散変換器は、画像生成やビデオ生成の分野で優れた性能を発揮している。
その堅牢な生成能力にもかかわらず、これらのモデルは不正確さに悩まされることが多い。
本研究では,修正流の逆流過程における誤差を軽減し,インバージョン精度を効果的に向上する訓練自由サンプリング器RF-rを提案する。
論文 参考訳(メタデータ) (2024-11-07T14:29:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。