論文の概要: SAM-Flow: Source-Anchored Masked Flow for Training-Free Image Editing
- arxiv url: http://arxiv.org/abs/2606.06228v1
- Date: Thu, 04 Jun 2026 14:36:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.860621
- Title: SAM-Flow: Source-Anchored Masked Flow for Training-Free Image Editing
- Title(参考訳): SAM-Flow:学習不要な画像編集のためのソースアンコール型マスケッドフロー
- Authors: Haowang Cui, Rui Chen, Tao Luo, Tao Guo, Zheng Qin, Jiaze Wang,
- Abstract要約: SAM-Flowは、ローカライズされたトレーニングフリーの画像編集のための、ソースアンコールされたマスキングフローフレームワークである。
正確なセマンティック編集を実現し、背景保存を大幅に改善する。
スタブルディフュージョン3やFLUXのようなメインストリームのフローマッチングバックボーンと、微調整なしで統合できる。
- 参考スコア(独自算出の注目度): 11.868477331606911
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training-free image editing has recently attracted increasing attention due to its ability to modify real images using powerful pre-trained diffusion and flow-matching models without additional training. However, existing inversion-based and differential-flow-based methods usually perform global latent transport, which inevitably propagates editing effects to non-target regions and leads to background leakage. To address this problem, we propose SAM-Flow, a source-anchored masked flow framework for localized training-free image editing. Instead of updating the whole latent representation, SAM-Flow first uses a scout image and token-grounded attention maps to localize the editable semantic regions. It then applies differential velocity updates only within these regions, while anchoring the remaining areas to the source-image latent trajectory. To further improve spatial stability and boundary naturalness, we introduce a time-varying source-anchored projection mechanism with dynamic soft masks, transition regions, and temporal mask accumulation. The proposed method is plug-and-play and can be integrated with mainstream flow-matching backbones such as Stable Diffusion 3 and FLUX without any fine-tuning. Extensive qualitative and quantitative experiments demonstrate that SAM-Flow achieves accurate semantic editing while significantly improving background preservation, providing a simple and general localized editing paradigm for training-free image editing. Code is available at: https://github.com/chwbob/Sam-Flow.
- Abstract(参考訳): トレーニング不要の画像編集は、トレーニングを必要とせず、強力な事前学習拡散モデルとフローマッチングモデルを用いて実際の画像を修正できることから、近年注目を集めている。
しかし、既存のインバージョンベースおよび差分フローベース手法は、通常グローバルな遅延輸送を行い、必然的に非ターゲット領域に編集効果を伝播させ、バックグラウンドリークを引き起こす。
そこで本研究では,学習自由な画像編集のためのソースアンコール型マスキングフローフレームワークであるSAM-Flowを提案する。
SAM-Flowは、潜在表現全体を更新する代わりに、最初にスカウトイメージとトークングラウンドのアテンションマップを使用して、編集可能なセマンティック領域をローカライズする。
次に、これらの領域内でのみ差速度更新を適用し、残りの領域をソースイメージの潜在軌道に固定する。
空間的安定性と境界自然性をさらに向上するため,ダイナミックなソフトマスク,遷移領域,時間的マスク蓄積を備えた時間変化ソースアンコレッドプロジェクション機構を導入する。
提案手法はプラグアンドプレイであり,スタブルディフュージョン3やFLUXなどのメインストリームのフローマッチングバックボーンと一体化可能である。
大規模定性的かつ定量的な実験によりSAM-Flowは背景保存を著しく改善し、訓練不要な画像編集のためのシンプルで汎用的な編集パラダイムを提供するとともに、正確な意味編集を実現することが示されている。
コードは、https://github.com/chwbob/Sam-Flow.comで入手できる。
関連論文リスト
- DirectEdit: Step-Level Accurate Inversion for Flow-Based Image Editing [51.56484100374058]
我々は、事前訓練されたテキスト・ツー・イメージ(T2I)モデルのトレーニング不要な編集方法であるDirectEditを提案する。
DirectEditは、追加の神経機能評価(NFE)を導入することなく、固有の再構成エラーを除去する
実験により、DirectEditは効率よく正確な画像編集を実現し、最先端の手法よりも優れたパフォーマンスを提供することが示された。
論文 参考訳(メタデータ) (2026-05-04T10:09:18Z) - SteerFlow: Steering Rectified Flows for Faithful Inversion-Based Image Editing [9.343095346668665]
SteerFlowはモデルに依存しない編集フレームワークで、ソースの忠実性に関する強力な理論的保証がある。
本稿では,ターゲット編集速度とソース再構成速度を適応的にブレンドして,編集軌道をソースに固定するトラジェクトリ補間法を提案する。
FLUX.1-devとStable Diffusion 3.5 Mediumの実験では、SteerFlowは既存の方法よりも優れた編集品質を実現している。
論文 参考訳(メタデータ) (2026-04-02T07:26:13Z) - Training-free Geometric Image Editing on Diffusion Models [53.38549950608886]
画像内の物体が再配置、再配向、あるいは再形成されるような幾何学的画像編集の課題に取り組む。
本稿では、オブジェクト変換、ソース領域のインペイント、ターゲット領域の洗練を分離する分離パイプラインを提案する。
塗装と精錬は、トレーニングフリーの拡散アプローチであるFreeFineを使って実装されている。
論文 参考訳(メタデータ) (2025-07-31T07:36:00Z) - FlowAlign: Trajectory-Regularized, Inversion-Free Flow-based Image Editing [47.908940130654535]
FlowAlignは、最適な制御ベースの軌道制御による一貫した画像編集のためのインバージョンフリーなフローベースフレームワークである。
我々の終点正規化は、編集プロンプトとのセマンティックアライメントのバランスと、軌道に沿ったソース画像との構造的整合性を示す。
FlowAlignは、ソース保存と編集の制御性の両方において、既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2025-05-29T06:33:16Z) - Stable Flow: Vital Layers for Training-Free Image Editing [74.52248787189302]
拡散モデルはコンテンツ合成と編集の分野に革命をもたらした。
最近のモデルでは、従来のUNetアーキテクチャをDiffusion Transformer (DiT)に置き換えている。
画像形成に欠かせないDiT内の「硝子層」を自動同定する手法を提案する。
次に、実画像編集を可能にするために、フローモデルのための改良された画像反転手法を提案する。
論文 参考訳(メタデータ) (2024-11-21T18:59:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。