論文の概要: Semantic Granularity Navigation in Image Editing
- arxiv url: http://arxiv.org/abs/2605.21190v2
- Date: Sat, 23 May 2026 12:57:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 16:32:37.865977
- Title: Semantic Granularity Navigation in Image Editing
- Title(参考訳): 画像編集における意味的粒度ナビゲーション
- Authors: Liangsi Lu, Minzhe Guo, Xuhang Chen, Yang Shi,
- Abstract要約: NaviEditは、リアルタイム編集のためのトレーニング不要の推論時間コントローラである。
厳密な自己整合契約を通じて、モデルスケールから編集の進捗を分離する。
スケールを制御入力として扱い、意味的に応答する中間スケールに向けて固定ステップ予算を割り当てる。
- 参考スコア(独自算出の注目度): 4.8073791571301125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the generative capabilities of diffusion and flow models, real-image editing remains constrained by a persistent trade-off between semantic editability and structural fidelity. We trace a primary cause of this limitation to the implicit coupling of edit progress with model scale in existing paradigms. Under this coupling, stronger edits typically require visiting noisier states, which spends computation on destabilizing layout before the semantic change is well localized. We introduce NaviEdit, a training-free inference-time controller that decouples edit progress from model scale traversal through a strict self-consistency contract. NaviEdit operates at the rollout level and leaves the underlying pretrained model unchanged. It treats scale as a control input and reallocates a fixed step budget toward semantically responsive intermediate scales instead of destructive high-noise regimes. Experiments show positive average gains across compatible editors and flow backbones, supporting decoupling as a portable inference-time control principle.
- Abstract(参考訳): 拡散とフローモデルの生成能力にもかかわらず、実画像編集は意味的編集性と構造的忠実性の間の永続的なトレードオフによって制約されている。
この制限の主な原因は、既存のパラダイムにおける編集進行とモデルスケールとの暗黙の結合に遡る。
この結合の下では、より強力な編集は一般的に訪問ノイズ状態を必要とし、セマンティックな変更が適切にローカライズされる前に、レイアウトの不安定化に計算に費やす。
NaviEditは、厳密な自己整合性契約を通じて、モデルスケールのトラバースから進捗を分離する、トレーニング不要な推論時間コントローラである。
NaviEditはロールアウトレベルで動作し、基礎となる事前訓練されたモデルを変更しない。
スケールを制御入力として扱い、破壊的なハイノイズレジームではなく、意味的に応答する中間スケールに固定ステップ予算を割り当てる。
実験では、互換性のあるエディタとフローバックボーンで平均的なゲインが得られ、ポータブルな推論時間制御の原則としてデカップリングをサポートする。
関連論文リスト
- GeoEdit: Local Frames for Fast, Training-Free On-Manifold Editing in Diffusion Models [9.1810262671279]
訓練なしの編集は通常、全ての編集強度の完全な装飾軌跡を再実行し、反復的な洗練が高価になる。
代わりに、小さなローカル更新が繰り返し再合成を置き換えることができるデータ多様体の近くで編集します。
提案アルゴリズムは、初期雑音に対する小さな摂動を通して接フレームを構築し、拡散に基づく投影と小さな接移動を交互に行う。
論文 参考訳(メタデータ) (2026-04-27T09:47:02Z) - FlowSlider: Training-Free Continuous Image Editing via Fidelity-Steering Decomposition [0.07646713951724009]
連続画像編集は、ソースイメージの忠実性を保ち、一貫した編集方向を維持しながら、スライダスタイルの編集強度の制御を提供することを目的としている。
本論文では,Rectified Flow で連続的な編集を行うためのトレーニング不要な textitFlowSlider を提案する。
論文 参考訳(メタデータ) (2026-04-02T14:16:06Z) - SteerFlow: Steering Rectified Flows for Faithful Inversion-Based Image Editing [9.343095346668665]
SteerFlowはモデルに依存しない編集フレームワークで、ソースの忠実性に関する強力な理論的保証がある。
本稿では,ターゲット編集速度とソース再構成速度を適応的にブレンドして,編集軌道をソースに固定するトラジェクトリ補間法を提案する。
FLUX.1-devとStable Diffusion 3.5 Mediumの実験では、SteerFlowは既存の方法よりも優れた編集品質を実現している。
論文 参考訳(メタデータ) (2026-04-02T07:26:13Z) - Continuous Control of Editing Models via Adaptive-Origin Guidance [27.623081798640907]
拡散に基づく編集モデルは、意味論と画像編集の強力なツールとして登場した。
AdaOr(Adaptive-Origin Guidance、アダオル)は、標準ガイダンスの原点をアイデンティティ条件付き適応原点で調整する手法である。
本手法は画像および映像の編集作業において,現在のスライダベースの編集手法に比べてスムーズで一貫した制御が可能であることを示す。
論文 参考訳(メタデータ) (2026-02-03T18:33:39Z) - On Exact Editing of Flow-Based Diffusion Models [97.0633397035926]
本研究では,フローベース編集を既知ソースによって駆動される分散変換問題として再構成する条件付き速度補正(CVC)を提案する。
CVCは、双対パースペクティブな速度変換機構を導入することにより、分配間変換における速度の役割を再考する。
我々は,CVCが優れた忠実度,セマンティックアライメント,多種多様なタスクに対する信頼性の高い編集動作を一貫して達成していることを示す。
論文 参考訳(メタデータ) (2025-12-30T06:29:20Z) - FlowAlign: Trajectory-Regularized, Inversion-Free Flow-based Image Editing [47.908940130654535]
FlowAlignは、最適な制御ベースの軌道制御による一貫した画像編集のためのインバージョンフリーなフローベースフレームワークである。
我々の終点正規化は、編集プロンプトとのセマンティックアライメントのバランスと、軌道に沿ったソース画像との構造的整合性を示す。
FlowAlignは、ソース保存と編集の制御性の両方において、既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2025-05-29T06:33:16Z) - Tuning-Free Image Editing with Fidelity and Editability via Unified Latent Diffusion Model [60.82962950960996]
拡散遅延最適化を行うチューニング不要なUnifyEditを導入する。
本研究では, 自己注意保持制約(SA)と相互注意アライメント制約(CA)の2つを開発し, テキストアライメントの強化を図る。
提案手法は,様々な編集作業における構造保存とテキストアライメントのバランスを保ち,他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2025-04-08T01:02:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。