論文の概要: GeoEdit: Local Frames for Fast, Training-Free On-Manifold Editing in Diffusion Models
- arxiv url: http://arxiv.org/abs/2604.24238v1
- Date: Mon, 27 Apr 2026 09:47:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.884039
- Title: GeoEdit: Local Frames for Fast, Training-Free On-Manifold Editing in Diffusion Models
- Title(参考訳): GeoEdit: 拡散モデルにおける高速でトレーニング不要なオンマニフォールド編集のためのローカルフレーム
- Authors: Yiming Zhang, Sitong Liu, Ke Li, Zhihong Wu, Alex Cloninger, Melvin Leok,
- Abstract要約: 訓練なしの編集は通常、全ての編集強度の完全な装飾軌跡を再実行し、反復的な洗練が高価になる。
代わりに、小さなローカル更新が繰り返し再合成を置き換えることができるデータ多様体の近くで編集します。
提案アルゴリズムは、初期雑音に対する小さな摂動を通して接フレームを構築し、拡散に基づく投影と小さな接移動を交互に行う。
- 参考スコア(独自算出の注目度): 9.1810262671279
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models are a leading paradigm for data generation, but training-free editing typically re-runs the full denoising trajectory for every edit strength, making iterative refinement expensive. To address this issue, we instead edit near the data manifold, where small local updates can replace repeated re-synthesis. To enable this, we estimate a local manifold tangent space directly from perturbed samples and prove that this sample-based estimator closely approximates the true tangent. Building on this guarantee, we devise a Jacobian-free algorithm that constructs a tangent frame via small perturbations to the initial noise and alternates small tangent moves with diffusion-based projections. Updates within this frame follow principled on-manifold directions while suppressing off-manifold drift, enabling fine-grained edits without full re-diffusion or additional training. Edit strength is controlled by the number of steps for rapid, continuous adjustments that preserve fidelity and plug into existing samplers. Empirically, the resulting tangent directions yield smooth, semantic unsupervised traversals and effective CLIP-guided optimization, demonstrating practical interactive continuous editing.
- Abstract(参考訳): 拡散モデルはデータ生成の第一のパラダイムであるが、トレーニング不要な編集は通常、編集の強さごとに完全なデノイング軌跡を再実行し、反復的な洗練は高価である。
この問題に対処するため、我々はデータ多様体の近くを編集し、小さなローカル更新で繰り返し再合成を置き換えることができる。
これを実現するために、摂動サンプルから直接局所多様体接空間を推定し、このサンプルベース推定器が真の接空間に近似していることを証明する。
この保証に基づいて,初期雑音に対する小さな摂動を通して接フレームを構成するヤコビアンフリーなアルゴリズムを考案し,拡散ベースの投影と小さな接移動を交互に行う。
このフレーム内の更新は、オフマニフォールドドリフトを抑制しながら、オンマニフォールド方向の原則に従っている。
編集強度は、忠実さを保ち、既存のサンプリング装置に差し込む、迅速かつ継続的な調整のためのステップの数によって制御される。
経験的に、得られた接尾辞方向は、スムーズで意味不明なトラバーサルと効果的なCLIP誘導最適化をもたらし、実用的なインタラクティブな連続的な編集を実証する。
関連論文リスト
- SteerFlow: Steering Rectified Flows for Faithful Inversion-Based Image Editing [9.343095346668665]
SteerFlowはモデルに依存しない編集フレームワークで、ソースの忠実性に関する強力な理論的保証がある。
本稿では,ターゲット編集速度とソース再構成速度を適応的にブレンドして,編集軌道をソースに固定するトラジェクトリ補間法を提案する。
FLUX.1-devとStable Diffusion 3.5 Mediumの実験では、SteerFlowは既存の方法よりも優れた編集品質を実現している。
論文 参考訳(メタデータ) (2026-04-02T07:26:13Z) - FlowBypass: Rectified Flow Trajectory Bypass for Training-Free Image Editing [10.304374060580828]
トレーニング不要の画像編集は、その効率性とトレーニングデータからの独立性に注目が集まっている。
この問題に対処する以前の試みでは、一般的にバックボーン固有の機能操作を採用し、一般的な適用性を制限していた。
本稿では, インバージョンと再構成軌道を直接接続するバイパスを構成する, 整形流れを基盤とした, 新規かつ解析的なフレームワークであるFlowBypassを提案する。
論文 参考訳(メタデータ) (2026-02-02T08:37:00Z) - Adaptive Domain Shift in Diffusion Models for Cross-Modality Image Translation [35.54089670586124]
画像の相互変換は不安定で非効率である。
標準拡散アプローチはドメイン間の1つの大域的線型移動に依存することが多い。
生成プロセスに直接ドメインシフトダイナミクスを組み込む。
論文 参考訳(メタデータ) (2026-01-26T16:00:36Z) - On Exact Editing of Flow-Based Diffusion Models [97.0633397035926]
本研究では,フローベース編集を既知ソースによって駆動される分散変換問題として再構成する条件付き速度補正(CVC)を提案する。
CVCは、双対パースペクティブな速度変換機構を導入することにより、分配間変換における速度の役割を再考する。
我々は,CVCが優れた忠実度,セマンティックアライメント,多種多様なタスクに対する信頼性の高い編集動作を一貫して達成していることを示す。
論文 参考訳(メタデータ) (2025-12-30T06:29:20Z) - Edit-Based Flow Matching for Temporal Point Processes [51.33476564706644]
時間的ポイントプロセス(TPP)は、イベントシーケンスを連続的にモデル化するための基本的なツールである。
最近の非自己回帰拡散型モデルでは、ノイズとデータとの連立補間によってこれらの問題を緩和している。
本稿では,TPPの編集操作を挿入,削除,置換することで,ノイズをデータに転送する編集フロープロセスを提案する。
論文 参考訳(メタデータ) (2025-10-07T15:44:12Z) - TAG:Tangential Amplifying Guidance for Hallucination-Resistant Diffusion Sampling [53.61290359948953]
タンジェンシャル増幅誘導(TAG)は、下層の拡散モデルを変更することなく、軌道信号のみで動作する。
この誘導過程を1次テイラー展開を利用して定式化する。
TAGは、最小限の計算加算で拡散サンプリング忠実度を改善する、プラグアンドプレイのアーキテクチャに依存しないモジュールである。
論文 参考訳(メタデータ) (2025-10-06T06:53:29Z) - FlowDirector: Training-Free Flow Steering for Precise Text-to-Video Editing [2.7248421583285265]
FlowDirectorは、新しいインバージョンフリーのビデオ編集フレームワークである。
我々のフレームワークは、編集プロセスをデータ空間の直接進化としてモデル化する。
局所的かつ制御可能な編集を実現するために,注意誘導型マスキング機構を導入する。
論文 参考訳(メタデータ) (2025-06-05T13:54:40Z) - FlowAlign: Trajectory-Regularized, Inversion-Free Flow-based Image Editing [47.908940130654535]
FlowAlignは、最適な制御ベースの軌道制御による一貫した画像編集のためのインバージョンフリーなフローベースフレームワークである。
我々の終点正規化は、編集プロンプトとのセマンティックアライメントのバランスと、軌道に沿ったソース画像との構造的整合性を示す。
FlowAlignは、ソース保存と編集の制御性の両方において、既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2025-05-29T06:33:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。