論文の概要: Score-Guided Proximal Projection: A Unified Geometric Framework for Rectified Flow Editing
- arxiv url: http://arxiv.org/abs/2603.05761v1
- Date: Thu, 05 Mar 2026 23:44:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:44.696053
- Title: Score-Guided Proximal Projection: A Unified Geometric Framework for Rectified Flow Editing
- Title(参考訳): Score-Guided Proximal Projection:rectified Flow Editingのための統一幾何フレームワーク
- Authors: Vansh Bansal, James G Scott,
- Abstract要約: Rectified Flowモデルは最先端の世代品質を実現するが、正確なタスクのためにそれらを制御することは依然として困難である。
現在のアプローチは「幾何学的ロック」に苦しむ逆法に基づくガイダンスに分岐する
Score-Guided Proximal Projectionは,決定論的最適化と縮尺サンプリングのギャップを埋める統一フレームワークである。
- 参考スコア(独自算出の注目度): 1.0312968200748118
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Rectified Flow (RF) models achieve state-of-the-art generation quality, yet controlling them for precise tasks -- such as semantic editing or blind image recovery -- remains a challenge. Current approaches bifurcate into inversion-based guidance, which suffers from "geometric locking" by rigidly adhering to the source trajectory, and posterior sampling approximations (e.g., DPS), which are computationally expensive and unstable. In this work, we propose Score-Guided Proximal Projection (SGPP), a unified framework that bridges the gap between deterministic optimization and stochastic sampling. We reformulate the recovery task as a proximal optimization problem, defining an energy landscape that balances fidelity to the input with realism from the pre-trained score field. We theoretically prove that this objective induces a normal contraction property, geometrically guaranteeing that out-of-distribution inputs are snapped onto the data manifold, and it effectively reaches the posterior mode constrained to the manifold. Crucially, we demonstrate that SGPP generalizes state-of-the-art editing methods: RF-inversion is effectively a limiting case of our framework. By relaxing the proximal variance, SGPP enables "soft guidance," offering a continuous, training-free trade-off between strict identity preservation and generative freedom.
- Abstract(参考訳): Rectified Flow(RF)モデルは最先端の世代品質を実現するが、セマンティック編集やブラインドイメージリカバリといった、正確なタスクのためにそれらを制御することは依然として難しい課題である。
現在のアプローチでは、ソース軌道に厳密に固執することで「幾何学的ロック」に苦しむインバージョンベースのガイダンスと、計算コストが高く不安定な後続サンプリング近似(eg, DPS)に分岐する。
本研究では,Score-Guided Proximal Projection (SGPP)を提案する。
我々は、回復タスクを近位最適化問題として再構成し、事前学習されたスコアフィールドからの入力とリアル性との整合性をバランスさせるエネルギーランドスケープを定義する。
理論的には、この目的が正規収縮特性を誘導し、分布外入力がデータ多様体にスナップされることを幾何学的に保証し、その多様体に制約された後続モードに効果的に到達する。
重要なことは、SGPPが最先端の編集方法を一般化することを実証している: RF-inversionは、我々のフレームワークの事実上の限界ケースである。
近距離分散を緩和することにより、SGPPは「ソフトガイダンス」を可能にし、厳密なアイデンティティ保存と生成の自由の間の継続的な、トレーニングなしのトレードオフを提供する。
関連論文リスト
- Provably Safe Generative Sampling with Constricting Barrier Functions [1.8377602530643375]
フローベース生成モデルは複雑なデータ分布の学習において顕著な成功を収めた。
本稿では,事前学習した生成モデルのオンラインシールドとして機能する安全フィルタリングフレームワークを提案する。
本機構は, 各サンプリングステップにおいて, 元のモデルからの分布シフトを最小限に抑えながら, 安全なサンプリングを保証する。
論文 参考訳(メタデータ) (2026-02-24T23:06:58Z) - Improving Classifier-Free Guidance of Flow Matching via Manifold Projection [3.6087998976768128]
最適化のレンズによるCFGの原理的解釈を提供する。
CFGサンプリングを多様体制約によるホモトピー最適化として再構成する。
提案手法は, トレーニング不要かつ一貫した生成忠実度, 迅速なアライメント, ガイダンス尺度に対するロバスト性である。
論文 参考訳(メタデータ) (2026-01-29T15:49:31Z) - Sequential Bayesian Optimal Experimental Design in Infinite Dimensions via Policy Gradient Reinforcement Learning [3.2580743227673694]
高忠実性アプローチでは、ネストしたベイズ反転と設計ループの中で、繰り返し前方および随伴したPDEが解かれる。
我々は、SBOEDを有限水平マルコフ決定プロセスとして定式化し、ポリシー段階の強化学習を通じて、償却設計ポリシーを学習する。
汚染源追跡のための逐次マルチセンサ配置に関する数値実験は、高忠実度有限要素法よりも約100倍のスピードアップを示す。
論文 参考訳(メタデータ) (2026-01-09T15:44:49Z) - Guided Path Sampling: Steering Diffusion Models Back on Track with Principled Path Guidance [5.814544128372275]
本稿では,反復的改善のための新しいパラダイムとしてガイドパスサンプリング(GPS)を提案する。
GPSは不安定な外挿を、データ多様体上のサンプリングパスが残るように、原理化された、多様体に制約されたものに置き換える。
GPSは、知覚品質と複雑なプロンプト順守の両方において、既存の手法より優れています。
論文 参考訳(メタデータ) (2025-12-28T11:12:56Z) - Aligning Latent Spaces with Flow Priors [72.24305287508474]
本稿では,学習可能な潜在空間を任意の目標分布に整合させるための新しいフレームワークを提案する。
特に,提案手法は計算コストの高い確率評価を排除し,最適化時のODE解決を回避する。
論文 参考訳(メタデータ) (2025-06-05T16:59:53Z) - On the Convergence of DP-SGD with Adaptive Clipping [56.24689348875711]
勾配クリッピングによるグラディエントDescentは、微分プライベート最適化を実現するための強力な技術である。
本稿では,量子クリッピング(QC-SGD)を用いたSGDの総合収束解析について述べる。
本稿では,QC-SGDが一定閾値クリッピングSGDに類似したバイアス問題にどのように悩まされているかを示す。
論文 参考訳(メタデータ) (2024-12-27T20:29:47Z) - Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.09480867526656]
人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。
過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。
報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文 参考訳(メタデータ) (2024-05-26T05:38:50Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。