論文の概要: Guided Path Sampling: Steering Diffusion Models Back on Track with Principled Path Guidance
- arxiv url: http://arxiv.org/abs/2512.22881v1
- Date: Sun, 28 Dec 2025 11:12:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.267631
- Title: Guided Path Sampling: Steering Diffusion Models Back on Track with Principled Path Guidance
- Title(参考訳): ガイド付き経路サンプリング:原則的経路誘導による軌道上の拡散モデル
- Authors: Haosen Li, Wenshuo Chen, Shaofeng Liang, Lei Wang, Haozhe Jia, Yutao Yue,
- Abstract要約: 本稿では,反復的改善のための新しいパラダイムとしてガイドパスサンプリング(GPS)を提案する。
GPSは不安定な外挿を、データ多様体上のサンプリングパスが残るように、原理化された、多様体に制約されたものに置き換える。
GPSは、知覚品質と複雑なプロンプト順守の両方において、既存の手法より優れています。
- 参考スコア(独自算出の注目度): 5.814544128372275
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Iterative refinement methods based on a denoising-inversion cycle are powerful tools for enhancing the quality and control of diffusion models. However, their effectiveness is critically limited when combined with standard Classifier-Free Guidance (CFG). We identify a fundamental limitation: CFG's extrapolative nature systematically pushes the sampling path off the data manifold, causing the approximation error to diverge and undermining the refinement process. To address this, we propose Guided Path Sampling (GPS), a new paradigm for iterative refinement. GPS replaces unstable extrapolation with a principled, manifold-constrained interpolation, ensuring the sampling path remains on the data manifold. We theoretically prove that this correction transforms the error series from unbounded amplification to strictly bounded, guaranteeing stability. Furthermore, we devise an optimal scheduling strategy that dynamically adjusts guidance strength, aligning semantic injection with the model's natural coarse-to-fine generation process. Extensive experiments on modern backbones like SDXL and Hunyuan-DiT show that GPS outperforms existing methods in both perceptual quality and complex prompt adherence. For instance, GPS achieves a superior ImageReward of 0.79 and HPS v2 of 0.2995 on SDXL, while improving overall semantic alignment accuracy on GenEval to 57.45%. Our work establishes that path stability is a prerequisite for effective iterative refinement, and GPS provides a robust framework to achieve it.
- Abstract(参考訳): 退化反転サイクルに基づく反復的改良法は拡散モデルの品質と制御を向上させる強力なツールである。
しかし、それらの効果は標準の分類自由誘導(CFG)と組み合わせると著しく制限される。
CFGの外挿特性は、サンプリングパスをデータ多様体から体系的にプッシュし、近似誤差が分岐し、精製過程を損なう。
そこで我々は,反復的改善のための新しいパラダイムである Guided Path Smpling (GPS) を提案する。
GPSは不安定な補間を、データ多様体上のサンプリングパスが残るように、原理化された、多様体に制約された補間に置き換える。
理論的には、この補正は誤差列を非有界増幅から厳密な有界変換に変換し、安定性を保証する。
さらに,誘導強度を動的に調整し,モデルの自然な粗大な生成プロセスとセマンティックインジェクションを整合させる最適スケジューリング戦略を考案する。
SDXLやHunyuan-DiTのような現代のバックボーンに関する大規模な実験は、GPSが知覚的品質と複雑なプロンプト付着の両方において既存の手法より優れていることを示している。
例えば、GPSはSDXLで0.79、HPS v2で0.2995、GenEvalで全体のセマンティックアライメント精度は57.45%向上した。
我々の研究は、経路安定性が効果的な反復的改善の前提条件であることを確立し、GPSはそれを実現するための堅牢なフレームワークを提供する。
関連論文リスト
- ResAD: Normalized Residual Trajectory Modeling for End-to-End Autonomous Driving [64.42138266293202]
ResADは正規化された残留軌道モデリングフレームワークである。
学習タスクを再編成し、慣性参照からの残留偏差を予測する。
NAVSIMベンチマークでは、ResADはバニラ拡散ポリシーを用いて最先端のPDMS 88.6を達成している。
論文 参考訳(メタデータ) (2025-10-09T17:59:36Z) - RAAG: Ratio Aware Adaptive Guidance [9.525432706814675]
フローベースの生成モデルは驚くべき進歩を遂げた。
推論全体を通じて強力な、固定されたガイダンススケールを適用することは、現代的なアプリケーションに必要な、迅速な、数ステップのサンプリングには適していない。
本稿では,進化率に基づいて早期段階の指導尺度を自動的に減衰させる,シンプルな,理論的に基礎付けられた適応型指導スケジュールを提案する。
論文 参考訳(メタデータ) (2025-08-05T13:41:05Z) - DLBAcalib: Robust Extrinsic Calibration for Non-Overlapping LiDARs Based on Dual LBA [11.721420447780032]
本稿では,マルチLiDARシステムのための新しいターゲットレス外部キャリブレーションフレームワークを提案する。
提案手法は,目標LiDARからの連続走査により,正確な基準点クラウドマップを構築する。
本フレームワークでは,平均翻訳誤差が5mm,回転誤差が0.2deg,初期誤差が0.4m/30degである。
論文 参考訳(メタデータ) (2025-07-12T07:48:02Z) - Inference-Time Scaling of Diffusion Language Models with Particle Gibbs Sampling [70.8832906871441]
我々は、モデルを再訓練することなく、所望の報酬に向けて世代を操る方法を研究する。
従来の手法では、通常は1つの認知軌道内でサンプリングやフィルタを行い、軌道レベルの改善なしに報酬をステップバイステップで最適化する。
本稿では,拡散言語モデル(PG-DLM)の粒子ギブスサンプリングについて紹介する。
論文 参考訳(メタデータ) (2025-07-11T08:00:47Z) - Efficient Sampling for Data-Driven Frequency Stability Constraint via Forward-Mode Automatic Differentiation [5.603382086370097]
本稿では,フォワードモード自動微分による勾配データ生成手法を提案する。
この方法では、元の力学系は、元の状態の感度のダイナミクスを表す新しい状態で拡張される。
提案アルゴリズムは, 非線形微分法と有限差分法と比較して, サンプリングアルゴリズムの優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-21T03:50:11Z) - Adaptive Federated Learning Over the Air [108.62635460744109]
オーバー・ザ・エア・モデル・トレーニングの枠組みの中で,適応勾配法,特にAdaGradとAdamの連合バージョンを提案する。
解析の結果,AdaGrad に基づくトレーニングアルゴリズムは $mathcalO(ln(T) / T 1 - frac1alpha の速度で定常点に収束することがわかった。
論文 参考訳(メタデータ) (2024-03-11T09:10:37Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Pushing the Envelope of Rotation Averaging for Visual SLAM [69.7375052440794]
視覚SLAMシステムのための新しい最適化バックボーンを提案する。
従来の単分子SLAMシステムの精度, 効率, 堅牢性を向上させるために, 平均化を活用している。
我々のアプローチは、公開ベンチマークの最先端技術に対して、同等の精度で最大10倍高速に表示することができる。
論文 参考訳(メタデータ) (2020-11-02T18:02:26Z) - Extrapolation for Large-batch Training in Deep Learning [72.61259487233214]
我々は、バリエーションのホストが、我々が提案する統一されたフレームワークでカバー可能であることを示す。
本稿では,この手法の収束性を証明し,ResNet,LSTM,Transformer上での経験的性能を厳格に評価する。
論文 参考訳(メタデータ) (2020-06-10T08:22:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。