論文の概要: Flow-Direct: Feedback-Efficient and Reusable Guidance for Flow Models via Non-Parametric Guidance Field
- arxiv url: http://arxiv.org/abs/2605.16348v1
- Date: Fri, 08 May 2026 04:03:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.904868
- Title: Flow-Direct: Feedback-Efficient and Reusable Guidance for Flow Models via Non-Parametric Guidance Field
- Title(参考訳): 流れ方向:非パラメトリック誘導場による流れモデルのフィードバック効率と再利用可能な誘導
- Authors: Kim Yong Tan, Yueming Lyu, Ivor Tsang, Yew-Soon Ong,
- Abstract要約: トレーニング不要のガイダンスにより、事前トレーニングされた拡散とフローモデルにより、アプリケーション固有の目的を最適化できる。
本稿では、永続的なガイダンスフィールドを通じて生成プロセスをガイドするフレームワークであるFlow-Directを提案する。
- 参考スコア(独自算出の注目度): 42.27623008321844
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training-free guidance enables pre-trained diffusion and flow models to optimize application-specific objectives using feedback from external black-box reward functions. However, existing methods are feedback-inefficient because reward feedback is used only transiently to inform a localized gradient approximation or a discrete search decision, and is subsequently discarded. To address this limitation, we propose Flow-Direct, a framework that guides the generation process via a persistent guidance field. Theoretically, this guidance field is analytically derived from the log-density ratio between the base and reward-weighted target distributions; it transports the pre-trained distribution to the target distribution. In practice, the field is implemented as a non-parametric estimator constructed from all accumulated reward-evaluated samples. As more samples are collected during optimization, this empirical guidance field becomes increasingly accurate. This persistent formulation yields two major advantages. First, Flow-Direct is highly feedback-efficient: because every evaluated sample is used to refine the global guidance field, no reward information is wasted. Second, the framework is naturally reusable: once optimization is complete, the collected dataset defines a reusable guidance field for generating novel target samples without additional reward evaluations, and distinct guidance fields can be combined to generate samples that simultaneously satisfy multiple objectives.
- Abstract(参考訳): トレーニングフリーガイダンスにより、トレーニング済みの拡散とフローモデルにより、外部のブラックボックス報酬関数からのフィードバックを使用して、アプリケーション固有の目的を最適化できる。
しかし、報酬フィードバックは局所的な勾配近似や離散的な探索決定を伝達するためにのみ過渡的にのみ使用されるため、既存の手法はフィードバック非効率である。
この制限に対処するために、永続的なガイダンスフィールドを通じて生成プロセスをガイドするフレームワークであるFlow-Directを提案する。
理論的には、この誘導場は、ベースと報酬重み付けされた目標分布の対数密度比から解析的に導出され、事前学習された分布を目標分布へ輸送する。
実際には、このフィールドは、蓄積されたすべての報酬評価サンプルから構築された非パラメトリック推定器として実装される。
最適化中により多くのサンプルが収集されるにつれて、この経験的ガイダンスフィールドはますます正確になる。
この持続的な定式化は2つの大きな利点をもたらす。
第一に、Flow-Directは非常にフィードバック効率が良く、評価されたすべてのサンプルがグローバルガイダンスの分野を洗練するために使用されるため、報酬情報は無駄にされない。
第2に、このフレームワークは自然に再利用されている: 最適化が完了すると、収集されたデータセットは、追加の報酬評価なしで新規ターゲットサンプルを生成する再利用可能なガイダンスフィールドを定義し、異なるガイダンスフィールドを組み合わせて複数の目的を同時に満たすサンプルを生成することができる。
関連論文リスト
- Test-time scaling of diffusions with flow maps [68.79792714591564]
テスト時の拡散モデルを改善するための一般的なレシピは、報酬の勾配を拡散そのものの力学に導入することである。
フローマップを直接扱うことで,簡単な解を提案する。
本研究では, 流図と流速場の関係を利用して, 従来のテスト時間法よりも精度の高いフローマップトラジェクトリ・ティルティング (FMTT) アルゴリズムを構築した。
論文 参考訳(メタデータ) (2025-11-27T18:44:12Z) - Preference Trajectory Modeling via Flow Matching for Sequential Recommendation [50.077447974294586]
シーケンスレコメンデーションは、履歴的なインタラクションシーケンスに基づいて、各ユーザの次の項目を予測する。
FlowRecはシンプルだが効果的なシーケンシャルレコメンデーションフレームワークである。
我々は,ガウス雑音に代えてパーソナライズされた行動に基づく事前分布を構築し,ユーザの嗜好軌跡をモデル化するためのベクトル場を学習する。
論文 参考訳(メタデータ) (2025-08-25T02:55:42Z) - Source-Guided Flow Matching [7.888172595458005]
本稿ではソースガイド型フローマッチングフレームワークを提案する。
事前訓練されたベクトル場をそのまま保ちながら、ソース分布を直接修正する。
これにより、ガイダンス問題は、ソース分布からサンプリングする、明確に定義された問題に還元される。
論文 参考訳(メタデータ) (2025-08-20T15:56:25Z) - Gradient Guidance for Diffusion Models: An Optimization Perspective [45.6080199096424]
本稿では,ユーザ特定目的の最適化に向けて,事前学習した拡散モデルを適用するための勾配ガイダンスの形式について検討する。
我々は,その最適化理論とアルゴリズム設計を体系的に研究するために,誘導拡散の数学的枠組みを確立する。
論文 参考訳(メタデータ) (2024-04-23T04:51:02Z) - Sampling for Model Predictive Trajectory Planning in Autonomous Driving using Normalizing Flows [1.2972104025246092]
本稿では,軌道生成のためのサンプリング手法について検討する。
変分推論の分野を起源とする正規化フローが検討される。
学習に基づく正規化フローモデルは、入力領域のより効率的な探索のために訓練される。
論文 参考訳(メタデータ) (2024-04-15T10:45:12Z) - Diffusion Generative Flow Samplers: Improving learning signals through
partial trajectory optimization [87.21285093582446]
Diffusion Generative Flow Samplers (DGFS) はサンプルベースのフレームワークであり、学習プロセスを短い部分的軌道セグメントに分解することができる。
生成フローネットワーク(GFlowNets)のための理論から着想を得た。
論文 参考訳(メタデータ) (2023-10-04T09:39:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。