論文の概要: A Unified Density Operator View of Flow Control and Merging
- arxiv url: http://arxiv.org/abs/2602.08012v1
- Date: Sun, 08 Feb 2026 15:27:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.927118
- Title: A Unified Density Operator View of Flow Control and Merging
- Title(参考訳): フロー制御とマージの統一密度演算子
- Authors: Riccardo De Santi, Malte Franke, Ya-Ping Hsieh, Andreas Krause,
- Abstract要約: 本稿では,制約ケースとして仮定し,報酬誘導型フローマージを可能にする統一確率空間フレームワークを提案する。
また、リワードガイドフローマージング(RFM)を導入し、報酬誘導フローマージングを標準的な微調整問題に還元するミラー発光方式を提案する。
RFMによる報酬誘導と純フローマージの第一種理論的保証を提供する。
- 参考スコア(独自算出の注目度): 37.902481322917396
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent progress in large-scale flow and diffusion models raised two fundamental algorithmic challenges: (i) control-based reward adaptation of pre-trained flows, and (ii) integration of multiple models, i.e., flow merging. While current approaches address them separately, we introduce a unifying probability-space framework that subsumes both as limit cases, and enables reward-guided flow merging, allowing principled, task-aware combination of multiple pre-trained flows (e.g., merging priors while maximizing drug-discovery utilities). Our formulation renders possible to express a rich family of operators over generative models densities, including intersection (e.g., to enforce safety), union (e.g., to compose diverse models), interpolation (e.g., for discovery), their reward-guided counterparts, as well as complex logical expressions via generative circuits. Next, we introduce Reward-Guided Flow Merging (RFM), a mirror-descent scheme that reduces reward-guided flow merging to a sequence of standard fine-tuning problems. Then, we provide first-of-their-kind theoretical guarantees for reward-guided and pure flow merging via RFM. Ultimately, we showcase the capabilities of the proposed method on illustrative settings providing visually interpretable insights, and apply our method to high-dimensional de-novo molecular design and low-energy conformer generation.
- Abstract(参考訳): 大規模流れモデルと拡散モデルの最近の進歩は、2つの基本的なアルゴリズム上の課題を提起した。
一 事前訓練流の制御に基づく報酬適応及び
(ii)複数のモデルの統合、すなわちフローマージ。
現状のアプローチでは,両者を個別に扱う一方で,限定事例として仮定し,報酬誘導型フローマージを実現し,複数の事前学習フロー(例えば,薬物発見ユーティリティを最大化する前処理)を原則的かつタスク対応で組み合わせることができるような,統一的な確率空間フレームワークを導入している。
我々の定式化は、交叉(例えば、安全を強制するために)、結合(例えば、多様なモデルを構成するために)、補間(例えば、発見のために)、報酬誘導された演算子、および生成回路による複雑な論理的表現を含む、生成モデルの密度よりも豊富な演算子の族を表現することができる。
次に、リワード誘導フローマージング(RFM)を導入し、報酬誘導フローマージングを標準的な微調整問題に還元するミラー発光方式を提案する。
次に,RFMによる報酬誘導と純フローのマージに関する理論的保証を提供する。
最終的に、視覚的に解釈可能なインサイトを提供するイラストレーション環境における提案手法の機能を示し、本手法を高次元デノボ分子設計および低エネルギーコンバータ生成に適用する。
関連論文リスト
- Flow Density Control: Generative Optimization Beyond Entropy-Regularized Fine-Tuning [59.11663802446183]
フローおよび拡散生成モデルは、事前情報を保持しながらタスク固有の目的を最適化するために適応することができる。
本研究では,フロー密度制御(FDC)を導入し,複雑な問題をより単純な微調整タスクの特定のシーケンスに還元する。
我々は,近年のミラーフローの理解を活用して,現実的な仮定の下で提案されたスキームの収束保証を導出する。
論文 参考訳(メタデータ) (2025-11-27T17:19:01Z) - Optimal Control Meets Flow Matching: A Principled Route to Multi-Subject Fidelity [35.95129874095729]
テキスト・トゥ・イメージ(T2I)モデルは単一エンタリティ・プロンプトに優れるが、多目的記述に苦慮する。
マルチオブジェクト忠実度に向けてサンプリングダイナミクスを操るための原理的最適化可能な目的を持った最初の理論的枠組みを導入する。
論文 参考訳(メタデータ) (2025-10-02T17:59:58Z) - A Theory of Multi-Agent Generative Flow Networks [65.53605277612444]
マルチエージェント生成フローネットワーク(MA-GFlowNets)の理論的枠組みを提案する。
MA-GFlowNetsは複数のエージェントに適用して、一連のジョイントアクションを通じて協調的にオブジェクトを生成する。
ジョイントフロートレーニングは、(局所的な)GFNのコレクションをユニークな(グローバルな)GFNとしてトレーニングするための、ローカル・グローバルの原則に基づいている。
論文 参考訳(メタデータ) (2025-09-24T04:01:21Z) - FUDOKI: Discrete Flow-based Unified Understanding and Generation via Kinetic-Optimal Velocities [76.46448367752944]
MLLM(Multimodal large language model)は、単一のフレームワーク内で視覚的理解と画像生成を統一する言語である。
ほとんどの既存のMLLMはAutore(AR)アーキテクチャに依存しており、将来の開発に固有の制限を課している。
本稿では,離散フローマッチングに基づく統一マルチモーダルモデルであるFUDOKIを紹介する。
論文 参考訳(メタデータ) (2025-05-26T15:46:53Z) - Online Reward-Weighted Fine-Tuning of Flow Matching with Wasserstein Regularization [14.320131946691268]
本稿では,フローベース生成モデルのための,使いやすく,理論的に健全な微調整法を提案する。
提案手法は,オンライン報酬重み付け機構を導入することにより,データ多様体内の高次領域の優先順位付けをモデルに導出する。
本手法は,報酬と多様性のトレードオフを制御可能とし,最適な政策収束を実現する。
論文 参考訳(メタデータ) (2025-02-09T22:45:15Z) - Multi-Agent Continuous Control with Generative Flow Networks [23.07260731600958]
Generative Flow Networks (GFlowNets) は, トラジェクトリの最終状態が報酬に比例する分布から, 多様なトラジェクトリを生成することを目的としている。
本稿では,複数エージェントによる協調探索を実現するために,MACFN(Multi-Agent Generative Continuous Flow Networks)法を提案する。
論文 参考訳(メタデータ) (2024-08-13T14:12:03Z) - Combining Wasserstein-1 and Wasserstein-2 proximals: robust manifold learning via well-posed generative flows [6.799748192975493]
低次元多様体に支持された学習分布の連続時間生成フローを定式化する。
We show that the Wasserstein-1 proximal operator regularize $f$-divergences to be compareds。
また, ワッサーシュタイン2近似作用素は, 最適輸送コストを加算することにより, 生成フローの経路を正則化することを示した。
論文 参考訳(メタデータ) (2024-07-16T16:34:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。