論文の概要: Training-free Composition of Pre-trained GFlowNets for Multi-Objective Generation
- arxiv url: http://arxiv.org/abs/2602.21565v1
- Date: Wed, 25 Feb 2026 04:44:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-26 18:19:16.706111
- Title: Training-free Composition of Pre-trained GFlowNets for Multi-Objective Generation
- Title(参考訳): 複数目的生成のための事前学習GFlowNetの学習不要構成
- Authors: Seokwon Yoon, Youngbin Choi, Seunghyuk Cho, Seungbeom Lee, MoonJeong Park, Dongwoo Kim,
- Abstract要約: 本稿では,事前学習したGFlowNetを推論時に構成し,微調整や再学習をせずに迅速に適応できる学習自由混合方式を提案する。
我々のフレームワークは柔軟で、線形スカラー化から複雑な非線形論理演算子まで多様な報酬結合を処理できる。
合成2Dグリッドと実世界の分子生成タスクの実験により,本手法が追加トレーニングを必要とするベースラインに匹敵する性能を達成できることが実証された。
- 参考スコア(独自算出の注目度): 8.508577056327498
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative Flow Networks (GFlowNets) learn to sample diverse candidates in proportion to a reward function, making them well-suited for scientific discovery, where exploring multiple promising solutions is crucial. Further extending GFlowNets to multi-objective settings has attracted growing interest since real-world applications often involve multiple, conflicting objectives. However, existing approaches require additional training for each set of objectives, limiting their applicability and incurring substantial computational overhead. We propose a training-free mixing policy that composes pre-trained GFlowNets at inference time, enabling rapid adaptation without finetuning or retraining. Importantly, our framework is flexible, capable of handling diverse reward combinations ranging from linear scalarization to complex non-linear logical operators, which are often handled separately in previous literature. We prove that our method exactly recovers the target distribution for linear scalarization and quantify the approximation quality for nonlinear operators through a distortion factor. Experiments on a synthetic 2D grid and real-world molecule-generation tasks demonstrate that our approach achieves performance comparable to baselines that require additional training.
- Abstract(参考訳): Generative Flow Networks(GFlowNets)は、報酬関数に比例して多様な候補をサンプリングすることを学び、複数の有望なソリューションを探索する科学的発見に適している。
GFlowNetsをマルチオブジェクト設定に拡張することは、現実のアプリケーションが複数の競合する目的を含むことが多いため、関心が高まりつつある。
しかし、既存のアプローチでは、目的のセットごとに追加のトレーニングが必要であり、適用性を制限し、かなりの計算オーバーヘッドを発生させる。
本稿では,事前学習したGFlowNetを推論時に構成し,微調整や再学習をせずに迅速に適応できる学習自由混合方式を提案する。
重要なことは、我々のフレームワークは柔軟であり、線形スカラー化から複雑な非線形論理演算子まで多様な報酬結合を処理できる。
本手法は線形スカラー化の目標分布を正確に復元し,歪み係数を用いて非線形作用素の近似品質を定量化する。
合成2Dグリッドと実世界の分子生成タスクの実験により,本手法が追加トレーニングを必要とするベースラインに匹敵する性能を達成できることが実証された。
関連論文リスト
- Beyond the Proxy: Trajectory-Distilled Guidance for Offline GFlowNet Training [36.64849664688883]
Trajectory-Distilled GFlowNet(TD-GFN)は、新しいプロキシフリートレーニングフレームワークである。
逆強化学習を通じて、オフライン軌道から高密度で遷移レベルなエッジ報酬を学習する。
コンバージェンス速度と最終サンプル品質の両方において、既存のベースラインを大きく上回っている。
論文 参考訳(メタデータ) (2025-05-26T15:12:22Z) - Looking Backward: Retrospective Backward Synthesis for Goal-Conditioned GFlowNets [27.33222647437964]
Generative Flow Networks (GFlowNets) は、多種多様なハイリワード候補を生成する顕著な能力を示した。
しかし、そのようなモデルの訓練は、極めて少ない報酬のために困難である。
この問題を解決するために,textbfRetrospective textbfBackward textbfSynthesis (textbfRBS) という新しい手法を提案する。
論文 参考訳(メタデータ) (2024-06-03T09:44:10Z) - Pre-Training and Fine-Tuning Generative Flow Networks [61.90529626590415]
本稿では,GFlowNetの報酬なし事前学習のための新しいアプローチを提案する。
自己指導型問題としてトレーニングをフレーミングすることで,候補空間の探索を学習する結果条件付きGFlowNetを提案する。
事前学習したOC-GFNモデルにより、下流タスクにおける新しい報酬関数をサンプリングできるポリシーを直接抽出できることを示す。
論文 参考訳(メタデータ) (2023-10-05T09:53:22Z) - Distributional GFlowNets with Quantile Flows [73.73721901056662]
Generative Flow Networks(GFlowNets)は、エージェントが一連の意思決定ステップを通じて複雑な構造を生成するためのポリシーを学ぶ確率的サンプルの新たなファミリーである。
本研究では,GFlowNetの分散パラダイムを採用し,各フロー関数を分散化し,学習中により情報的な学習信号を提供する。
GFlowNet学習アルゴリズムは,リスク不確実性のあるシナリオを扱う上で不可欠な,リスクに敏感なポリシーを学習することができる。
論文 参考訳(メタデータ) (2023-02-11T22:06:17Z) - Trajectory balance: Improved credit assignment in GFlowNets [63.687669765579585]
従来提案したGFlowNetの学習目標,フローマッチング,詳細なバランスは,長いアクションシーケンスをまたいだ非効率な信用伝播の傾向が示唆された。
本稿では,GFlowNetsの新しい学習目標であるトラジェクトリバランスを,従来使用されていた目的に対して,より効率的な代替手段として提案する。
4つの異なる領域の実験において、GFlowNet収束のための軌道バランス目標の利点、生成されたサンプルの多様性、長いアクションシーケンスや大きなアクション空間に対する堅牢性を実証的に実証した。
論文 参考訳(メタデータ) (2022-01-31T14:07:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。