Fugu-MT 論文翻訳(概要): Training-free Composition of Pre-trained GFlowNets for Multi-Objective Generation

論文の概要: Training-free Composition of Pre-trained GFlowNets for Multi-Objective Generation

arxiv url: http://arxiv.org/abs/2602.21565v1
Date: Wed, 25 Feb 2026 04:44:46 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-26 18:19:16.706111
Title: Training-free Composition of Pre-trained GFlowNets for Multi-Objective Generation
Title（参考訳）: 複数目的生成のための事前学習GFlowNetの学習不要構成
Authors: Seokwon Yoon, Youngbin Choi, Seunghyuk Cho, Seungbeom Lee, MoonJeong Park, Dongwoo Kim,
Abstract要約: 本稿では,事前学習したGFlowNetを推論時に構成し,微調整や再学習をせずに迅速に適応できる学習自由混合方式を提案する。我々のフレームワークは柔軟で、線形スカラー化から複雑な非線形論理演算子まで多様な報酬結合を処理できる。合成2Dグリッドと実世界の分子生成タスクの実験により,本手法が追加トレーニングを必要とするベースラインに匹敵する性能を達成できることが実証された。
参考スコア（独自算出の注目度）: 8.508577056327498
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Generative Flow Networks (GFlowNets) learn to sample diverse candidates in proportion to a reward function, making them well-suited for scientific discovery, where exploring multiple promising solutions is crucial. Further extending GFlowNets to multi-objective settings has attracted growing interest since real-world applications often involve multiple, conflicting objectives. However, existing approaches require additional training for each set of objectives, limiting their applicability and incurring substantial computational overhead. We propose a training-free mixing policy that composes pre-trained GFlowNets at inference time, enabling rapid adaptation without finetuning or retraining. Importantly, our framework is flexible, capable of handling diverse reward combinations ranging from linear scalarization to complex non-linear logical operators, which are often handled separately in previous literature. We prove that our method exactly recovers the target distribution for linear scalarization and quantify the approximation quality for nonlinear operators through a distortion factor. Experiments on a synthetic 2D grid and real-world molecule-generation tasks demonstrate that our approach achieves performance comparable to baselines that require additional training.
Abstract（参考訳）: Generative Flow Networks(GFlowNets)は、報酬関数に比例して多様な候補をサンプリングすることを学び、複数の有望なソリューションを探索する科学的発見に適している。 GFlowNetsをマルチオブジェクト設定に拡張することは、現実のアプリケーションが複数の競合する目的を含むことが多いため、関心が高まりつつある。しかし、既存のアプローチでは、目的のセットごとに追加のトレーニングが必要であり、適用性を制限し、かなりの計算オーバーヘッドを発生させる。本稿では,事前学習したGFlowNetを推論時に構成し,微調整や再学習をせずに迅速に適応できる学習自由混合方式を提案する。重要なことは、我々のフレームワークは柔軟であり、線形スカラー化から複雑な非線形論理演算子まで多様な報酬結合を処理できる。本手法は線形スカラー化の目標分布を正確に復元し,歪み係数を用いて非線形作用素の近似品質を定量化する。合成2Dグリッドと実世界の分子生成タスクの実験により,本手法が追加トレーニングを必要とするベースラインに匹敵する性能を達成できることが実証された。

関連論文リスト

CollaPipe: Adaptive Segment-Optimized Pipeline Parallelism for Collaborative LLM Training in Heterogeneous Edge Networks [57.95170323315603]
CollaPipeは、コラボレーティブパイプライン並列性とフェデレーションアグリゲーションを統合し、自己進化型ネットワークをサポートする分散学習フレームワークである。 CollaPipeでは、エンコーダ部分は可変サイズのセグメントに適応的に分割され、パイプライン並列トレーニングのためにモバイルデバイスにデプロイされ、デコーダは生成タスクを処理するためにエッジサーバにデプロイされる。トレーニング効率を向上させるために,モデルセグメント,マイクロバッチ,帯域幅,送信電力を適応的に割り当てる共同最適化問題を定式化する。
論文参考訳（メタデータ） (2025-09-24T07:54:01Z)
Learning to Optimize Multi-Objective Alignment Through Dynamic Reward Weighting [48.87957020168614]
マルチリワード学習における以前の研究は、通常、固定重み付き線形スカラー化を使用しており、効果的なオンライン学習を捉えることができない。目的整合性を高めるための2つのアプローチ、オンライン学習のためのもの、宇宙探査のためのものを紹介する。
論文参考訳（メタデータ） (2025-09-14T21:56:35Z)
Beyond the Proxy: Trajectory-Distilled Guidance for Offline GFlowNet Training [36.64849664688883]
Trajectory-Distilled GFlowNet(TD-GFN)は、新しいプロキシフリートレーニングフレームワークである。逆強化学習を通じて、オフライン軌道から高密度で遷移レベルなエッジ報酬を学習する。コンバージェンス速度と最終サンプル品質の両方において、既存のベースラインを大きく上回っている。
論文参考訳（メタデータ） (2025-05-26T15:12:22Z)
Beyond Squared Error: Exploring Loss Design for Enhanced Training of Generative Flow Networks [36.084318189865066]
異なる回帰損失は特定の発散対策に対応し、対応する発散対策の所望の特性に応じて退散損失を設計・解析できることを示す。理論的枠組みに基づいて,シフトドコッシュ,リニアス(1/2),リニアス(1)という3つの新たな回帰損失を提案する。提案した損失は既存のトレーニングアルゴリズムと互換性があり、収束速度、サンプルの多様性、堅牢性に関するアルゴリズムの性能を大幅に向上させる。
論文参考訳（メタデータ） (2024-10-03T15:37:22Z)
Looking Backward: Retrospective Backward Synthesis for Goal-Conditioned GFlowNets [27.33222647437964]
Generative Flow Networks (GFlowNets) は、多種多様なハイリワード候補を生成する顕著な能力を示した。しかし、そのようなモデルの訓練は、極めて少ない報酬のために困難である。この問題を解決するために,textbfRetrospective textbfBackward textbfSynthesis (textbfRBS) という新しい手法を提案する。
論文参考訳（メタデータ） (2024-06-03T09:44:10Z)
Pre-Training and Fine-Tuning Generative Flow Networks [61.90529626590415]
本稿では,GFlowNetの報酬なし事前学習のための新しいアプローチを提案する。自己指導型問題としてトレーニングをフレーミングすることで,候補空間の探索を学習する結果条件付きGFlowNetを提案する。事前学習したOC-GFNモデルにより、下流タスクにおける新しい報酬関数をサンプリングできるポリシーを直接抽出できることを示す。
論文参考訳（メタデータ） (2023-10-05T09:53:22Z)
Distributional GFlowNets with Quantile Flows [73.73721901056662]
Generative Flow Networks(GFlowNets)は、エージェントが一連の意思決定ステップを通じて複雑な構造を生成するためのポリシーを学ぶ確率的サンプルの新たなファミリーである。本研究では,GFlowNetの分散パラダイムを採用し,各フロー関数を分散化し,学習中により情報的な学習信号を提供する。 GFlowNet学習アルゴリズムは,リスク不確実性のあるシナリオを扱う上で不可欠な,リスクに敏感なポリシーを学習することができる。
論文参考訳（メタデータ） (2023-02-11T22:06:17Z)
Learning GFlowNets from partial episodes for improved convergence and stability [56.99229746004125]
生成フローネットワーク(GFlowNets)は、非正規化対象密度の下で離散オブジェクトのシーケンシャルサンプリングを訓練するアルゴリズムである。 GFlowNetsの既存のトレーニング目的は、状態または遷移に局所的であるか、あるいはサンプリング軌道全体にわたって報酬信号を伝達する。強化学習におけるTD($lambda$)アルゴリズムにインスパイアされたサブトラジェクティブバランス(subtrajectory balance, SubTB($lambda$)を導入する。
論文参考訳（メタデータ） (2022-09-26T15:44:24Z)
Trajectory balance: Improved credit assignment in GFlowNets [63.687669765579585]
従来提案したGFlowNetの学習目標,フローマッチング,詳細なバランスは,長いアクションシーケンスをまたいだ非効率な信用伝播の傾向が示唆された。本稿では,GFlowNetsの新しい学習目標であるトラジェクトリバランスを,従来使用されていた目的に対して,より効率的な代替手段として提案する。 4つの異なる領域の実験において、GFlowNet収束のための軌道バランス目標の利点、生成されたサンプルの多様性、長いアクションシーケンスや大きなアクション空間に対する堅牢性を実証的に実証した。
論文参考訳（メタデータ） (2022-01-31T14:07:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。