論文の概要: Improving Generative Flow Networks with Path Regularization
- arxiv url: http://arxiv.org/abs/2209.15092v1
- Date: Thu, 29 Sep 2022 20:54:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 14:38:54.666509
- Title: Improving Generative Flow Networks with Path Regularization
- Title(参考訳): 経路正規化による生成フローネットワークの改善
- Authors: Anh Do and Duy Dinh and Tan Nguyen and Khuong Nguyen and Stanley Osher
and Nhat Ho
- Abstract要約: 近年,ジェネレーティブ・フロー・ネットワーク(GFlowNets)は,与えられた報酬関数に比例する確率を持つ行動列によって合成対象を生成する学習ポリシーのモデルとして提案されている。
本稿では,GFlowNetの基盤構造に事前制約を課す最適輸送理論に基づく経路正規化手法を提案する。
- 参考スコア(独自算出の注目度): 8.848799220256366
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative Flow Networks (GFlowNets) are recently proposed models for
learning stochastic policies that generate compositional objects by sequences
of actions with the probability proportional to a given reward function. The
central problem of GFlowNets is to improve their exploration and
generalization. In this work, we propose a novel path regularization method
based on optimal transport theory that places prior constraints on the
underlying structure of the GFlowNets. The prior is designed to help the
GFlowNets better discover the latent structure of the target distribution or
enhance its ability to explore the environment in the context of active
learning. The path regularization controls the flow in GFlowNets to generate
more diverse and novel candidates via maximizing the optimal transport
distances between two forward policies or to improve the generalization via
minimizing the optimal transport distances. In addition, we derive an efficient
implementation of the regularization by finding its closed form solutions in
specific cases and a meaningful upper bound that can be used as an
approximation to minimize the regularization term. We empirically demonstrate
the advantage of our path regularization on a wide range of tasks, including
synthetic hypergrid environment modeling, discrete probabilistic modeling, and
biological sequence design.
- Abstract(参考訳): 生成フローネットワーク(gflownets)は、与えられた報酬関数に比例する確率の作用列によって構成対象を生成する確率的ポリシーを学習するためのモデルとして最近提案されている。
GFlowNetsの中心的な問題は、探索と一般化を改善することである。
本研究では,gflownetsの基盤構造に事前制約を課す最適輸送理論に基づく新しい経路正規化法を提案する。
前者は、gflownetsがターゲットディストリビューションの潜在構造をよりよく発見したり、アクティブラーニングのコンテキストで環境を探索する能力を高めるために設計されている。
経路正規化はGFlowNetのフローを制御し、2つのフォワードポリシー間の最適な輸送距離を最大化したり、最適な輸送距離を最小化することで一般化を改善することによって、より多様な新しい候補を生成する。
さらに、特定の場合における閉形式解を見つけることで正規化の効率的な実装と、正規化項を最小化する近似として使用できる有意義な上界を得る。
我々は, 合成ハイパーグリッド環境モデリング, 離散確率モデリング, 生物シーケンス設計など, 幅広いタスクにおける経路規則化の利点を実証的に示す。
関連論文リスト
- Optimizing Backward Policies in GFlowNets via Trajectory Likelihood Maximization [4.158255103170876]
GFlowNetsは、与えられた報酬関数に比例したオブジェクトのサンプルを学習する生成モデルのファミリーである。
近年の研究では,GFlowNetトレーニングとエントロピー規則化強化学習問題との密接な関係が示されている。
本稿では,エントロピー規則化マルコフ決定プロセスにおいて,値関数を直接逐次的に適用する,シンプルな後方ポリシー最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-20T19:12:14Z) - On Generalization for Generative Flow Networks [54.20924253330039]
生成フローネットワーク(GFlowNets)は、非正規化確率分布からのサンプリングの課題に対処するために設計された革新的な学習パラダイムとして登場した。
本稿では,GFlowNetsの文脈で一般化を形式化し,一般化と安定性を結びつけるとともに,これらのモデルの能力を評価する実験を行い,報酬関数の未知の部分を明らかにする。
論文 参考訳(メタデータ) (2024-07-03T13:42:21Z) - Thompson sampling for improved exploration in GFlowNets [75.89693358516944]
生成フローネットワーク(Generative Flow Networks, GFlowNets)は、合成対象物上の分布からのサンプリングを、学習可能なアクションポリシーを用いたシーケンシャルな意思決定問題として扱う、アモータイズされた変分推論アルゴリズムである。
2つの領域において、TS-GFNは、過去の研究で使われたオフ・ポリティクス・サーベイ・ストラテジーよりも、探索を改善し、目標分布への収束を早くすることを示す。
論文 参考訳(メタデータ) (2023-06-30T14:19:44Z) - Stochastic Generative Flow Networks [89.34644133901647]
生成フローネットワーク(GFlowNets)は「制御としての推論」のレンズを通して複雑な構造をサンプリングすることを学ぶ
既存のGFlowNetsは決定論的環境にのみ適用でき、動的処理によるより一般的なタスクではフェールする。
本稿では,GFlowNetsを環境に拡張する新しいアルゴリズムであるGFlowNetsを紹介する。
論文 参考訳(メタデータ) (2023-02-19T03:19:40Z) - Distributional GFlowNets with Quantile Flows [73.73721901056662]
Generative Flow Networks(GFlowNets)は、エージェントが一連の意思決定ステップを通じて複雑な構造を生成するためのポリシーを学ぶ確率的サンプルの新たなファミリーである。
本研究では,GFlowNetの分散パラダイムを採用し,各フロー関数を分散化し,学習中により情報的な学習信号を提供する。
GFlowNet学習アルゴリズムは,リスク不確実性のあるシナリオを扱う上で不可欠な,リスクに敏感なポリシーを学習することができる。
論文 参考訳(メタデータ) (2023-02-11T22:06:17Z) - Learning GFlowNets from partial episodes for improved convergence and
stability [56.99229746004125]
生成フローネットワーク(GFlowNets)は、非正規化対象密度の下で離散オブジェクトのシーケンシャルサンプリングを訓練するアルゴリズムである。
GFlowNetsの既存のトレーニング目的は、状態または遷移に局所的であるか、あるいはサンプリング軌道全体にわたって報酬信号を伝達する。
強化学習におけるTD($lambda$)アルゴリズムにインスパイアされたサブトラジェクティブバランス(subtrajectory balance, SubTB($lambda$)を導入する。
論文 参考訳(メタデータ) (2022-09-26T15:44:24Z) - Trajectory balance: Improved credit assignment in GFlowNets [63.687669765579585]
従来提案したGFlowNetの学習目標,フローマッチング,詳細なバランスは,長いアクションシーケンスをまたいだ非効率な信用伝播の傾向が示唆された。
本稿では,GFlowNetsの新しい学習目標であるトラジェクトリバランスを,従来使用されていた目的に対して,より効率的な代替手段として提案する。
4つの異なる領域の実験において、GFlowNet収束のための軌道バランス目標の利点、生成されたサンプルの多様性、長いアクションシーケンスや大きなアクション空間に対する堅牢性を実証的に実証した。
論文 参考訳(メタデータ) (2022-01-31T14:07:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。