論文の概要: A Theory of Non-Acyclic Generative Flow Networks
- arxiv url: http://arxiv.org/abs/2312.15246v1
- Date: Sat, 23 Dec 2023 12:58:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 19:01:54.430829
- Title: A Theory of Non-Acyclic Generative Flow Networks
- Title(参考訳): 非非環状生成フローネットワークの理論
- Authors: Leo Maxime Brunswic and Yinchuan Li and Yushun Xu and Shangling Jui
and Lizhuang Ma
- Abstract要約: 我々は,GFlowNetの応用範囲を制限する仮説の緩和に寄与する。
サイクル制限のない連続状態空間を含む可測空間上でGFlowNetsの理論を拡張する。
今までの損失はサイクルに留まり、この問題を解決するための損失のファミリーを定義しています。
- 参考スコア(独自算出の注目度): 42.00774632491589
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: GFlowNets is a novel flow-based method for learning a stochastic policy to
generate objects via a sequence of actions and with probability proportional to
a given positive reward. We contribute to relaxing hypotheses limiting the
application range of GFlowNets, in particular: acyclicity (or lack thereof). To
this end, we extend the theory of GFlowNets on measurable spaces which includes
continuous state spaces without cycle restrictions, and provide a
generalization of cycles in this generalized context. We show that losses used
so far push flows to get stuck into cycles and we define a family of losses
solving this issue. Experiments on graphs and continuous tasks validate those
principles.
- Abstract(参考訳): GFlowNetsは、与えられた正の報酬に比例した確率で、一連のアクションを通してオブジェクトを生成する確率ポリシーを学ぶための、新しいフローベースの方法である。
我々は,GFlowNetsの適用範囲を制限する仮説,特に非循環性(あるいはその欠如)の緩和に寄与する。
この目的のために、サイクル制限のない連続状態空間を含む可測空間上でのGFlowNetsの理論を拡張し、この一般化された文脈におけるサイクルの一般化を提供する。
これまでのプッシュフローで使われた損失がサイクルに収まることを示し、この問題を解決する損失のファミリーを定義する。
グラフと連続タスクの実験は、これらの原則を検証する。
関連論文リスト
- On Generalization for Generative Flow Networks [54.20924253330039]
生成フローネットワーク(GFlowNets)は、非正規化確率分布からのサンプリングの課題に対処するために設計された革新的な学習パラダイムとして登場した。
本稿では,GFlowNetsの文脈で一般化を形式化し,一般化と安定性を結びつけるとともに,これらのモデルの能力を評価する実験を行い,報酬関数の未知の部分を明らかにする。
論文 参考訳(メタデータ) (2024-07-03T13:42:21Z) - Investigating Generalization Behaviours of Generative Flow Networks [3.4642376250601017]
GFlowNetの一般化の仮説的なメカニズムを実証的に検証する。
GFlowNetsが近似的に学習する関数は、一般化を促進する暗黙の基盤構造を持つ。
また、GFlowNetsはオフラインおよび非政治のトレーニングに敏感であることもわかっていますが、GFlowNetsが暗黙的に学んだ報酬は、トレーニングディストリビューションの変更に対して堅牢です。
論文 参考訳(メタデータ) (2024-02-07T23:02:53Z) - Generative Flow Networks as Entropy-Regularized RL [4.857649518812728]
生成フローネットワーク(ジェネレーティブフローネットワーク、英:generative flow network、GFlowNets)は、一連の行動を通じて与えられた報酬に比例確率を持つ合成対象をサンプリングするためのポリシーを訓練する手法である。
生成フローネットワークの学習作業は,エントロピー規則化強化学習問題として効率的に行うことができることを示す。
先に報告した結果とは対照的に,エントロピー的RLアプローチは,既存のGFlowNetトレーニング手法と競合する可能性がある。
論文 参考訳(メタデータ) (2023-10-19T17:31:40Z) - CFlowNets: Continuous Control with Generative Flow Networks [23.093316128475564]
探索制御タスクの強化学習の代替として,ジェネレーティブフローネットワーク(GFlowNets)を用いることができる。
本稿では,連続制御タスクに適用可能な生成連続フローネットワーク(CFlowNets)を提案する。
論文 参考訳(メタデータ) (2023-03-04T14:37:47Z) - Stochastic Generative Flow Networks [89.34644133901647]
生成フローネットワーク(GFlowNets)は「制御としての推論」のレンズを通して複雑な構造をサンプリングすることを学ぶ
既存のGFlowNetsは決定論的環境にのみ適用でき、動的処理によるより一般的なタスクではフェールする。
本稿では,GFlowNetsを環境に拡張する新しいアルゴリズムであるGFlowNetsを紹介する。
論文 参考訳(メタデータ) (2023-02-19T03:19:40Z) - A theory of continuous generative flow networks [104.93913776866195]
生成フローネットワーク(Generative Flow Networks, GFlowNets)は、非正規化されたターゲット分布からサンプルを抽出するように訓練されたアモータイズされた変分推論アルゴリズムである。
本稿では、既存の離散GFlowNetと、連続的あるいはハイブリッドな状態空間を持つGFlowNetを包含する一般化GFlowNetの理論を提案する。
論文 参考訳(メタデータ) (2023-01-30T00:37:56Z) - Trajectory balance: Improved credit assignment in GFlowNets [63.687669765579585]
従来提案したGFlowNetの学習目標,フローマッチング,詳細なバランスは,長いアクションシーケンスをまたいだ非効率な信用伝播の傾向が示唆された。
本稿では,GFlowNetsの新しい学習目標であるトラジェクトリバランスを,従来使用されていた目的に対して,より効率的な代替手段として提案する。
4つの異なる領域の実験において、GFlowNet収束のための軌道バランス目標の利点、生成されたサンプルの多様性、長いアクションシーケンスや大きなアクション空間に対する堅牢性を実証的に実証した。
論文 参考訳(メタデータ) (2022-01-31T14:07:49Z) - GFlowNet Foundations [66.69854262276391]
Generative Flow Networks (GFlowNets) は、多様な候補をアクティブな学習コンテキストでサンプリングする方法として導入された。
GFlowNetのさらなる理論的性質について述べる。
論文 参考訳(メタデータ) (2021-11-17T17:59:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。