論文の概要: Controlling Exploration-Exploitation in GFlowNets via Markov Chain Perspectives
- arxiv url: http://arxiv.org/abs/2602.01749v2
- Date: Tue, 03 Feb 2026 06:13:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 16:18:58.858034
- Title: Controlling Exploration-Exploitation in GFlowNets via Markov Chain Perspectives
- Title(参考訳): マルコフ連鎖から見たGFlowNetの探索・探索制御
- Authors: Lin Chen, Samuel Drapeau, Fanghao Shao, Xuekai Zhu, Bo Xue, Yunchong Song, Mathieu Laurière, Zhouhan Lin,
- Abstract要約: Generative Flow Network(GFlowNet)の目的は、前向きと後向きのポリシーの均等な混合を暗黙的に修正することである。
調整可能なパラメータ$$で混合を一般化する$-GFNを提案する。
これにより、探索・探索のダイナミクスを直接制御し、ユニークな流れへの収束を確保しながらモード発見能力を高めることができる。
- 参考スコア(独自算出の注目度): 23.095168795582126
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative Flow Network (GFlowNet) objectives implicitly fix an equal mixing of forward and backward policies, potentially constraining the exploration-exploitation trade-off during training. By further exploring the link between GFlowNets and Markov chains, we establish an equivalence between GFlowNet objectives and Markov chain reversibility, thereby revealing the origin of such constraints, and provide a framework for adapting Markov chain properties to GFlowNets. Building on these theoretical findings, we propose $α$-GFNs, which generalize the mixing via a tunable parameter $α$. This generalization enables direct control over exploration-exploitation dynamics to enhance mode discovery capabilities, while ensuring convergence to unique flows. Across various benchmarks, including Set, Bit Sequence, and Molecule Generation, $α$-GFN objectives consistently outperform previous GFlowNet objectives, achieving up to a $10 \times$ increase in the number of discovered modes.
- Abstract(参考訳): ジェネレーティブ・フロー・ネットワーク(GFlowNet)の目的は、トレーニング中の探索と探索のトレードオフを制限し、前向きと後向きのポリシーの均等な混合を暗黙的に修正することにある。
GFlowNetとマルコフ連鎖の関係をさらに探求することにより、GFlowNetの目的とマルコフ連鎖の可逆性の間に等価性を確立し、そのような制約の起源を明らかにし、GFlowNetにマルコフ連鎖特性を適用するためのフレームワークを提供する。
これらの理論的な知見に基づいて、調整可能なパラメータ$α$を用いて混合を一般化する$α$-GFNを提案する。
この一般化により、探索・探索力学を直接制御し、一意の流れへの収束を確保しつつモード発見能力を高めることができる。
Set、Bit Sequence、Morecule Generationなど、さまざまなベンチマークにおいて、$α$-GFNの目標がGFlowNetの目標を一貫して上回り、発見モードの数の増加を最大10 \times$で達成している。
関連論文リスト
- Generative Flow Networks: a Markov Chain Perspective [93.9910025411313]
我々はマルコフ連鎖を用いたGFlowNetsの新しい視点を提案し、状態空間の性質に関わらずGFlowNetsの統一的な視点を示す。
GFlowNetsをMCMCメソッドと同じ理論的フレームワークに配置することで、両方のフレームワーク間の類似性も特定できます。
論文 参考訳(メタデータ) (2023-07-04T01:28:02Z) - Stochastic Generative Flow Networks [89.34644133901647]
生成フローネットワーク(GFlowNets)は「制御としての推論」のレンズを通して複雑な構造をサンプリングすることを学ぶ
既存のGFlowNetsは決定論的環境にのみ適用でき、動的処理によるより一般的なタスクではフェールする。
本稿では,GFlowNetsを環境に拡張する新しいアルゴリズムであるGFlowNetsを紹介する。
論文 参考訳(メタデータ) (2023-02-19T03:19:40Z) - A theory of continuous generative flow networks [104.93913776866195]
生成フローネットワーク(Generative Flow Networks, GFlowNets)は、非正規化されたターゲット分布からサンプルを抽出するように訓練されたアモータイズされた変分推論アルゴリズムである。
本稿では、既存の離散GFlowNetと、連続的あるいはハイブリッドな状態空間を持つGFlowNetを包含する一般化GFlowNetの理論を提案する。
論文 参考訳(メタデータ) (2023-01-30T00:37:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。