論文の概要: GFlowState: Visualizing the Training of Generative Flow Networks Beyond the Reward
- arxiv url: http://arxiv.org/abs/2604.21830v1
- Date: Thu, 23 Apr 2026 16:22:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.762332
- Title: GFlowState: Visualizing the Training of Generative Flow Networks Beyond the Reward
- Title(参考訳): GFlowState: 逆方向を越えた生成フローネットワークのトレーニングを可視化する
- Authors: Florian Holeczek, Andreas Hinterreiter, Alex Hernandez-Garcia, Marc Streit, Christina Humer,
- Abstract要約: GFlowStateは、生成フローネットワーク(GFlowNets)の学習過程を照らすために設計された視覚分析システムである。
GFlowNetsは、報酬関数に比例してサンプルを生成する確率的フレームワークである。
提案ソリューションでは,サンプリングトラジェクトリの解析,参照データセットに対するサンプル空間の比較,トレーニングダイナミクスの解析を行うことができる。
- 参考スコア(独自算出の注目度): 4.65577767518426
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present GFlowState, a visual analytics system designed to illuminate the training process of Generative Flow Networks (GFlowNets or GFNs). GFlowNets are a probabilistic framework for generating samples proportionally to a reward function. While GFlowNets have proved to be powerful tools in applications such as molecule and material discovery, their training dynamics remain difficult to interpret. Standard machine learning tools allow metric tracking but do not reveal how models explore the sample space, construct sample trajectories, or shift sampling probabilities during training. Our solution, GFlowState, allows users to analyze sampling trajectories, compare the sample space relative to reference datasets, and analyze the training dynamics. To this end, we introduce multiple views, including a chart of candidate rankings, a state projection, a node-link diagram of the trajectory network, and a transition heatmap. These visualizations enable GFlowNet developers and users to investigate sampling behavior and policy evolution, and to identify underexplored regions and sources of training failure. Case studies demonstrate how the system supports debugging and assessing the quality of GFlowNets across application domains. By making the structural dynamics of GFlowNets observable, our work enhances their interpretability and can accelerate GFlowNet development in practice.
- Abstract(参考訳): GFlowStateは、生成フローネットワーク(GFlowNetsまたはGFNs)の学習過程を照らすために設計されたビジュアル分析システムである。
GFlowNetsは、報酬関数に比例してサンプルを生成する確率的フレームワークである。
GFlowNetsは分子や物質発見などのアプリケーションにおいて強力なツールであることが証明されているが、それらのトレーニングダイナミクスは解釈が難しいままである。
標準的な機械学習ツールは、メトリックトラッキングを可能にするが、モデルがどのようにサンプル空間を探索するかを明らかにしたり、サンプル軌道を構築したり、トレーニング中にサンプリング確率をシフトしたりしない。
我々のソリューションであるGFlowStateでは、サンプリングトラジェクトリを分析し、参照データセットと比較してサンプル空間を比較し、トレーニングダイナミクスを解析することができます。
この目的のために、候補ランキングチャート、状態予測、軌道網のノードリンク図、遷移ヒートマップなど、複数のビューを導入している。
これらの視覚化により、GFlowNetの開発者やユーザは、サンプリングの動作とポリシーの進化を調査し、未調査の領域とトレーニング失敗の原因を特定することができる。
ケーススタディでは、アプリケーションがアプリケーションドメイン全体にわたるGFlowNetのデバッグと品質評価をどのようにサポートするかを示す。
GFlowNetの構造的ダイナミクスを観測可能にすることで、我々の研究は解釈可能性を高め、実際にGFlowNetの開発を加速させることができる。
関連論文リスト
- Improving GFlowNets with Monte Carlo Tree Search [6.497027864860203]
近年の研究では,GFlowNetsとエントロピー規則化強化学習の強い関係が明らかにされている。
我々はモンテカルロ木探索(MCTS)を適用してGFlowNetの計画能力を高めることを提案する。
実験により,本手法により,GFlowNetトレーニングのサンプル効率と,事前学習したGFlowNetモデルの生成精度が向上することが示された。
論文 参考訳(メタデータ) (2024-06-19T15:58:35Z) - Investigating Generalization Behaviours of Generative Flow Networks [2.9323961779599736]
生成フローネットワーク(英: Generative Flow Networks, GFlowNets)は、離散空間上の非正規化確率質量関数を学習するための生成フレームワークである。
GFlowNetの一般化の仮説的なメカニズムを実証的に検証する。
論文 参考訳(メタデータ) (2024-02-07T23:02:53Z) - Evolution Guided Generative Flow Networks [10.330009481776454]
Generative Flow Networks(GFlowNets)は、報酬に比例した合成オブジェクトのサンプリングを学ぶ。
GFlowNetsの大きな課題のひとつは、長期間の地平線とまばらな報酬を扱う際に、それらを効果的にトレーニングすることだ。
進化的アルゴリズム(EA)を用いたGFlowNetsトレーニングの簡易かつ強力な拡張であるEGFN(Evolution Guided Generative Flow Network)を提案する。
論文 参考訳(メタデータ) (2024-02-03T15:28:53Z) - Learning to Scale Logits for Temperature-Conditional GFlowNets [77.36931187299896]
温度条件付きGFlowNetのトレーニングを大幅に高速化する新しいアーキテクチャ設計である textitLogit-scaling GFlowNets (Logit-GFN) を提案する。
温度の学習関数がポリシーのロジットを直接スケールするために使用されると、課題は大幅に減少する。
論文 参考訳(メタデータ) (2023-10-04T13:45:56Z) - Stochastic Generative Flow Networks [89.34644133901647]
生成フローネットワーク(GFlowNets)は「制御としての推論」のレンズを通して複雑な構造をサンプリングすることを学ぶ
既存のGFlowNetsは決定論的環境にのみ適用でき、動的処理によるより一般的なタスクではフェールする。
本稿では,GFlowNetsを環境に拡張する新しいアルゴリズムであるGFlowNetsを紹介する。
論文 参考訳(メタデータ) (2023-02-19T03:19:40Z) - Learning GFlowNets from partial episodes for improved convergence and
stability [56.99229746004125]
生成フローネットワーク(GFlowNets)は、非正規化対象密度の下で離散オブジェクトのシーケンシャルサンプリングを訓練するアルゴリズムである。
GFlowNetsの既存のトレーニング目的は、状態または遷移に局所的であるか、あるいはサンプリング軌道全体にわたって報酬信号を伝達する。
強化学習におけるTD($lambda$)アルゴリズムにインスパイアされたサブトラジェクティブバランス(subtrajectory balance, SubTB($lambda$)を導入する。
論文 参考訳(メタデータ) (2022-09-26T15:44:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。