論文の概要: Why Pool When You Can Flow? Active Learning with GFlowNets
- arxiv url: http://arxiv.org/abs/2509.00704v1
- Date: Sun, 31 Aug 2025 05:15:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.353256
- Title: Why Pool When You Can Flow? Active Learning with GFlowNets
- Title(参考訳): GFlowNetsによるアクティブラーニング
- Authors: Renfei Zhang, Mohit Pandey, Artem Cherkasov, Martin Ester,
- Abstract要約: 生成能動学習フレームワークBALD-GFlowNetを紹介する。
従来のプールベースの買収を生成サンプリングに置き換えることで、BALD-GFlowNetはラベルなしプールのサイズに依存しないスケーラビリティを実現する。
我々の仮想スクリーニング実験では、BALD-GFlowNetは標準的なBALDベースラインに匹敵する性能を示しながら、より構造的に多様な分子を生成する。
- 参考スコア(独自算出の注目度): 4.578243417267117
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The scalability of pool-based active learning is limited by the computational cost of evaluating large unlabeled datasets, a challenge that is particularly acute in virtual screening for drug discovery. While active learning strategies such as Bayesian Active Learning by Disagreement (BALD) prioritize informative samples, it remains computationally intensive when scaled to libraries containing billions samples. In this work, we introduce BALD-GFlowNet, a generative active learning framework that circumvents this issue. Our method leverages Generative Flow Networks (GFlowNets) to directly sample objects in proportion to the BALD reward. By replacing traditional pool-based acquisition with generative sampling, BALD-GFlowNet achieves scalability that is independent of the size of the unlabeled pool. In our virtual screening experiment, we show that BALD-GFlowNet achieves a performance comparable to that of standard BALD baseline while generating more structurally diverse molecules, offering a promising direction for efficient and scalable molecular discovery.
- Abstract(参考訳): プールベースのアクティブラーニングのスケーラビリティは、大きなラベルのないデータセットを評価する計算コストによって制限される。
Bayesian Active Learning by Disagreement (BALD) のようなアクティブな学習戦略は、情報的サンプルを優先するが、数十億のサンプルを含むライブラリにスケールしても、計算的に集中的である。
本研究では,この問題を回避するための生成能動的学習フレームワークであるBALD-GFlowNetを紹介する。
本手法では,生成フローネットワーク(GFlowNets)を用いて,BALD報酬に比例してオブジェクトを直接サンプリングする。
従来のプールベースの買収を生成サンプリングに置き換えることで、BALD-GFlowNetはラベルなしプールのサイズに依存しないスケーラビリティを実現する。
我々の仮想スクリーニング実験では、BALD-GFlowNetは、より構造的に多様な分子を生成しながら、標準的なBALDベースラインに匹敵する性能を達成し、効率的でスケーラブルな分子発見のための有望な方向を提供する。
関連論文リスト
- Baking Symmetry into GFlowNets [58.932776403471635]
GFlowNetsは、さまざまな候補を高い報酬で生成する上で、有望なパフォーマンスを示している。
本研究は,生成過程における等価な動作を特定することにより,GFlowNetに対称性を統合することを目的とする。
論文 参考訳(メタデータ) (2024-06-08T10:11:10Z) - Random Policy Evaluation Uncovers Policies of Generative Flow Networks [12.294107455811496]
Generative Flow Network(GFlowNet)は、エージェントがポリシーとフロー関数を学習する確率的フレームワークである。
本稿では,GFlowNetsとRLの最も基本的なコンポーネントであるポリシー評価の基本的な関係を明らかにする。
本稿では,GFlowNetsと同様の報酬マッチング効果を達成できる修正ランダムポリシー評価アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-04T11:11:53Z) - Bifurcated Generative Flow Networks [32.40020432840822]
Bifurcated GFlowNets (BN) は、状態フローとエッジベースのフローアロケーションの別々の表現にフローを分解する新しいアプローチである。
BNは,強いベースラインに比べて学習効率と効果を著しく向上することを示した。
論文 参考訳(メタデータ) (2024-06-04T02:12:27Z) - BatchGFN: Generative Flow Networks for Batch Active Learning [80.73649229919454]
BatchGFNは、生成フローネットワークを使用してバッチ報酬に比例したデータポイントのセットをサンプリングする、プールベースのアクティブラーニングのための新しいアプローチである。
提案手法は,おもちゃの回帰問題において,1点当たり1回の前方通過で推定時間に近距離最適効用バッチをサンプリングすることを可能にした。
論文 参考訳(メタデータ) (2023-06-26T20:41:36Z) - Training Energy-Based Normalizing Flow with Score-Matching Objectives [36.0810550035231]
エネルギーベース正規化フロー(EBFlow)と呼ばれる新しいフローベースモデリング手法を提案する。
本研究では,EBFlowをスコアマッチング目的に最適化することにより,線形変換に対するヤコビ行列式の計算を完全に回避できることを実証する。
論文 参考訳(メタデータ) (2023-05-24T15:54:29Z) - Distributional GFlowNets with Quantile Flows [73.73721901056662]
Generative Flow Networks(GFlowNets)は、エージェントが一連の意思決定ステップを通じて複雑な構造を生成するためのポリシーを学ぶ確率的サンプルの新たなファミリーである。
本研究では,GFlowNetの分散パラダイムを採用し,各フロー関数を分散化し,学習中により情報的な学習信号を提供する。
GFlowNet学習アルゴリズムは,リスク不確実性のあるシナリオを扱う上で不可欠な,リスクに敏感なポリシーを学習することができる。
論文 参考訳(メタデータ) (2023-02-11T22:06:17Z) - Generative Augmented Flow Networks [88.50647244459009]
GFlowNetsに中間報酬を組み込むためにGAFlowNets(Generative Augmented Flow Networks)を提案する。
GAFlowNetsは、エッジベースとステートベース固有の報酬を共同で活用して、探索を改善することができる。
論文 参考訳(メタデータ) (2022-10-07T03:33:56Z) - Generative Flow Networks for Discrete Probabilistic Modeling [118.81967600750428]
エネルギーベース生成フローネットワーク(EB-GFN)について述べる。
EB-GFNは高次元離散データのための新しい確率論的モデリングアルゴリズムである。
GFlowNetsは、モード間を混在させるために、大ブロックギブスサンプリングを略して行うことができるかを示す。
論文 参考訳(メタデータ) (2022-02-03T01:27:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。