Fugu-MT 論文翻訳(概要): Local Search GFlowNets

論文の概要: Local Search GFlowNets

arxiv url: http://arxiv.org/abs/2310.02710v2
Date: Fri, 22 Mar 2024 18:49:46 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-27 02:57:27.903046
Title: Local Search GFlowNets
Title（参考訳）: ローカル検索GFlowNets
Authors: Minsu Kim, Taeyoung Yun, Emmanuel Bengio, Dinghuai Zhang, Yoshua Bengio, Sungsoo Ahn, Jinkyoo Park,
Abstract要約: Generative Flow Networks (GFlowNets) は、報酬に比例した離散オブジェクト上の分布を学習するアモータイズされたサンプリング手法である。 GFlowNetsは、多様なサンプルを生成する素晴らしい能力を示していますが、広いサンプル空間での過剰な探索のために、常に高い報酬を持つサンプルを生成するのに苦労することがあります。本稿では,局所探索によるGFlowNetsの学習を提案する。
参考スコア（独自算出の注目度）: 85.0053493167887
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Generative Flow Networks (GFlowNets) are amortized sampling methods that learn a distribution over discrete objects proportional to their rewards. GFlowNets exhibit a remarkable ability to generate diverse samples, yet occasionally struggle to consistently produce samples with high rewards due to over-exploration on wide sample space. This paper proposes to train GFlowNets with local search, which focuses on exploiting high-rewarded sample space to resolve this issue. Our main idea is to explore the local neighborhood via backtracking and reconstruction guided by backward and forward policies, respectively. This allows biasing the samples toward high-reward solutions, which is not possible for a typical GFlowNet solution generation scheme, which uses the forward policy to generate the solution from scratch. Extensive experiments demonstrate a remarkable performance improvement in several biochemical tasks. Source code is available: \url{https://github.com/dbsxodud-11/ls_gfn}.
Abstract（参考訳）: Generative Flow Networks (GFlowNets) は、報酬に比例した離散オブジェクト上の分布を学習するアモータイズされたサンプリング手法である。 GFlowNetsは、多様なサンプルを生成する素晴らしい能力を示していますが、広いサンプル空間での過剰な探索のために、常に高い報酬を持つサンプルを生成するのに苦労することがあります。本稿では,局所探索によるGFlowNetsの学習について提案する。本研究の主目的は, 後進政策と前進政策によるバックトラックと再建を通じて, 地域を探索することである。これは典型的なGFlowNetソリューション生成スキームでは不可能であり、フォワードポリシーを使ってソリューションをゼロから生成する。大規模な実験は、いくつかの生化学的タスクにおいて顕著な性能改善を示す。ソースコードは: \url{https://github.com/dbsxodud-11/ls_gfn}.

関連論文リスト

MG2FlowNet: Accelerating High-Reward Sample Generation via Enhanced MCTS and Greediness Control [19.49552596070782]
Generative Flow Networks (GFlowNets) は、与えられた報酬関数に比例した分布からサンプルを学習することで、多種多様な高次構造化オブジェクトを生成する強力なツールとして登場した。本研究では,モンテカルロ木探索(MCTS)をGFlowNetsサンプリングプロセスに統合し,探索とエクスプロイトを適応的にバランスさせる。本手法は,高次領域の発見速度を早めるだけでなく,生成分布の多様性を保ちながら,連続的に高次領域を生成できる。
論文参考訳（メタデータ） (2025-10-01T12:09:04Z)
Loss-Guided Auxiliary Agents for Overcoming Mode Collapse in GFlowNets [0.7461398179934781]
Loss-Guided GFlowNets(LGGFN)は、GFlowNetのトレーニング損失によって補助的なGFlowNetが探索される新しいアプローチである。 LGGFNは、ベースラインに比べて探索効率とサンプルの多様性を一貫して向上させる。
論文参考訳（メタデータ） (2025-05-21T08:27:10Z)
Global-Order GFlowNets [0.36681882674260474]
Order-Preserving (OP) GFlowNetsは、複雑なマルチオブジェクト(MOO)ブラックボックス最適化問題に対処することに成功した。我々は,Global-Order GFlowNetsを導入し,局所的な秩序をグローバルな秩序に変えることで,これらの対立を解決する。
論文参考訳（メタデータ） (2025-04-03T18:43:52Z)
Embarrassingly Parallel GFlowNets [17.751086304612667]
GFlowNetsは、離散合成ランダム変数に対するMCMCサンプリングに代わる有望な代替品である。 EP-GFlowNet は、$R(cdot) propto R_1(cdot)... R_N(cdot)$ -- の形の製品分布から、例えば並列または連合ベイズ(英語版)でサンプルを採取するための、証明可能な正当な分割・対数法である。
論文参考訳（メタデータ） (2024-06-05T13:59:05Z)
Looking Backward: Retrospective Backward Synthesis for Goal-Conditioned GFlowNets [27.33222647437964]
Generative Flow Networks (GFlowNets) は、報酬に確率のあるオブジェクトを逐次生成するポリシーを学ぶためのアモータイズされたサンプリング手法である。 GFlowNetsは、標準的な強化学習手法とは対照的に、多種多様な高次比例オブジェクトを生成する優れた能力を示す。近年、目標条件付きGFlowNetを学習し、タスクが指定した目標を達成できる単一のGFlowNetをトレーニングすることを目的として、様々な有用なプロパティを取得するための研究が進められている。本稿では,これらの課題に対処するため,RBS(Retrospective Backward Synthesis)という新しい手法を提案する。
論文参考訳（メタデータ） (2024-06-03T09:44:10Z)
Investigating Generalization Behaviours of Generative Flow Networks [2.9323961779599736]
生成フローネットワーク(英: Generative Flow Networks, GFlowNets)は、離散空間上の非正規化確率質量関数を学習するための生成フレームワークである。 GFlowNetの一般化の仮説的なメカニズムを実証的に検証する。
論文参考訳（メタデータ） (2024-02-07T23:02:53Z)
Evolution Guided Generative Flow Networks [10.330009481776454]
Generative Flow Networks(GFlowNets)は、報酬に比例した合成オブジェクトのサンプリングを学ぶ。 GFlowNetsの大きな課題のひとつは、長期間の地平線とまばらな報酬を扱う際に、それらを効果的にトレーニングすることだ。進化的アルゴリズム(EA)を用いたGFlowNetsトレーニングの簡易かつ強力な拡張であるEGFN(Evolution Guided Generative Flow Network)を提案する。
論文参考訳（メタデータ） (2024-02-03T15:28:53Z)
Stochastic Generative Flow Networks [89.34644133901647]
生成フローネットワーク(GFlowNets)は「制御としての推論」のレンズを通して複雑な構造をサンプリングすることを学ぶ既存のGFlowNetsは決定論的環境にのみ適用でき、動的処理によるより一般的なタスクではフェールする。本稿では,GFlowNetsを環境に拡張する新しいアルゴリズムであるGFlowNetsを紹介する。
論文参考訳（メタデータ） (2023-02-19T03:19:40Z)
GFlowOut: Dropout with Generative Flow Networks [76.59535235717631]
モンテカルロ・ドロップアウトは近似推論の比較的安価な方法として広く利用されている。最近の研究は、ドロップアウトマスクを潜伏変数と見なすことができ、変動推論で推測できることを示している。 GFlowOutleveragesは、最近提案されたジェネレーティブフローネットワーク(GFlowNets)の確率的フレームワークを使用して、ドロップアウトマスク上の後部分布を学習する。
論文参考訳（メタデータ） (2022-10-24T03:00:01Z)
Generative Augmented Flow Networks [88.50647244459009]
GFlowNetsに中間報酬を組み込むためにGAFlowNets(Generative Augmented Flow Networks)を提案する。 GAFlowNetsは、エッジベースとステートベース固有の報酬を共同で活用して、探索を改善することができる。
論文参考訳（メタデータ） (2022-10-07T03:33:56Z)
Learning GFlowNets from partial episodes for improved convergence and stability [56.99229746004125]
生成フローネットワーク(GFlowNets)は、非正規化対象密度の下で離散オブジェクトのシーケンシャルサンプリングを訓練するアルゴリズムである。 GFlowNetsの既存のトレーニング目的は、状態または遷移に局所的であるか、あるいはサンプリング軌道全体にわたって報酬信号を伝達する。強化学習におけるTD($lambda$)アルゴリズムにインスパイアされたサブトラジェクティブバランス(subtrajectory balance, SubTB($lambda$)を導入する。
論文参考訳（メタデータ） (2022-09-26T15:44:24Z)
Flow Network based Generative Models for Non-Iterative Diverse Candidate Generation [110.09855163856326]
本稿では,アクションのシーケンスからオブジェクトを生成するためのポリシーを学習する問題について述べる。本稿では,生成過程をフローネットワークとして見たGFlowNetを提案する。提案した目的の任意のグローバルな最小限が、所望の分布から標本化する方針を導出することを証明する。
論文参考訳（メタデータ） (2021-06-08T14:21:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。