論文の概要: Generative Flow Networks: a Markov Chain Perspective
- arxiv url: http://arxiv.org/abs/2307.01422v1
- Date: Tue, 4 Jul 2023 01:28:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 18:35:33.077954
- Title: Generative Flow Networks: a Markov Chain Perspective
- Title(参考訳): 生成フローネットワーク - Markov Chain の視点から
- Authors: Tristan Deleu, Yoshua Bengio
- Abstract要約: 我々はマルコフ連鎖を用いたGFlowNetsの新しい視点を提案し、状態空間の性質に関わらずGFlowNetsの統一的な視点を示す。
GFlowNetsをMCMCメソッドと同じ理論的フレームワークに配置することで、両方のフレームワーク間の類似性も特定できます。
- 参考スコア(独自算出の注目度): 93.9910025411313
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While Markov chain Monte Carlo methods (MCMC) provide a general framework to
sample from a probability distribution defined up to normalization, they often
suffer from slow convergence to the target distribution when the latter is
highly multi-modal. Recently, Generative Flow Networks (GFlowNets) have been
proposed as an alternative framework to mitigate this issue when samples have a
clear compositional structure, by treating sampling as a sequential decision
making problem. Although they were initially introduced from the perspective of
flow networks, the recent advances of GFlowNets draw more and more inspiration
from the Markov chain literature, bypassing completely the need for flows. In
this paper, we formalize this connection and offer a new perspective for
GFlowNets using Markov chains, showing a unifying view for GFlowNets regardless
of the nature of the state space as recurrent Markov chains. Positioning
GFlowNets under the same theoretical framework as MCMC methods also allows us
to identify the similarities between both frameworks, and most importantly to
highlight their
- Abstract(参考訳): マルコフ連鎖モンテカルロ法(MCMC)は、正規化まで定義された確率分布からサンプリングするための一般的な枠組みを提供するが、後者が高度にマルチモーダルである場合、しばしばターゲット分布への緩やかな収束に悩まされる。
近年,サンプルが明確な構成構造を持つ場合,サンプリングを逐次意思決定問題として扱うことにより,この問題を軽減するための代替フレームワークとして生成フローネットワーク(GFlowNets)が提案されている。
最初はフローネットワークの観点から紹介されたが、近年のGFlowNetsの進歩は、フローの必要性を完全に回避し、マルコフ連鎖の文献からより多くのインスピレーションを得ている。
本稿では、この接続を形式化し、マルコフ連鎖を用いたGFlowNetsの新しい視点を提供し、マルコフ連鎖としての状態空間の性質に関係なくGFlowNetsの統一的な視点を示す。
MCMCメソッドと同じ理論的フレームワークの下でGFlowNetを配置することで、両方のフレームワークの類似性を識別できます。
関連論文リスト
- Multi-Agent Continuous Control with Generative Flow Networks [23.07260731600958]
Generative Flow Networks (GFlowNets) は, トラジェクトリの最終状態が報酬に比例する分布から, 多様なトラジェクトリを生成することを目的としている。
本稿では,複数エージェントによる協調探索を実現するために,MACFN(Multi-Agent Generative Continuous Flow Networks)法を提案する。
論文 参考訳(メタデータ) (2024-08-13T14:12:03Z) - Joint Bayesian Inference of Graphical Structure and Parameters with a
Single Generative Flow Network [59.79008107609297]
本稿では,ベイジアンネットワークの構造上の結合後部を近似する手法を提案する。
サンプリングポリシが2フェーズプロセスに従う単一のGFlowNetを使用します。
パラメータは後部分布に含まれるため、これは局所確率モデルに対してより柔軟である。
論文 参考訳(メタデータ) (2023-05-30T19:16:44Z) - Stochastic Generative Flow Networks [89.34644133901647]
生成フローネットワーク(GFlowNets)は「制御としての推論」のレンズを通して複雑な構造をサンプリングすることを学ぶ
既存のGFlowNetsは決定論的環境にのみ適用でき、動的処理によるより一般的なタスクではフェールする。
本稿では,GFlowNetsを環境に拡張する新しいアルゴリズムであるGFlowNetsを紹介する。
論文 参考訳(メタデータ) (2023-02-19T03:19:40Z) - Distributional GFlowNets with Quantile Flows [73.73721901056662]
Generative Flow Networks(GFlowNets)は、エージェントが一連の意思決定ステップを通じて複雑な構造を生成するためのポリシーを学ぶ確率的サンプルの新たなファミリーである。
本研究では,GFlowNetの分散パラダイムを採用し,各フロー関数を分散化し,学習中により情報的な学習信号を提供する。
GFlowNet学習アルゴリズムは,リスク不確実性のあるシナリオを扱う上で不可欠な,リスクに敏感なポリシーを学習することができる。
論文 参考訳(メタデータ) (2023-02-11T22:06:17Z) - A theory of continuous generative flow networks [104.93913776866195]
生成フローネットワーク(Generative Flow Networks, GFlowNets)は、非正規化されたターゲット分布からサンプルを抽出するように訓練されたアモータイズされた変分推論アルゴリズムである。
本稿では、既存の離散GFlowNetと、連続的あるいはハイブリッドな状態空間を持つGFlowNetを包含する一般化GFlowNetの理論を提案する。
論文 参考訳(メタデータ) (2023-01-30T00:37:56Z) - Rethinking skip connection model as a learnable Markov chain [12.135167279383815]
我々は、学習可能なマルコフ連鎖として定式化できるスキップ接続でモデルの振舞いを深く掘り下げる。
効率的なマルコフ連鎖は、入力データを常により良い方法でターゲットドメインにマップするので好まれる。
残差のようなモデルを学習可能なマルコフ連鎖にするために、簡単なペナル接続のルーチンを提案する。
論文 参考訳(メタデータ) (2022-09-30T07:31:49Z) - Bayesian Structure Learning with Generative Flow Networks [85.84396514570373]
ベイズ構造学習では、データから有向非巡回グラフ(DAG)上の分布を推定することに興味がある。
近年,ジェネレーティブ・フロー・ネットワーク(GFlowNets)と呼ばれる確率モデルのクラスが,ジェネレーティブ・モデリングの一般的なフレームワークとして紹介されている。
DAG-GFlowNetと呼ばれる本手法は,DAGよりも後方の正確な近似を提供する。
論文 参考訳(メタデータ) (2022-02-28T15:53:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。