論文の概要: Learning Shortest Paths with Generative Flow Networks
- arxiv url: http://arxiv.org/abs/2603.01786v1
- Date: Mon, 02 Mar 2026 12:12:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.859357
- Title: Learning Shortest Paths with Generative Flow Networks
- Title(参考訳): 生成フローネットワークによる最短経路の学習
- Authors: Nikita Morozov, Ian Maksimov, Daniil Tiapkin, Sergey Samsonov,
- Abstract要約: 任意のグラフにおけるパスフィンディング問題は、非環状GFlowNetをフロー正規化でトレーニングすることで解決できることを示す。
置換環境におけるパスフィンディングとルービックキューブの解法における手法の性能を実験的に実証した。
- 参考スコア(独自算出の注目度): 13.611450488723394
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present a novel learning framework for finding shortest paths in graphs utilizing Generative Flow Networks (GFlowNets). First, we examine theoretical properties of GFlowNets in non-acyclic environments in relation to shortest paths. We prove that, if the total flow is minimized, forward and backward policies traverse the environment graph exclusively along shortest paths between the initial and terminal states. Building on this result, we show that the pathfinding problem in an arbitrary graph can be solved by training a non-acyclic GFlowNet with flow regularization. We experimentally demonstrate the performance of our method in pathfinding in permutation environments and in solving Rubik's Cubes. For the latter problem, our approach shows competitive results with state-of-the-art machine learning approaches designed specifically for this task in terms of the solution length, while requiring smaller search budget at test-time.
- Abstract(参考訳): 本稿では,生成フローネットワーク(GFlowNets)を用いたグラフの最短経路探索のための新しい学習フレームワークを提案する。
まず,非循環環境におけるGFlowNetの理論的特性を最短経路に関して検討する。
総フローが最小化された場合、前と後ろのポリシーは、初期状態と終端状態の間の最短経路に沿ってのみ環境グラフを横切ることを証明している。
この結果に基づいて,非環状GFlowNetをフロー正規化でトレーニングすることにより,任意のグラフにおけるパスフィンディング問題を解くことができることを示す。
置換環境におけるパスフィンディングとルービックキューブの解法における手法の性能を実験的に実証した。
後者の問題に対して,本手法は,この課題に特化して設計された最先端の機械学習手法と競合する結果を示すとともに,テスト時により少ない検索予算を必要とする。
関連論文リスト
- Exploration through Generation: Applying GFlowNets to Structured Search [0.0]
この研究は、トラベリングセールスパーソン問題、最小スパンニングツリー、最短パスという3つのグラフ最適化問題に生成フローネットワーク(GFlowNets)を適用した。
GFlowNetsは、報酬関数に比例してソリューションをサンプリングすることを学ぶ生成モデルである。
さまざまなサイズのベンチマークインスタンスの実験は、GFlowNetsが最適なソリューションを見つけることを学ぶことを示している。
論文 参考訳(メタデータ) (2025-10-23T20:43:09Z) - Knowledge-Guided Machine Learning for Stabilizing Near-Shortest Path Routing [3.595536209220219]
本稿では,局所的なルーティングポリシーを学習するために,単一のグラフからデータサンプルを少数必要とするような単純なアルゴリズムを提案する。
GreedyTensileルーティングと呼ばれる新しいポリシーを学びます。
本稿では,Greedy Tensileルーティングの実行時の説明可能性と超低レイテンシ動作について述べる。
論文 参考訳(メタデータ) (2025-09-08T12:56:42Z) - Unsupervised Learning for the Elementary Shortest Path Problem [5.617211365270248]
プライマリ・ショート・パス問題(英語版) (ESPP) は、s から t への最小のコストパスを求め、それぞれを一度に訪問する。
本稿では,教師なしグラフニューラルネットワークによって実現された近似ESPPの確率的探索法を提案する。
論文 参考訳(メタデータ) (2025-08-03T03:03:05Z) - Diffusion Generative Flow Samplers: Improving learning signals through
partial trajectory optimization [87.21285093582446]
Diffusion Generative Flow Samplers (DGFS) はサンプルベースのフレームワークであり、学習プロセスを短い部分的軌道セグメントに分解することができる。
生成フローネットワーク(GFlowNets)のための理論から着想を得た。
論文 参考訳(メタデータ) (2023-10-04T09:39:05Z) - Learning from A Single Graph is All You Need for Near-Shortest Path
Routing in Wireless Networks [8.22181379329857]
無線ネットワークの標準モデルにおいて,任意のランダムグラフに一般化しながら,単一のグラフから得られるデータサンプルを数個だけ必要とするような局所ルーティングポリシーの学習アルゴリズムを提案する。
そこで我々はディープニューラルネットワーク(DNN)を訓練し、局所的なルーティングポリシーを効率的に学習することで、全ペアに近い経路問題を解決する。
論文 参考訳(メタデータ) (2023-08-18T21:35:45Z) - Towards Understanding and Improving GFlowNet Training [71.85707593318297]
本稿では,学習したサンプリング分布と目標報酬分布を比較するための効率的な評価手法を提案する。
本稿では,高解像度のx$,相対的エッジフローポリシーのパラメータ化,新しい軌道バランス目標を提案する。
論文 参考訳(メタデータ) (2023-05-11T22:50:41Z) - CFlowNets: Continuous Control with Generative Flow Networks [23.093316128475564]
探索制御タスクの強化学習の代替として,ジェネレーティブフローネットワーク(GFlowNets)を用いることができる。
本稿では,連続制御タスクに適用可能な生成連続フローネットワーク(CFlowNets)を提案する。
論文 参考訳(メタデータ) (2023-03-04T14:37:47Z) - Stochastic Generative Flow Networks [89.34644133901647]
生成フローネットワーク(GFlowNets)は「制御としての推論」のレンズを通して複雑な構造をサンプリングすることを学ぶ
既存のGFlowNetsは決定論的環境にのみ適用でき、動的処理によるより一般的なタスクではフェールする。
本稿では,GFlowNetsを環境に拡張する新しいアルゴリズムであるGFlowNetsを紹介する。
論文 参考訳(メタデータ) (2023-02-19T03:19:40Z) - Distributional GFlowNets with Quantile Flows [73.73721901056662]
Generative Flow Networks(GFlowNets)は、エージェントが一連の意思決定ステップを通じて複雑な構造を生成するためのポリシーを学ぶ確率的サンプルの新たなファミリーである。
本研究では,GFlowNetの分散パラダイムを採用し,各フロー関数を分散化し,学習中により情報的な学習信号を提供する。
GFlowNet学習アルゴリズムは,リスク不確実性のあるシナリオを扱う上で不可欠な,リスクに敏感なポリシーを学習することができる。
論文 参考訳(メタデータ) (2023-02-11T22:06:17Z) - Learning GFlowNets from partial episodes for improved convergence and
stability [56.99229746004125]
生成フローネットワーク(GFlowNets)は、非正規化対象密度の下で離散オブジェクトのシーケンシャルサンプリングを訓練するアルゴリズムである。
GFlowNetsの既存のトレーニング目的は、状態または遷移に局所的であるか、あるいはサンプリング軌道全体にわたって報酬信号を伝達する。
強化学習におけるTD($lambda$)アルゴリズムにインスパイアされたサブトラジェクティブバランス(subtrajectory balance, SubTB($lambda$)を導入する。
論文 参考訳(メタデータ) (2022-09-26T15:44:24Z) - MeshfreeFlowNet: A Physics-Constrained Deep Continuous Space-Time
Super-Resolution Framework [58.49761896587656]
MeshfreeFlowNetは、低解像度入力から連続(グリッドフリー)80%ソリューションを生成するフレームワークである。
MeshfreeFlowNetは、(i)出力をすべての解像度でサンプリングし、(ii)任意のサイズの時間ドメイン上の固定サイズの入力をトレーニングすることを可能にする。
本稿では,MeshfreeFlowNetの大規模実装を提案する。
論文 参考訳(メタデータ) (2020-05-01T05:29:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。