論文の概要: Partial GFlowNet: Accelerating Convergence in Large State Spaces via Strategic Partitioning
- arxiv url: http://arxiv.org/abs/2602.11498v1
- Date: Thu, 12 Feb 2026 02:50:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.606004
- Title: Partial GFlowNet: Accelerating Convergence in Large State Spaces via Strategic Partitioning
- Title(参考訳): 部分的GFlowNet:戦略分割による大規模状態空間の収束促進
- Authors: Xuan Yu, Xu Wang, Rui Zhu, Yudong Zhang, Yang Wang,
- Abstract要約: プランナーは、状態空間全体を重なり合う部分的な状態空間に分割するために導入される。
部分領域を切り替える戦略を導入し、アクターが完全に探索されたり、低逆の部分領域を探索する時間を無駄にしないようにする。
いくつかの広く使われているデータセットの実験では、モデル名は大きな状態空間上の既存の研究よりも早く収束することを示した。
- 参考スコア(独自算出の注目度): 15.81040206459648
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative Flow Networks (GFlowNets) have shown promising potential to generate high-scoring candidates with probability proportional to their rewards. As existing GFlowNets freely explore in state space, they encounter significant convergence challenges when scaling to large state spaces. Addressing this issue, this paper proposes to restrict the exploration of actor. A planner is introduced to partition the entire state space into overlapping partial state spaces. Given their limited size, these partial state spaces allow the actor to efficiently identify subregions with higher rewards. A heuristic strategy is introduced to switch partial regions thus preventing the actor from wasting time exploring fully explored or low-reward partial regions. By iteratively exploring these partial state spaces, the actor learns to converge towards the high-reward subregions within the entire state space. Experiments on several widely used datasets demonstrate that \modelname converges faster than existing works on large state spaces. Furthermore, \modelname not only generates candidates with higher rewards but also significantly improves their diversity.
- Abstract(参考訳): Generative Flow Networks (GFlowNets) は、報酬に比例する確率の高いハイスコア候補を生成する有望な可能性を示している。
既存のGFlowNetは、状態空間を自由に探索するので、大きな状態空間にスケールする際には、かなりの収束の問題に遭遇する。
本稿では,俳優の探究を制限することを提案する。
プランナーは、状態空間全体を重なり合う部分的な状態空間に分割するために導入される。
サイズが制限されているため、これらの部分状態空間により、アクターはより高い報酬を持つサブリージョンを効率的に識別することができる。
部分領域を切り替えるヒューリスティック戦略を導入し、アクターが完全に探索されたり、低逆の部分領域を探索する時間を無駄にしないようにする。
これらの部分状態空間を反復的に探索することにより、アクターは状態空間全体の高次部分領域へ収束することを学ぶ。
いくつかの広く使われているデータセットの実験では、大面積の空間上の既存の研究よりもモデル名の方が早く収束することが示されている。
さらに、モデルネームはより高い報酬を持つ候補を生成するだけでなく、その多様性を著しく向上させる。
関連論文リスト
- Exploring Multiple High-Scoring Subspaces in Generative Flow Networks [15.81040206459648]
生成フローネットワークは、複雑なオブジェクトを構築する強力な可能性を示す。
既存のGFlowNetは、広大な状態空間の過剰な探索に悩まされることが多い。
CMAB-GFNを提案する。これはGFlowNetポリシに最適化されたマルチアームバンディットフレームワークを統合する。
論文 参考訳(メタデータ) (2026-02-12T02:30:52Z) - Holistic Surgical Phase Recognition with Hierarchical Input Dependent State Space Models [56.2236083600999]
手術映像解析のための階層型入力依存状態空間モデルを提案する。
本フレームワークは,時間的一貫した視覚特徴抽出器を内蔵し,状態空間モデルヘッドを視覚特徴抽出器に付加し,時間的情報を伝達する。
実験により,本手法は最先端の手法よりも高い性能を示した。
論文 参考訳(メタデータ) (2025-06-26T14:43:57Z) - Symbolic State Partitioning for Reinforcement Learning [2.2486667277872994]
優れたパーティショニングは、学習中の一般化と、事前経験のより効率的な活用を可能にする。
パーティショニングは、状態成分間の非線形関係の存在において特に有害な近似を導入する。
シンボル分割は, 環境行動に関して, 状態空間のカバレッジを向上し, 余分な報酬に対して強化学習がより優れていることを示す。
論文 参考訳(メタデータ) (2024-09-25T10:09:47Z) - GrootVL: Tree Topology is All You Need in State Space Model [66.36757400689281]
GrootVLは、視覚的タスクとテキストタスクの両方に適用できる多目的マルチモーダルフレームワークである。
本手法は, 画像分類, オブジェクト検出, セグメンテーションにおいて, 既存の構造化状態空間モデルよりも大幅に優れる。
大規模言語モデルの微調整により,本手法は訓練コストの少ない複数のテキストタスクにおいて一貫した改善を実現する。
論文 参考訳(メタデータ) (2024-06-04T15:09:29Z) - Scalable Multi-agent Covering Option Discovery based on Kronecker Graphs [49.71319907864573]
本稿では,分解が容易なマルチエージェントスキル発見法を提案する。
我々のキーとなる考え方は、合同状態空間をクロネッカーグラフとして近似することであり、そのフィドラーベクトルを直接見積もることができる。
ラプラシアンスペクトルを直接計算することは、無限大の状態空間を持つタスクには難易度が高いことを考慮し、さらに本手法の深層学習拡張を提案する。
論文 参考訳(メタデータ) (2023-07-21T14:53:12Z) - Semantic Segmentation by Early Region Proxy [53.594035639400616]
本稿では,学習可能な領域のテッセルレーションとしてイメージを解釈することから始まる,新規で効率的なモデリングについて述べる。
領域のコンテキストをモデル化するために,Transformerを用いてシーケンス・ツー・シーケンス方式で領域を符号化する。
現在、符号化された領域埋め込みの上に、領域ごとのセマンティックセグメンテーションを行う。
論文 参考訳(メタデータ) (2022-03-26T10:48:32Z) - Non-Salient Region Object Mining for Weakly Supervised Semantic
Segmentation [64.2719590819468]
弱教師付きセマンティックセグメンテーションのための非塩分領域オブジェクトマイニング手法を提案する。
擬似ラベルの偽陰性率を低減するために、潜在的なオブジェクトマイニングモジュールを提案する。
非サリエント領域マスキングモジュールは、非サリエント領域内のオブジェクトをさらに発見するのに役立ちます。
論文 参考訳(メタデータ) (2021-03-26T16:44:03Z) - Heterogeneous Multipartite Entanglement Purification for
Size-Constrained Quantum Devices [68.8204255655161]
不完全生成後の絡み合い資源の浄化は、量子アーキテクチャーでそれらを使用するための必要不可欠なステップである。
ここでは、過去20年間に探索された多国間国家の典型的浄化パラダイムから逸脱する。
ベル対のような小さな犠牲状態は、これらの同じ状態の余分なコピーよりも多粒子状態の浄化に有用であることがわかった。
論文 参考訳(メタデータ) (2020-11-23T19:00:00Z) - Scalable Multi-Agent Reinforcement Learning for Networked Systems with
Average Reward [17.925681736096482]
マルチエージェント強化学習(MARL)が大きなスケーラビリティの問題に直面していることは長年認識されてきた。
本稿では、モデルが局所的な依存構造を示し、スケーラブルな方法で解けるような、ネットワーク化されたMARL問題のリッチなクラスを同定する。
論文 参考訳(メタデータ) (2020-06-11T17:23:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。