論文の概要: Graph-Assisted Stitching for Offline Hierarchical Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2506.07744v1
- Date: Mon, 09 Jun 2025 13:26:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.969532
- Title: Graph-Assisted Stitching for Offline Hierarchical Reinforcement Learning
- Title(参考訳): オフライン階層型強化学習のためのグラフ支援スティッチリング
- Authors: Seungho Baek, Taegeon Park, Jongchan Park, Seungjun Oh, Yusung Kim,
- Abstract要約: Graph-Assisted Stitching (GAS)はグラフ探索問題としてサブゴール選択を定式化する新しいフレームワークである。
ガスクラスターは、異なる軌道からのセマンティックに類似した状態を統一グラフノードに分割し、効率的な遷移縫合を可能にする。
グラフ品質を改善するために,ノイズや非効率な遷移状態をフィルタする時間効率(TE)指標を導入する。
- 参考スコア(独自算出の注目度): 4.979738997262135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing offline hierarchical reinforcement learning methods rely on high-level policy learning to generate subgoal sequences. However, their efficiency degrades as task horizons increase, and they lack effective strategies for stitching useful state transitions across different trajectories. We propose Graph-Assisted Stitching (GAS), a novel framework that formulates subgoal selection as a graph search problem rather than learning an explicit high-level policy. By embedding states into a Temporal Distance Representation (TDR) space, GAS clusters semantically similar states from different trajectories into unified graph nodes, enabling efficient transition stitching. A shortest-path algorithm is then applied to select subgoal sequences within the graph, while a low-level policy learns to reach the subgoals. To improve graph quality, we introduce the Temporal Efficiency (TE) metric, which filters out noisy or inefficient transition states, significantly enhancing task performance. GAS outperforms prior offline HRL methods across locomotion, navigation, and manipulation tasks. Notably, in the most stitching-critical task, it achieves a score of 88.3, dramatically surpassing the previous state-of-the-art score of 1.0. Our source code is available at: https://github.com/qortmdgh4141/GAS.
- Abstract(参考訳): 既存のオフライン階層的強化学習法は、下位列を生成するための高レベルなポリシー学習に依存している。
しかし、タスクの水平線が増加するにつれて効率は低下し、異なる軌道にまたがる有用な状態遷移を縫う効果的な戦略が欠如している。
本稿では,グラフ検索問題としてサブゴール選択を定式化するための新しいフレームワークであるグラフ支援スティッチリング(GAS)を提案する。
時間距離表現(TDR)空間に状態を埋め込むことで、GASクラスタは異なる軌跡から意味的に類似した状態を統一グラフノードに埋め込み、効率的な遷移縫合を可能にする。
最短パスアルゴリズムがグラフ内のサブゴール列の選択に適用され、低レベルポリシーがサブゴールに到達することを学習する。
グラフ品質を改善するために,ノイズや非効率な遷移状態をフィルタし,タスク性能を大幅に向上する時間効率(TE)指標を導入する。
GASは、ローコモーション、ナビゲーション、操作タスク間で、事前のオフラインHRLメソッドよりも優れています。
特に、最も縫合クリティカルなタスクでは、88.3のスコアを達成し、以前の最先端の1.0のスコアを劇的に上回っている。
ソースコードは、https://github.com/qortmdgh4141/GAS.com/で公開されています。
関連論文リスト
- GC4NC: A Benchmark Framework for Graph Condensation on Node Classification with New Insights [30.796414860754837]
グラフ凝縮(GC)は、元のグラフの本質的な情報を保持する、はるかに小さなグラフを学習するために設計された新興技術である。
本稿では,ノード分類における多様なGC手法を評価するための包括的フレームワークである textbfGC4NC を紹介する。
私たちの体系的な評価は、凝縮グラフがどのように振る舞うか、そしてその成功を導く重要な設計選択について、新しい洞察を与えます。
論文 参考訳(メタデータ) (2024-06-24T15:17:49Z) - GSINA: Improving Subgraph Extraction for Graph Invariant Learning via
Graph Sinkhorn Attention [52.67633391931959]
グラフ不変学習(GIL)は,グラフデータとそのラベル間の不変性を発見するための効果的な手法である。
グラフシンクホーン注意機構(GSINA)を提案する。
GSINAは、制御可能な空間性と柔らかさを持つ有意義で微分可能な不変部分グラフを得ることができる。
論文 参考訳(メタデータ) (2024-02-11T12:57:16Z) - T-GAE: Transferable Graph Autoencoder for Network Alignment [79.89704126746204]
T-GAEはグラフオートエンコーダフレームワークで、GNNの転送性と安定性を活用して、再トレーニングなしに効率的なネットワークアライメントを実現する。
実験の結果、T-GAEは最先端の最適化手法と最高のGNN手法を最大38.7%、50.8%で上回っていることがわかった。
論文 参考訳(メタデータ) (2023-10-05T02:58:29Z) - SimTeG: A Frustratingly Simple Approach Improves Textual Graph Learning [131.04781590452308]
テキストグラフ学習におけるフラストレーションに富んだアプローチであるSimTeGを提案する。
まず、下流タスクで予め訓練されたLM上で、教師付きパラメータ効率の微調整(PEFT)を行う。
次に、微調整されたLMの最後の隠れ状態を用いてノード埋め込みを生成する。
論文 参考訳(メタデータ) (2023-08-03T07:00:04Z) - DOTIN: Dropping Task-Irrelevant Nodes for GNNs [119.17997089267124]
最近のグラフ学習アプローチでは、学習のためのグラフのサイズを減らすためのプール戦略が導入されている。
我々はDOTIN(underlineDrunderlineopping underlineTask-underlineIrrelevant underlineNodes)と呼ばれる新しいアプローチを設計し、グラフのサイズを減らす。
本手法は,グラフ分類やグラフ編集距離を含むグラフレベルのタスクにおいて,GATを約50%高速化する。
論文 参考訳(メタデータ) (2022-04-28T12:00:39Z) - Learnable Graph Matching: Incorporating Graph Partitioning with Deep
Feature Learning for Multiple Object Tracking [58.30147362745852]
フレーム間のデータアソシエーションは、Multiple Object Tracking(MOT)タスクの中核にある。
既存の手法は、主にトラックレットとフレーム内検出の間のコンテキスト情報を無視する。
そこで本研究では,学習可能なグラフマッチング手法を提案する。
論文 参考訳(メタデータ) (2021-03-30T08:58:45Z) - Adaptive Graph Encoder for Attributed Graph Embedding [36.06427854846497]
分散グラフ埋め込みは、グラフトポロジとノード特徴からベクトル表現を学ぶ。
本稿では,新しい属性グラフ埋め込みフレームワークであるAdaptive Graph(AGE)を提案する。
4つの公開ベンチマークデータセットを用いてノードクラスタリングとリンク予測タスクのAGEを検証する実験を行った。
論文 参考訳(メタデータ) (2020-07-03T10:20:34Z) - Heuristic Semi-Supervised Learning for Graph Generation Inspired by
Electoral College [80.67842220664231]
本稿では,新たなノードやエッジを自動的に拡張して,高密度サブグラフ内のラベル類似性を向上する,新しい前処理手法であるElectoral College(ELCO)を提案する。
テストされたすべての設定において、我々の手法はベースモデルの平均スコアを4.7ポイントの広いマージンで引き上げるとともに、常に最先端のモデルよりも優れています。
論文 参考訳(メタデータ) (2020-06-10T14:48:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。