論文の概要: Learning-Based Sparsification of Dynamic Graphs in Robotic Exploration Algorithms
- arxiv url: http://arxiv.org/abs/2604.16509v1
- Date: Wed, 15 Apr 2026 03:39:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.038035
- Title: Learning-Based Sparsification of Dynamic Graphs in Robotic Exploration Algorithms
- Title(参考訳): ロボット探索アルゴリズムにおける動的グラフの学習に基づくスパース化
- Authors: Adithya V. Sastry, Bibek Poudel, Weizi Li,
- Abstract要約: 本稿では,PPO(Proximal Policy Optimization)でトレーニングしたトランスフォーマーベースのフレームワークについて述べる。
我々のフレームワークは、粗末で遅延した報酬信号にもかかわらず、探索結果とプルーニング決定を関連付けることを学習しているという予備的な証拠を見出す。
我々の知る限り、これらの結果はロボット探索アルゴリズムで使用される動的グラフのスパース化におけるRLの生存可能性を示す最初のものである。
- 参考スコア(独自算出の注目度): 3.630368480889924
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many robotic exploration algorithms rely on graph structures for frontier-based exploration and dynamic path planning. However, these graphs grow rapidly, accumulating redundant information and impacting performance. We present a transformer-based framework trained with Proximal Policy Optimization (PPO) to prune these graphs during exploration, limiting their growth and reducing the accumulation of excess information. The framework was evaluated on simulations of a robotic agent using Rapidly Exploring Random Trees (RRT) to carry out frontier-based exploration, where the learned policy reduces graph size by up to 96%. We find preliminary evidence that our framework learns to associate pruning decisions with exploration outcomes despite sparse, delayed reward signals. We also observe that while intelligent pruning achieves a lower rate of exploration compared to baselines, it yields the lowest standard deviation, producing the most consistent exploration across varied environments. To the best of our knowledge, these results are the first suggesting the viability of RL in sparsification of dynamic graphs used in robotic exploration algorithms.
- Abstract(参考訳): 多くのロボット探索アルゴリズムは、フロンティアベースの探索と動的経路計画のためのグラフ構造に依存している。
しかし、これらのグラフは急速に成長し、冗長な情報を蓄積し、性能に影響を与える。
本稿では、PPO(Proximal Policy Optimization)でトレーニングされたトランスフォーマーベースのフレームワークについて、探索中にこれらのグラフを抽出し、その成長を制限し、過剰な情報の蓄積を減らす。
このフレームワークは、Rapidly Exploring Random Trees (RRT) を用いたロボットエージェントのシミュレーションに基づいて、フロンティアベースの探索を行い、学習ポリシーはグラフサイズを最大96%削減する。
我々のフレームワークは、粗末で遅延した報酬信号にもかかわらず、探索結果とプルーニング決定を関連付けることを学習しているという予備的な証拠を見出す。
また、インテリジェントプルーニングがベースラインよりも低い探索率を達成する一方で、標準偏差が低く、様々な環境をまたいだ最も一貫した探索をもたらすことも観察した。
我々の知る限り、これらの結果はロボット探索アルゴリズムで使用される動的グラフのスパース化におけるRLの生存可能性を示す最初のものである。
関連論文リスト
- Learning to Explore: Policy-Guided Outlier Synthesis for Graph Out-of-Distribution Detection [51.93878677594561]
教師なしグラフレベルのOOD検出では、モデルは通常、IDデータのみを使用して訓練される。
本稿では,スタティックスを学習した探索戦略に置き換える政策誘導型アウトリア合成フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-28T11:40:18Z) - Reasoning by Exploration: A Unified Approach to Retrieval and Generation over Graphs [39.425801384830415]
構造化グラフに対する推論は、大規模言語モデルにとって依然として根本的な課題である。
グラフ探索のプロセスとしてグラフ上の推論をフレーミングすることによって検索と生成を統一する新しい手法であるReasoning by Exploration (RoE)を提案する。
RoEは、ベースラインよりも大幅に全体的な改善を実現し、また、目に見えないグラフに効果的に一般化する。
論文 参考訳(メタデータ) (2025-10-08T19:29:19Z) - RGL: A Graph-Centric, Modular Framework for Efficient Retrieval-Augmented Generation on Graphs [58.10503898336799]
完全なRAGパイプラインをシームレスに統合するモジュラーフレームワークであるRAG-on-Graphs Library(RGL)を紹介した。
RGLは、さまざまなグラフフォーマットをサポートし、必須コンポーネントの最適化実装を統合することで、重要な課題に対処する。
評価の結果,RGLはプロトタイピングプロセスの高速化だけでなく,グラフベースRAGシステムの性能や適用性の向上も図っている。
論文 参考訳(メタデータ) (2025-03-25T03:21:48Z) - G-OSR: A Comprehensive Benchmark for Graph Open-Set Recognition [54.45837774534411]
ノードレベルとグラフレベルの両方でグラフオープンセット認識(GOSR)手法を評価するベンチマークである textbfG-OSR を導入する。
結果は、現在のGOSR手法の一般化可能性と限界に関する重要な洞察を与える。
論文 参考訳(メタデータ) (2025-03-01T13:02:47Z) - Variable-Agnostic Causal Exploration for Reinforcement Learning [56.52768265734155]
強化学習のための新しいフレームワークVACERL(Variable-Agnostic Causal Exploration for Reinforcement Learning)を導入する。
本手法は,注目機構を用いて,重要変数に関連する重要な観測行動ステップを自動的に同定する。
これらのステップを接続する因果グラフを構築し、エージェントをタスク完了に対する因果的影響の大きい観察-作用ペアへと導く。
論文 参考訳(メタデータ) (2024-07-17T09:45:27Z) - TAS: A Transit-Aware Strategy for Embodied Navigation with Non-Stationary Targets [55.09248760290918]
非定常目標を持つ動的シナリオにおけるナビゲーションのための新しいアルゴリズムを提案する。
我々の新しいTAS(Transit-Aware Strategy)は、具体化されたナビゲーションポリシーをオブジェクトパス情報で強化する。
TASは、ターゲットルートとルートを同期させるエージェントを報酬することで、非定常環境での性能を改善する。
論文 参考訳(メタデータ) (2024-03-14T22:33:22Z) - Comparing Active Learning Performance Driven by Gaussian Processes or
Bayesian Neural Networks for Constrained Trajectory Exploration [0.0]
現在、人間は科学的な目的を達成するためにロボットを駆動しているが、ロボットの位置によっては、情報交換と駆動コマンドがミッション遂行に不適切な遅延を引き起こす可能性がある。
科学的目的と探索戦略で符号化された自律ロボットは、通信遅延を発生させず、ミッションをより迅速に達成することができる。
能動学習アルゴリズムは知的探索の能力を提供するが、その基盤となるモデル構造は、環境の理解を正確に形成する際に、能動学習アルゴリズムの性能を変化させる。
論文 参考訳(メタデータ) (2023-09-28T02:45:14Z) - Learning Graph Search Heuristics [48.83557172525969]
本稿では,新しいニューラルネットワークと学習アルゴリズムであるPHIL(Path Heuristic with Imitation Learning)について述べる。
我々の関数は、ノード距離の推測に有用なグラフ埋め込みを学習し、グラフサイズに依存しない一定時間で実行し、テスト時にA*のようなアルゴリズムに容易に組み込むことができる。
実験の結果、PHILはベンチマークデータセットの最先端の手法と比較して平均58.5%の探索ノード数を削減している。
論文 参考訳(メタデータ) (2022-12-07T22:28:00Z) - Reducing Collision Checking for Sampling-Based Motion Planning Using
Graph Neural Networks [10.698553177585973]
本研究では,衝突チェックを減らし,動作計画の高速化を図るための新しい学習手法を提案する。
経路探索と経路平滑化を行うグラフニューラルネットワーク(GNN)を訓練する。
実験の結果,学習したコンポーネントは衝突チェックを著しく低減し,全体の計画効率を向上できることがわかった。
論文 参考訳(メタデータ) (2022-10-17T09:02:04Z) - Mastering Spatial Graph Prediction of Road Networks [18.321172168775472]
グラフエッジの列の追加をシミュレートするグラフベースのフレームワークを提案する。
特に、衛星画像に関連する部分生成グラフが与えられた場合、RLエージェントは累積報酬を最大化する修正を通知する。
論文 参考訳(メタデータ) (2022-10-03T11:26:09Z) - Autonomous UAV Exploration of Dynamic Environments via Incremental
Sampling and Probabilistic Roadmap [0.3867363075280543]
インクリメンタルサンプリングと確率的ロードマップ(PRM)を用いた未知環境探索のための新しい動的探索プランナ(DEP)を提案する。
本手法は, 動的環境を安全に探索し, 探索時間, 経路長, 計算時間でベンチマークプランナーより優れている。
論文 参考訳(メタデータ) (2020-10-14T22:52:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。