論文の概要: Hilbert-Augmented Reinforcement Learning for Scalable Multi-Robot Coverage and Exploration
- arxiv url: http://arxiv.org/abs/2602.19400v1
- Date: Mon, 23 Feb 2026 00:19:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.624889
- Title: Hilbert-Augmented Reinforcement Learning for Scalable Multi-Robot Coverage and Exploration
- Title(参考訳): Hilbert-Augmented Reinforcement Learning for Scalable Multi-Robot Coverage and Exploration
- Authors: Tamil Selvan Gurunathan, Aryya Gangopadhyay,
- Abstract要約: 本稿では,Hilbert空間充足前処理を分散型マルチロボット学習と実行に統合するフレームワークを提案する。
実験により、DQN/PPOベースラインよりもカバー効率、冗長性、収束速度が改善された。
- 参考スコア(独自算出の注目度): 2.7501248535328315
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present a coverage framework that integrates Hilbert space-filling priors into decentralized multi-robot learning and execution. We augment DQN and PPO with Hilbert-based spatial indices to structure exploration and reduce redundancy in sparse-reward environments, and we evaluate scalability in multi-robot grid coverage. We further describe a waypoint interface that converts Hilbert orderings into curvature-bounded, time-parameterized SE(2) trajectories (planar (x, y, θ)), enabling onboard feasibility on resource-constrained robots. Experiments show improvements in coverage efficiency, redundancy, and convergence speed over DQN/PPO baselines. In addition, we validate the approach on a Boston Dynamics Spot legged robot, executing the generated trajectories in indoor environments and observing reliable coverage with low redundancy. These results indicate that geometric priors improve autonomy and scalability for swarm and legged robotics.
- Abstract(参考訳): 本稿では,Hilbert空間充足前処理を分散型マルチロボット学習と実行に統合するカバレッジフレームワークを提案する。
我々は、DQNとPPOをヒルベルトに基づく空間指標で拡張し、スパース・リワード環境における冗長性を低減し、マルチロボットグリッドカバレッジにおけるスケーラビリティを評価する。
さらに、ヒルベルト順序を曲率境界付き時間パラメータ付きSE(2)軌跡(平面(x, y, θ))に変換し、資源制約されたロボットのオンボード実現を可能にするウェイポイントインタフェースについて述べる。
実験により、DQN/PPOベースラインよりもカバー効率、冗長性、収束速度が改善された。
さらに,ボストン・ダイナミクス・スポット(Boston Dynamics Spot)脚ロボットのアプローチを検証するとともに,室内環境下で発生した軌道を実行し,信頼性の高いカバーを低冗長で観察する。
これらの結果から,Swarmおよび脚付きロボットの自律性とスケーラビリティは,幾何的先行性により向上することが示唆された。
関連論文リスト
- CRoSS: A Continual Robotic Simulation Suite for Scalable Reinforcement Learning with High Task Diversity and Realistic Physics Simulation [46.950823663585425]
継続的な強化学習では、エージェントは以前取得したポリシーを忘れずに一連のタスクから学ぶ必要がある。
本稿では,ガゼボシミュレータで現実的にシミュレーションされたロボットをベースとしたCRLのための新しいベンチマークスイートを提案する。
論文 参考訳(メタデータ) (2026-02-04T18:54:26Z) - Scaling Up Occupancy-centric Driving Scene Generation: Dataset and Method [54.461213497603154]
作業中心の手法は、最近、フレームとモダリティをまたいだ一貫した条件付けを提供することで、最先端の結果を得た。
Nuplan-Occは、広く使われているNuplanベンチマークから構築された、これまでで最大の占有率データセットである。
高品質な占有、多視点ビデオ、LiDAR点雲を共同で合成する統合フレームワークを開発した。
論文 参考訳(メタデータ) (2025-10-27T03:52:45Z) - Projective Kolmogorov Arnold Neural Networks (P-KANs): Entropy-Driven Functional Space Discovery for Interpretable Machine Learning [0.0]
Kolmogorov-Arnold Networks (KAN) は学習可能な非線形性をノードからエッジに移動させる。
現在のkanは、高次元スプラインパラメータ空間の冗長性に起因する基本的な非効率性に悩まされている。
本稿では,エッジ関数発見を導く新しいトレーニングフレームワークであるProjective Kolmogorov-Arnold Networks (P-KANs)を紹介する。
論文 参考訳(メタデータ) (2025-09-24T12:15:37Z) - Real-time Spatial-temporal Traversability Assessment via Feature-based Sparse Gaussian Process [15.756895046886406]
本研究では,自律型ロボットが複雑な地形を移動できるようにすることを目的とした,空間的時間的トラバーサビリティ評価手法を提案する。
我々の手法は精度と計算効率の両面でSOTAよりも優れている。
本研究では,移動可能性マップと統合された自律ナビゲーションフレームワークを開発し,複雑な屋外環境下での微分駆動車による検証を行う。
論文 参考訳(メタデータ) (2025-03-06T06:26:57Z) - EnerVerse: Envisioning Embodied Future Space for Robotics Manipulation [55.26713167507132]
本稿では,エンボディ空間の構築と解釈を行う生成ロボティクス基礎モデルを提案する。
EnerVerseは、自己回帰的ビデオ拡散フレームワークを使用して、命令から将来のエンボディドスペースを予測する。
本稿では,生成モデルと4次元ガウススプラッティングを組み合わせたデータエンジンパイプラインであるEnerVerse-Dについて述べる。
論文 参考訳(メタデータ) (2025-01-03T17:00:33Z) - NeuPAN: Direct Point Robot Navigation with End-to-End Model-based Learning [67.53972459080437]
乱雑で未知の環境で非ホロノミックロボットをナビゲートするには、リアルタイム衝突回避のための正確な認識と正確な動きが必要である。
本稿では, リアルタイム, 高精度, 地図のない, 展開が容易で, 環境によらないロボットモーションプランナであるNeuPANについて述べる。
論文 参考訳(メタデータ) (2024-03-11T15:44:38Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。