論文の概要: Learning Maximal Safe Sets Using Hypernetworks for MPC-based Local Trajectory Planning in Unknown Environments
- arxiv url: http://arxiv.org/abs/2410.20267v2
- Date: Tue, 04 Mar 2025 21:33:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-06 15:48:31.642756
- Title: Learning Maximal Safe Sets Using Hypernetworks for MPC-based Local Trajectory Planning in Unknown Environments
- Title(参考訳): MPCに基づく未知環境における局所軌道計画のためのハイパーネットを用いた最大安全集合の学習
- Authors: Bojan Derajić, Mohamed-Khalil Bouzidi, Sebastian Bernhard, Wolfgang Hönig,
- Abstract要約: 本稿では,未知の静的環境における局所軌道計画のための最適集合のオンライン推定のための学習に基づく新しいアプローチを提案する。
モデル予測制御(MPC)ローカルプランナの終端セット制約として、集合の神経表現を用いる。
我々は,提案手法であるNTC-MPCを物理ロボットに展開し,ベースラインが故障した場合の障害物を安全に回避できることを実証した。
- 参考スコア(独自算出の注目度): 1.3182466374784207
- License:
- Abstract: This paper presents a novel learning-based approach for online estimation of maximal safe sets for local trajectory planning in unknown static environments. The neural representation of a set is used as the terminal set constraint for a model predictive control (MPC) local planner, resulting in improved recursive feasibility and safety. To achieve real-time performance and desired generalization properties, we employ the idea of hypernetworks. We use the Hamilton-Jacobi (HJ) reachability analysis as the source of supervision during the training process, allowing us to consider general nonlinear dynamics and arbitrary constraints. The proposed method is extensively evaluated against relevant baselines in simulations for different environments and robot dynamics. The results show a success rate increase of up to 52 \% compared to the best baseline while maintaining comparable execution speed. Additionally, we deploy our proposed method, NTC-MPC, on a physical robot and demonstrate its ability to safely avoid obstacles in scenarios where the baselines fail.
- Abstract(参考訳): 本稿では,未知の静的環境における局所軌道計画のための最適集合のオンライン推定のための学習に基づく新しいアプローチを提案する。
集合の神経表現は、モデル予測制御(MPC)ローカルプランナーの終端セット制約として使用され、再帰可能性と安全性が向上する。
実時間性能と所望の一般化特性を達成するために,ハイパーネットの考え方を用いる。
我々は、ハミルトン・ヤコビ(HJ)の到達可能性解析を訓練過程の監督源として使用し、一般的な非線形力学と任意の制約を考慮できる。
提案手法は,異なる環境のシミュレーションやロボットのダイナミクスにおいて,関連するベースラインに対して広範囲に評価される。
その結果,実行速度を同等に保ちながら,最高のベースラインに比べて最大52 \%の成功率が向上した。
さらに,提案手法であるNTC-MPCを物理ロボットに展開し,ベースラインが故障した場合の障害物を安全に回避できることを示す。
関連論文リスト
- End-to-End Predictive Planner for Autonomous Driving with Consistency Models [5.966385886363771]
軌道予測と計画は、自動運転車が動的環境において安全かつ効率的に航行するための基本的な要素である。
伝統的に、これらのコンポーネントは、しばしば別々のモジュールとして扱われ、インタラクティブな計画を実行する能力を制限する。
単一の一貫性モデルで予測と計画を統合する,統一的でデータ駆動のフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-12T00:26:01Z) - Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
私たちは世界モデルを学ぶための新しいフレームワークを紹介します。
スケーラブルで堅牢なフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - Monte Carlo Tree Search with Velocity Obstacles for safe and efficient motion planning in dynamic environments [49.30744329170107]
本稿では,動的障害物に関する情報を最小限に抑えた最適オンライン動作計画手法を提案する。
提案手法は,モデルシミュレーションによるオンライン最適計画のためのモンテカルロ木探索 (MCTS) と障害物回避のためのVelocity Obstacles (VO) を組み合わせた。
我々は,非線形モデル予測制御(NMPC)を含む最先端のプランナーに対して,衝突速度,計算,タスク性能の向上の観点から,我々の方法論の優位性を示す。
論文 参考訳(メタデータ) (2025-01-16T16:45:08Z) - PLANRL: A Motion Planning and Imitation Learning Framework to Bootstrap Reinforcement Learning [13.564676246832544]
PLANRLは、ロボットがいつ古典的な動き計画を使うべきか、いつポリシーを学ぶべきかを選択するためのフレームワークである。
PLANRLは2つの操作モードを切り替える: オブジェクトから離れたときに古典的なテクニックを使ってウェイポイントに到達し、オブジェクトと対話しようとするときに細かい操作制御を行う。
我々は,複数の課題のあるシミュレーション環境と実世界のタスクにまたがってアプローチを評価し,既存手法と比較して適応性,効率,一般化の点で優れた性能を示す。
論文 参考訳(メタデータ) (2024-08-07T19:30:08Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - Constrained Policy Optimization via Bayesian World Models [79.0077602277004]
LAMBDAは、マルコフ決定プロセスを通じてモデル化された安全クリティカルタスクにおけるポリシー最適化のためのモデルに基づくアプローチである。
LAMBDA のSafety-Gymベンチマークスイートにおける技術性能について,サンプル効率と制約違反の観点から示す。
論文 参考訳(メタデータ) (2022-01-24T17:02:22Z) - On Effective Scheduling of Model-based Reinforcement Learning [53.027698625496015]
実データ比率を自動的にスケジュールするAutoMBPOというフレームワークを提案する。
本稿ではまず,政策訓練における実データの役割を理論的に分析し,実際のデータの比率を徐々に高めれば,より優れた性能が得られることを示唆する。
論文 参考訳(メタデータ) (2021-11-16T15:24:59Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。