論文の概要: Learning Provably Robust Motion Planners Using Funnel Libraries
- arxiv url: http://arxiv.org/abs/2111.08733v1
- Date: Tue, 16 Nov 2021 19:11:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-18 16:04:16.310531
- Title: Learning Provably Robust Motion Planners Using Funnel Libraries
- Title(参考訳): ファンネルライブラリを用いたロバストな運動プランナーの学習
- Authors: Ali Ekin Gurgen, Anirudha Majumdar, Sushant Veer
- Abstract要約: 本稿では,新しい環境下での成功の確率論的保証を伴う運動プランナの学習方法を提案する。
一般化理論と頑健な制御からツールをまとめることにより、これを実現する。
2つのシミュレートされた例に対して強い保証を提供するためのアプローチの能力を実証する。
- 参考スコア(独自算出の注目度): 6.671201304858938
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents an approach for learning motion planners that are
accompanied with probabilistic guarantees of success on new environments that
hold uniformly for any disturbance to the robot's dynamics within an admissible
set. We achieve this by bringing together tools from generalization theory and
robust control. First, we curate a library of motion primitives where the
robustness of each primitive is characterized by an over-approximation of the
forward reachable set, i.e., a "funnel". Then, we optimize probably
approximately correct (PAC)-Bayes generalization bounds for training our
planner to compose these primitives such that the entire funnels respect the
problem specification. We demonstrate the ability of our approach to provide
strong guarantees on two simulated examples: (i) navigation of an autonomous
vehicle under external disturbances on a five-lane highway with multiple
vehicles, and (ii) navigation of a drone across an obstacle field in the
presence of wind disturbances.
- Abstract(参考訳): 本稿では,ロボットの動特性に一様に干渉する新しい環境において,その成功の確率的保証を伴う運動プランナーを学習する手法を提案する。
我々は一般化理論とロバスト制御のツールを組み合わせてこれを達成する。
まず、各プリミティブのロバスト性が前方到達可能な集合、すなわち「ファンネル」の過度な近似によって特徴づけられる動きプリミティブのライブラリをキュレートする。
そして、計画立案者がこれらのプリミティブを構成するように訓練するために、おそらくほぼ正しい(PAC)-ベイズ一般化境界を最適化する。
2つのシミュレーション例に対して,強い保証を提供するためのアプローチの能力を示す。
(i)複数の車両を有する5車線の幹線道路における外乱による自律走行車両の航行
(ii)風乱の存在下で障害物フィールドを横断するドローンの航行
関連論文リスト
- Evaluating Robustness of Reinforcement Learning Algorithms for Autonomous Shipping [2.9109581496560044]
本稿では,自律型海運シミュレータにおける内陸水路輸送(IWT)のために実装されたベンチマークディープ強化学習(RL)アルゴリズムのロバスト性について検討する。
モデルのないアプローチはシミュレーターで適切なポリシーを達成でき、訓練中に遭遇したことのないポート環境をナビゲートすることに成功した。
論文 参考訳(メタデータ) (2024-11-07T17:55:07Z) - Hybrid Imitation-Learning Motion Planner for Urban Driving [0.0]
本稿では,学習ベースと最適化ベースを融合した新しいハイブリッドモーションプランナを提案する。
我々のモデルは、これらの目的に固有のトレードオフを緩和し、安全性と人間の類似性を効果的にバランスさせます。
シミュレーション実験により本手法を検証し,現実の自動運転車に導入することで,その有効性を更に実証する。
論文 参考訳(メタデータ) (2024-09-04T16:54:31Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Integrating Higher-Order Dynamics and Roadway-Compliance into
Constrained ILQR-based Trajectory Planning for Autonomous Vehicles [3.200238632208686]
軌道計画は、自動運転車のグローバルな最適ルートを作成することを目的としている。
既存の自転車キネマティックモデルを用いた実装では、制御可能な軌道は保証できない。
このモデルを、曲率と長手ジャークの1階および2階微分を含む高階項で拡張する。
論文 参考訳(メタデータ) (2023-09-25T22:30:18Z) - Smooth Trajectory Collision Avoidance through Deep Reinforcement
Learning [0.0]
本稿では,DRLに基づくナビゲーションソリューションにおける2つの重要な問題に対処するために,エージェントの状態と報酬関数の設計を提案する。
我々のモデルは、衝突の可能性を著しく低減しつつ、UAVのスムーズな飛行を確保するために、マージンの報酬と滑らかさの制約に依存している。
論文 参考訳(メタデータ) (2022-10-12T16:27:32Z) - Inverted Landing in a Small Aerial Robot via Deep Reinforcement Learning
for Triggering and Control of Rotational Maneuvers [11.29285364660789]
高速で頑健な逆着陸は、特に機内でのセンシングと計算に完全に依存しながらも、空中ロボットにとって難しい偉業である。
これまでの研究では、一連の視覚的手がかりとキネマティックな動作の間に直接的な因果関係が特定され、小型の空中ロボットでこの困難なエアロバティックな操作を確実に実行することができた。
本研究では、まずDeep Reinforcement Learningと物理シミュレーションを用いて、頑健な逆着陸のための汎用的最適制御ポリシーを得る。
論文 参考訳(メタデータ) (2022-09-22T14:38:10Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - Next Steps: Learning a Disentangled Gait Representation for Versatile
Quadruped Locomotion [69.87112582900363]
現在のプランナーは、ロボットが動いている間、キー歩行パラメータを連続的に変更することはできない。
本研究では、特定の歩行を構成する重要な姿勢位相を捉える潜在空間を学習することにより、この制限に対処する。
本研究では, 歩幅, 歩幅, 立位など, 歩行パラメータに直接対応した駆動信号マップの具体的特性を示す。
論文 参考訳(メタデータ) (2021-12-09T10:02:02Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z) - First Steps: Latent-Space Control with Semantic Constraints for
Quadruped Locomotion [73.37945453998134]
従来の四重化制御のアプローチでは、単純化された手作りのモデルが採用されている。
これにより、有効な運動範囲が縮小されているため、ロボットの能力が大幅に低下する。
この研究において、これらの課題は、構造化潜在空間における最適化として四重化制御をフレーミングすることによって解決される。
深い生成モデルは、実現可能な関節構成の統計的表現を捉え、一方、複雑な動的および終端的制約は高レベルな意味的指標によって表現される。
実世界とシミュレーションの両方で最適化された移動軌跡の実現可能性を検証する。
論文 参考訳(メタデータ) (2020-07-03T07:04:18Z) - The Importance of Prior Knowledge in Precise Multimodal Prediction [71.74884391209955]
道路にはよく定義された地形、地形、交通規則がある。
本稿では,構造的事前を損失関数として組み込むことを提案する。
実世界の自動運転データセットにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-06-04T03:56:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。