論文の概要: Learned Risk Metric Maps for Kinodynamic Systems
- arxiv url: http://arxiv.org/abs/2302.14803v1
- Date: Tue, 28 Feb 2023 17:51:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-01 15:02:31.334995
- Title: Learned Risk Metric Maps for Kinodynamic Systems
- Title(参考訳): キノダイナミックシステムのための学習リスクメトリックマップ
- Authors: Ross Allen, Wei Xiao, Daniela Rus
- Abstract要約: 本研究では,高次元力学系のコヒーレントリスクメトリクスをリアルタイムに推定するための学習型リスクメトリクスマップを提案する。
LRMMモデルは設計と訓練が簡単で、障害セットの手続き的生成、状態と制御のサンプリング、および関数近似器の教師付きトレーニングのみを必要とする。
- 参考スコア(独自算出の注目度): 54.49871675894546
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present Learned Risk Metric Maps (LRMM) for real-time estimation of
coherent risk metrics of high dimensional dynamical systems operating in
unstructured, partially observed environments. LRMM models are simple to design
and train -- requiring only procedural generation of obstacle sets, state and
control sampling, and supervised training of a function approximator -- which
makes them broadly applicable to arbitrary system dynamics and obstacle sets.
In a parallel autonomy setting, we demonstrate the model's ability to rapidly
infer collision probabilities of a fast-moving car-like robot driving
recklessly in an obstructed environment; allowing the LRMM agent to intervene,
take control of the vehicle, and avoid collisions. In this time-critical
scenario, we show that LRMMs can evaluate risk metrics 20-100x times faster
than alternative safety algorithms based on control barrier functions (CBFs)
and Hamilton-Jacobi reachability (HJ-reach), leading to 5-15\% fewer obstacle
collisions by the LRMM agent than CBFs and HJ-reach. This performance
improvement comes in spite of the fact that the LRMM model only has access to
local/partial observation of obstacles, whereas the CBF and HJ-reach agents are
granted privileged/global information. We also show that our model can be
equally well trained on a 12-dimensional quadrotor system operating in an
obstructed indoor environment. The LRMM codebase is provided at
https://github.com/mit-drl/pyrmm.
- Abstract(参考訳): 本研究では,非構造的,部分的に観察された環境下で動作する高次元力学系のコヒーレントリスクメトリクスをリアルタイムに推定するためのLearted Risk Metric Maps(LRMM)を提案する。
LRMMモデルは、設計と訓練が簡単で、障害物セットの手続き的な生成、状態と制御のサンプリング、関数近似器の教師付きトレーニングしか必要とせず、任意のシステムダイナミクスや障害物セットに広く適用できる。
並列自律運転環境では, 高速走行する車型ロボットの衝突確率を素早く推定するモデルの能力を示し, lrmmエージェントが衝突を回避し, 衝突を回避できることを示す。
本稿では、制御障壁関数(CBF)とハミルトン・ヤコビ到達可能性(HJリーチ)に基づいて、LRMMが代替安全アルゴリズムの20~100倍の速度でリスクメトリクスを評価することを示し、LRMMエージェントによる障害物衝突をCBFやHJリーチよりも5~15倍少なくすることを示した。
この性能改善は、LRMMモデルが障害の局所的・部分的観察のみにしかアクセスできないのに対して、CBFおよびHJ-リーチエージェントは特権的・グローバルな情報を与える。
また, 本モデルは, 遮蔽屋内環境で動作する12次元四重子システム上で等しく訓練できることを示した。
LRMMのコードベースはhttps://github.com/mit-drl/pyrmmにある。
関連論文リスト
- Learning a Fast Mixing Exogenous Block MDP using a Single Trajectory [87.62730694973696]
STEELは、単一軌道から外因性ブロックマルコフ決定過程の制御可能なダイナミクスを学習するための、最初の証明可能なサンプル効率アルゴリズムである。
我々は,STEELが正解であり,サンプル効率が良いことを証明し,STEELを2つの玩具問題で実証した。
論文 参考訳(メタデータ) (2024-10-03T21:57:21Z) - Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [79.088116316919]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文 参考訳(メタデータ) (2024-09-19T14:36:00Z) - Variational Autoencoders for exteroceptive perception in reinforcement learning-based collision avoidance [0.0]
Deep Reinforcement Learning (DRL) は有望な制御フレームワークとして登場した。
現在のDRLアルゴリズムは、ほぼ最適ポリシーを見つけるために不均等な計算資源を必要とする。
本稿では,海洋制御システムにおける提案手法の総合的な探索について述べる。
論文 参考訳(メタデータ) (2024-03-31T09:25:28Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Identifying the Hazard Boundary of ML-enabled Autonomous Systems Using
Cooperative Co-Evolutionary Search [9.511076358998073]
機械学習対応自律システムにおけるMLコンポーネント(MLC)のハザード境界を解析により同定することが不可欠である。
協調進化アルゴリズム(CCEA)に基づく新しい手法であるMLCSHEを提案する。
複雑な自律走行車(AV)のケーススタディにおけるMLCSHEの有効性と効率について検討した。
論文 参考訳(メタデータ) (2023-01-31T17:50:52Z) - Risk-based implementation of COLREGs for autonomous surface vehicles
using deep reinforcement learning [1.304892050913381]
深層強化学習(DRL)は幅広い応用の可能性を示している。
本研究は,海上衝突防止国際規則(COLREG)のサブセットをDRLに基づく経路追従と障害物回避システムに組み込んだものである。
得られた自律エージェントは、訓練シナリオ、孤立した遭遇状況、実世界のシナリオのAISに基づくシミュレーションにおいて、経路追従とCOLREG準拠の衝突回避を動的に補間する。
論文 参考訳(メタデータ) (2021-11-30T21:32:59Z) - Relative Distributed Formation and Obstacle Avoidance with Multi-agent
Reinforcement Learning [20.401609420707867]
マルチエージェント強化学習(MARL)に基づく分散生成・障害物回避手法を提案する。
提案手法は, 障害物回避における生成誤差, 生成収束率, オンパー成功率に関して, ベースラインと比較して高い性能を実現する。
論文 参考訳(メタデータ) (2021-11-14T13:02:45Z) - Risk-Sensitive Sequential Action Control with Multi-Modal Human
Trajectory Forecasting for Safe Crowd-Robot Interaction [55.569050872780224]
本稿では,リスクに敏感な最適制御に基づく安全な群集ロボットインタラクションのためのオンラインフレームワークを提案し,そのリスクをエントロピーリスク尺度でモデル化する。
私たちのモジュラーアプローチは、クラウドとロボットの相互作用を学習ベースの予測とモデルベースの制御に分離します。
シミュレーション研究と実世界の実験により、このフレームワークは、現場にいる50人以上の人間との衝突を避けながら、安全で効率的なナビゲーションを実現することができることが示された。
論文 参考訳(メタデータ) (2020-09-12T02:02:52Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。