論文の概要: Learning-Aware Safety for Interactive Autonomy
- arxiv url: http://arxiv.org/abs/2309.01267v1
- Date: Sun, 3 Sep 2023 20:34:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 20:34:06.925954
- Title: Learning-Aware Safety for Interactive Autonomy
- Title(参考訳): 対話型自律性のための学習・認識安全
- Authors: Haimin Hu, Zixu Zhang, Kensuke Nakamura, Andrea Bajcsy, Jaime F. Fisac
- Abstract要約: 既存の安全分析手法は、ロボットが実行時に学習し適応する能力を無視することが多い。
本稿では,将来的なシナリオ下でのシステムの進化的不確実性を明確に考慮した,安全な制御ポリシのための新しいクローズドループパラダイムを提案する。
- 参考スコア(独自算出の注目度): 7.915956857741506
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the outstanding challenges for the widespread deployment of robotic
systems like autonomous vehicles is ensuring safe interaction with humans
without sacrificing efficiency. Existing safety analysis methods often neglect
the robot's ability to learn and adapt at runtime, leading to overly
conservative behavior. This paper proposes a new closed-loop paradigm for
synthesizing safe control policies that explicitly account for the system's
evolving uncertainty under possible future scenarios. The formulation reasons
jointly about the physical dynamics and the robot's learning algorithm, which
updates its internal belief over time. We leverage adversarial deep
reinforcement learning (RL) for scaling to high dimensions, enabling tractable
safety analysis even for implicit learning dynamics induced by state-of-the-art
prediction models. We demonstrate our framework's ability to work with both
Bayesian belief propagation and the implicit learning induced by a large
pre-trained neural trajectory predictor.
- Abstract(参考訳): 自動運転車のようなロボットシステムの広範な展開における顕著な課題の1つは、効率を犠牲にすることなく、人間との安全なインタラクションを保証することだ。
既存の安全分析手法は、ロボットが実行時に学習し適応する能力を無視することが多く、過度に保守的な行動を引き起こす。
本稿では,将来のシナリオにおいてシステムの不確実性が明らかに変化することを考慮し,安全な制御ポリシを合成するための新しい閉ループパラダイムを提案する。
定式化の理由は、物理力学とロボットの学習アルゴリズムに共通しており、時間とともに内部の信念が更新される。
我々は,最先端予測モデルによって引き起こされる暗黙の学習ダイナミクスにおいても,高次元への拡張に敵意の深層強化学習(rl)を活用し,扱いやすい安全性解析を可能にした。
本研究では,バイエルン信念伝播と,前訓練型神経軌道予測器による暗黙的学習の両方に対応するためのフレームワークの能力を示す。
関連論文リスト
- Robot Navigation with Entity-Based Collision Avoidance using Deep Reinforcement Learning [0.0]
本稿では,ロボットのさまざまなエージェントや障害物との相互作用を高める新しい手法を提案する。
このアプローチでは、エンティティタイプに関する情報を使用し、衝突回避を改善し、より安全なナビゲーションを保証する。
本研究では,大人,自転車乗り,子供,静的障害物など,さまざまな物体との衝突に対してロボットをペナルティ化する新たな報酬関数を提案する。
論文 参考訳(メタデータ) (2024-08-26T11:16:03Z) - Commonsense Reasoning for Legged Robot Adaptation with Vision-Language Models [81.55156507635286]
脚のついたロボットは、様々な環境をナビゲートし、幅広い障害を克服することができる。
現在の学習手法は、人間の監督を伴わずに、予期せぬ状況の長い尾への一般化に苦慮することが多い。
本稿では,VLM-Predictive Control (VLM-PC) というシステムを提案する。
論文 参考訳(メタデータ) (2024-07-02T21:00:30Z) - ABNet: Attention BarrierNet for Safe and Scalable Robot Learning [58.4951884593569]
バリアベースの手法は、安全なロボット学習における主要なアプローチの1つである。
本稿では,より大規模な基本安全モデルを段階的に構築するスケーラブルなAttention BarrierNet(ABNet)を提案する。
2次元ロボット障害物回避、安全なロボット操作、視覚に基づくエンドツーエンド自動運転におけるABNetの強みを実証する。
論文 参考訳(メタデータ) (2024-06-18T19:37:44Z) - Safe Reinforcement Learning on the Constraint Manifold: Theory and Applications [21.98309272057848]
本稿では,学習に基づくロボットシステムに対して,複雑な安全制約を原則的に課す方法について述べる。
我々のアプローチは、安全ロボット構成の集合を表すConstraint Manifoldの概念に基づいている。
実世界のロボットエアホッケータスクにおいて,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2024-04-13T20:55:15Z) - Learning Vision-based Pursuit-Evasion Robot Policies [54.52536214251999]
我々は、部分的に観察可能なロボットの監督を生成する完全観測可能なロボットポリシーを開発する。
我々は、RGB-Dカメラを搭載した4足歩行ロボットに、野生での追従回避のインタラクションにポリシーを展開させる。
論文 参考訳(メタデータ) (2023-08-30T17:59:05Z) - Bridging Active Exploration and Uncertainty-Aware Deployment Using
Probabilistic Ensemble Neural Network Dynamics [11.946807588018595]
本稿では,活発な探索と不確実性を考慮した展開を橋渡しするモデルベース強化学習フレームワークを提案する。
探索と展開の対立する2つのタスクは、最先端のサンプリングベースのMPCによって最適化されている。
自動運転車と車輪付きロボットの両方で実験を行い、探索と展開の両方に有望な結果を示します。
論文 参考訳(メタデータ) (2023-05-20T17:20:12Z) - Safe reinforcement learning of dynamic high-dimensional robotic tasks:
navigation, manipulation, interaction [31.553783147007177]
強化学習では、損傷を起こさない環境を探索する上で、安全はより基本的なものである。
本稿では,各種ロボット作業の強化学習のための安全探索の新たな定式化について紹介する。
我々のアプローチは、幅広い種類のロボットプラットフォームに適用され、データから学んだ複雑な衝突制約の下でも安全を強制する。
論文 参考訳(メタデータ) (2022-09-27T11:23:49Z) - Revisiting the Adversarial Robustness-Accuracy Tradeoff in Robot
Learning [121.9708998627352]
近年の研究では、現実的なロボット学習の応用において、対人訓練の効果が公平なトレードオフを起こさないことが示されている。
本研究は,ロボット学習におけるロバストネスと精度のトレードオフを再考し,最近のロバストトレーニング手法と理論の進歩により,現実のロボット応用に適した対人トレーニングが可能かどうかを解析する。
論文 参考訳(メタデータ) (2022-04-15T08:12:15Z) - Dual-Arm Adversarial Robot Learning [0.6091702876917281]
ロボット学習のためのプラットフォームとしてデュアルアーム設定を提案する。
このセットアップの潜在的なメリットと、追求できる課題と研究の方向性について論じる。
論文 参考訳(メタデータ) (2021-10-15T12:51:57Z) - Adversarial Training is Not Ready for Robot Learning [55.493354071227174]
対人訓練は,ノルム有界摂動に耐性のあるディープラーニングモデルを訓練する有効な方法である。
敵訓練により得られたニューラルコントローラが3種類の欠陥を受けることを理論的および実験的に示す。
この結果から, ロボット学習にはまだ対応できていないことが示唆された。
論文 参考訳(メタデータ) (2021-03-15T07:51:31Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。