論文の概要: Active Uncertainty Reduction for Safe and Efficient Interaction
Planning: A Shielding-Aware Dual Control Approach
- arxiv url: http://arxiv.org/abs/2302.00171v1
- Date: Wed, 1 Feb 2023 01:34:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-02 18:12:05.397538
- Title: Active Uncertainty Reduction for Safe and Efficient Interaction
Planning: A Shielding-Aware Dual Control Approach
- Title(参考訳): 安全かつ効率的なインタラクション計画のためのアクティブ不確実性削減:シールド型デュアル制御アプローチ
- Authors: Haimin Hu, David Isele, Sangjae Bae, Jaime F. Fisac
- Abstract要約: 相手の行動を正確に予測する能力は、対話的な環境でのロボットシステムの安全性と効率の中心である。
二重制御理論は、予測モデルの未知のパラメータを隠れ状態として扱うことでこの問題に対処する。
本稿では,対話型動作計画における能動的不確実性低減を実現するアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 12.67606695654363
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The ability to accurately predict the opponent's behavior is central to the
safety and efficiency of robotic systems in interactive settings, such as
human-robot interaction and multi-robot teaming tasks. Unfortunately, robots
often lack access to key information on which these predictions may hinge, such
as opponent's goals, attention, and willingness to cooperate. Dual control
theory addresses this challenge by treating unknown parameters of a predictive
model as hidden states and inferring their values at runtime using information
gathered during system operation. While able to optimally and automatically
trade off exploration and exploitation, dual control is computationally
intractable for general interactive motion planning. In this paper, we present
a novel algorithmic approach to enable active uncertainty reduction for
interactive motion planning based on the implicit dual control paradigm. Our
approach relies on sampling-based approximation of stochastic dynamic
programming, leading to a model predictive control problem. The resulting
policy is shown to preserve the dual control effect for a broad class of
predictive models with both continuous and categorical uncertainty. To ensure
the safe operation of the interacting agents, we leverage a supervisory control
scheme, oftentimes referred to as ``shielding'', which overrides the ego
agent's dual control policy with a safety fallback strategy when a
safety-critical event is imminent. We then augment the dual control framework
with an improved variant of the recently proposed shielding-aware robust
planning scheme, which proactively balances the nominal planning performance
with the risk of high-cost emergency maneuvers triggered by low-probability
opponent's behaviors. We demonstrate the efficacy of our approach with both
simulated driving examples and hardware experiments using 1/10 scale autonomous
vehicles.
- Abstract(参考訳): 相手の行動を正確に予測する能力は、人間とロボットのインタラクションやマルチロボットのチーム作業など、インタラクティブな環境でのロボットシステムの安全性と効率性の中心である。
残念ながら、ロボットは多くの場合、敵の目標、注意、協力意欲など、これらの予測が係わる重要な情報へのアクセスを欠いている。
二重制御理論は、予測モデルの未知のパラメータを隠蔽状態として扱い、システム操作中に収集された情報を用いて実行時にそれらの値を推測することでこの問題に対処する。
探索と搾取を最適かつ自動的にトレードオフできるが、双対制御は一般的な対話型モーションプランニングには計算的に難解である。
本稿では,暗黙的二重制御パラダイムに基づく対話型動作計画における能動的不確実性低減を実現するアルゴリズムを提案する。
提案手法は,確率的動的プログラミングのサンプリングに基づく近似に依拠し,モデル予測制御問題を引き起こす。
結果として得られた方針は、連続的およびカテゴリー的不確実性の両方を持つ幅広い予測モデルに対する双対制御効果を保つことが示される。
対話型エージェントの安全な運用を確保するために,安全クリティカルなイベントが間近に迫った場合,egoエージェントのデュアルコントロールポリシを安全フォールバック戦略でオーバーライドする,‘shielding’と呼ばれる監督制御スキームを利用する。
そこで我々は,最近提案された遮蔽対応の頑健な計画スキームの改良により,二元制御の枠組みを改良し,低確率相手の行動に起因した高コスト緊急操作のリスクと名目計画性能を積極的にバランスさせる。
シミュレーション駆動例と1/10スケールの自律走行車を用いたハードウェア実験により,本手法の有効性を実証した。
関連論文リスト
- SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Model Checking for Closed-Loop Robot Reactive Planning [0.0]
モデル検査を用いて、ディファレンシャルドライブホイールロボットの多段階計画を作成することにより、即時危険を回避できることを示す。
簡単な生物エージェントのエゴセントリックな反応を反映した,小型で汎用的なモデル検査アルゴリズムを用いて,リアルタイムで計画を生成する。
論文 参考訳(メタデータ) (2023-11-16T11:02:29Z) - Tuning Legged Locomotion Controllers via Safe Bayesian Optimization [47.87675010450171]
本稿では,ロボットハードウェアプラットフォームにおけるモデルベースコントローラの展開を効率化するための,データ駆動型戦略を提案する。
モデルフリーな安全な学習アルゴリズムを用いて制御ゲインのチューニングを自動化し、制御定式化で使用される単純化されたモデルと実システムとのミスマッチに対処する。
論文 参考訳(メタデータ) (2023-06-12T13:10:14Z) - Safe Machine-Learning-supported Model Predictive Force and Motion
Control in Robotics [0.0]
人間とロボットの相互作用や脆弱な物体のハンドリングのような多くのロボットタスクは、安全かつ高性能な操作を実現するために、動き制御と共に現れる力とモーメントの厳密な制御と制限を必要とする。
本研究では,学習支援型モデル予測力と運動制御方式を提案する。
論文 参考訳(メタデータ) (2023-03-08T13:30:02Z) - Active Uncertainty Learning for Human-Robot Interaction: An Implicit
Dual Control Approach [5.05828899601167]
暗黙的な二重制御パラダイムに基づくループ内動作計画のための不確実性学習を実現するアルゴリズムを提案する。
提案手法は,動的プログラミングモデル予測制御問題のサンプリングに基づく近似に依拠する。
結果として得られたポリシーは、連続的およびカテゴリー的不確実性を持つ一般的な人間の予測モデルに対する二重制御効果を維持することが示されている。
論文 参考訳(メタデータ) (2022-02-15T20:40:06Z) - SHARP: Shielding-Aware Robust Planning for Safe and Efficient
Human-Robot Interaction [5.804727815849655]
シールド」制御スキームは、安全クリティカルなイベントが差し迫った場合に、ロボットの名目上の計画と安全フォールバック戦略をオーバーライドする。
本研究では,ロボットが将来の遮蔽イベントを明示的に考慮し,効率的に計画できる新しい遮蔽型計画手法を提案する。
論文 参考訳(メタデータ) (2021-10-02T17:01:59Z) - Deep Structured Reactive Planning [94.92994828905984]
自動運転のための新しいデータ駆動型リアクティブ計画目標を提案する。
本モデルは,非常に複雑な操作を成功させる上で,非反応性変種よりも優れることを示す。
論文 参考訳(メタデータ) (2021-01-18T01:43:36Z) - Risk-Sensitive Sequential Action Control with Multi-Modal Human
Trajectory Forecasting for Safe Crowd-Robot Interaction [55.569050872780224]
本稿では,リスクに敏感な最適制御に基づく安全な群集ロボットインタラクションのためのオンラインフレームワークを提案し,そのリスクをエントロピーリスク尺度でモデル化する。
私たちのモジュラーアプローチは、クラウドとロボットの相互作用を学習ベースの予測とモデルベースの制御に分離します。
シミュレーション研究と実世界の実験により、このフレームワークは、現場にいる50人以上の人間との衝突を避けながら、安全で効率的なナビゲーションを実現することができることが示された。
論文 参考訳(メタデータ) (2020-09-12T02:02:52Z) - The Importance of Prior Knowledge in Precise Multimodal Prediction [71.74884391209955]
道路にはよく定義された地形、地形、交通規則がある。
本稿では,構造的事前を損失関数として組み込むことを提案する。
実世界の自動運転データセットにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-06-04T03:56:11Z) - Chance-Constrained Trajectory Optimization for Safe Exploration and
Learning of Nonlinear Systems [81.7983463275447]
学習に基づく制御アルゴリズムは、訓練のための豊富な監督を伴うデータ収集を必要とする。
本稿では,機会制約付き最適制御と動的学習とフィードバック制御を統合した安全な探索による最適動作計画のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-09T05:57:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。