論文の概要: Active Uncertainty Reduction for Safe and Efficient Interaction
Planning: A Shielding-Aware Dual Control Approach
- arxiv url: http://arxiv.org/abs/2302.00171v2
- Date: Wed, 1 Nov 2023 17:33:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 18:20:32.649324
- Title: Active Uncertainty Reduction for Safe and Efficient Interaction
Planning: A Shielding-Aware Dual Control Approach
- Title(参考訳): 安全かつ効率的なインタラクション計画のためのアクティブ不確実性削減:シールド型デュアル制御アプローチ
- Authors: Haimin Hu, David Isele, Sangjae Bae, Jaime F. Fisac
- Abstract要約: 本稿では,暗黙的二重制御パラダイムに基づく対話型動作計画における能動的不確実性低減を実現するアルゴリズムを提案する。
提案手法は, 動的プログラミングのサンプリングに基づく近似に依拠し, リアルタイム勾配最適化法で容易に解けるモデル予測制御問題に導かれる。
- 参考スコア(独自算出の注目度): 9.07774184840379
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The ability to accurately predict others' behavior is central to the safety
and efficiency of interactive robotics. Unfortunately, robots often lack access
to key information on which these predictions may hinge, such as other agents'
goals, attention, and willingness to cooperate. Dual control theory addresses
this challenge by treating unknown parameters of a predictive model as
stochastic hidden states and inferring their values at runtime using
information gathered during system operation. While able to optimally and
automatically trade off exploration and exploitation, dual control is
computationally intractable for general interactive motion planning. In this
paper, we present a novel algorithmic approach to enable active uncertainty
reduction for interactive motion planning based on the implicit dual control
paradigm. Our approach relies on sampling-based approximation of stochastic
dynamic programming, leading to a model predictive control problem that can be
readily solved by real-time gradient-based optimization methods. The resulting
policy is shown to preserve the dual control effect for a broad class of
predictive models with both continuous and categorical uncertainty. To ensure
the safe operation of the interacting agents, we use a runtime safety filter
(also referred to as a "shielding" scheme), which overrides the robot's dual
control policy with a safety fallback strategy when a safety-critical event is
imminent. We then augment the dual control framework with an improved variant
of the recently proposed shielding-aware robust planning scheme, which
proactively balances the nominal planning performance with the risk of
high-cost emergency maneuvers triggered by low-probability agent behaviors. We
demonstrate the efficacy of our approach with both simulated driving studies
and hardware experiments using 1/10 scale autonomous vehicles.
- Abstract(参考訳): 他者の行動を正確に予測する能力は、対話型ロボットの安全性と効率性の中心である。
残念なことに、ロボットは、他のエージェントの目標、注意、協力意欲など、これらの予測が係わる重要な情報にアクセスできないことが多い。
二重制御理論は、予測モデルの未知のパラメータを確率的隠れ状態として扱い、システム操作中に収集された情報を用いて実行時にそれらの値を推測することでこの問題に対処する。
探索と搾取を最適かつ自動的にトレードオフできるが、双対制御は一般的な対話型モーションプランニングには計算的に難解である。
本稿では,暗黙的二重制御パラダイムに基づく対話型動作計画における能動的不確実性低減を実現するアルゴリズムを提案する。
提案手法は,確率的動的プログラミングのサンプリングに基づく近似に依拠し,実時間勾配に基づく最適化手法で容易に解けるモデル予測制御問題を導出する。
結果として得られた方針は、連続的およびカテゴリー的不確実性の両方を持つ幅広い予測モデルに対する双対制御効果を保つことが示される。
インタラクションエージェントの安全な動作を確保するために、安全性クリティカルなイベントが間近にある場合に、ロボットのデュアルコントロールポリシをセーフフォールバック戦略でオーバーライドするランタイムセーフティフィルタ("shielding"スキームとも呼ばれる)を使用します。
そこで我々は,最近提案されたシールド対応型ロバスト計画法を改良したデュアルコントロール・フレームワークを改良し,低確率エージェントの動作によって引き起こされる高コスト緊急操作のリスクと名目計画性能を積極的にバランスさせる。
1/10スケールの自律走行車を用いたシミュレーション運転実験とハードウェア実験によるアプローチの有効性を実証した。
関連論文リスト
- SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Model Checking for Closed-Loop Robot Reactive Planning [0.0]
モデル検査を用いて、ディファレンシャルドライブホイールロボットの多段階計画を作成することにより、即時危険を回避できることを示す。
簡単な生物エージェントのエゴセントリックな反応を反映した,小型で汎用的なモデル検査アルゴリズムを用いて,リアルタイムで計画を生成する。
論文 参考訳(メタデータ) (2023-11-16T11:02:29Z) - Tuning Legged Locomotion Controllers via Safe Bayesian Optimization [47.87675010450171]
本稿では,ロボットハードウェアプラットフォームにおけるモデルベースコントローラの展開を効率化するための,データ駆動型戦略を提案する。
モデルフリーな安全な学習アルゴリズムを用いて制御ゲインのチューニングを自動化し、制御定式化で使用される単純化されたモデルと実システムとのミスマッチに対処する。
論文 参考訳(メタデータ) (2023-06-12T13:10:14Z) - Safe Machine-Learning-supported Model Predictive Force and Motion
Control in Robotics [0.0]
人間とロボットの相互作用や脆弱な物体のハンドリングのような多くのロボットタスクは、安全かつ高性能な操作を実現するために、動き制御と共に現れる力とモーメントの厳密な制御と制限を必要とする。
本研究では,学習支援型モデル予測力と運動制御方式を提案する。
論文 参考訳(メタデータ) (2023-03-08T13:30:02Z) - Active Uncertainty Learning for Human-Robot Interaction: An Implicit
Dual Control Approach [5.05828899601167]
暗黙的な二重制御パラダイムに基づくループ内動作計画のための不確実性学習を実現するアルゴリズムを提案する。
提案手法は,動的プログラミングモデル予測制御問題のサンプリングに基づく近似に依拠する。
結果として得られたポリシーは、連続的およびカテゴリー的不確実性を持つ一般的な人間の予測モデルに対する二重制御効果を維持することが示されている。
論文 参考訳(メタデータ) (2022-02-15T20:40:06Z) - SHARP: Shielding-Aware Robust Planning for Safe and Efficient
Human-Robot Interaction [5.804727815849655]
シールド」制御スキームは、安全クリティカルなイベントが差し迫った場合に、ロボットの名目上の計画と安全フォールバック戦略をオーバーライドする。
本研究では,ロボットが将来の遮蔽イベントを明示的に考慮し,効率的に計画できる新しい遮蔽型計画手法を提案する。
論文 参考訳(メタデータ) (2021-10-02T17:01:59Z) - Deep Structured Reactive Planning [94.92994828905984]
自動運転のための新しいデータ駆動型リアクティブ計画目標を提案する。
本モデルは,非常に複雑な操作を成功させる上で,非反応性変種よりも優れることを示す。
論文 参考訳(メタデータ) (2021-01-18T01:43:36Z) - Risk-Sensitive Sequential Action Control with Multi-Modal Human
Trajectory Forecasting for Safe Crowd-Robot Interaction [55.569050872780224]
本稿では,リスクに敏感な最適制御に基づく安全な群集ロボットインタラクションのためのオンラインフレームワークを提案し,そのリスクをエントロピーリスク尺度でモデル化する。
私たちのモジュラーアプローチは、クラウドとロボットの相互作用を学習ベースの予測とモデルベースの制御に分離します。
シミュレーション研究と実世界の実験により、このフレームワークは、現場にいる50人以上の人間との衝突を避けながら、安全で効率的なナビゲーションを実現することができることが示された。
論文 参考訳(メタデータ) (2020-09-12T02:02:52Z) - The Importance of Prior Knowledge in Precise Multimodal Prediction [71.74884391209955]
道路にはよく定義された地形、地形、交通規則がある。
本稿では,構造的事前を損失関数として組み込むことを提案する。
実世界の自動運転データセットにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-06-04T03:56:11Z) - Chance-Constrained Trajectory Optimization for Safe Exploration and
Learning of Nonlinear Systems [81.7983463275447]
学習に基づく制御アルゴリズムは、訓練のための豊富な監督を伴うデータ収集を必要とする。
本稿では,機会制約付き最適制御と動的学習とフィードバック制御を統合した安全な探索による最適動作計画のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-09T05:57:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。