論文の概要: Planning with Learned Dynamics: Probabilistic Guarantees on Safety and
Reachability via Lipschitz Constants
- arxiv url: http://arxiv.org/abs/2010.08993v4
- Date: Tue, 19 Oct 2021 18:46:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 04:40:46.680856
- Title: Planning with Learned Dynamics: Probabilistic Guarantees on Safety and
Reachability via Lipschitz Constants
- Title(参考訳): 学習ダイナミクスによる計画:リプシッツ定数による安全性と到達性に関する確率的保証
- Authors: Craig Knuth, Glen Chou, Necmiye Ozay, Dmitry Berenson
- Abstract要約: 未知のダイナミクスを持つシステムのフィードバック動作計画法を提案する。
安全、到達可能性、目標安定性の保証を提供します。
提案手法は,6次元立方体と7DOFクカアームの学習モデルを用いて計画する。
- 参考スコア(独自算出の注目度): 7.216586291939535
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a method for feedback motion planning of systems with unknown
dynamics which provides probabilistic guarantees on safety, reachability, and
goal stability. To find a domain in which a learned control-affine
approximation of the true dynamics can be trusted, we estimate the Lipschitz
constant of the difference between the true and learned dynamics, and ensure
the estimate is valid with a given probability. Provided the system has at
least as many controls as states, we also derive existence conditions for a
one-step feedback law which can keep the real system within a small bound of a
nominal trajectory planned with the learned dynamics. Our method imposes the
feedback law existence as a constraint in a sampling-based planner, which
returns a feedback policy around a nominal plan ensuring that, if the Lipschitz
constant estimate is valid, the true system is safe during plan execution,
reaches the goal, and is ultimately invariant in a small set about the goal. We
demonstrate our approach by planning using learned models of a 6D quadrotor and
a 7DOF Kuka arm. We show that a baseline which plans using the same learned
dynamics without considering the error bound or the existence of the feedback
law can fail to stabilize around the plan and become unsafe.
- Abstract(参考訳): 本稿では,安全性,到達性,目標安定性を確率論的に保証する未知力学系のフィードバック動作計画法を提案する。
真のダイナミクスの学習された制御-アフィン近似を信頼できる領域を見つけるために、真のダイナミクスと学習されたダイナミクスの差のリプシッツ定数を推定し、その推定が与えられた確率で有効であることを保証する。
システムに状態と同じくらい多くの制御がある場合、学習力学で計画された名目軌道の小さな境界内に実システムを保持することができるワンステップフィードバック法の存在条件も導出する。
提案手法は,リプシッツ定数推定が有効である場合,真のシステムが計画実行中に安全であり,目標に達し,最終的に目標に関する小さなセットで不変であることを示す,名目計画に関するフィードバックポリシを返却するサンプリングベースプランナーの制約として,フィードバック法の存在を課している。
6次元クワッドローターと7dof kukaアームの学習モデルを用いて,このアプローチを実証する。
誤差境界やフィードバック則の存在を考慮せずに,同じ学習力学を用いて計画するベースラインは,計画の周りでは安定せず,安全性に欠ける可能性がある。
関連論文リスト
- Probabilistic Reach-Avoid for Bayesian Neural Networks [71.67052234622781]
最適合成アルゴリズムは、証明された状態の数を4倍以上に増やすことができることを示す。
このアルゴリズムは、平均的な到達回避確率を3倍以上に向上させることができる。
論文 参考訳(メタデータ) (2023-10-03T10:52:21Z) - Statistical Safety and Robustness Guarantees for Feedback Motion
Planning of Unknown Underactuated Stochastic Systems [1.0323063834827415]
本研究では, 平均力学モデルを用いたサンプリングベースプランナを提案し, 学習外乱境界による閉ループ追従誤差を同時に有界化する。
この保証は,10次元四角形ロボットのシミュレーションや,クレージーフライ四角形ロボットとクリアパスジャカルロボットの現実世界でのシミュレーションにおいて,経験的安全性に変換されることを検証した。
論文 参考訳(メタデータ) (2022-12-13T19:38:39Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Safe Reinforcement Learning via Confidence-Based Filters [78.39359694273575]
我々は,標準的な強化学習技術を用いて学習した名目政策に対して,国家安全の制約を認定するための制御理論的アプローチを開発する。
我々は、正式な安全保証を提供し、我々のアプローチの有効性を実証的に実証する。
論文 参考訳(メタデータ) (2022-07-04T11:43:23Z) - ProBF: Learning Probabilistic Safety Certificates with Barrier Functions [31.203344483485843]
制御バリア関数は、地平系力学にアクセスできれば安全を保証できる便利なツールである。
実際には、システムダイナミクスに関する不正確な知識があるため、安全でない振る舞いにつながる可能性があります。
本手法の有効性をSegwayとQuadrotorのシミュレーション実験により示す。
論文 参考訳(メタデータ) (2021-12-22T20:18:18Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Model Error Propagation via Learned Contraction Metrics for Safe
Feedback Motion Planning of Unknown Systems [4.702729080310267]
本稿では,局所的に安定化可能な動的システムの収縮に基づくフィードバック動作計画法を提案する。
動的データセットが与えられたとき、本手法はダイナミクスの深い制御親和近似を学習する。
4dカー,6dクワッドローター,22d変形可能なオブジェクト操作タスクにおいて,高次元不動システムの学習モデルを用いて,提案手法を安全に提示する。
論文 参考訳(メタデータ) (2021-04-18T03:34:00Z) - Safe Learning of Uncertain Environments for Nonlinear Control-Affine
Systems [10.918870296899245]
未知の添加不確実性を受ける非線形制御アフィン系における安全な学習の問題を検討する。
我々はガウス信号として不確実性をモデル化し、状態測定を用いて平均と共分散境界を学習する。
学習と制御が同時に行われる間、我々は任意に大きな確率で状態が安全なセットにとどまることを保証することができることを示しています。
論文 参考訳(メタデータ) (2021-03-02T01:58:02Z) - Uncertainty-Aware Constraint Learning for Adaptive Safe Motion Planning
from Demonstrations [6.950510860295866]
本稿では,実証から不確実な制約を満たすための学習方法を提案する。
提案手法はロバスト最適化を用いて,実証と整合した制約の潜在的無限の集合に対する信念を得る。
我々は,我々の制約信念の正確さと計画の安全性に関する確率的保証を導出する。
論文 参考訳(メタデータ) (2020-11-09T01:59:14Z) - Chance-Constrained Trajectory Optimization for Safe Exploration and
Learning of Nonlinear Systems [81.7983463275447]
学習に基づく制御アルゴリズムは、訓練のための豊富な監督を伴うデータ収集を必要とする。
本稿では,機会制約付き最適制御と動的学習とフィードバック制御を統合した安全な探索による最適動作計画のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-09T05:57:43Z) - Learning Control Barrier Functions from Expert Demonstrations [69.23675822701357]
制御障壁関数(CBF)に基づく安全な制御器合成のための学習に基づくアプローチを提案する。
最適化に基づくCBFの学習手法を解析し、基礎となる力学系のリプシッツ仮定の下で証明可能な安全保証を享受する。
私たちの知る限りでは、これらはデータから確実に安全な制御障壁関数を学習する最初の結果です。
論文 参考訳(メタデータ) (2020-04-07T12:29:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。