論文の概要: Guaranteed Contraction Control in the Presence of Imperfectly Learned
Dynamics
- arxiv url: http://arxiv.org/abs/2112.08222v1
- Date: Wed, 15 Dec 2021 15:57:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-16 17:18:44.667347
- Title: Guaranteed Contraction Control in the Presence of Imperfectly Learned
Dynamics
- Title(参考訳): 不完全学習ダイナミクスの存在下での保証された収縮制御
- Authors: Pan Zhao, Ziyao Guo, Yikun Cheng, Aditya Gahlawat and Naira Hovakimyan
- Abstract要約: 本稿では,制約指標と外乱推定に基づく軌道中心学習制御のアプローチを提案する。
提案するフレームワークは、平面四辺形ナビゲーションの例で検証される。
- 参考スコア(独自算出の注目度): 3.4521275962283626
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents an approach for trajectory-centric learning control based
on contraction metrics and disturbance estimation for nonlinear systems subject
to matched uncertainties. The approach allows for the use of a broad class of
model learning tools including deep neural networks to learn uncertain dynamics
while still providing guarantees of transient tracking performance throughout
the learning phase, including the special case of no learning. Within the
proposed approach, a disturbance estimation law is proposed to estimate the
pointwise value of the uncertainty, with pre-computable estimation error bounds
(EEBs). The learned dynamics, the estimated disturbances, and the EEBs are then
incorporated in a robust Riemannian energy condition to compute the control law
that guarantees exponential convergence of actual trajectories to desired ones
throughout the learning phase, even when the learned model is poor. On the
other hand, with improved accuracy, the learned model can be incorporated in a
high-level planner to plan better trajectories with improved performance, e.g.,
lower energy consumption and shorter travel time. The proposed framework is
validated on a planar quadrotor navigation example.
- Abstract(参考訳): 本稿では,不確かさに適合する非線形システムの収縮メトリックと外乱推定に基づく軌道中心学習制御のアプローチを提案する。
このアプローチでは、ディープニューラルネットワークを含む幅広いモデルの学習ツールを使用して、不確実なダイナミクスを学習すると同時に、学習のない特別なケースを含む学習フェーズ全体を通して、過渡的なトラッキングパフォーマンスの保証を提供する。
提案手法では,事前計算可能な推定誤差境界(eebs)を用いて不確かさのポイントワイズ値を推定するために外乱推定法が提案されている。
学習されたダイナミクス、推定された外乱、およびeebは、学習されたモデルが貧弱であっても、学習フェーズを通じて所望の軌道が所望の軌道に指数収束することを保証する制御則を計算するために、強固なリーマンエネルギー条件に組み込まれている。
一方、精度の向上により、学習したモデルを高レベルプランナーに組み込むことで、より優れた軌道計画、例えば、エネルギー消費量の低減や旅行時間の短縮など、性能の向上を図ることができる。
提案されたフレームワークは、平面四角形ナビゲーションの例で検証される。
関連論文リスト
- Selective Learning: Towards Robust Calibration with Dynamic
Regularization [93.2503677723367]
ディープラーニングにおけるミススキャリブレーションとは、予測された信頼とパフォーマンスの間には相違がある、という意味である。
トレーニング中に何を学ぶべきかを学ぶことを目的とした動的正規化(DReg)を導入し、信頼度調整のトレードオフを回避する。
論文 参考訳(メタデータ) (2024-02-13T11:25:20Z) - Actively Learning Reinforcement Learning: A Stochastic Optimal Control
Approach [3.7728340443952577]
提案する枠組みは,2つある: (i) 活発な探索と意図的な情報収集を伴う強化学習, (i) ミスマッチのモデル化による状態と不確実性を制御し, (ii) 最適制御の膨大な計算コストを克服する。
我々は、強化学習を用いて最適制御法を達成することにより、両方の目的にアプローチする。
論文 参考訳(メタデータ) (2023-09-18T18:05:35Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z) - EvCenterNet: Uncertainty Estimation for Object Detection using
Evidential Learning [26.535329379980094]
EvCenterNetは、新しい不確実性を認識した2Dオブジェクト検出フレームワークである。
分類と回帰の不確実性の両方を推定するために、顕在的学習を用いる。
我々は、KITTIデータセット上でモデルをトレーニングし、配布外のデータセットに挑戦して評価する。
論文 参考訳(メタデータ) (2023-03-06T11:07:11Z) - Lightweight, Uncertainty-Aware Conformalized Visual Odometry [2.429910016019183]
データ駆動型ビジュアルオドメトリー(VO)は、自律エッジロボティクスにとって重要なサブルーチンである。
昆虫スケールドローンや外科ロボットのような最先端ロボットデバイスは、VOの予測の不確実性を推定する計算的に効率的な枠組みを欠いている。
本稿では,共形推論(CI)を利用してVOの不確実な帯域を抽出する,新しい,軽量で統計的に堅牢なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-03T20:37:55Z) - Statistical Safety and Robustness Guarantees for Feedback Motion
Planning of Unknown Underactuated Stochastic Systems [1.0323063834827415]
本研究では, 平均力学モデルを用いたサンプリングベースプランナを提案し, 学習外乱境界による閉ループ追従誤差を同時に有界化する。
この保証は,10次元四角形ロボットのシミュレーションや,クレージーフライ四角形ロボットとクリアパスジャカルロボットの現実世界でのシミュレーションにおいて,経験的安全性に変換されることを検証した。
論文 参考訳(メタデータ) (2022-12-13T19:38:39Z) - Adaptive Robust Model Predictive Control via Uncertainty Cancellation [25.736296938185074]
本稿では,動的に重要な不確かさを補う学習に基づく頑健な予測制御アルゴリズムを提案する。
我々は、一定の等価な「推定とキャンセル」制御法に着想を得た、非線形フィードバックポリシーのクラスを最適化する。
論文 参考訳(メタデータ) (2022-12-02T18:54:23Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - A Regret Minimization Approach to Iterative Learning Control [61.37088759497583]
我々は、標準的な不確実性の仮定を最悪の場合の後悔に置き換える新しいパフォーマンスメトリック、計画後悔を提案します。
提案アルゴリズムがいくつかのベンチマークで既存の手法よりも優れているという理論的および実証的な証拠を提供します。
論文 参考訳(メタデータ) (2021-02-26T13:48:49Z) - Adaptive Gradient Method with Resilience and Momentum [120.83046824742455]
レジリエンスとモメンタム(AdaRem)を用いた適応勾配法を提案する。
AdaRemは、過去の1つのパラメータの変化方向が現在の勾配の方向と一致しているかどうかに応じてパラメータワイズ学習率を調整する。
本手法は,学習速度とテスト誤差の観点から,従来の適応学習率に基づくアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2020-10-21T14:49:00Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。