論文の概要: Guaranteed Contraction Control in the Presence of Imperfectly Learned
Dynamics
- arxiv url: http://arxiv.org/abs/2112.08222v1
- Date: Wed, 15 Dec 2021 15:57:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-16 17:18:44.667347
- Title: Guaranteed Contraction Control in the Presence of Imperfectly Learned
Dynamics
- Title(参考訳): 不完全学習ダイナミクスの存在下での保証された収縮制御
- Authors: Pan Zhao, Ziyao Guo, Yikun Cheng, Aditya Gahlawat and Naira Hovakimyan
- Abstract要約: 本稿では,制約指標と外乱推定に基づく軌道中心学習制御のアプローチを提案する。
提案するフレームワークは、平面四辺形ナビゲーションの例で検証される。
- 参考スコア(独自算出の注目度): 3.4521275962283626
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents an approach for trajectory-centric learning control based
on contraction metrics and disturbance estimation for nonlinear systems subject
to matched uncertainties. The approach allows for the use of a broad class of
model learning tools including deep neural networks to learn uncertain dynamics
while still providing guarantees of transient tracking performance throughout
the learning phase, including the special case of no learning. Within the
proposed approach, a disturbance estimation law is proposed to estimate the
pointwise value of the uncertainty, with pre-computable estimation error bounds
(EEBs). The learned dynamics, the estimated disturbances, and the EEBs are then
incorporated in a robust Riemannian energy condition to compute the control law
that guarantees exponential convergence of actual trajectories to desired ones
throughout the learning phase, even when the learned model is poor. On the
other hand, with improved accuracy, the learned model can be incorporated in a
high-level planner to plan better trajectories with improved performance, e.g.,
lower energy consumption and shorter travel time. The proposed framework is
validated on a planar quadrotor navigation example.
- Abstract(参考訳): 本稿では,不確かさに適合する非線形システムの収縮メトリックと外乱推定に基づく軌道中心学習制御のアプローチを提案する。
このアプローチでは、ディープニューラルネットワークを含む幅広いモデルの学習ツールを使用して、不確実なダイナミクスを学習すると同時に、学習のない特別なケースを含む学習フェーズ全体を通して、過渡的なトラッキングパフォーマンスの保証を提供する。
提案手法では,事前計算可能な推定誤差境界(eebs)を用いて不確かさのポイントワイズ値を推定するために外乱推定法が提案されている。
学習されたダイナミクス、推定された外乱、およびeebは、学習されたモデルが貧弱であっても、学習フェーズを通じて所望の軌道が所望の軌道に指数収束することを保証する制御則を計算するために、強固なリーマンエネルギー条件に組み込まれている。
一方、精度の向上により、学習したモデルを高レベルプランナーに組み込むことで、より優れた軌道計画、例えば、エネルギー消費量の低減や旅行時間の短縮など、性能の向上を図ることができる。
提案されたフレームワークは、平面四角形ナビゲーションの例で検証される。
関連論文リスト
- Selective Learning: Towards Robust Calibration with Dynamic Regularization [79.92633587914659]
ディープラーニングにおけるミススキャリブレーションとは、予測された信頼とパフォーマンスの間には相違がある、という意味である。
トレーニング中に何を学ぶべきかを学ぶことを目的とした動的正規化(DReg)を導入し、信頼度調整のトレードオフを回避する。
論文 参考訳(メタデータ) (2024-02-13T11:25:20Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z) - Constrained Reinforcement Learning using Distributional Representation for Trustworthy Quadrotor UAV Tracking Control [2.325021848829375]
本研究では, 未知の空力効果に対する分散強化学習障害推定器を統合した新しいトラジェクトリトラッカーを提案する。
提案手法は, 空気力学効果の真値と推定値の不確かさを正確に同定する。
本システムは,最近の技術と比較して,累積追尾誤差を少なくとも70%改善することを示した。
論文 参考訳(メタデータ) (2023-02-22T23:15:56Z) - Statistical Safety and Robustness Guarantees for Feedback Motion
Planning of Unknown Underactuated Stochastic Systems [1.0323063834827415]
本研究では, 平均力学モデルを用いたサンプリングベースプランナを提案し, 学習外乱境界による閉ループ追従誤差を同時に有界化する。
この保証は,10次元四角形ロボットのシミュレーションや,クレージーフライ四角形ロボットとクリアパスジャカルロボットの現実世界でのシミュレーションにおいて,経験的安全性に変換されることを検証した。
論文 参考訳(メタデータ) (2022-12-13T19:38:39Z) - Interpretable Stochastic Model Predictive Control using Distributional
Reinforced Estimation for Quadrotor Tracking Systems [0.8411385346896411]
本研究では,動的・複雑環境下での自律的四角形ナビゲーションのためのトラジェクトリトラッカーを提案する。
提案フレームワークは,未知の空力効果に対する分散強化学習推定器をモデル予測制御器に統合する。
我々は,未知かつ多様な空気力を用いて,累積追従誤差を少なくとも66%改善するシステムを実証した。
論文 参考訳(メタデータ) (2022-05-14T23:27:38Z) - Robust Learning via Persistency of Excitation [4.674053902991301]
勾配勾配勾配を用いたネットワークトレーニングは力学系パラメータ推定問題と等価であることを示す。
極値理論を用いて対応するリプシッツ定数を推定する効率的な手法を提案する。
我々の手法は、様々な最先端の対数訓練モデルにおいて、対数精度を0.1%から0.3%に普遍的に向上させる。
論文 参考訳(メタデータ) (2021-06-03T18:49:05Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Adaptive Degradation Process with Deep Learning-Driven Trajectory [5.060233857860902]
RUL(Remaining useful Life)推定は、インテリジェントな予測保守と健康管理の実装において重要な要素である。
本論文では, ハイブリットDNNベースの予後予測モデルを開発し, 適応ドリフトを用いてシステム劣化を特徴づける。
LSTM-CNNエンコーダデコーダを開発し、ノイズ係数とドリフト係数を併用して将来の劣化軌道を予測し、ベイズ推論により適応ドリフトを更新する。
論文 参考訳(メタデータ) (2021-03-22T06:00:42Z) - A Regret Minimization Approach to Iterative Learning Control [61.37088759497583]
我々は、標準的な不確実性の仮定を最悪の場合の後悔に置き換える新しいパフォーマンスメトリック、計画後悔を提案します。
提案アルゴリズムがいくつかのベンチマークで既存の手法よりも優れているという理論的および実証的な証拠を提供します。
論文 参考訳(メタデータ) (2021-02-26T13:48:49Z) - Adaptive Gradient Method with Resilience and Momentum [120.83046824742455]
レジリエンスとモメンタム(AdaRem)を用いた適応勾配法を提案する。
AdaRemは、過去の1つのパラメータの変化方向が現在の勾配の方向と一致しているかどうかに応じてパラメータワイズ学習率を調整する。
本手法は,学習速度とテスト誤差の観点から,従来の適応学習率に基づくアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2020-10-21T14:49:00Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。