論文の概要: Deep Learning Tubes for Tube MPC
- arxiv url: http://arxiv.org/abs/2002.01587v2
- Date: Thu, 4 Jun 2020 20:12:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 22:04:03.198611
- Title: Deep Learning Tubes for Tube MPC
- Title(参考訳): チューブMPCのための深層学習チューブ
- Authors: David D. Fan, Ali-akbar Agha-mohammadi and Evangelos A. Theodorou
- Abstract要約: 深層学習を用いて、軌道の振舞いの表現的かつ柔軟なモデルを得る。
非線形モデル予測制御(MPC)に使用する。
非線形四元数系のシミュレーション実験について述べる。
- 参考スコア(独自算出の注目度): 21.84264471259777
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning-based control aims to construct models of a system to use for
planning or trajectory optimization, e.g. in model-based reinforcement
learning. In order to obtain guarantees of safety in this context, uncertainty
must be accurately quantified. This uncertainty may come from errors in
learning (due to a lack of data, for example), or may be inherent to the
system. Propagating uncertainty forward in learned dynamics models is a
difficult problem. In this work we use deep learning to obtain expressive and
flexible models of how distributions of trajectories behave, which we then use
for nonlinear Model Predictive Control (MPC). We introduce a deep quantile
regression framework for control that enforces probabilistic quantile bounds
and quantifies epistemic uncertainty. Using our method we explore three
different approaches for learning tubes that contain the possible trajectories
of the system, and demonstrate how to use each of them in a Tube MPC scheme. We
prove these schemes are recursively feasible and satisfy constraints with a
desired margin of probability. We present experiments in simulation on a
nonlinear quadrotor system, demonstrating the practical efficacy of these
ideas.
- Abstract(参考訳): 学習に基づく制御は、例えばモデルに基づく強化学習において、計画や軌道最適化に使用するシステムのモデルを構築することを目的としている。
この文脈で安全を保証するためには、不確実性は正確に定量化する必要がある。
この不確実性は、学習におけるエラー(例えばデータの欠如による)や、システム固有のものである可能性がある。
学習力学モデルにおける不確実性を前進させることは難しい問題である。
本研究では、ディープラーニングを用いて軌道の分布の振る舞いの表現的および柔軟なモデルを求め、非線形モデル予測制御(MPC)に使用する。
我々は,確率的質的境界を強制し,認識的不確かさを定量化する制御のための深い質的回帰フレームワークを提案する。
提案手法を用いて,システムの軌跡を包含するチューブを学習するための3つの異なるアプローチを探索し,それぞれをチューブmpc方式で使用する方法を示す。
これらのスキームは再帰的に実現可能であり、制約を所望の確率の限界で満たす。
本稿では,非線形四重項系のシミュレーション実験を行い,その実効性を示す。
関連論文リスト
- Learning Controlled Stochastic Differential Equations [61.82896036131116]
本研究では,非一様拡散を伴う連続多次元非線形微分方程式のドリフト係数と拡散係数の両方を推定する新しい手法を提案する。
我々は、(L2)、(Linfty)の有限サンプル境界や、係数の正則性に適応する学習率を持つリスクメトリクスを含む、強力な理論的保証を提供する。
当社のメソッドはオープンソースPythonライブラリとして利用可能です。
論文 参考訳(メタデータ) (2024-11-04T11:09:58Z) - Non-Markovian Quantum Control via Model Maximum Likelihood Estimation
and Reinforcement Learning [0.0]
環境の非マルコフ的性質を低次元有効貯留層に組み込む新しい手法を提案する。
従来のトモグラフィ法よりも効率的な量子力学の学習に機械学習技術を用いる。
このアプローチはモデルバイアスの問題を緩和するだけでなく、量子力学のより正確な表現を提供する。
論文 参考訳(メタデータ) (2024-02-07T18:37:17Z) - Statistical Safety and Robustness Guarantees for Feedback Motion
Planning of Unknown Underactuated Stochastic Systems [1.0323063834827415]
本研究では, 平均力学モデルを用いたサンプリングベースプランナを提案し, 学習外乱境界による閉ループ追従誤差を同時に有界化する。
この保証は,10次元四角形ロボットのシミュレーションや,クレージーフライ四角形ロボットとクリアパスジャカルロボットの現実世界でのシミュレーションにおいて,経験的安全性に変換されることを検証した。
論文 参考訳(メタデータ) (2022-12-13T19:38:39Z) - Learning-enhanced Nonlinear Model Predictive Control using
Knowledge-based Neural Ordinary Differential Equations and Deep Ensembles [5.650647159993238]
本研究では,知識に基づくニューラル常微分方程式(KNODE)とディープアンサンブルというディープラーニングツールを活用し,モデル予測制御(MPC)の予測精度を向上させる。
特に、KNODEモデルのアンサンブル(KNODEアンサンブル)を学習し、真のシステム力学の正確な予測を得る。
KNODEアンサンブルはより正確な予測を提供し、提案した非線形MPCフレームワークの有効性と閉ループ性能を示す。
論文 参考訳(メタデータ) (2022-11-24T23:51:18Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Controlling nonlinear dynamical systems into arbitrary states using
machine learning [77.34726150561087]
機械学習(ML)を活用した,新しい完全データ駆動制御方式を提案する。
最近開発されたMLに基づく複雑なシステムの予測機能により、非線形系は任意の初期状態から来る任意の動的対象状態に留まることが証明された。
必要なデータ量が少なく,柔軟性の高いコントロールスキームを備えることで,工学から医学まで幅広い応用の可能性について簡単に議論する。
論文 参考訳(メタデータ) (2021-02-23T16:58:26Z) - Using Data Assimilation to Train a Hybrid Forecast System that Combines
Machine-Learning and Knowledge-Based Components [52.77024349608834]
利用可能なデータがノイズの多い部分測定の場合,カオスダイナミクスシステムのデータ支援予測の問題を検討する。
動的システムの状態の部分的測定を用いることで、不完全な知識ベースモデルによる予測を改善するために機械学習モデルを訓練できることを示す。
論文 参考訳(メタデータ) (2021-02-15T19:56:48Z) - Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。
AntLer は確率 1 と任意に最適な解を近似することを示す。
論文 参考訳(メタデータ) (2020-07-24T07:00:14Z) - How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文 参考訳(メタデータ) (2020-05-25T12:13:49Z) - DISCO: Double Likelihood-free Inference Stochastic Control [29.84276469617019]
確率自由推論のためのベイズ統計学における現代シミュレータのパワーと最近の技術を活用することを提案する。
シミュレーションパラメータの後方分布は、システムの潜在的非解析モデルによって伝播される。
実験により、制御器の提案により、古典的な制御やロボット工学のタスクにおいて、優れた性能と堅牢性が得られることが示された。
論文 参考訳(メタデータ) (2020-02-18T05:29:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。