論文の概要: Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model
Predictive Control
- arxiv url: http://arxiv.org/abs/2210.12583v1
- Date: Sun, 23 Oct 2022 00:45:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 22:01:48.001057
- Title: Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model
Predictive Control
- Title(参考訳): 不確実性を考慮した予測制御のための離散時間ダイナミクスのアクティブ学習
- Authors: Alessandro Saviolo, Jonathan Frey, Abhishek Rathod, Moritz Diehl,
Giuseppe Loianno
- Abstract要約: 本稿では,ロボットの離散時間ダイナミクスを積極的にモデル化する自己教師型学習手法を提案する。
過去の体験からのオフライン学習と、現在のロボットと未知の環境との相互作用からオンライン学習を組み合わせる。
提案手法は,未確認の飛行条件に一貫して適応することにより,高い柔軟性と一般化能力を示す。
- 参考スコア(独自算出の注目度): 63.82250322661112
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Model-based control requires an accurate model of the system dynamics for
precisely and safely controlling the robot in complex and dynamic environments.
Moreover, in presence of variations in the operating conditions, the model
should be continuously refined to compensate for dynamics changes. In this
paper, we propose a self-supervised learning approach to actively model robot
discrete-time dynamics. We combine offline learning from past experience and
online learning from present robot interaction with the unknown environment.
These two ingredients enable highly sample-efficient and adaptive learning for
accurate inference of the model dynamics in real-time even in operating regimes
significantly different from the training distribution. Moreover, we design an
uncertainty-aware model predictive controller that is conditioned to the
aleatoric (data) uncertainty of the learned dynamics. The controller actively
selects the optimal control actions that (i) optimize the control performance
and (ii) boost the online learning sample efficiency. We apply the proposed
method to a quadrotor system in multiple challenging real-world experiments.
Our approach exhibits high flexibility and generalization capabilities by
consistently adapting to unseen flight conditions, while it significantly
outperforms classical and adaptive control baselines.
- Abstract(参考訳): モデルに基づく制御は、複雑でダイナミックな環境でロボットを正確に安全に制御するために、システムダイナミクスの正確なモデルを必要とする。
さらに,動作条件の変動がある場合には,動的変化を補うためにモデルを継続的に改良する必要がある。
本稿では,ロボットの離散時間ダイナミクスを積極的にモデル化する自己教師型学習手法を提案する。
過去の体験からのオフライン学習と、現在のロボットと未知の環境との相互作用からオンライン学習を組み合わせる。
これらの2つの要素は、トレーニング分布と大きく異なる操作状態であっても、リアルタイムにモデルダイナミクスを正確に推定するための、高効率で適応的な学習を可能にする。
さらに,学習するダイナミクスの不確実性(データ)を条件とした不確実性認識モデル予測制御系を設計する。
コントローラは、最適な制御アクションを積極的に選択する
(i)制御性能を最適化し、
(ii)オンライン学習サンプルの効率を高めること。
提案手法を実世界の複数の挑戦実験において, 四元数系に適用する。
本手法は飛行条件に一貫して適応することで高い柔軟性と一般化能力を示し,古典的かつ適応的な制御ベースラインを著しく上回っている。
関連論文リスト
- Learning Exactly Linearizable Deep Dynamics Models [0.07366405857677226]
本稿では, 安定度, 信頼性, 信頼性を確保するために, 様々な制御理論を容易に適用可能な, 線形化可能な動的モデルの学習法を提案する。
提案手法は, 自動車エンジンのリアルタイム制御に応用され, 予測性能と制約下での安定制御が良好であることを示す。
論文 参考訳(メタデータ) (2023-11-30T05:40:55Z) - Data-Driven Control with Inherent Lyapunov Stability [3.695480271934742]
本研究では,非線形力学モデルと安定化制御器のパラメトリック表現をデータから共同学習する手法として,インヒーレント・リャプノフ安定度制御(CoILS)を提案する。
新たな構成によって保証される学習力学の安定化性に加えて、学習した制御器は学習力学の忠実性に関する特定の仮定の下で真の力学を安定化することを示す。
論文 参考訳(メタデータ) (2023-03-06T14:21:42Z) - ControlVAE: Model-Based Learning of Generative Controllers for
Physics-Based Characters [28.446959320429656]
可変オートエンコーダ(VAE)に基づく生成動作制御ポリシーを学習するためのモデルベースのフレームワークであるControlVAEを紹介する。
我々のフレームワークは、多種多様な非組織的な動作シーケンスから、リッチで柔軟なスキル表現と、スキル条件付き生成制御ポリシーを学習することができる。
シミュレーション文字のリアルかつインタラクティブな制御を可能にする多種多様なタスクセットを用いた制御VAEの有効性を実証する。
論文 参考訳(メタデータ) (2022-10-12T10:11:36Z) - Online Dynamics Learning for Predictive Control with an Application to
Aerial Robots [3.673994921516517]
予測モデルは学習し、モデルベースのコントローラに適用することができるが、これらのモデルはしばしばオフラインで学習される。
このオフライン設定では、トレーニングデータをまず収集し、精巧なトレーニング手順により予測モデルを学ぶ。
本稿では,デプロイ中の動的モデルの精度を継続的に向上するオンライン動的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-19T15:51:25Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Gradient-Based Trajectory Optimization With Learned Dynamics [80.41791191022139]
データからシステムの微分可能なダイナミクスモデルを学習するために、機械学習技術を使用します。
ニューラルネットワークは、大規模な時間的地平線に対して、非常に非線形な振る舞いを正確にモデル化できることが示される。
ハードウェア実験において、学習したモデルがSpotとRadio- controlled (RC)の両方の複雑な力学を表現できることを実証した。
論文 参考訳(メタデータ) (2022-04-09T22:07:34Z) - Adaptive Model Predictive Control by Learning Classifiers [26.052368583196426]
制御パラメータとモデルパラメータを自動的に推定する適応型MPC変種を提案する。
我々は,BOを密度比推定として定式化できることを示す最近の結果を活用する。
その後、これはモデル予測経路積分制御フレームワークに統合され、様々な困難なロボティクスタスクのための堅牢なコントローラを生成する。
論文 参考訳(メタデータ) (2022-03-13T23:22:12Z) - Trajectory-wise Multiple Choice Learning for Dynamics Generalization in
Reinforcement Learning [137.39196753245105]
本稿では,動的一般化のためのマルチヘッドダイナミックスモデルを学習するモデルベース強化学習アルゴリズムを提案する。
文脈学習は,過去の経験から得られる動的情報からコンテキスト潜在ベクトルにエンコードする。
提案手法は,最先端のRL法と比較して,様々な制御タスクにおいて優れたゼロショット一般化性能を示す。
論文 参考訳(メタデータ) (2020-10-26T03:20:42Z) - Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。
AntLer は確率 1 と任意に最適な解を近似することを示す。
論文 参考訳(メタデータ) (2020-07-24T07:00:14Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。