論文の概要: Bridging the Model-Reality Gap with Lipschitz Network Adaptation
- arxiv url: http://arxiv.org/abs/2112.03756v1
- Date: Tue, 7 Dec 2021 15:12:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-08 15:18:53.520966
- Title: Bridging the Model-Reality Gap with Lipschitz Network Adaptation
- Title(参考訳): リプシッツネットワーク適応によるモデル-現実ギャップのブリッジ
- Authors: Siqi Zhou, Karime Pereida, Wenda Zhao and Angela P. Schoellig
- Abstract要約: ロボットが現実世界に進出するにつれ、ロボットは非モデル化された力学と乱れにさらされる。
従来のモデルベースの制御アプローチは、比較的静的で既知の運用環境で成功している。
本稿では,モデルと現実のギャップを埋め,動的不確実性が存在する場合でもモデルに基づくアプローチの適用を可能にする手法を提案する。
- 参考スコア(独自算出の注目度): 22.499090318313662
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As robots venture into the real world, they are subject to unmodeled dynamics
and disturbances. Traditional model-based control approaches have been proven
successful in relatively static and known operating environments. However, when
an accurate model of the robot is not available, model-based design can lead to
suboptimal and even unsafe behaviour. In this work, we propose a method that
bridges the model-reality gap and enables the application of model-based
approaches even if dynamic uncertainties are present. In particular, we present
a learning-based model reference adaptation approach that makes a robot system,
with possibly uncertain dynamics, behave as a predefined reference model. In
turn, the reference model can be used for model-based controller design. In
contrast to typical model reference adaptation control approaches, we leverage
the representative power of neural networks to capture highly nonlinear
dynamics uncertainties and guarantee stability by encoding a certifying
Lipschitz condition in the architectural design of a special type of neural
network called the Lipschitz network. Our approach applies to a general class
of nonlinear control-affine systems even when our prior knowledge about the
true robot system is limited. We demonstrate our approach in flying inverted
pendulum experiments, where an off-the-shelf quadrotor is challenged to balance
an inverted pendulum while hovering or tracking circular trajectories.
- Abstract(参考訳): ロボットが現実の世界に参入するにつれ、それらは非モデル化のダイナミクスと外乱にさらされる。
従来のモデルベースの制御アプローチは、比較的静的で既知の運用環境で成功している。
しかし、ロボットの正確なモデルが利用できない場合、モデルベースの設計は、最適でない行動や安全でない行動につながる可能性がある。
本研究では,モデル-現実ギャップを橋渡しし,動的不確実性が存在する場合でもモデルベースアプローチの適用を可能にする手法を提案する。
特に,未知のダイナミクスを持つロボットシステムが,事前定義された参照モデルとして振る舞うような,学習に基づくモデル参照適応手法を提案する。
逆に、参照モデルはモデルベースのコントローラ設計に使用することができる。
リプシッツネットワークと呼ばれる特殊なタイプのニューラルネットワークのアーキテクチャ設計において、一般的なモデル参照適応制御アプローチとは対照的に、高非線形ダイナミクスの不確かさを捕捉し、証明可能なリプシッツ条件を符号化することで安定性を保証するためにニューラルネットワークの代表的なパワーを利用する。
本手法は, 真のロボットシステムに関する事前知識が限られている場合でも, 一般的な非線形制御適応システムに適用できる。
本研究は, 逆振子実験において, 逆振子をホバリングしたり円軌道を追尾したりしながら, 逆振子をバランスさせることが課題であることを示す。
関連論文リスト
- Neural Internal Model Control: Learning a Robust Control Policy via Predictive Error Feedback [16.46487826869775]
本稿では,モデルベース制御とRLベース制御を統合し,ロバスト性を高めるニューラル内部モデル制御を提案する。
我々のフレームワークは、剛体力学にニュートン・オイラー方程式を適用することで予測モデルを合理化し、複雑な高次元非線形性を捉える必要がなくなる。
本研究では,四足歩行ロボットと四足歩行ロボットにおけるフレームワークの有効性を実証し,最先端の手法と比較して優れた性能を実現する。
論文 参考訳(メタデータ) (2024-11-20T07:07:42Z) - Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated
Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。
ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文 参考訳(メタデータ) (2024-01-09T11:54:54Z) - Neural Abstractions [72.42530499990028]
本稿では,ニューラルネットワークを用いた非線形力学モデルの安全性検証手法を提案する。
提案手法は,既存のベンチマーク非線形モデルにおいて,成熟度の高いFlow*と同等に動作することを示す。
論文 参考訳(メタデータ) (2023-01-27T12:38:09Z) - Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.81433026280051]
本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文 参考訳(メタデータ) (2022-10-23T00:45:05Z) - Real-to-Sim: Predicting Residual Errors of Robotic Systems with Sparse
Data using a Learning-based Unscented Kalman Filter [65.93205328894608]
我々は,動的・シミュレータモデルと実ロボット間の残差を学習する。
学習した残差誤差により、動的モデル、シミュレーション、および実際のハードウェア間の現実的ギャップをさらに埋めることができることを示す。
論文 参考訳(メタデータ) (2022-09-07T15:15:12Z) - Online Dynamics Learning for Predictive Control with an Application to
Aerial Robots [3.673994921516517]
予測モデルは学習し、モデルベースのコントローラに適用することができるが、これらのモデルはしばしばオフラインで学習される。
このオフライン設定では、トレーニングデータをまず収集し、精巧なトレーニング手順により予測モデルを学ぶ。
本稿では,デプロイ中の動的モデルの精度を継続的に向上するオンライン動的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-19T15:51:25Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Bridging Model-based Safety and Model-free Reinforcement Learning
through System Identification of Low Dimensional Linear Models [16.511440197186918]
モデルベース安全性とモデルフリー強化学習を組み合わせた新しい手法を提案する。
閉ループ系の力学を捉えるためには,低次元の力学モデルが十分であることを示す。
検出された線形モデルは、安全クリティカルな最適制御フレームワークによる保証を提供することができることを示す。
論文 参考訳(メタデータ) (2022-05-11T22:03:18Z) - Iterative Semi-parametric Dynamics Model Learning For Autonomous Racing [2.40966076588569]
本稿では,ニューラルネットワークを用いた反復学習セミパラメトリックモデルを自律レースの課題に適用する。
我々のモデルは純粋にパラメトリックモデルよりも正確に学習でき、純粋に非パラメトリックモデルよりもより一般化できることを示す。
論文 参考訳(メタデータ) (2020-11-17T16:24:10Z) - Generative Temporal Difference Learning for Infinite-Horizon Prediction [101.59882753763888]
我々は、無限確率的地平線を持つ環境力学の予測モデルである$gamma$-modelを導入する。
トレーニングタイムとテストタイムの複合的なエラーの間には、そのトレーニングが避けられないトレードオフを反映しているかについて議論する。
論文 参考訳(メタデータ) (2020-10-27T17:54:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。