論文の概要: Hybrid Systems Neural Control with Region-of-Attraction Planner
- arxiv url: http://arxiv.org/abs/2303.10327v1
- Date: Sat, 18 Mar 2023 04:26:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 20:03:58.497262
- Title: Hybrid Systems Neural Control with Region-of-Attraction Planner
- Title(参考訳): エリア・オブ・アトラクションプランナを用いたハイブリッドシステムニューラル制御
- Authors: Yue Meng, Chuchu Fan
- Abstract要約: 汎用ハイブリッドシステムを制御するために,階層型ニューラルネットワーク(NN)に基づく手法を提案する。
我々は,車追跡制御,ポゴボットナビゲーション,二足歩行運動において,新たな理論的安定性を保証するとともに,実験を行う。
- 参考スコア(独自算出の注目度): 10.914300987810128
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hybrid systems are prevalent in robotics. However, ensuring the stability of
hybrid systems is challenging due to sophisticated continuous and discrete
dynamics. A system with all its system modes stable can still be unstable.
Hence special treatments are required at mode switchings to stabilize the
system. In this work, we propose a hierarchical, neural network (NN)-based
method to control general hybrid systems. For each system mode, we first learn
an NN Lyapunov function and an NN controller to ensure the states within the
region of attraction (RoA) can be stabilized. Then an RoA NN estimator is
learned across different modes. Upon mode switching, we propose a
differentiable planner to ensure the states after switching can land in next
mode's RoA, hence stabilizing the hybrid system. We provide novel theoretical
stability guarantees and conduct experiments in car tracking control, pogobot
navigation, and bipedal walker locomotion. Our method only requires 0.25X of
the training time as needed by other learning-based methods. With low running
time (10-50X faster than model predictive control (MPC)), our controller
achieves a higher stability/success rate over other baselines such as MPC,
reinforcement learning (RL), common Lyapunov methods (CLF), linear quadratic
regulator (LQR), quadratic programming (QP) and Hamilton-Jacobian-based methods
(HJB). The project page is on https://mit-realm.github.io/hybrid-clf.
- Abstract(参考訳): ハイブリッドシステムはロボティクスで広く使われている。
しかしながら、高度な連続的および離散的ダイナミクスのため、ハイブリッドシステムの安定性を確保することは困難である。
すべてのシステムモードが安定しているシステムは、依然として不安定である。
したがって、システムの安定化にはモードスイッチングで特別な処理が必要となる。
本研究では,汎用ハイブリッドシステムを制御する階層型ニューラルネットワーク(NN)に基づく手法を提案する。
各システムモードに対して、まずNNリアプノフ関数とNNコントローラを学習し、アトラクション領域(RoA)内の状態を安定化できるようにする。
そして、異なるモードでRoA NN推定器が学習される。
モード切替時に,次モードのRoAに切り替え後の状態が着地可能であることを保証し,ハイブリッドシステムの安定化を図る。
我々は,新しい理論安定性保証を提供し,カートラッキング制御,ポゴボットナビゲーション,二足歩行実験を行う。
本手法は他の学習法で必要とされるトレーニング時間の0.25倍しか必要としない。
低実行時間(mpc)では、mpc、強化学習(rl)、共通リアプノフ法(clf)、線形二次レギュレータ(lqr)、二次計画(qp)、ハミルトン・ジャコビアン法(hjb)といった他のベースラインよりも高い安定性/成功率を達成している。
プロジェクトページはhttps://mit-realm.github.io/hybrid-clf。
関連論文リスト
- Lyapunov-stable Neural Control for State and Output Feedback: A Novel Formulation [67.63756749551924]
学習ベースのニューラルネットワーク(NN)制御ポリシは、ロボット工学と制御の幅広いタスクにおいて、印象的な経験的パフォーマンスを示している。
非線形力学系を持つNNコントローラのトラクション領域(ROA)に対するリアプノフ安定性の保証は困難である。
我々は、高速な経験的ファルシフィケーションと戦略的正則化を用いて、Lyapunov証明書とともにNNコントローラを学習するための新しいフレームワークを実証する。
論文 参考訳(メタデータ) (2024-04-11T17:49:15Z) - Parameter-Adaptive Approximate MPC: Tuning Neural-Network Controllers without Retraining [50.00291020618743]
この研究は、大規模なデータセットを再計算し、再トレーニングすることなくオンラインチューニングが可能な、新しいパラメータ適応型AMPCアーキテクチャを導入している。
資源制約の厳しいマイクロコントローラ(MCU)を用いた2種類の実カートポールシステムの揺らぎを制御し,パラメータ適応型AMPCの有効性を示す。
これらの貢献は、現実世界のシステムにおけるAMPCの実践的応用に向けた重要な一歩である。
論文 参考訳(メタデータ) (2024-04-08T20:02:19Z) - Combining model-predictive control and predictive reinforcement learning
for stable quadrupedal robot locomotion [0.0]
モデル予測型と予測型強化型学習コントローラの組み合わせによりこれを実現できるかを検討する。
本研究では,両制御手法を組み合わせて,四足歩行ロボットの安定ゲート生成問題に対処する。
論文 参考訳(メタデータ) (2023-07-15T09:22:37Z) - Neural Lyapunov Control for Discrete-Time Systems [30.135651803114307]
一般的なアプローチは、リャプノフ関数と関連する制御ポリシーの組み合わせを計算することである。
ニューラルネットワークを用いてリアプノフ関数を表現するいくつかの手法が提案されている。
離散時間系におけるニューラルリアプノフ制御の学習のための最初のアプローチを提案する。
論文 参考訳(メタデータ) (2023-05-11T03:28:20Z) - Formal Controller Synthesis for Markov Jump Linear Systems with
Uncertain Dynamics [64.72260320446158]
マルコフジャンプ線形系に対する制御器の合成法を提案する。
本手法は,MJLSの離散(モードジャンピング)と連続(確率線形)の両方の挙動を捉える有限状態抽象化に基づいている。
本手法を複数の現実的なベンチマーク問題,特に温度制御と航空機の配送問題に適用する。
論文 参考訳(メタデータ) (2022-12-01T17:36:30Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Neural Identification for Control [30.91037635723668]
提案手法は、安定閉ループ力学仮説と対応する制御則を生成するために、リアプノフ安定性理論に依存する。
我々は,nリンク振り子バランスや軌道追跡,カートバランスの振り子,車輪付き車両経路の追従など,様々な非線形制御問題について実演する。
論文 参考訳(メタデータ) (2020-09-24T16:17:44Z) - Extended Radial Basis Function Controller for Reinforcement Learning [3.42658286826597]
本稿では,モデルベース線形コントローラと任意の微分可能なポリシを動的に補間するハイブリッド強化学習コントローラを提案する。
線形制御器は、局所線形化モデル知識に基づいて設計され、運転点付近のシステムを安定化する。
学習はモデルベース(PILCO)とモデルフリー(DDPG)の両方のフレームワークで行われている。
論文 参考訳(メタデータ) (2020-09-12T20:56:48Z) - Reinforcement Learning with Fast Stabilization in Linear Dynamical
Systems [91.43582419264763]
未知の安定化線形力学系におけるモデルベース強化学習(RL)について検討する。
本研究では,環境を効果的に探索することで,基盤システムの高速安定化を証明できるアルゴリズムを提案する。
提案アルゴリズムはエージェント環境相互作用の時間ステップで$tildemathcalO(sqrtT)$ regretを達成した。
論文 参考訳(メタデータ) (2020-07-23T23:06:40Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。