論文の概要: Neural Identification for Control
- arxiv url: http://arxiv.org/abs/2009.11782v4
- Date: Wed, 16 Mar 2022 03:01:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 05:28:55.427257
- Title: Neural Identification for Control
- Title(参考訳): 制御のための神経同定
- Authors: Priyabrata Saha, Magnus Egerstedt, and Saibal Mukhopadhyay
- Abstract要約: 提案手法は、安定閉ループ力学仮説と対応する制御則を生成するために、リアプノフ安定性理論に依存する。
我々は,nリンク振り子バランスや軌道追跡,カートバランスの振り子,車輪付き車両経路の追従など,様々な非線形制御問題について実演する。
- 参考スコア(独自算出の注目度): 30.91037635723668
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a new method for learning control law that stabilizes an unknown
nonlinear dynamical system at an equilibrium point. We formulate a system
identification task in a self-supervised learning setting that jointly learns a
controller and corresponding stable closed-loop dynamics hypothesis. The
input-output behavior of the unknown dynamical system under random control
inputs is used as the supervising signal to train the neural network-based
system model and the controller. The proposed method relies on the Lyapunov
stability theory to generate a stable closed-loop dynamics hypothesis and
corresponding control law. We demonstrate our method on various nonlinear
control problems such as n-link pendulum balancing and trajectory tracking,
pendulum on cart balancing, and wheeled vehicle path following.
- Abstract(参考訳): 本稿では,未知の非線形力学系を平衡点に安定化させる制御則の学習法を提案する。
制御器と対応する安定閉ループダイナミクス仮説を共同で学習する自己教師付き学習設定において,システム同定タスクを定式化する。
ランダム制御入力下での未知の力学系の入力出力挙動は、ニューラルネットワークベースのシステムモデルとコントローラをトレーニングするための監視信号として使用される。
提案手法は、安定閉ループダイナミクス仮説と対応する制御則を生成するために、リアプノフ安定理論に依存する。
我々は,nリンク振り子バランスや軌道追跡,カートバランスの振り子,車輪付き車両経路の追従など,様々な非線形制御問題について述べる。
関連論文リスト
- Identification For Control Based on Neural Networks: Approximately Linearizable Models [42.15267357325546]
本研究では,非線形システムの効率的な制御設計と安定性解析のための制御指向同定手法を提案する。
ニューラルネットワークは離散時間非線形状態空間モデルを特定し、時間領域の入力出力挙動を近似する。
ネットワークは、同定されたモデルがフィードバックによってほぼ線形化可能であるように構成され、制御則が学習段階から自明に従うことを保証する。
論文 参考訳(メタデータ) (2024-09-24T08:31:22Z) - Data-Driven Control with Inherent Lyapunov Stability [3.695480271934742]
本研究では,非線形力学モデルと安定化制御器のパラメトリック表現をデータから共同学習する手法として,インヒーレント・リャプノフ安定度制御(CoILS)を提案する。
新たな構成によって保証される学習力学の安定化性に加えて、学習した制御器は学習力学の忠実性に関する特定の仮定の下で真の力学を安定化することを示す。
論文 参考訳(メタデータ) (2023-03-06T14:21:42Z) - Learning Control-Oriented Dynamical Structure from Data [25.316358215670274]
一般非線形制御アフィン系に対する状態依存非線形トラッキングコントローラの定式化について論じる。
安定軌跡追跡における学習版の有効性を実証的に実証した。
論文 参考訳(メタデータ) (2023-02-06T02:01:38Z) - Learning Stabilizable Deep Dynamics Models [1.75320459412718]
本稿では,入力-アフィン制御系のダイナミクスを学習するための新しい手法を提案する。
重要な特徴は、学習モデルの安定化コントローラと制御リャプノフ関数も得られることである。
提案手法はハミルトン-ヤコビ不等式の解法にも適用可能である。
論文 参考訳(メタデータ) (2022-03-18T03:09:24Z) - Neural Koopman Lyapunov Control [0.0]
データから安定化可能な双線形制御系とその関連する可観測物を特定し,構築するためのフレームワークを提案する。
提案手法は、未知のダイナミクスを持つ非線形制御系に対して、大域的安定性の証明可能な保証を提供する。
論文 参考訳(メタデータ) (2022-01-13T17:38:09Z) - The Impact of Data on the Stability of Learning-Based Control- Extended
Version [63.97366815968177]
本稿では,Lyapunovをベースとした,認証制御性能に対するデータの影響の定量化手法を提案する。
ガウス過程を通じて未知系の力学をモデル化することにより、モデルの不確実性と安定性条件の満足度の間の相互関係を決定できる。
論文 参考訳(メタデータ) (2020-11-20T19:10:01Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z) - Active Learning for Nonlinear System Identification with Guarantees [102.43355665393067]
状態遷移が既知の状態-作用対の特徴埋め込みに線形に依存する非線形力学系のクラスについて検討する。
そこで本稿では, トラジェクティブ・プランニング, トラジェクティブ・トラッキング, システムの再推定という3つのステップを繰り返すことで, この問題を解決するためのアクティブ・ラーニング・アプローチを提案する。
本手法は, 非線形力学系を標準線形回帰の統計速度と同様, パラメトリック速度で推定する。
論文 参考訳(メタデータ) (2020-06-18T04:54:11Z) - Online Reinforcement Learning Control by Direct Heuristic Dynamic
Programming: from Time-Driven to Event-Driven [80.94390916562179]
時間駆動学習は、新しいデータが到着すると予測モデルのパラメータを継続的に更新する機械学習手法を指す。
ノイズなどの重要なシステムイベントによる時間駆動型dHDPの更新を防止することが望ましい。
イベント駆動型dHDPアルゴリズムは,従来の時間駆動型dHDPと比較して動作することを示す。
論文 参考訳(メタデータ) (2020-06-16T05:51:25Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。