論文の概要: Certified Robust Invariant Polytope Training in Neural Controlled ODEs
- arxiv url: http://arxiv.org/abs/2408.01273v1
- Date: Fri, 2 Aug 2024 13:55:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-05 13:17:55.969953
- Title: Certified Robust Invariant Polytope Training in Neural Controlled ODEs
- Title(参考訳): ニューラルネットワークODEにおける認証ロバスト不変ポリトープ訓練
- Authors: Akash Harapanahalli, Samuel Coogan,
- Abstract要約: 本研究では、フィードフォワードニューラルネットワークとしてパラメータ化された状態フィードバック制御器を用いて、外乱を受ける通常の微分方程式としてモデル化された非線形制御系について考察する。
本研究では,ポリトープ内の任意の軌道が乱れに関係なくポリトープ内に留まる,頑健な前方不変ポリトープを持つコントローラのトレーニングフレームワークを提案する。
我々は,手話制約の単純さによって,システム次元を50ドル以上の状態に拡張し,実行時に最先端のリャプノフに基づくサンプリングアプローチより優れていることを示す。
- 参考スコア(独自算出の注目度): 3.5481521547811976
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider a nonlinear control system modeled as an ordinary differential equation subject to disturbance, with a state feedback controller parameterized as a feedforward neural network. We propose a framework for training controllers with certified robust forward invariant polytopes, where any trajectory initialized inside the polytope remains within the polytope, regardless of the disturbance. First, we parameterize a family of lifted control systems in a higher dimensional space, where the original neural controlled system evolves on an invariant subspace of each lifted system. We use interval analysis and neural network verifiers to further construct a family of lifted embedding systems, carefully capturing the knowledge of this invariant subspace. If the vector field of any lifted embedding system satisfies a sign constraint at a single point, then a certain convex polytope of the original system is robustly forward invariant. Treating the neural network controller and the lifted system parameters as variables, we propose an algorithm to train controllers with certified forward invariant polytopes in the closed-loop control system. Through two examples, we demonstrate how the simplicity of the sign constraint allows our approach to scale with system dimension to over $50$ states, and outperform state-of-the-art Lyapunov-based sampling approaches in runtime.
- Abstract(参考訳): 本研究では、フィードフォワードニューラルネットワークとしてパラメータ化された状態フィードバック制御器を用いて、外乱を受ける通常の微分方程式としてモデル化された非線形制御系について考察する。
本研究では,ポリトープ内で初期化される任意の軌道が,乱れに関係なくポリトープ内に留まる,頑健な前方不変ポリトープを持つコントローラのトレーニングフレームワークを提案する。
まず,高次元空間における昇降制御系の一群をパラメータ化し,各昇降系の不変部分空間上で元のニューラル制御系が進化する。
我々は、間隔解析とニューラルネットワーク検証を用いて、昇降埋め込みシステムのファミリーを構築し、この不変部分空間の知識を注意深く把握する。
任意の持ち上げ埋め込み系のベクトル場が1つの点で符号制約を満たすなら、元の系のある凸ポリトープは頑強に前方不変である。
ニューラルネットワーク制御器と昇降系パラメータを変数として扱うことにより,閉ループ制御系における前方不変ポリトープを認定した制御器を訓練するアルゴリズムを提案する。
2つの例を通して、手話制約の単純さによって、システム次元を50ドル以上の状態に拡張し、実行時に最先端のリャプノフベースのサンプリングアプローチより優れていることを示す。
関連論文リスト
- Sample-efficient Model-based Reinforcement Learning for Quantum Control [0.2999888908665658]
ノイズの多い時間依存ゲート最適化のためのモデルベース強化学習(RL)手法を提案する。
標準モデルフリーRLに比べて,本手法のサンプル複雑性において,桁違いの優位性を示す。
提案アルゴリズムは,部分的特徴付き1量子ビット系と2量子ビット系の制御に適している。
論文 参考訳(メタデータ) (2023-04-19T15:05:19Z) - Automated Reachability Analysis of Neural Network-Controlled Systems via
Adaptive Polytopes [2.66512000865131]
適応テンプレートポリトープを用いたニューラルネットワーク動的システムの到達可能な集合を過度に近似する新しい手法を開発した。
本稿では,ニューラルネットワークコントローラによって駆動される線形システムの到達可能性解析における提案手法の有用性について述べる。
論文 参考訳(メタデータ) (2022-12-14T23:49:53Z) - Controlling quantum many-body systems using reduced-order modelling [0.0]
本稿では,多体量子システムにおける制御問題のクラスを解くための効率的な手法を提案する。
もともとのサブシステムの「デジタルツイン」と見なされる、そのような縮小順序モデルの力学のシミュレーションは、はるかに効率的である。
この結果は、多体システムの研究、非自明な準粒子特性の探索、および量子コンピューティングデバイスの開発管理ツールに直接応用される。
論文 参考訳(メタデータ) (2022-11-01T13:58:44Z) - Robust stabilization of polytopic systems via fast and reliable neural
network-based approximations [2.2299983745857896]
ポリトピック不確実性を有する線形システムに対する従来の安定化制御器の高速かつ信頼性の高いニューラルネットワーク(NN)に基づく近似設計について検討する。
訓練された修正線形単位(ReLU)に基づく近似が従来の制御系に取って代わる場合、線形不確かさシステムの閉ループ安定性と性能を証明する。
論文 参考訳(メタデータ) (2022-04-27T21:58:07Z) - Deep Learning Approximation of Diffeomorphisms via Linear-Control
Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。
対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文 参考訳(メタデータ) (2021-10-24T08:57:46Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Improper Learning for Non-Stochastic Control [78.65807250350755]
逆方向の摂動, 逆方向に選択された凸損失関数, 部分的に観察された状態を含む, 未知の線形力学系を制御することの問題点を考察する。
このパラメトリゼーションにオンライン降下を適用することで、大規模なクローズドループポリシーに対してサブリニア後悔を実現する新しいコントローラが得られる。
我々の境界は、線形力学コントローラの安定化と競合する非確率的制御設定における最初のものである。
論文 参考訳(メタデータ) (2020-01-25T02:12:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。