論文の概要: Lyapunov Stability Learning with Nonlinear Control via Inductive Biases
- arxiv url: http://arxiv.org/abs/2511.01283v1
- Date: Mon, 03 Nov 2025 06:57:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:27.147407
- Title: Lyapunov Stability Learning with Nonlinear Control via Inductive Biases
- Title(参考訳): 誘導バイアスによる非線形制御によるリアプノフ安定性学習
- Authors: Yupu Lu, Shijie Lin, Hao Xu, Zeqing Zhang, Jia Pan,
- Abstract要約: 制御Lyapunov関数(CLF)をコントローラで動的システムで見つけることは、安定性を保証する効果的な方法である。
近年, CLFを表現したディープラーニングモデルを学習者検証フレームワークに適用し, 満足度の高い候補を同定している。
我々は、リアプノフ条件を誘導バイアスとして扱うことにより、この枠組みを改善し、この知識によって導かれる神経CLFとCLFベースのコントローラを設計する。
- 参考スコア(独自算出の注目度): 21.083462885546556
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Finding a control Lyapunov function (CLF) in a dynamical system with a controller is an effective way to guarantee stability, which is a crucial issue in safety-concerned applications. Recently, deep learning models representing CLFs have been applied into a learner-verifier framework to identify satisfiable candidates. However, the learner treats Lyapunov conditions as complex constraints for optimisation, which is hard to achieve global convergence. It is also too complicated to implement these Lyapunov conditions for verification. To improve this framework, we treat Lyapunov conditions as inductive biases and design a neural CLF and a CLF-based controller guided by this knowledge. This design enables a stable optimisation process with limited constraints, and allows end-to-end learning of both the CLF and the controller. Our approach achieves a higher convergence rate and larger region of attraction (ROA) in learning the CLF compared to existing methods among abundant experiment cases. We also thoroughly reveal why the success rate decreases with previous methods during learning.
- Abstract(参考訳): コントローラを用いた動的システムにおける制御リャプノフ関数(CLF)の発見は、安定性を保証する効果的な方法である。
近年,CLFを表現したディープラーニングモデルを学習者検証フレームワークに適用し,満足度の高い候補を同定している。
しかし、学習者はリアプノフ条件を最適化のための複雑な制約として扱い、これは世界的な収束を達成するのが困難である。
また、検証のためにこれらのリャプノフ条件を実装するのも複雑すぎる。
この枠組みを改善するために、リアプノフ条件を誘導バイアスとして扱い、この知識で導かれる神経CLFとCLFベースのコントローラを設計する。
この設計は制限のある安定な最適化プロセスを可能にし、CLFとコントローラの両方のエンドツーエンドの学習を可能にする。
提案手法は, CLFの学習において, 豊富な実験事例の既存の手法と比較して, 収束率が高く, アトラクションの領域が大きい。
また,学習中に従来の手法で成功率が低下する理由を,徹底的に明らかにした。
関連論文リスト
- Certifying Stability of Reinforcement Learning Policies using Generalized Lyapunov Functions [15.306107403623075]
最適制御・強化学習(RL)に基づく制御ポリシ下での閉ループシステムの安定性の証明問題について検討する。
古典的なリャプノフ法は、リャプノフ関数の厳格な段階的減少を必要とするが、そのような証明は学習された制御ポリシーのために構築することは困難である。
ニューラルネットワーク残差項でRL値関数を増大させることにより、一般化されたリアプノフ関数を学習するためのアプローチを定式化する。
論文 参考訳(メタデータ) (2025-05-16T07:36:40Z) - Lyapunov-stable Neural Control for State and Output Feedback: A Novel Formulation [67.63756749551924]
学習ベースのニューラルネットワーク(NN)制御ポリシは、ロボット工学と制御の幅広いタスクにおいて、印象的な経験的パフォーマンスを示している。
非線形力学系を持つNNコントローラのトラクション領域(ROA)に対するリアプノフ安定性の保証は困難である。
我々は、高速な経験的ファルシフィケーションと戦略的正則化を用いて、Lyapunov証明書とともにNNコントローラを学習するための新しいフレームワークを実証する。
論文 参考訳(メタデータ) (2024-04-11T17:49:15Z) - Learning Stability Attention in Vision-based End-to-end Driving Policies [100.57791628642624]
本稿では, 制御型リアプノフ関数(CLF)を利用して, エンドツーエンドのビジョンベースのポリシに安定性を付与する手法を提案する。
本稿では,att-CLFに密に統合された不確実性伝播手法を提案する。
論文 参考訳(メタデータ) (2023-04-05T20:31:10Z) - Joint Differentiable Optimization and Verification for Certified
Reinforcement Learning [91.93635157885055]
安全クリティカル制御システムのためのモデルベース強化学習では,システム特性を正式に認定することが重要である。
本稿では,強化学習と形式検証を共同で行う枠組みを提案する。
論文 参考訳(メタデータ) (2022-01-28T16:53:56Z) - Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。
我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文 参考訳(メタデータ) (2021-02-18T05:11:41Z) - Constrained Model-Free Reinforcement Learning for Process Optimization [0.0]
強化学習(Reinforcement Learning, RL)は、非線形最適制御問題を扱うための制御手法である。
展示された約束にもかかわらず、RLは産業的な実践への顕著な翻訳をまだ見ていない。
確率の高い共同確率制約の満足度を保証できる「オークル」支援型制約付きQ-ラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-16T13:16:22Z) - Neural Lyapunov Control [14.534839557929375]
非線形制御問題に対する制御ポリシーとニューラルネットワークのリアプノフ関数の学習法を提案する。
このフレームワークは、制御とリアプノフ関数を見つけようとする学習者と、学習者が迅速にソリューションへ導くための反例を見つけるファルシファイアで構成されている。
論文 参考訳(メタデータ) (2020-05-01T21:18:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。