論文の概要: Safe Exploration for Nonlinear Processes Using Online Gaussian Process Learning
- arxiv url: http://arxiv.org/abs/2605.09772v1
- Date: Sun, 10 May 2026 21:33:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.413037
- Title: Safe Exploration for Nonlinear Processes Using Online Gaussian Process Learning
- Title(参考訳): オンラインガウス過程学習を用いた非線形プロセスの安全な探索
- Authors: Stefano Tonini, Soroush Rastegarpour, Hamid Reza Feyzmahdavian, Nicola Bastianello, Karl Henrik Johansson,
- Abstract要約: 本稿では,非線形システムに対するデータ駆動型安全な制御フレームワークを提案する。
モデル化されていない非線形力学はガウス過程によってリアルタイムで学習される。
数値的な結果は、モデル不確実性の下で安全かつ情報的な探索を実証し、アプローチを検証する。
- 参考スコア(独自算出の注目度): 7.223664911847993
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a safe data-driven control framework for nonlinear systems with partially known dynamics. The method ensures stability and constraint satisfaction during online learning, assuming only a stabilizable linear approximation of the process is available. Unmodeled nonlinear dynamics are captured by a Gaussian process residual learned in real time. Safety is enforced through a probabilistic control-invariant set derived from Lyapunov theory, guaranteeing high-probability stability. A convex quadratic program computes control inputs that maximize information gain while respecting probabilistic safety constraints. The framework provides finite-sample safety guarantees and allows adaptive expansion of the invariant set as uncertainty decreases. Numerical results validate the approach, demonstrating safe and informative exploration under model uncertainty: the safe set expands by about 30% while the Gaussian process root-mean-square error drops from 1.11 to 0.03.
- Abstract(参考訳): 本稿では,非線形システムに対するデータ駆動型安全な制御フレームワークを提案する。
この方法は、安定化可能な線形近似しか利用できないと仮定して、オンライン学習中の安定性と制約満足度を保証する。
モデル化されていない非線形力学はガウス過程によってリアルタイムで学習される。
安全は、リャプノフ理論から導かれた確率論的制御不変集合を通じて強制され、高い確率安定性が保証される。
凸二次プログラムは、確率的安全性制約を尊重しながら情報ゲインを最大化する制御入力を算出する。
このフレームワークは有限サンプル安全保証を提供し、不確実性が減少するにつれて不変集合の適応的な拡張を可能にする。
ガウス過程のルート平均二乗誤差は1.11から0.03に減少する一方、安全なセットは約30%拡大する。
関連論文リスト
- Statistical Contraction for Chance-Constrained Trajectory Optimization of Non-Gaussian Stochastic Systems [0.0]
このフレームワークは共形推論を用いて任意の参照軌跡を囲む閉ループ力学に対する信頼セットを生成する。
適切な制約の締め付けにより、基準軌跡上の統計的に妥当な決定論的制約をトラクタブルに修正することができる。
これにより、安全クリティカルな現実世界のアプリケーションにおいて、ニューラルネットワークメトリクスのような学習ベースのモーションプランナとコントローラを活用、検証するフォーマルなパスが可能になる。
論文 参考訳(メタデータ) (2026-03-07T08:01:20Z) - Distributionally Robust Policy and Lyapunov-Certificate Learning [13.38077406934971]
不確実なシステムに対する安定性を保証するコントローラの設計における重要な課題は、オンラインデプロイメント中のモデルパラメトリック不確実性の変化の正確な決定と適応である。
我々は、リアプノフ証明書の単調な減少を保証するために、リアプノフ微分チャンス制約を分布的に頑健に定式化することで、この問題に取り組む。
得られた閉ループシステムに対して、その平衡のグローバルな安定性は、アウト・オブ・ディストリビューションの不確実性があっても高い信頼性で証明できることを示す。
論文 参考訳(メタデータ) (2024-04-03T18:57:54Z) - Information-Theoretic Safe Bayesian Optimization [59.758009422067005]
そこでは、未知の(安全でない)制約に反するパラメータを評価することなく、未知の関数を最適化することを目的としている。
現在のほとんどのメソッドはドメインの離散化に依存しており、連続ケースに直接拡張することはできない。
本稿では,GP後部を直接利用して,最も情報に富む安全なパラメータを識別する情報理論的安全な探索基準を提案する。
論文 参考訳(メタデータ) (2024-02-23T14:31:10Z) - Information-Theoretic Safe Exploration with Gaussian Processes [89.31922008981735]
未知の(安全でない)制約に反するパラメータを評価できないような、逐次的な意思決定タスクについて検討する。
現在のほとんどのメソッドはドメインの離散化に依存しており、連続ケースに直接拡張することはできない。
本稿では,GP後部を直接利用して,最も情報に富む安全なパラメータを識別する情報理論的安全な探索基準を提案する。
論文 参考訳(メタデータ) (2022-12-09T15:23:58Z) - Log Barriers for Safe Black-box Optimization with Application to Safe
Reinforcement Learning [72.97229770329214]
本稿では,学習時の安全性維持が不可欠である高次元非線形最適化問題に対する一般的なアプローチを提案する。
LBSGDと呼ばれるアプローチは、慎重に選択されたステップサイズで対数障壁近似を適用することに基づいている。
安全強化学習における政策課題の違反を最小限に抑えるためのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-07-21T11:14:47Z) - ProBF: Learning Probabilistic Safety Certificates with Barrier Functions [31.203344483485843]
制御バリア関数は、地平系力学にアクセスできれば安全を保証できる便利なツールである。
実際には、システムダイナミクスに関する不正確な知識があるため、安全でない振る舞いにつながる可能性があります。
本手法の有効性をSegwayとQuadrotorのシミュレーション実験により示す。
論文 参考訳(メタデータ) (2021-12-22T20:18:18Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。