論文の概要: Safe Beyond the Horizon: Efficient Sampling-based MPC with Neural Control Barrier Functions
- arxiv url: http://arxiv.org/abs/2502.15006v1
- Date: Thu, 20 Feb 2025 19:59:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-24 16:09:39.881805
- Title: Safe Beyond the Horizon: Efficient Sampling-based MPC with Neural Control Barrier Functions
- Title(参考訳): 水平を越える安全: ニューラルネットワークバリア機能付き効率的なサンプリングベースMPC
- Authors: Ji Yin, Oswin So, Eric Yang Yu, Chuchu Fan, Panagiotis Tsiotras,
- Abstract要約: モデル予測制御(MPC)を実際に使用する場合の一般的な問題は、予測地平線を超えた安全仕様の満足度である。
推定最適制御のばらつきを大幅に低減する新しいサンプリング戦略を提案する。
結果のNeural Shield-VIMPCコントローラは、既存のサンプリングベースのMPCコントローラと比較して大幅に安全性が向上する。
- 参考スコア(独自算出の注目度): 23.693610702522236
- License:
- Abstract: A common problem when using model predictive control (MPC) in practice is the satisfaction of safety specifications beyond the prediction horizon. While theoretical works have shown that safety can be guaranteed by enforcing a suitable terminal set constraint or a sufficiently long prediction horizon, these techniques are difficult to apply and thus are rarely used by practitioners, especially in the case of general nonlinear dynamics. To solve this problem, we impose a tradeoff between exact recursive feasibility, computational tractability, and applicability to ''black-box'' dynamics by learning an approximate discrete-time control barrier function and incorporating it into a variational inference MPC (VIMPC), a sampling-based MPC paradigm. To handle the resulting state constraints, we further propose a new sampling strategy that greatly reduces the variance of the estimated optimal control, improving the sample efficiency, and enabling real-time planning on a CPU. The resulting Neural Shield-VIMPC (NS-VIMPC) controller yields substantial safety improvements compared to existing sampling-based MPC controllers, even under badly designed cost functions. We validate our approach in both simulation and real-world hardware experiments.
- Abstract(参考訳): モデル予測制御(MPC)を実際に使用する場合の一般的な問題は、予測地平線を超えた安全仕様の満足度である。
理論的な研究により、適切な端末セットの制約や十分に長い予測水平線を課すことで安全性を保証できることが示されているが、これらの手法は適用が困難であり、特に一般の非線形力学の場合において、実践者が使用することは稀である。
この問題を解決するために、近似離散時間制御障壁関数を学習し、サンプリングベースのMPCパラダイムである変分推論MPC(VIMPC)に組み込むことにより、正確な再帰的実現可能性、計算的トラクタビリティ、および'ブラックボックス'ダイナミクスの適用性の間のトレードオフを課す。
得られた状態制約に対処するため,推定最適制御のばらつきを大幅に低減し,サンプル効率を向上し,CPU上でのリアルタイム計画を可能にする新しいサンプリング戦略を提案する。
NS-VIMPC(Neural Shield-VIMPC)コントローラは、設計の悪いコスト関数下であっても、既存のサンプリングベースのMPCコントローラと比較して大幅に安全性が向上する。
シミュレーションと実世界のハードウェア実験の両方において、我々のアプローチを検証する。
関連論文リスト
- Safe Learning-Based Optimization of Model Predictive Control: Application to Battery Fast-Charging [0.0]
本稿では,モデル予測制御とベイズ最適化を統合し,長期閉ループ性能を最適化する手法について議論する。
この研究は、閉ループ制約満足度を強調することによって、これまでの研究を拡張した。
本手法をリチウムイオン電池の高速充電に適用する。
論文 参考訳(メタデータ) (2024-10-07T12:23:40Z) - Towards safe and tractable Gaussian process-based MPC: Efficient sampling within a sequential quadratic programming framework [35.79393879150088]
本稿では,制約満足度を高い確率で保証する頑健なGP-MPCの定式化を提案する。
提案手法は,既存手法とリアルタイム実現可能な時間に比較して,改良された到達可能集合近似を強調した。
論文 参考訳(メタデータ) (2024-09-13T08:15:20Z) - Automatically Adaptive Conformal Risk Control [49.95190019041905]
本稿では,テストサンプルの難易度に適応して,統計的リスクの近似的条件制御を実現する手法を提案する。
我々のフレームワークは、ユーザが提供するコンディショニングイベントに基づく従来のコンディショニングリスク制御を超えて、コンディショニングに適した関数クラスのアルゴリズム的、データ駆動決定を行う。
論文 参考訳(メタデータ) (2024-06-25T08:29:32Z) - Robust Control for Dynamical Systems With Non-Gaussian Noise via Formal
Abstractions [59.605246463200736]
雑音分布の明示的な表現に依存しない新しい制御器合成法を提案する。
まず、連続制御系を有限状態モデルに抽象化し、離散状態間の確率的遷移によってノイズを捕捉する。
我々は最先端の検証技術を用いてマルコフ決定プロセスの間隔を保証し、これらの保証が元の制御システムに受け継がれるコントローラを演算する。
論文 参考訳(メタデータ) (2023-01-04T10:40:30Z) - Learning Sampling Distributions for Model Predictive Control [36.82905770866734]
モデル予測制御(MPC)に対するサンプリングに基づくアプローチは、MPCに対する現代のアプローチの基盤となっている。
我々は、学習された分布を最大限に活用できるように、潜在空間における全ての操作を実行することを提案する。
具体的には、学習問題を双方向の最適化として捉え、バックプロパゲーションスルータイムでコントローラをトレーニングする方法を示す。
論文 参考訳(メタデータ) (2022-12-05T20:35:36Z) - Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。
まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。
次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文 参考訳(メタデータ) (2021-11-18T23:21:00Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Reinforcement Learning of the Prediction Horizon in Model Predictive
Control [1.536989504296526]
強化学習(RL)を用いた状態関数としての最適予測地平線学習を提案する。
本稿では,RL学習問題を定式化して2つの制御タスクでテストする方法を示し,固定地平線MPC方式に対する改善点を示す。
論文 参考訳(メタデータ) (2021-02-22T15:52:32Z) - Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。
我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文 参考訳(メタデータ) (2021-02-18T05:11:41Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Neural Lyapunov Model Predictive Control: Learning Safe Global
Controllers from Sub-optimal Examples [4.777323087050061]
多くの実世界の産業アプリケーションでは、例えば人間の操作者による実行など、既存の制御戦略を持つことが典型的である。
この研究の目的は、安全と安定性を維持する新しいコントローラを学習することで、この未知の、安全だが、最適でないポリシーを改善することである。
提案アルゴリズムは、端末コストを学習し、安定性基準に従ってMPCパラメータを更新する。
論文 参考訳(メタデータ) (2020-02-21T16:57:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。