論文の概要: Safe and High-Performance Learning of Model Predicitve Control using Kernel-Based Interpolation
- arxiv url: http://arxiv.org/abs/2410.06771v1
- Date: Wed, 9 Oct 2024 11:04:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-01 03:40:32.209828
- Title: Safe and High-Performance Learning of Model Predicitve Control using Kernel-Based Interpolation
- Title(参考訳): カーネル補間を用いたモデル述語制御の安全性と高性能学習
- Authors: Alexander Rose, Philipp Schaub, Rolf Findeisen,
- Abstract要約: 本稿では,カーネルを用いたモデル予測制御の効率的かつ安全な近似を可能にする手法を提案する。
近似関数の計算複雑性はデータ点数と線形にスケールするため,最も有望なデータを選択するスコアリング関数を提案する。
設計した近似制御器の安全性と性能を保証するため,モンテカルロ法に基づく到達可能性解析を用いる。
- 参考スコア(独自算出の注目度): 44.99833362998488
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a method, which allows efficient and safe approximation of model predictive controllers using kernel interpolation. Since the computational complexity of the approximating function scales linearly with the number of data points, we propose to use a scoring function which chooses the most promising data. To further reduce the complexity of the approximation, we restrict our considerations to the set of closed-loop reachable states. That is, the approximating function only has to be accurate within this set. This makes our method especially suited for systems, where the set of initial conditions is small. In order to guarantee safety and high performance of the designed approximated controller, we use reachability analysis based on Monte Carlo methods.
- Abstract(参考訳): 本稿では,カーネル補間を用いたモデル予測制御器の効率的かつ安全な近似を可能にする手法を提案する。
近似関数の計算複雑性はデータ点数と線形にスケールするため,最も有望なデータを選択するスコアリング関数を提案する。
近似の複雑さをさらに軽減するために、我々は閉ループ到達可能な状態の集合に対する考慮を限定する。
つまり、近似関数はこの集合の中でのみ正確である必要がある。
この手法は初期条件の集合が小さいシステムに特に適している。
設計した近似制御器の安全性と性能を保証するため,モンテカルロ法に基づく到達可能性解析を用いる。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - Analysis of regularized federated learning [8.489782750973005]
フェデレーション学習は、異質なビッグデータとプライバシ保護を扱うための効率的なツールである。
ループ降下は、通信コストを削減するために、ビッグデータの実装においてしばしば使用される。
論文 参考訳(メタデータ) (2024-11-03T12:47:54Z) - Real-Time Adaptive Safety-Critical Control with Gaussian Processes in
High-Order Uncertain Models [14.790031018404942]
本稿では,不確実なパラメータを持つシステムを対象とした適応型オンライン学習フレームワークを提案する。
まず,差分スパースGPアルゴリズムを改良するために,まず忘れ係数を積分する。
第2フェーズでは,高次制御バリア関数に基づく安全フィルタを提案する。
論文 参考訳(メタデータ) (2024-02-29T08:25:32Z) - Data-driven Reachability using Christoffel Functions and Conformal
Prediction [0.0]
力学系の解析において重要な道具はリーチ集合、すなわち与えられた初期状態から与えられた時間後に到達可能な状態の集合の近似である。
データベースのアプローチは、状態のサンプルに基づいてリーチセットを推定することで、困難を避けることを約束する。
データベースのリーチ集合近似に対する最近提案されたアプローチは、リーチ集合を近似するためにChristoffel関数を使用する。
論文 参考訳(メタデータ) (2023-09-16T12:21:57Z) - Efficient Model-Free Exploration in Low-Rank MDPs [76.87340323826945]
低ランクマルコフ決定プロセスは、関数近似を持つRLに対して単純だが表現力のあるフレームワークを提供する。
既存のアルゴリズムは、(1)計算的に抽出可能であるか、または(2)制限的な統計的仮定に依存している。
提案手法は,低ランクMPPの探索のための最初の実証可能なサンプル効率アルゴリズムである。
論文 参考訳(メタデータ) (2023-07-08T15:41:48Z) - A Stochastic Bundle Method for Interpolating Networks [18.313879914379008]
本稿では,実験的な損失をゼロにすることができるディープニューラルネットワークのトレーニング手法を提案する。
各イテレーションにおいて,本手法は目的学習近似のバンドルとして知られる最大線形近似を構成する。
論文 参考訳(メタデータ) (2022-01-29T23:02:30Z) - Efficient semidefinite bounds for multi-label discrete graphical models [6.226454551201676]
このようなモデルにおける主要なクエリの1つは、Posteri(MAP)ネットワークのコストに関するSDPWCSP関数を特定することである。
従来の二重化制約手法と,行ごとの更新に基づく専用SDP/Monteiroスタイルの手法を検討する。
論文 参考訳(メタデータ) (2021-11-24T13:38:34Z) - Parallel Stochastic Mirror Descent for MDPs [72.75921150912556]
無限水平マルコフ決定過程(MDP)における最適政策学習の問題を考える。
リプシッツ連続関数を用いた凸プログラミング問題に対してミラー・ディクセントの変種が提案されている。
このアルゴリズムを一般の場合において解析し,提案手法の動作中に誤差を蓄積しない収束率の推定値を得る。
論文 参考訳(メタデータ) (2021-02-27T19:28:39Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Learning Control Barrier Functions from Expert Demonstrations [69.23675822701357]
制御障壁関数(CBF)に基づく安全な制御器合成のための学習に基づくアプローチを提案する。
最適化に基づくCBFの学習手法を解析し、基礎となる力学系のリプシッツ仮定の下で証明可能な安全保証を享受する。
私たちの知る限りでは、これらはデータから確実に安全な制御障壁関数を学習する最初の結果です。
論文 参考訳(メタデータ) (2020-04-07T12:29:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。