論文の概要: Online Parameter Estimation for Safety-Critical Systems with Gaussian
Processes
- arxiv url: http://arxiv.org/abs/2002.07870v1
- Date: Tue, 18 Feb 2020 20:38:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 20:44:28.048176
- Title: Online Parameter Estimation for Safety-Critical Systems with Gaussian
Processes
- Title(参考訳): ガウス過程を有する安全クリティカルシステムのオンラインパラメータ推定
- Authors: Mouhyemen Khan and Abhijit Chatterjee
- Abstract要約: オンラインパラメータ推定のためのガウス過程(GP)に基づくベイズ最適化フレームワークを提案する。
パラメータ空間の応答面上の効率的な探索戦略を用いて、最小限の機能評価で大域最適解を求める。
我々は,パラメータの変化を考慮したシミュレーションにおいて,アクティベートされた平面振子と安全臨界振子について実演する。
- 参考スコア(独自算出の注目度): 6.122161391301866
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Parameter estimation is crucial for modeling, tracking, and control of
complex dynamical systems. However, parameter uncertainties can compromise
system performance under a controller relying on nominal parameter values.
Typically, parameters are estimated using numerical regression approaches
framed as inverse problems. However, they suffer from non-uniqueness due to
existence of multiple local optima, reliance on gradients, numerous
experimental data, or stability issues. Addressing these drawbacks, we present
a Bayesian optimization framework based on Gaussian processes (GPs) for online
parameter estimation. It uses an efficient search strategy over a response
surface in the parameter space for finding the global optima with minimal
function evaluations. The response surface is modeled as correlated surrogates
using GPs on noisy data. The GP posterior predictive variance is exploited for
smart adaptive sampling. This balances the exploration versus exploitation
trade-off which is key in reaching the global optima under limited budget. We
demonstrate our technique on an actuated planar pendulum and safety-critical
quadrotor in simulation with changing parameters. We also benchmark our results
against solvers using interior point method and sequential quadratic program.
By reconfiguring the controller with new optimized parameters iteratively, we
drastically improve trajectory tracking of the system versus the nominal case
and other solvers.
- Abstract(参考訳): パラメータ推定は複雑な力学系のモデリング、追跡、制御に不可欠である。
しかしパラメータの不確実性は、パラメータ値に依存するコントローラの下でのシステム性能を損なう可能性がある。
通常、パラメータは逆問題としてフレーム化された数値回帰アプローチを用いて推定される。
しかし、複数の局所最適点が存在すること、勾配に依存すること、多くの実験データ、安定性の問題などにより、非特異性に悩まされている。
これらの欠点に対処するため,オンラインパラメータ推定のためのガウス過程(GP)に基づくベイズ最適化フレームワークを提案する。
パラメータ空間の応答面上の効率的な探索戦略を用いて、最小限の機能評価で大域最適解を求める。
応答面は、ノイズデータ上のGPを用いて相関代理としてモデル化される。
GP後部予測分散は、スマートアダプティブサンプリングに利用される。
これは、限られた予算の下でグローバルオプティマに到達する上で鍵となる探索と搾取のトレードオフのバランスをとる。
我々は,パラメータの変化を考慮したシミュレーションにおいて,アクティベートされた平面振子と安全臨界振子について実演する。
また, 内部点法と逐次二次プログラムを用いて, 解法に対するベンチマークを行った。
制御器を新しい最適化パラメータで反復的に再構成することにより,システムにおけるトラジェクティブトラッキングを,名目ケースや他の解法よりも大幅に改善する。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - Scaling Exponents Across Parameterizations and Optimizers [94.54718325264218]
本稿では,先行研究における重要な仮定を考察し,パラメータ化の新たな視点を提案する。
私たちの経験的調査には、3つの組み合わせでトレーニングされた数万のモデルが含まれています。
最高の学習率のスケーリング基準は、以前の作業の仮定から除外されることがよくあります。
論文 参考訳(メタデータ) (2024-07-08T12:32:51Z) - A Unified Gaussian Process for Branching and Nested Hyperparameter
Optimization [19.351804144005744]
ディープラーニングでは、条件に依存したパラメータのチューニングが一般的に行われている。
新しいGPモデルでは、新しいカーネル関数を通じて入力変数間の依存構造が説明される。
ニューラルネットワークの一連の合成シミュレーションおよび実データ応用において、高い予測精度とより良い最適化効率が観察される。
論文 参考訳(メタデータ) (2024-01-19T21:11:32Z) - A Framework for History-Aware Hyperparameter Optimisation in
Reinforcement Learning [8.659973888018781]
強化学習(RL)システムは、システムの性能に影響を与える一連の初期条件に依存する。
これらのトレードオフを軽減するため,複雑なイベント処理と時間モデルの統合に基づくフレームワークを提案する。
提案手法を,RLの変種であるDQNを用いた5Gモバイル通信ケーススタディで検証した。
論文 参考訳(メタデータ) (2023-03-09T11:30:40Z) - Surrogate modeling for Bayesian optimization beyond a single Gaussian
process [62.294228304646516]
本稿では,探索空間の活用と探索のバランスをとるための新しいベイズ代理モデルを提案する。
拡張性のある関数サンプリングを実現するため、GPモデル毎にランダムな特徴ベースのカーネル近似を利用する。
提案した EGP-TS を大域的最適に収束させるため,ベイズ的後悔の概念に基づいて解析を行う。
論文 参考訳(メタデータ) (2022-05-27T16:43:10Z) - Auto-Tuned Sim-to-Real Transfer [143.44593793640814]
シミュレーションで訓練されたポリシーは、しばしば現実世界に移されるときに失敗する。
ドメインのランダム化のようなこの問題に取り組む現在のアプローチには、事前の知識とエンジニアリングが必要である。
実世界に合わせてシミュレータシステムパラメータを自動的にチューニングする手法を提案する。
論文 参考訳(メタデータ) (2021-04-15T17:59:55Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Variable selection for Gaussian process regression through a sparse
projection [0.802904964931021]
本稿では,ガウス過程(GP)レグレッションと統合された新しい変数選択手法を提案する。
パラメータの調整と推定の精度を,選択したベンチマーク手法を用いて評価した。
論文 参考訳(メタデータ) (2020-08-25T01:06:10Z) - Bayesian Sparse learning with preconditioned stochastic gradient MCMC
and its applications [5.660384137948734]
提案アルゴリズムは, 温和な条件下で, 制御可能なバイアスで正しい分布に収束する。
提案アルゴリズムは, 温和な条件下で, 制御可能なバイアスで正しい分布に収束可能であることを示す。
論文 参考訳(メタデータ) (2020-06-29T20:57:20Z) - Parameterized MDPs and Reinforcement Learning Problems -- A Maximum
Entropy Principle Based Framework [2.741266294612776]
逐次的意思決定問題に対処する枠組みを提案する。
我々のフレームワークは、ノイズの多いデータに対する堅牢性を備えた最適制御ポリシーの学習を特徴としている。
論文 参考訳(メタデータ) (2020-06-17T04:08:35Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。