論文の概要: Gaussian Processes with State-Dependent Noise for Stochastic Control
- arxiv url: http://arxiv.org/abs/2305.16229v1
- Date: Thu, 25 May 2023 16:36:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 13:53:17.162504
- Title: Gaussian Processes with State-Dependent Noise for Stochastic Control
- Title(参考訳): 確率制御のための状態依存雑音をもつガウス過程
- Authors: Marcel Menner, Karl Berntorp
- Abstract要約: 力学系の残留モデル不確実性はガウス過程(GP)を用いて学習される
2つのGPは相互依存しており、反復アルゴリズムを用いて共同で学習される。
- 参考スコア(独自算出の注目度): 2.842794675894731
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper considers a stochastic control framework, in which the residual
model uncertainty of the dynamical system is learned using a Gaussian Process
(GP). In the proposed formulation, the residual model uncertainty consists of a
nonlinear function and state-dependent noise. The proposed formulation uses a
posterior-GP to approximate the residual model uncertainty and a prior-GP to
account for state-dependent noise. The two GPs are interdependent and are thus
learned jointly using an iterative algorithm. Theoretical properties of the
iterative algorithm are established. Advantages of the proposed state-dependent
formulation include (i) faster convergence of the GP estimate to the unknown
function as the GP learns which data samples are more trustworthy and (ii) an
accurate estimate of state-dependent noise, which can, e.g., be useful for a
controller or decision-maker to determine the uncertainty of an action.
Simulation studies highlight these two advantages.
- Abstract(参考訳): 本稿では,ガウス過程(gp)を用いて力学系の残留モデルの不確かさを学習する確率的制御枠組みについて考察する。
提案手法では,残差モデルの不確かさは非線形関数と状態依存ノイズからなる。
提案した定式化では,残差モデルの不確かさを近似するために後部GPと,状態依存雑音を考慮した前部GPを用いる。
2つのGPは相互依存しており、反復アルゴリズムを用いて共同で学習される。
反復アルゴリズムの理論的性質を確立した。
提案する状態依存的定式化の利点には
(i) gpがどのデータサンプルがより信頼できるかを知ると、gpの推定値が未知の関数により高速に収束する。
(ii) 状態依存ノイズの正確な推定は、例えば、コントローラ又は意思決定者が、動作の不確実性を決定するのに有用である。
シミュレーション研究はこの2つの利点を強調している。
関連論文リスト
- Variational Nonlinear Kalman Filtering with Unknown Process Noise
Covariance [24.23243651301339]
本稿では,近似ベイズ推定原理に基づく非線形状態推定とモデルパラメータの同定手法を提案する。
シミュレーションおよび実世界のデータを用いて,レーダ目標追尾法の性能を検証した。
論文 参考訳(メタデータ) (2023-05-06T03:34:39Z) - Robust Control for Dynamical Systems With Non-Gaussian Noise via Formal
Abstractions [59.605246463200736]
雑音分布の明示的な表現に依存しない新しい制御器合成法を提案する。
まず、連続制御系を有限状態モデルに抽象化し、離散状態間の確率的遷移によってノイズを捕捉する。
我々は最先端の検証技術を用いてマルコフ決定プロセスの間隔を保証し、これらの保証が元の制御システムに受け継がれるコントローラを演算する。
論文 参考訳(メタデータ) (2023-01-04T10:40:30Z) - Probabilities Are Not Enough: Formal Controller Synthesis for Stochastic
Dynamical Models with Epistemic Uncertainty [68.00748155945047]
複雑な力学系のモデルにおける不確実性を捉えることは、安全なコントローラの設計に不可欠である。
いくつかのアプローチでは、安全と到達可能性に関する時間的仕様を満たすポリシーを形式的な抽象化を用いて合成する。
我々の貢献は、ノイズ、不確実なパラメータ、外乱を含む連続状態モデルに対する新しい抽象的制御法である。
論文 参考訳(メタデータ) (2022-10-12T07:57:03Z) - A Priori Denoising Strategies for Sparse Identification of Nonlinear
Dynamical Systems: A Comparative Study [68.8204255655161]
本研究では, 局所的およびグローバルな平滑化手法の性能と, 状態測定値の偏差について検討・比較する。
一般に,測度データセット全体を用いたグローバルな手法は,局所点の周辺に隣接するデータサブセットを用いる局所的手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-01-29T23:31:25Z) - Robust and Adaptive Temporal-Difference Learning Using An Ensemble of
Gaussian Processes [70.80716221080118]
本稿では、時間差学習(TD)による政策評価の世代的視点について考察する。
OS-GPTDアプローチは、状態-逆ペアのシーケンスを観測することにより、与えられたポリシーの値関数を推定するために開発された。
1つの固定カーネルに関連する限られた表現性を緩和するために、GP前の重み付けアンサンブル(E)を用いて代替のスキームを生成する。
論文 参考訳(メタデータ) (2021-12-01T23:15:09Z) - Identification and Adaptation with Binary-Valued Observations under
Non-Persistent Excitation Condition [1.6897716547971817]
2値観測による回帰モデルのパラメータ推定のためのオンライン予測準ニュートン型アルゴリズムを提案する。
推定アルゴリズムの強い整合性を確立し,収束率を与える。
適応予測器の収束と適応制御への応用についても論じる。
論文 参考訳(メタデータ) (2021-07-08T03:57:50Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Adversarial Robustness Guarantees for Gaussian Processes [22.403365399119107]
ガウス過程(GP)は、モデルの不確実性の原理的計算を可能にし、安全性に重要なアプリケーションに魅力的です。
境界付き摂動に対するモデル決定の不変性として定義されるGPの対向的堅牢性を分析するためのフレームワークを提案する。
我々は境界を洗練し、任意の$epsilon > 0$に対して、我々のアルゴリズムが有限個の反復で実際の値に$epsilon$-closeの値に収束することを保証していることを示す分岐とバウンドのスキームを開発する。
論文 参考訳(メタデータ) (2021-04-07T15:14:56Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Transport Gaussian Processes for Regression [0.22843885788439797]
本稿では,GP,ワープGP,学生プロセスなどを含むプロセス構築手法を提案する。
私たちのアプローチはレイヤベースのモデルにインスパイアされ、各レイヤが生成されたプロセス上で特定のプロパティを変更する。
実世界のデータを用いた実験により,提案モデルの有効性を検証した。
論文 参考訳(メタデータ) (2020-01-30T17:44:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。