Fugu-MT 論文翻訳(概要): Online Parameter Estimation for Safety-Critical Systems with Gaussian Processes

論文の概要: Online Parameter Estimation for Safety-Critical Systems with Gaussian Processes

arxiv url: http://arxiv.org/abs/2002.07870v1
Date: Tue, 18 Feb 2020 20:38:00 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-30 20:44:28.048176
Title: Online Parameter Estimation for Safety-Critical Systems with Gaussian Processes
Title（参考訳）: ガウス過程を有する安全クリティカルシステムのオンラインパラメータ推定
Authors: Mouhyemen Khan and Abhijit Chatterjee
Abstract要約: オンラインパラメータ推定のためのガウス過程(GP)に基づくベイズ最適化フレームワークを提案する。パラメータ空間の応答面上の効率的な探索戦略を用いて、最小限の機能評価で大域最適解を求める。我々は,パラメータの変化を考慮したシミュレーションにおいて,アクティベートされた平面振子と安全臨界振子について実演する。
参考スコア（独自算出の注目度）: 6.122161391301866
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Parameter estimation is crucial for modeling, tracking, and control of complex dynamical systems. However, parameter uncertainties can compromise system performance under a controller relying on nominal parameter values. Typically, parameters are estimated using numerical regression approaches framed as inverse problems. However, they suffer from non-uniqueness due to existence of multiple local optima, reliance on gradients, numerous experimental data, or stability issues. Addressing these drawbacks, we present a Bayesian optimization framework based on Gaussian processes (GPs) for online parameter estimation. It uses an efficient search strategy over a response surface in the parameter space for finding the global optima with minimal function evaluations. The response surface is modeled as correlated surrogates using GPs on noisy data. The GP posterior predictive variance is exploited for smart adaptive sampling. This balances the exploration versus exploitation trade-off which is key in reaching the global optima under limited budget. We demonstrate our technique on an actuated planar pendulum and safety-critical quadrotor in simulation with changing parameters. We also benchmark our results against solvers using interior point method and sequential quadratic program. By reconfiguring the controller with new optimized parameters iteratively, we drastically improve trajectory tracking of the system versus the nominal case and other solvers.
Abstract（参考訳）: パラメータ推定は複雑な力学系のモデリング、追跡、制御に不可欠である。しかしパラメータの不確実性は、パラメータ値に依存するコントローラの下でのシステム性能を損なう可能性がある。通常、パラメータは逆問題としてフレーム化された数値回帰アプローチを用いて推定される。しかし、複数の局所最適点が存在すること、勾配に依存すること、多くの実験データ、安定性の問題などにより、非特異性に悩まされている。これらの欠点に対処するため,オンラインパラメータ推定のためのガウス過程(GP)に基づくベイズ最適化フレームワークを提案する。パラメータ空間の応答面上の効率的な探索戦略を用いて、最小限の機能評価で大域最適解を求める。応答面は、ノイズデータ上のGPを用いて相関代理としてモデル化される。 GP後部予測分散は、スマートアダプティブサンプリングに利用される。これは、限られた予算の下でグローバルオプティマに到達する上で鍵となる探索と搾取のトレードオフのバランスをとる。我々は,パラメータの変化を考慮したシミュレーションにおいて,アクティベートされた平面振子と安全臨界振子について実演する。また, 内部点法と逐次二次プログラムを用いて, 解法に対するベンチマークを行った。制御器を新しい最適化パラメータで反復的に再構成することにより,システムにおけるトラジェクティブトラッキングを,名目ケースや他の解法よりも大幅に改善する。

関連論文リスト

A Physics Informed Machine Learning Framework for Optimal Sensor Placement and Parameter Estimation [0.0]
本研究では,センサ配置とパラメータ推定を同時に行う,包括的なPINNベースのフレームワークを提案する。その結果,本手法は直感的あるいはランダムに選択されたセンサ位置から推定したパラメータ値と比較して,常に高精度であることがわかった。
論文参考訳（メタデータ） (2025-11-19T15:37:17Z)
Robust Filtering and Learning in State-Space Models: Skewness and Heavy Tails Via Asymmetric Laplace Distribution [8.60136504672206]
本稿では,効率的な変分ベイズアルゴリズムと新しい単一ループパラメータ推定手法を提案する。実験により,提案手法は様々なノイズ設定に対して一貫した頑健な性能を提供することを示した。
論文参考訳（メタデータ） (2025-07-30T03:06:27Z)
Continual Adaptation: Environment-Conditional Parameter Generation for Object Detection in Dynamic Scenarios [54.58186816693791]
環境は時間と空間によって常に変化し、クローズドセットの仮定に基づいて訓練された物体検出器にとって重要な課題となる。そこで本研究では,微調整過程をパラメータ生成に変換する機構を提案する。特に,2経路LoRAベースのドメイン認識アダプタを最初に設計し,特徴をドメイン不変およびドメイン固有コンポーネントに分解する。
論文参考訳（メタデータ） (2025-06-30T17:14:12Z)
Online Cluster-Based Parameter Control for Metaheuristic [0.0]
本稿では,クラスタベースメタヒューリスティックスのためのクラスタベース適応(CPA)と呼ばれる,汎用的なオンラインパラメータチューニング手法を提案する。主な考え方は、パラメータ探索空間内の有望な領域の同定と、これらの領域に関する新しいパラメータの生成である。得られた結果は統計的に解析され、高度な自動チューニング手法を含む最先端のアルゴリズムと比較される。
論文参考訳（メタデータ） (2025-04-07T14:48:30Z)
Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。このような問題は医学、物理学、機械学習で発生する。両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文参考訳（メタデータ） (2024-11-21T10:26:17Z)
Scaling Exponents Across Parameterizations and Optimizers [94.54718325264218]
本稿では,先行研究における重要な仮定を考察し,パラメータ化の新たな視点を提案する。私たちの経験的調査には、3つの組み合わせでトレーニングされた数万のモデルが含まれています。最高の学習率のスケーリング基準は、以前の作業の仮定から除外されることがよくあります。
論文参考訳（メタデータ） (2024-07-08T12:32:51Z)
A Unified Gaussian Process for Branching and Nested Hyperparameter Optimization [19.351804144005744]
ディープラーニングでは、条件に依存したパラメータのチューニングが一般的に行われている。新しいGPモデルでは、新しいカーネル関数を通じて入力変数間の依存構造が説明される。ニューラルネットワークの一連の合成シミュレーションおよび実データ応用において、高い予測精度とより良い最適化効率が観察される。
論文参考訳（メタデータ） (2024-01-19T21:11:32Z)
A Framework for History-Aware Hyperparameter Optimisation in Reinforcement Learning [8.659973888018781]
強化学習(RL)システムは、システムの性能に影響を与える一連の初期条件に依存する。これらのトレードオフを軽減するため,複雑なイベント処理と時間モデルの統合に基づくフレームワークを提案する。提案手法を,RLの変種であるDQNを用いた5Gモバイル通信ケーススタディで検証した。
論文参考訳（メタデータ） (2023-03-09T11:30:40Z)
Surrogate modeling for Bayesian optimization beyond a single Gaussian process [62.294228304646516]
本稿では,探索空間の活用と探索のバランスをとるための新しいベイズ代理モデルを提案する。拡張性のある関数サンプリングを実現するため、GPモデル毎にランダムな特徴ベースのカーネル近似を利用する。提案した EGP-TS を大域的最適に収束させるため,ベイズ的後悔の概念に基づいて解析を行う。
論文参考訳（メタデータ） (2022-05-27T16:43:10Z)
Auto-Tuned Sim-to-Real Transfer [143.44593793640814]
シミュレーションで訓練されたポリシーは、しばしば現実世界に移されるときに失敗する。ドメインのランダム化のようなこの問題に取り組む現在のアプローチには、事前の知識とエンジニアリングが必要である。実世界に合わせてシミュレータシステムパラメータを自動的にチューニングする手法を提案する。
論文参考訳（メタデータ） (2021-04-15T17:59:55Z)
Gaussian Process-based Min-norm Stabilizing Controller for Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文参考訳（メタデータ） (2020-11-14T01:27:32Z)
Variable selection for Gaussian process regression through a sparse projection [0.802904964931021]
本稿では,ガウス過程(GP)レグレッションと統合された新しい変数選択手法を提案する。パラメータの調整と推定の精度を,選択したベンチマーク手法を用いて評価した。
論文参考訳（メタデータ） (2020-08-25T01:06:10Z)
Bayesian Sparse learning with preconditioned stochastic gradient MCMC and its applications [5.660384137948734]
提案アルゴリズムは, 温和な条件下で, 制御可能なバイアスで正しい分布に収束する。提案アルゴリズムは, 温和な条件下で, 制御可能なバイアスで正しい分布に収束可能であることを示す。
論文参考訳（メタデータ） (2020-06-29T20:57:20Z)
Parameterized MDPs and Reinforcement Learning Problems -- A Maximum Entropy Principle Based Framework [2.741266294612776]
逐次的意思決定問題に対処する枠組みを提案する。我々のフレームワークは、ノイズの多いデータに対する堅牢性を備えた最適制御ポリシーの学習を特徴としている。
論文参考訳（メタデータ） (2020-06-17T04:08:35Z)
Adaptive Control and Regret Minimization in Linear Quadratic Gaussian (LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。 LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文参考訳（メタデータ） (2020-03-12T19:56:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。