論文の概要: Learning Dynamics from Infrequent Output Measurements for Uncertainty-Aware Optimal Control
- arxiv url: http://arxiv.org/abs/2512.08013v1
- Date: Mon, 08 Dec 2025 20:10:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.711949
- Title: Learning Dynamics from Infrequent Output Measurements for Uncertainty-Aware Optimal Control
- Title(参考訳): 不確実性を考慮した最適制御のための低出力計測からの学習ダイナミクス
- Authors: Robert Lefringhausen, Theodor Springer, Sandra Hirche,
- Abstract要約: 非線形システムの力学が未知であり、希少かつノイズの多い出力の測定しかできない場合、信頼性の高い最適制御は困難である。
この研究は、連続時間力学と潜在状態軌道を状態空間形式で定式化することで、制限されたセンシングのこの設定に対処する。
得られた後続サンプルは、モデルと測定の不確実性の両方を考慮に入れたシナリオベースの最適制御問題を定式化するために使用される。
- 参考スコア(独自算出の注目度): 4.85082036531237
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable optimal control is challenging when the dynamics of a nonlinear system are unknown and only infrequent, noisy output measurements are available. This work addresses this setting of limited sensing by formulating a Bayesian prior over the continuous-time dynamics and latent state trajectory in state-space form and updating it through a targeted marginal Metropolis-Hastings sampler equipped with a numerical ODE integrator. The resulting posterior samples are used to formulate a scenario-based optimal control problem that accounts for both model and measurement uncertainty and is solved using standard nonlinear programming methods. The approach is validated in a numerical case study on glucose regulation using a Type 1 diabetes model.
- Abstract(参考訳): 非線形システムの力学が未知であり、希少かつノイズの多い出力の測定しかできない場合、信頼性の高い最適制御は困難である。
この研究は、連続時間力学と潜時状態軌道を状態空間の形で定式化し、数値ODE積分器を備えた目標極端のメトロポリス・ハスティングスサンプリング器を通して更新することで、ベイズ式を限定的なセンシング設定に対処する。
得られた後続サンプルは、モデルと測定の不確実性の両方を考慮に入れたシナリオベースの最適制御問題を定式化し、標準的な非線形プログラミング手法を用いて解決する。
本手法は1型糖尿病モデルを用いたグルコース調節に関する数値ケーススタディで検証された。
関連論文リスト
- Reservoir Predictive Path Integral Control for Unknown Nonlinear Dynamics [2.152586952462536]
本稿では, エコー状態ネットワーク (ESN) とモデル予測経路積分 (MPPI) の制御を統合し, 高速オンライン識別と未知のダイナミクスの制御の課題に対処する。
提案した貯水池予測経路積分(RPPI)は, ESNを用いた非線形力学の高速学習を可能にし, 並列化MPPI制御計算において, 学習された非線形性を直接活用する。
論文 参考訳(メタデータ) (2025-09-04T03:05:17Z) - Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated
Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。
ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文 参考訳(メタデータ) (2024-01-09T11:54:54Z) - Stochastic Nonlinear Control via Finite-dimensional Spectral Dynamic Embedding [20.43835169613882]
本稿では,非線形系の最適制御のためのスペクトルダイナミクス埋め込み制御(SDEC)を提案する。
これはシステムの非線形力学によって誘導される無限次元の特徴表現を明らかにし、状態-作用値関数の線形表現を可能にする。
実用的な実装では、この表現は有限次元のトランケーションを用いて近似される。
論文 参考訳(メタデータ) (2023-04-08T04:23:46Z) - LMI-based Data-Driven Robust Model Predictive Control [0.1473281171535445]
入力制約と状態制約を考慮したデータ駆動型ロバストな線形行列不等式モデル予測制御手法を提案する。
コントローラは閉ループシステムを安定化し、制約満足度を保証する。
論文 参考訳(メタデータ) (2023-03-08T18:20:06Z) - Neural ODEs as Feedback Policies for Nonlinear Optimal Control [1.8514606155611764]
ニューラルネットワークをパラメータ化した微分方程式として連続時間力学をモデル化するために、ニューラル常微分方程式(ニューラルODE)を用いる。
本稿では,一般非線形最適制御問題の解法としてニューラル・オードとして提案するニューラル・コントロール・ポリシーを提案する。
論文 参考訳(メタデータ) (2022-10-20T13:19:26Z) - A Priori Denoising Strategies for Sparse Identification of Nonlinear
Dynamical Systems: A Comparative Study [68.8204255655161]
本研究では, 局所的およびグローバルな平滑化手法の性能と, 状態測定値の偏差について検討・比較する。
一般に,測度データセット全体を用いたグローバルな手法は,局所点の周辺に隣接するデータサブセットを用いる局所的手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-01-29T23:31:25Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - LSTM-based Anomaly Detection for Non-linear Dynamical System [11.797156206007612]
本稿では,Long Short-Term Memory (LSTM)に基づく非線形力学系における新しい異常検出手法を提案する。
まず、データ前処理、多段階予測、異常検出を含む非線形力学系におけるLSTMに基づく異常検出の枠組みについて述べる。
提案手法は,壁面せん断応力データセットにおいて従来の手法よりも高い精度で予測できる。
論文 参考訳(メタデータ) (2020-06-05T01:09:36Z) - Sparse Identification of Nonlinear Dynamical Systems via Reweighted
$\ell_1$-regularized Least Squares [62.997667081978825]
本研究は, 非線形系の制御方程式をノイズ状態測定から復元するための繰り返しスパース規則化回帰法を提案する。
本研究の目的は、状態測定ノイズの存在下での手法の精度とロバスト性を改善することである。
論文 参考訳(メタデータ) (2020-05-27T08:30:15Z) - Technical Report: Adaptive Control for Linearizable Systems Using
On-Policy Reinforcement Learning [41.24484153212002]
本稿では,未知システムに対するフィードバック線形化に基づくトラッキング制御系を適応的に学習するフレームワークを提案する。
学習した逆モデルがすべての時点において可逆である必要はない。
二重振り子の模擬例は、提案された理論の有用性を示している。
論文 参考訳(メタデータ) (2020-04-06T15:50:31Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。