論文の概要: Reservoir Predictive Path Integral Control for Unknown Nonlinear Dynamics
- arxiv url: http://arxiv.org/abs/2509.03839v1
- Date: Thu, 04 Sep 2025 03:05:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-05 20:21:10.031514
- Title: Reservoir Predictive Path Integral Control for Unknown Nonlinear Dynamics
- Title(参考訳): 未知非線形ダイナミクスに対する貯留層予測経路積分制御
- Authors: Daisuke Inoue, Tadayoshi Matsumori, Gouhei Tanaka, Yuji Ito,
- Abstract要約: 本稿では, エコー状態ネットワーク (ESN) とモデル予測経路積分 (MPPI) の制御を統合し, 高速オンライン識別と未知のダイナミクスの制御の課題に対処する。
提案した貯水池予測経路積分(RPPI)は, ESNを用いた非線形力学の高速学習を可能にし, 並列化MPPI制御計算において, 学習された非線形性を直接活用する。
- 参考スコア(独自算出の注目度): 2.152586952462536
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural networks capable of approximating complex nonlinearities have found extensive application in data-driven control of nonlinear dynamical systems. However, fast online identification and control of unknown dynamics remain central challenges. This paper integrates echo-state networks (ESNs) -- reservoir computing models implemented with recurrent neural networks -- and model predictive path integral (MPPI) control -- sampling-based variants of model predictive control -- to meet these challenges. The proposed reservoir predictive path integral (RPPI) enables fast learning of nonlinear dynamics with ESN and exploits the learned nonlinearities directly in parallelized MPPI control computation without linearization approximations. The framework is further extended to uncertainty-aware RPPI (URPPI), which leverages ESN uncertainty to balance exploration and exploitation: exploratory inputs dominate during early learning, while exploitative inputs prevail as model confidence grows. Experiments on controlling the Duffing oscillator and four-tank systems demonstrate that URPPI improves control performance, reducing control costs by up to 60% compared to traditional quadratic programming-based model predictive control methods.
- Abstract(参考訳): 複雑な非線形性を近似できるニューラルネットワークは、非線形力学系のデータ駆動制御に広く応用されている。
しかし、高速なオンライン識別と未知のダイナミクスの制御は依然として中心的な課題である。
本稿では、リカレントニューラルネットワークで実装されたエコー状態ネットワーク(ESN)とモデル予測経路積分(MPPI)制御(モデル予測制御のサンプリングに基づく変種)を統合し、これらの課題を満たす。
提案した貯水池予測経路積分 (RPPI) は, 線形化近似を伴わない並列化MPPI制御計算において, ESNを用いた非線形力学の高速学習を可能にし, 学習された非線形性を直接活用する。
このフレームワークはさらに不確実性を認識したRPPI(URPPI)にも拡張され、ESNの不確実性を利用して探索とエクスプロイトのバランスをとる。
ダッフィング発振器と4タンク系の制御実験により、UPPPIは従来の二次プログラミングに基づくモデル予測制御法と比較して制御性能を向上し、制御コストを最大60%削減することを示した。
関連論文リスト
- Model-based controller assisted domain randomization in deep reinforcement learning: application to nonlinear powertrain control [0.0]
本研究では, 深部強化学習(DRL)の枠組みを用いた新しいロバスト制御手法を提案する。
問題設定は、不確実性と非線形性を考慮した制御系に対して、バニラMDPの集合である潜在マルコフ決定プロセス(LMDP)を介してモデル化される。
従来のDRLベースの制御と比較して、提案するコントローラ設計はより賢く、高度な一般化能力を実現することができる。
論文 参考訳(メタデータ) (2025-04-28T12:09:07Z) - Parameter-Adaptive Approximate MPC: Tuning Neural-Network Controllers without Retraining [50.00291020618743]
この研究は、大規模なデータセットを再計算し、再トレーニングすることなくオンラインチューニングが可能な、新しいパラメータ適応型AMPCアーキテクチャを導入している。
資源制約の厳しいマイクロコントローラ(MCU)を用いた2種類の実カートポールシステムの揺らぎを制御し,パラメータ適応型AMPCの有効性を示す。
これらの貢献は、現実世界のシステムにおけるAMPCの実践的応用に向けた重要な一歩である。
論文 参考訳(メタデータ) (2024-04-08T20:02:19Z) - Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated
Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。
ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文 参考訳(メタデータ) (2024-01-09T11:54:54Z) - End-to-End Reinforcement Learning of Koopman Models for Economic Nonlinear Model Predictive Control [45.84205238554709]
本研究では, (e)NMPCの一部として最適性能を示すために, Koopman シュロゲートモデルの強化学習法を提案する。
エンドツーエンドトレーニングモデルは,(e)NMPCにおけるシステム識別を用いてトレーニングしたモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-03T10:21:53Z) - Unifying Model-Based and Neural Network Feedforward: Physics-Guided
Neural Networks with Linear Autoregressive Dynamics [0.0]
本稿では,未知の非線形力学を補償するフィードフォワード制御フレームワークを開発する。
フィードフォワードコントローラは、物理モデルとニューラルネットワークの並列結合としてパラメータ化される。
論文 参考訳(メタデータ) (2022-09-26T08:01:28Z) - Physics-informed Neural Networks-based Model Predictive Control for
Multi-link Manipulators [0.0]
物理インフォームド機械学習手法を用いて,多体ダイナミクスに対する非線形モデル予測制御(NMPC)について論じる。
本稿では,ネットワーク入力として制御動作と初期条件を付加することでPINNの強化を提案する。
PINNベースのMPCを用いて,複雑な機械システムにおける追跡問題の解法を提案する。
論文 参考訳(メタデータ) (2021-09-22T15:31:24Z) - Stochastic Deep Model Reference Adaptive Control [9.594432031144715]
本稿では,ディープニューラルネットワークを用いたモデル参照適応制御を提案する。
Deep Model Reference Adaptive Controlは、DNNモデルの出力層重みをリアルタイムに適応させるために、リアプノフ法を用いる。
データ駆動型教師付き学習アルゴリズムは、内部層パラメータの更新に使用される。
論文 参考訳(メタデータ) (2021-08-04T14:05:09Z) - Approximate Robust NMPC using Reinforcement Learning [0.0]
障害や不確実性の存在下で非線形システムを制御するための強化学習に基づくロバストモデル予測制御(RL-RNMPC)を提案する。
論文 参考訳(メタデータ) (2021-04-06T18:34:58Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。