論文の概要: Information-seeking polynomial NARX model-predictive control through
expected free energy minimization
- arxiv url: http://arxiv.org/abs/2312.15046v1
- Date: Fri, 22 Dec 2023 20:18:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 20:15:53.348033
- Title: Information-seeking polynomial NARX model-predictive control through
expected free energy minimization
- Title(参考訳): 予測自由エネルギー最小化による情報探索多項式narxモデル予測制御
- Authors: Wouter M. Kouw
- Abstract要約: 本稿では,システムの目標状態への運転とシステム観測の両立を両立させる適応型モデル予測制御器を提案する。
パラメータの不確かさが制御対象にどのように影響するかを実験で示し、振り子スイングアップタスクのための提案したコントローラを評価する。
- 参考スコア(独自算出の注目度): 4.02487511510606
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose an adaptive model-predictive controller that balances driving the
system to a goal state and seeking system observations that are informative
with respect to the parameters of a nonlinear autoregressive exogenous model.
The controller's objective function is derived from an expected free energy
functional and contains information-theoretic terms expressing uncertainty over
model parameters and output predictions. Experiments illustrate how parameter
uncertainty affects the control objective and evaluate the proposed controller
for a pendulum swing-up task.
- Abstract(参考訳): 本稿では,システムの目標状態への運転と,非線形自己回帰的外因性モデルのパラメータに関する情報的システム観測を求める適応型モデル予測制御器を提案する。
コントローラの目的関数は期待される自由エネルギー関数から派生し、モデルパラメータや出力予測に対する不確実性を表す情報理論用語を含む。
パラメータの不確かさが制御対象にどのように影響するかを実験で示し、振り子スイングアップタスクのための提案したコントローラを評価する。
関連論文リスト
- Mitigating Parameter Degeneracy using Joint Conditional Diffusion Model for WECC Composite Load Model in Power Systems [2.7212274374272543]
連立条件拡散モデルに基づく逆問題解法(JCDI)を開発した。
JCDIは、パラメータの一般化性を改善するために、マルチイベント観測を同時に入力するジョイントコンディショニングアーキテクチャを組み込んでいる。
WECC CLMのシミュレーション研究により、提案したJCDIは縮退パラメータの不確かさを効果的に低減することを示した。
論文 参考訳(メタデータ) (2024-11-15T18:53:08Z) - Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated
Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。
ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文 参考訳(メタデータ) (2024-01-09T11:54:54Z) - Controllability-Constrained Deep Network Models for Enhanced Control of
Dynamical Systems [4.948174943314265]
力学の知識を持たない力学系の制御は重要かつ困難な課題である。
ディープニューラルネットワーク(DNN)のような現代の機械学習アプローチは、制御入力と対応する状態観測出力から動的モデルの推定を可能にする。
制御性のあるデータから推定されるモデルを明確に拡張する制御理論法を提案する。
論文 参考訳(メタデータ) (2023-11-11T00:04:26Z) - Probabilities Are Not Enough: Formal Controller Synthesis for Stochastic
Dynamical Models with Epistemic Uncertainty [68.00748155945047]
複雑な力学系のモデルにおける不確実性を捉えることは、安全なコントローラの設計に不可欠である。
いくつかのアプローチでは、安全と到達可能性に関する時間的仕様を満たすポリシーを形式的な抽象化を用いて合成する。
我々の貢献は、ノイズ、不確実なパラメータ、外乱を含む連続状態モデルに対する新しい抽象的制御法である。
論文 参考訳(メタデータ) (2022-10-12T07:57:03Z) - On the Forward Invariance of Neural ODEs [92.07281135902922]
本稿では,ニューラル常微分方程式(ODE)が出力仕様を満たすことを保証するための新しい手法を提案する。
提案手法では,出力仕様を学習システムのパラメータや入力の制約に変換するために,制御障壁関数のクラスを用いる。
論文 参考訳(メタデータ) (2022-10-10T15:18:28Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - On the Parameter Combinations That Matter and on Those That do Not [0.0]
モデルパラメータの非識別性を特徴付けるためのデータ駆動型手法を提案する。
Diffusion Mapsとその拡張を利用することで、動的出力の振る舞いを特徴づけるために必要なパラメータの最小の組み合わせを発見する。
論文 参考訳(メタデータ) (2021-10-13T13:46:23Z) - Physics-constrained deep neural network method for estimating parameters
in a redox flow battery [68.8204255655161]
バナジウムフローバッテリ(VRFB)のゼロ次元(0D)モデルにおけるパラメータ推定のための物理拘束型ディープニューラルネットワーク(PCDNN)を提案する。
そこで, PCDNN法は, 動作条件のモデルパラメータを推定し, 電圧の0Dモデル予測を改善することができることを示す。
また,PCDNNアプローチでは,トレーニングに使用しない操作条件のパラメータ値を推定する一般化能力が向上することが実証された。
論文 参考訳(メタデータ) (2021-06-21T23:42:58Z) - Accurate Parameter Estimation for Risk-aware Autonomous Systems [0.0]
本稿では,自律システムの動的モデルのパラメータを推定するためのスペクトル線に基づくアプローチについて述べる。
既存の文献では、力学系のすべての非モデル化された成分をガウス下雑音として扱っている。
提案手法は既存の文献と一致して$tildeO(sqrtT)$ regretを保証できることを示す。
論文 参考訳(メタデータ) (2020-06-23T01:20:44Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - DISCO: Double Likelihood-free Inference Stochastic Control [29.84276469617019]
確率自由推論のためのベイズ統計学における現代シミュレータのパワーと最近の技術を活用することを提案する。
シミュレーションパラメータの後方分布は、システムの潜在的非解析モデルによって伝播される。
実験により、制御器の提案により、古典的な制御やロボット工学のタスクにおいて、優れた性能と堅牢性が得られることが示された。
論文 参考訳(メタデータ) (2020-02-18T05:29:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。