Fugu-MT 論文翻訳(概要): Structured Hammerstein-Wiener Model Learning for Model Predictive Control

論文の概要: Structured Hammerstein-Wiener Model Learning for Model Predictive Control

arxiv url: http://arxiv.org/abs/2107.04247v1
Date: Fri, 9 Jul 2021 06:41:34 GMT
ステータス: 翻訳完了
システム内更新日: 2021-07-12 13:38:49.530638
Title: Structured Hammerstein-Wiener Model Learning for Model Predictive Control
Title（参考訳）: モデル予測制御のための構造化ハマースタイン・ウィーナーモデル学習
Authors: Ryuta Moriyasu, Taro Ikeda, Sho Kawaguchi, Kenji Kashima
Abstract要約: 本稿では,機械学習によって構築されたモデルを用いて最適制御の信頼性を向上させることを目的とする。本稿では,Hammerstein-Wienerモデルと凸ニューラルネットワークを組み合わせたモデルを提案する。
参考スコア（独自算出の注目度）: 0.2752817022620644
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper aims to improve the reliability of optimal control using models constructed by machine learning methods. Optimal control problems based on such models are generally non-convex and difficult to solve online. In this paper, we propose a model that combines the Hammerstein-Wiener model with input convex neural networks, which have recently been proposed in the field of machine learning. An important feature of the proposed model is that resulting optimal control problems are effectively solvable exploiting their convexity and partial linearity while retaining flexible modeling ability. The practical usefulness of the method is examined through its application to the modeling and control of an engine airpath system.
Abstract（参考訳）: 本稿では,機械学習によって構築されたモデルを用いて最適制御の信頼性を向上させることを目的とする。このようなモデルに基づく最適制御問題は一般に非凸であり、オンラインでは解決が難しい。本稿では,Hammerstein-Wienerモデルと入力凸ニューラルネットワークを組み合わせたモデルを提案する。提案モデルの重要な特徴は, 最適制御問題の発生は, 柔軟モデリング能力を維持しつつ, 対流性と部分線形性を効果的に活用できる点である。本手法の実用性について,エンジンエアパスシステムのモデル化と制御への応用を通して検討した。

関連論文リスト

Learning Physically Consistent Lagrangian Control Models Without Acceleration Measurements [11.581126685402083]
本稿では、モデルベース制御合成に不可欠な物理的に一貫したモデルの導出と同定に焦点を当てる。ラグランジアンまたはハミルトンニューラルネットワークは有用な構造保証を提供するが、そのようなモデルの学習はしばしば矛盾するモデルにつながる。ラグランジアンシステムの物理的整合性を改善するために、元の損失関数に依存する学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2025-12-02T18:56:02Z)
Approach to Finding a Robust Deep Learning Model [0.28675177318965045]
機械学習(ML)と人工知能(AI)のアプリケーションの開発は、多数のモデルのトレーニングを必要とする。本稿ではメタアルゴリズムとして設計したモデル選択アルゴリズムを用いてモデルロバスト性を決定する新しい手法を提案する。本フレームワークでは,学習モデルの堅牢性に及ぼすトレーニングサンプルサイズ,モデル重み,帰納的バイアスの影響について検討する。
論文参考訳（メタデータ） (2025-05-22T20:05:20Z)
Model-based Policy Optimization using Symbolic World Model [46.42871544295734]
ロボット工学における学習に基づく制御手法の適用は、大きな課題を呈している。 1つは、モデルなし強化学習アルゴリズムがサンプル効率の低い観測データを使用することである。シンボリック回帰によって生成されるシンボリック表現による遷移ダイナミクスの近似を提案する。
論文参考訳（メタデータ） (2024-07-18T13:49:21Z)
Deep autoregressive density nets vs neural ensembles for model-based offline reinforcement learning [2.9158689853305693]
本稿では、利用可能なデータからシステムダイナミクスを推定し、仮想モデルロールアウトにおけるポリシー最適化を行うモデルベース強化学習アルゴリズムについて考察する。このアプローチは、実際のシステムで破滅的な失敗を引き起こす可能性のあるモデルエラーを悪用することに対して脆弱である。 D4RLベンチマークの1つのよく校正された自己回帰モデルにより、より良い性能が得られることを示す。
論文参考訳（メタデータ） (2024-02-05T10:18:15Z)
Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文参考訳（メタデータ） (2024-01-09T11:54:54Z)
Learning Exactly Linearizable Deep Dynamics Models [0.07366405857677226]
本稿では, 安定度, 信頼性, 信頼性を確保するために, 様々な制御理論を容易に適用可能な, 線形化可能な動的モデルの学習法を提案する。提案手法は, 自動車エンジンのリアルタイム制御に応用され, 予測性能と制約下での安定制御が良好であることを示す。
論文参考訳（メタデータ） (2023-11-30T05:40:55Z)
When to Update Your Model: Constrained Model-based Reinforcement Learning [50.74369835934703]
モデルベースRL(MBRL)の非遅延性能保証のための新規で一般的な理論スキームを提案する。続いて導いた境界は、モデルシフトとパフォーマンス改善の関係を明らかにします。さらなる例では、動的に変化する探索からの学習モデルが、最終的なリターンの恩恵をもたらすことが示されている。
論文参考訳（メタデータ） (2022-10-15T17:57:43Z)
Online Dynamics Learning for Predictive Control with an Application to Aerial Robots [3.673994921516517]
予測モデルは学習し、モデルベースのコントローラに適用することができるが、これらのモデルはしばしばオフラインで学習される。このオフライン設定では、トレーニングデータをまず収集し、精巧なトレーニング手順により予測モデルを学ぶ。本稿では,デプロイ中の動的モデルの精度を継続的に向上するオンライン動的学習フレームワークを提案する。
論文参考訳（メタデータ） (2022-07-19T15:51:25Z)
Sufficiently Accurate Model Learning for Planning [119.80502738709937]
本稿では,制約付きSufficiently Accurateモデル学習手法を提案する。これはそのような問題の例を示し、いくつかの近似解がいかに近いかという定理を提示する。近似解の質は、関数のパラメータ化、損失と制約関数の滑らかさ、モデル学習におけるサンプルの数に依存する。
論文参考訳（メタデータ） (2021-02-11T16:27:31Z)
Model-free and Bayesian Ensembling Model-based Deep Reinforcement Learning for Particle Accelerator Control Demonstrated on the FERMI FEL [0.0]
本稿では,加速物理問題における強化学習の運用レベルでの活用方法を示す。 FERMI FELシステムの強度最適化に適用されるモデルベースとモデルフリー強化学習を比較します。モデルベースアプローチは、高い表現力とサンプル効率を示す一方、モデルフリーメソッドのパフォーマンスはわずかに優れています。
論文参考訳（メタデータ） (2020-12-17T16:57:27Z)
Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文参考訳（メタデータ） (2020-07-11T19:44:09Z)
Hybrid modeling: Applications in real-time diagnosis [64.5040763067757]
我々は、機械学習にインスパイアされたモデルと物理モデルを組み合わせた、新しいハイブリッドモデリングアプローチの概要を述べる。このようなモデルをリアルタイム診断に利用しています。
論文参考訳（メタデータ） (2020-03-04T00:44:57Z)
Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文参考訳（メタデータ） (2019-12-31T00:29:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。