Fugu-MT 論文翻訳(概要): Smooth Model Predictive Control with Applications to Statistical Learning

論文の概要: Smooth Model Predictive Control with Applications to Statistical Learning

arxiv url: http://arxiv.org/abs/2306.01914v1
Date: Fri, 2 Jun 2023 20:43:38 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-06 23:11:10.481947
Title: Smooth Model Predictive Control with Applications to Statistical Learning
Title（参考訳）: スムースモデル予測制御と統計的学習への応用
Authors: Kwangjun Ahn, Daniel Pfrommer, Jack Umenberger, Tobia Marcucci, Zak Mhammedi and Ali Jadbabaie
Abstract要約: 本稿では,制約をバリア関数に置き換える線形モデル予測制御(MPC)のスムーズな近似について検討する。特に、障壁MPCは、元の非滑らかなMPCポリシーの指数的安定性特性を継承することを示す。
参考スコア（独自算出の注目度）: 19.06936620903542
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Statistical learning theory and high dimensional statistics have had a tremendous impact on Machine Learning theory and have impacted a variety of domains including systems and control theory. Over the past few years we have witnessed a variety of applications of such theoretical tools to help answer questions such as: how many state-action pairs are needed to learn a static control policy to a given accuracy? Recent results have shown that continuously differentiable and stabilizing control policies can be well-approximated using neural networks with hard guarantees on performance, yet often even the simplest constrained control problems are not smooth. To address this void, in this paper we study smooth approximations of linear Model Predictive Control (MPC) policies, in which hard constraints are replaced by barrier functions, a.k.a. barrier MPC. In particular, we show that barrier MPC inherits the exponential stability properties of the original non-smooth MPC policy. Using a careful analysis of the proposed barrier MPC, we show that its smoothness constant can be carefully controlled, thereby paving the way for new sample complexity results for approximating MPC policies from sampled state-action pairs.
Abstract（参考訳）: 統計的学習理論と高次元統計学は機械学習理論に大きな影響を与え、システムや制御理論を含む様々な領域に影響を与えた。過去数年間、我々はこのような理論ツールの様々な応用を目撃し、次のような質問に答えた。与えられた精度で静的制御ポリシーを学ぶのに、状態-作用ペアがいくつ必要か? 近年の研究では、連続的な微分可能かつ安定化制御ポリシーは、性能の保証が難しいニューラルネットワークを用いて適切に近似できるが、最も単純な制約された制御問題でさえ滑らかではないことが示されている。本稿では, 線形モデル予測制御 (MPC) ポリシーのスムーズな近似について検討し, 厳密な制約をバリア関数, すなわちバリア MPC に置き換える。特に、障壁MPCは、元の非滑らかなMPCポリシーの指数的安定性特性を継承することを示す。提案した障壁MPCを慎重に解析することにより,その滑らかさ定数を慎重に制御できることを示す。

関連論文リスト

Improved Sample Complexity of Imitation Learning for Barrier Model Predictive Control [27.609098229134]
システムの汎用クラスに対して,スムーズな専門家コントローラを設計する方法を示す。 MPCの障壁は, 何らかの方向に沿って, 理論的に最適な誤差-平滑性トレードオフを達成できることを示す。
論文参考訳（メタデータ） (2024-10-01T16:52:23Z)
Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文参考訳（メタデータ） (2023-07-27T04:27:26Z)
Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文参考訳（メタデータ） (2021-11-18T23:21:00Z)
Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文参考訳（メタデータ） (2021-05-17T08:36:18Z)
Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文参考訳（メタデータ） (2021-02-18T05:11:41Z)
Gaussian Process-based Min-norm Stabilizing Controller for Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文参考訳（メタデータ） (2020-11-14T01:27:32Z)
Adaptive Control and Regret Minimization in Linear Quadratic Gaussian (LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。 LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文参考訳（メタデータ） (2020-03-12T19:56:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。