論文の概要: The Impact of Data on the Stability of Learning-Based Control- Extended
Version
- arxiv url: http://arxiv.org/abs/2011.10596v2
- Date: Fri, 30 Jul 2021 13:25:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 06:50:32.203136
- Title: The Impact of Data on the Stability of Learning-Based Control- Extended
Version
- Title(参考訳): 学習ベース制御拡張版の安定性に及ぼすデータの影響
- Authors: Armin Lederer, Alexandre Capone, Thomas Beckers, Jonas Umlauft, Sandra
Hirche
- Abstract要約: 本稿では,Lyapunovをベースとした,認証制御性能に対するデータの影響の定量化手法を提案する。
ガウス過程を通じて未知系の力学をモデル化することにより、モデルの不確実性と安定性条件の満足度の間の相互関係を決定できる。
- 参考スコア(独自算出の注目度): 63.97366815968177
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the existence of formal guarantees for learning-based control
approaches, the relationship between data and control performance is still
poorly understood. In this paper, we propose a Lyapunov-based measure for
quantifying the impact of data on the certifiable control performance. By
modeling unknown system dynamics through Gaussian processes, we can determine
the interrelation between model uncertainty and satisfaction of stability
conditions. This allows us to directly asses the impact of data on the provable
stationary control performance, and thereby the value of the data for the
closed-loop system performance. Our approach is applicable to a wide variety of
unknown nonlinear systems that are to be controlled by a generic learning-based
control law, and the results obtained in numerical simulations indicate the
efficacy of the proposed measure.
- Abstract(参考訳): 学習に基づく制御アプローチの形式的保証が存在するにもかかわらず、データと制御性能の関係はいまだによく分かっていない。
本稿では,Lyapunovをベースとした,認証制御性能に対するデータの影響の定量化手法を提案する。
ガウス過程を通じて未知の系のダイナミクスをモデル化することにより、モデルの不確かさと安定性条件の満足度との関係を決定できる。
これにより,提案可能な定常制御性能に対するデータの影響を直接評価し,クローズドループシステム性能に対するデータの値を求めることができる。
本手法は, 一般学習に基づく制御法により制御される未知の非線形系に適用可能であり, 数値シミュレーションの結果から, 提案手法の有効性が示唆された。
関連論文リスト
- Learning-Based Optimal Control with Performance Guarantees for Unknown Systems with Latent States [4.4820711784498]
本稿では,潜在状態を持つ未知非線形系に対する最適入力軌道の計算法を提案する。
提案手法の有効性を数値シミュレーションで示す。
論文 参考訳(メタデータ) (2023-03-31T11:06:09Z) - In-Distribution Barrier Functions: Self-Supervised Policy Filters that
Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。
本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文 参考訳(メタデータ) (2023-01-27T22:28:19Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - DEALIO: Data-Efficient Adversarial Learning for Imitation from
Observation [57.358212277226315]
観察ifoからの模倣学習において、学習エージェントは、実演者の生成した制御信号にアクセスせずに、実演行動の観察のみを用いて実演エージェントを模倣しようとする。
近年、逆模倣学習に基づく手法は、ifO問題に対する最先端のパフォーマンスをもたらすが、データ非効率でモデルなしの強化学習アルゴリズムに依存するため、サンプルの複雑さに悩まされることが多い。
この問題は、サンプルの収集が時間、エネルギー、およびリスクの面で高いコストを被る可能性がある現実世界の設定に展開することは非現実的です。
よりデータ効率の高いifOアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-31T23:46:32Z) - Robust Data-Driven Predictive Control using Reachability Analysis [6.686241050151697]
境界プロセスおよび測定ノイズを有する未知の線形システムの堅牢なデータ駆動制御方式を提案する。
データ駆動到達可能領域は、システムの軌道のノイズの多い入出力データのみに基づいて算出される。
ノイズフリーの場合、提示された純粋にデータ駆動制御スキームが、名目モデル予測制御スキームに等価な閉ループ挙動をもたらすことを示す。
論文 参考訳(メタデータ) (2021-03-25T19:55:15Z) - Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。
AntLer は確率 1 と任意に最適な解を近似することを示す。
論文 参考訳(メタデータ) (2020-07-24T07:00:14Z) - How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文 参考訳(メタデータ) (2020-05-25T12:13:49Z) - Learning Constrained Adaptive Differentiable Predictive Control Policies
With Guarantees [1.1086440815804224]
本稿では,線形システムに対する制約付きニューラルコントロールポリシーの学習方法として,微分可能予測制御(DPC)を提案する。
我々は,モデル予測制御(MPC)損失関数の逆伝搬と,微分可能な閉ループ系力学モデルによるペナルティの制約により,直接的な政策勾配を求めるために,自動微分を用いる。
論文 参考訳(メタデータ) (2020-04-23T14:24:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。