論文の概要: How Training Data Impacts Performance in Learning-based Control
- arxiv url: http://arxiv.org/abs/2005.12062v1
- Date: Mon, 25 May 2020 12:13:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 06:41:17.541174
- Title: How Training Data Impacts Performance in Learning-based Control
- Title(参考訳): 学習に基づく制御における学習データの効果
- Authors: Armin Lederer, Alexandre Capone, Jonas Umlauft, Sandra Hirche
- Abstract要約: 本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
- 参考スコア(独自算出の注目度): 67.7875109298865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When first principle models cannot be derived due to the complexity of the
real system, data-driven methods allow us to build models from system
observations. As these models are employed in learning-based control, the
quality of the data plays a crucial role for the performance of the resulting
control law. Nevertheless, there hardly exist measures for assessing training
data sets, and the impact of the distribution of the data on the closed-loop
system properties is largely unknown. This paper derives - based on Gaussian
process models - an analytical relationship between the density of the training
data and the control performance. We formulate a quality measure for the data
set, which we refer to as $\rho$-gap, and derive the ultimate bound for the
tracking error under consideration of the model uncertainty. We show how the
$\rho$-gap can be applied to a feedback linearizing control law and provide
numerical illustrations for our approach.
- Abstract(参考訳): 第一原理モデルが実システムの複雑さのために導出できない場合、データ駆動手法はシステム観測からモデルを構築することができる。
これらのモデルが学習に基づく制御に使用されるため、データの品質は結果の制御法の性能に重要な役割を果たす。
しかしながら、トレーニングデータセットを評価するための尺度はほとんど存在せず、閉ループシステムの特性に対するデータの分布の影響はほとんど分かっていない。
本稿では,ガウス過程モデルに基づいて,トレーニングデータの密度と制御性能の相関関係を導出する。
モデルの不確実性を考慮した追跡誤差の究極的境界を導出するため、データセットの品質指標を$\rho$-gapと呼ぶ。
我々は,$\rho$-gap がフィードバック線形化制御則に適用できることを示すとともに,その手法を数値的に示す。
関連論文リスト
- Explanatory Model Monitoring to Understand the Effects of Feature Shifts on Performance [61.06245197347139]
そこで本研究では,機能シフトによるブラックボックスモデルの振る舞いを説明する新しい手法を提案する。
本稿では,最適輸送と共有値の概念を組み合わせた提案手法について,説明的性能推定として紹介する。
論文 参考訳(メタデータ) (2024-08-24T18:28:19Z) - Data Shapley in One Training Run [88.59484417202454]
Data Shapleyは、機械学習コンテキストにおけるデータのコントリビューションに寄与するための、原則化されたフレームワークを提供する。
既存のアプローチでは、計算集約的な異なるデータサブセット上の再学習モデルが必要である。
本稿では、対象とするデータモデルに対するスケーラブルなデータ属性を提供することにより、これらの制限に対処するIn-Run Data Shapleyを紹介する。
論文 参考訳(メタデータ) (2024-06-16T17:09:24Z) - Unlearning Information Bottleneck: Machine Unlearning of Systematic Patterns and Biases [6.936871609178494]
本稿では,機械学習のプロセスを強化するための新しい情報理論フレームワークであるUnlearning Information Bottleneck(UIB)を紹介する。
変分上界を提案することにより,データ分布の変化を安価な計算コストと統合する動的事前計算により,モデルパラメータを再検討する。
さまざまなデータセット,モデル,未学習手法を対象とした実験により,本手法は学習後のモデルの性能を維持しながら,体系的なパターンやバイアスを効果的に除去することを示した。
論文 参考訳(メタデータ) (2024-05-22T21:54:05Z) - Distilled Datamodel with Reverse Gradient Matching [74.75248610868685]
オフライントレーニングとオンライン評価段階を含む,データ影響評価のための効率的なフレームワークを提案する。
提案手法は, 直接再学習法と比較して, プロセスの大幅な高速化を図りながら, 同等のモデル行動評価を実現する。
論文 参考訳(メタデータ) (2024-04-22T09:16:14Z) - Active Learning for Control-Oriented Identification of Nonlinear Systems [26.231260751633307]
本稿では,非線形力学の一般クラスに適した能動学習アルゴリズムの最初の有限サンプル解析について述べる。
ある設定では、アルゴリズムの過剰な制御コストは、対数係数まで、最適な速度を達成する。
我々は,非線形システムの制御におけるアクティブな制御指向探索の利点を示すとともに,シミュレーションにおける我々のアプローチを検証する。
論文 参考訳(メタデータ) (2024-04-13T15:40:39Z) - Learning a model is paramount for sample efficiency in reinforcement
learning control of PDEs [5.488334211013093]
RLエージェントの訓練と並行して動作モデルを学ぶことで,実システムからサンプリングしたデータ量を大幅に削減できることを示す。
また、RLトレーニングのバイアスを避けるために、モデルを反復的に更新することが重要であることも示している。
論文 参考訳(メタデータ) (2023-02-14T16:14:39Z) - Striving for data-model efficiency: Identifying data externalities on
group performance [75.17591306911015]
信頼できる、効果的で責任ある機械学習システムの構築は、トレーニングデータとモデリング決定の違いが、予測パフォーマンスにどのように影響するかを理解することに集中する。
我々は、特定のタイプのデータモデル非効率性に注目し、一部のソースからトレーニングデータを追加することで、集団の重要なサブグループで評価されるパフォーマンスを実際に低下させることができる。
以上の結果から,データ効率が正確かつ信頼性の高い機械学習の鍵となることが示唆された。
論文 参考訳(メタデータ) (2022-11-11T16:48:27Z) - Adjustment formulas for learning causal steady-state models from
closed-loop operational data [0.0]
定常状態データから因果定常状態モデルの推定を可能にする制御共起の調整式を導出する。
コントローラが対処しようとしている障害を推定して考慮し、フィードフォワードとフィードバックコントロールの両方で収集されたデータから学習することができる。
論文 参考訳(メタデータ) (2022-11-10T14:39:46Z) - The Impact of Data on the Stability of Learning-Based Control- Extended
Version [63.97366815968177]
本稿では,Lyapunovをベースとした,認証制御性能に対するデータの影響の定量化手法を提案する。
ガウス過程を通じて未知系の力学をモデル化することにより、モデルの不確実性と安定性条件の満足度の間の相互関係を決定できる。
論文 参考訳(メタデータ) (2020-11-20T19:10:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。