論文の概要: How Training Data Impacts Performance in Learning-based Control
- arxiv url: http://arxiv.org/abs/2005.12062v1
- Date: Mon, 25 May 2020 12:13:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 06:41:17.541174
- Title: How Training Data Impacts Performance in Learning-based Control
- Title(参考訳): 学習に基づく制御における学習データの効果
- Authors: Armin Lederer, Alexandre Capone, Jonas Umlauft, Sandra Hirche
- Abstract要約: 本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
- 参考スコア(独自算出の注目度): 67.7875109298865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When first principle models cannot be derived due to the complexity of the
real system, data-driven methods allow us to build models from system
observations. As these models are employed in learning-based control, the
quality of the data plays a crucial role for the performance of the resulting
control law. Nevertheless, there hardly exist measures for assessing training
data sets, and the impact of the distribution of the data on the closed-loop
system properties is largely unknown. This paper derives - based on Gaussian
process models - an analytical relationship between the density of the training
data and the control performance. We formulate a quality measure for the data
set, which we refer to as $\rho$-gap, and derive the ultimate bound for the
tracking error under consideration of the model uncertainty. We show how the
$\rho$-gap can be applied to a feedback linearizing control law and provide
numerical illustrations for our approach.
- Abstract(参考訳): 第一原理モデルが実システムの複雑さのために導出できない場合、データ駆動手法はシステム観測からモデルを構築することができる。
これらのモデルが学習に基づく制御に使用されるため、データの品質は結果の制御法の性能に重要な役割を果たす。
しかしながら、トレーニングデータセットを評価するための尺度はほとんど存在せず、閉ループシステムの特性に対するデータの分布の影響はほとんど分かっていない。
本稿では,ガウス過程モデルに基づいて,トレーニングデータの密度と制御性能の相関関係を導出する。
モデルの不確実性を考慮した追跡誤差の究極的境界を導出するため、データセットの品質指標を$\rho$-gapと呼ぶ。
我々は,$\rho$-gap がフィードバック線形化制御則に適用できることを示すとともに,その手法を数値的に示す。
関連論文リスト
- Learning with Noisy Foundation Models [95.50968225050012]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - Learning a model is paramount for sample efficiency in reinforcement
learning control of PDEs [5.488334211013093]
RLエージェントの訓練と並行して動作モデルを学ぶことで,実システムからサンプリングしたデータ量を大幅に削減できることを示す。
また、RLトレーニングのバイアスを避けるために、モデルを反復的に更新することが重要であることも示している。
論文 参考訳(メタデータ) (2023-02-14T16:14:39Z) - Striving for data-model efficiency: Identifying data externalities on
group performance [75.17591306911015]
信頼できる、効果的で責任ある機械学習システムの構築は、トレーニングデータとモデリング決定の違いが、予測パフォーマンスにどのように影響するかを理解することに集中する。
我々は、特定のタイプのデータモデル非効率性に注目し、一部のソースからトレーニングデータを追加することで、集団の重要なサブグループで評価されるパフォーマンスを実際に低下させることができる。
以上の結果から,データ効率が正確かつ信頼性の高い機械学習の鍵となることが示唆された。
論文 参考訳(メタデータ) (2022-11-11T16:48:27Z) - Adjustment formulas for learning causal steady-state models from
closed-loop operational data [0.0]
定常状態データから因果定常状態モデルの推定を可能にする制御共起の調整式を導出する。
コントローラが対処しようとしている障害を推定して考慮し、フィードフォワードとフィードバックコントロールの両方で収集されたデータから学習することができる。
論文 参考訳(メタデータ) (2022-11-10T14:39:46Z) - Data Provenance via Differential Auditing [5.7962871424710665]
本稿では,データ提示を監査するための実践的フレームワークである差分監査(DPDA)によるデータ公開について紹介する。
本稿では,2つの効果的な監査機能実装,加算関数と乗算関数を提案する。
提案手法の有効性を示す実世界のデータセットの評価について報告する。
論文 参考訳(メタデータ) (2022-09-04T06:02:25Z) - Training Deep Normalizing Flow Models in Highly Incomplete Data
Scenarios with Prior Regularization [13.985534521589257]
ハイパウシティシナリオにおけるデータ分布の学習を容易にする新しいフレームワークを提案する。
提案手法は,不完全データから学習過程を協調最適化タスクとして行うことに由来する。
論文 参考訳(メタデータ) (2021-04-03T20:57:57Z) - DEALIO: Data-Efficient Adversarial Learning for Imitation from
Observation [57.358212277226315]
観察ifoからの模倣学習において、学習エージェントは、実演者の生成した制御信号にアクセスせずに、実演行動の観察のみを用いて実演エージェントを模倣しようとする。
近年、逆模倣学習に基づく手法は、ifO問題に対する最先端のパフォーマンスをもたらすが、データ非効率でモデルなしの強化学習アルゴリズムに依存するため、サンプルの複雑さに悩まされることが多い。
この問題は、サンプルの収集が時間、エネルギー、およびリスクの面で高いコストを被る可能性がある現実世界の設定に展開することは非現実的です。
よりデータ効率の高いifOアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-31T23:46:32Z) - The Impact of Data on the Stability of Learning-Based Control- Extended
Version [63.97366815968177]
本稿では,Lyapunovをベースとした,認証制御性能に対するデータの影響の定量化手法を提案する。
ガウス過程を通じて未知系の力学をモデル化することにより、モデルの不確実性と安定性条件の満足度の間の相互関係を決定できる。
論文 参考訳(メタデータ) (2020-11-20T19:10:01Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。