論文の概要: Can Learning Deteriorate Control? Analyzing Computational Delays in
Gaussian Process-Based Event-Triggered Online Learning
- arxiv url: http://arxiv.org/abs/2305.08169v1
- Date: Sun, 14 May 2023 14:37:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 17:05:27.557244
- Title: Can Learning Deteriorate Control? Analyzing Computational Delays in
Gaussian Process-Based Event-Triggered Online Learning
- Title(参考訳): 制御の劣化を学べるか?
ガウス過程に基づくイベントトリガーオンライン学習における計算遅延の解析
- Authors: Xiaobing Dai, Armin Lederer, Zewen Yang, Sandra Hirche
- Abstract要約: 計算遅延を考慮したGPベースのオンライン学習のための新しいイベントトリガを提案する。
十分に少ない計算時間で、オフラインで訓練されたGPモデルよりも有利であることを示す。
- 参考スコア(独自算出の注目度): 7.697964930378468
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When the dynamics of systems are unknown, supervised machine learning
techniques are commonly employed to infer models from data. Gaussian process
(GP) regression is a particularly popular learning method for this purpose due
to the existence of prediction error bounds. Moreover, GP models can be
efficiently updated online, such that event-triggered online learning
strategies can be pursued to ensure specified tracking accuracies. However,
existing trigger conditions must be able to be evaluated at arbitrary times,
which cannot be achieved in practice due to non-negligible computation times.
Therefore, we first derive a delay-aware tracking error bound, which reveals an
accuracy-delay trade-off. Based on this result, we propose a novel event
trigger for GP-based online learning with computational delays, which we show
to offer advantages over offline trained GP models for sufficiently small
computation times. Finally, we demonstrate the effectiveness of the proposed
event trigger for online learning in simulations.
- Abstract(参考訳): システムのダイナミクスが未知である場合、教師付き機械学習技術は一般にデータからモデルを推測するために使用される。
ガウス過程(GP)回帰は、予測誤差境界が存在するため、この目的のために特に一般的な学習方法である。
さらに、イベントトリガー付きオンライン学習戦略を追求して、特定トラッキングアキュラシーを確保するように、gpモデルをオンラインで効率的に更新することができる。
しかし、既存のトリガー条件は任意のタイミングで評価できなければならず、不要な計算時間のために実際に達成できない。
そこで,まず遅延認識型トラッキングエラーバウンドを導出し,精度と遅延のトレードオフを明らかにする。
この結果に基づいて,計算遅延を伴うGPベースのオンライン学習における新たなイベントトリガを提案する。
最後に,シミュレーションにおけるオンライン学習におけるイベントトリガの有効性を示す。
関連論文リスト
- PILOT: A Pre-Trained Model-Based Continual Learning Toolbox [71.63186089279218]
本稿では,PILOTとして知られるモデルベース連続学習ツールボックスについて紹介する。
一方、PILOTはL2P、DualPrompt、CODA-Promptといった事前学習モデルに基づいて、最先端のクラスインクリメンタル学習アルゴリズムを実装している。
一方、PILOTは、事前学習されたモデルの文脈に典型的なクラス増分学習アルゴリズムを適合させ、それらの効果を評価する。
論文 参考訳(メタデータ) (2023-09-13T17:55:11Z) - Episodic Gaussian Process-Based Learning Control with Vanishing Tracking
Errors [10.627020714408445]
本稿では,任意の追跡精度を保証するために,GPモデル学習のためのエピソード手法を開発する。
導出理論の有効性はいくつかのシミュレーションで示されている。
論文 参考訳(メタデータ) (2023-07-10T08:43:28Z) - Memory-Based Dual Gaussian Processes for Sequential Learning [26.22552882103996]
提案手法は,最近提案されたデュアルスパース変分GPを用いて,これらの誤差をすべてチェックする手法である。
提案手法は,過去のデータのメモリを積極的に構築・更新することで,汎用可能性の正確な推測を可能にし,学習を改善する。
論文 参考訳(メタデータ) (2023-06-06T10:34:03Z) - Networked Online Learning for Control of Safety-Critical
Resource-Constrained Systems based on Gaussian Processes [9.544146562919792]
本稿では,ガウス過程の回帰に基づく新しいネットワーク型オンライン学習手法を提案する。
本稿では,送信チャネルの帯域制限と時間遅延を考慮した,ローカルシステムとクラウド間の効率的なデータ伝送方式を提案する。
論文 参考訳(メタデータ) (2022-02-23T13:12:12Z) - Recursive Least-Squares Estimator-Aided Online Learning for Visual
Tracking [58.14267480293575]
オフライン学習を必要とせず、簡単な効果的なオンライン学習手法を提案する。
これは、モデルが以前見たオブジェクトに関する知識を記憶するための、内蔵されたメモリ保持メカニズムを可能にする。
我々は、RT-MDNetにおける多層パーセプトロンと、DiMPにおける畳み込みニューラルネットワークの追跡のためのオンライン学習ファミリーにおける2つのネットワークに基づくアプローチを評価する。
論文 参考訳(メタデータ) (2021-12-28T06:51:18Z) - Incremental Ensemble Gaussian Processes [53.3291389385672]
本稿では,EGPメタラーナーがGP学習者のインクリメンタルアンサンブル(IE-) GPフレームワークを提案し,それぞれが所定のカーネル辞書に属するユニークなカーネルを持つ。
各GP専門家は、ランダムな特徴ベースの近似を利用してオンライン予測とモデル更新を行い、そのスケーラビリティを生かし、EGPメタラーナーはデータ適応重みを生かし、熟練者ごとの予測を合成する。
新たなIE-GPは、EGPメタラーナーおよび各GP学習者内における構造化力学をモデル化することにより、時間変化関数に対応するように一般化される。
論文 参考訳(メタデータ) (2021-10-13T15:11:25Z) - Online Learning Probabilistic Event Calculus Theories in Answer Set
Programming [70.06301658267125]
イベント認識(CER)システムは、事前に定義されたイベントパターンを使用して、ストリーミングタイムスタンプデータセットで発生を検出する。
本稿では,複雑なイベントパターンによる確率論的推論を,イベント計算で重み付けされたルールの形で行うことができるAnswer Set Programming(ASP)に基づくシステムを提案する。
その結果, 効率と予測の両面で, 新たなアプローチの優位性が示された。
論文 参考訳(メタデータ) (2021-03-31T23:16:29Z) - Real-Time Regression with Dividing Local Gaussian Processes [62.01822866877782]
局所ガウス過程は、ガウス過程の回帰に基づく新しい、計算効率の良いモデリング手法である。
入力空間の反復的データ駆動分割により、実際にはトレーニングポイントの総数において、サブ線形計算複雑性が達成される。
実世界のデータセットに対する数値的な評価は、予測と更新の速度だけでなく、精度の点で他の最先端手法よりも有利であることを示している。
論文 参考訳(メタデータ) (2020-06-16T18:43:31Z) - Online Reinforcement Learning Control by Direct Heuristic Dynamic
Programming: from Time-Driven to Event-Driven [80.94390916562179]
時間駆動学習は、新しいデータが到着すると予測モデルのパラメータを継続的に更新する機械学習手法を指す。
ノイズなどの重要なシステムイベントによる時間駆動型dHDPの更新を防止することが望ましい。
イベント駆動型dHDPアルゴリズムは,従来の時間駆動型dHDPと比較して動作することを示す。
論文 参考訳(メタデータ) (2020-06-16T05:51:25Z) - Real-time Out-of-distribution Detection in Learning-Enabled
Cyber-Physical Systems [1.4213973379473654]
サイバー物理システムは、現実世界の不確実性と可変性を処理できる機械学習コンポーネントを使用することで恩恵を受ける。
しかし、ディープニューラルネットワークは、システムの安全性に影響を及ぼす可能性のある、新しいタイプのハザードを導入している。
アウト・オブ・ディストリビューションデータは大きなエラーを引き起こし、安全性を損なう可能性がある。
論文 参考訳(メタデータ) (2020-01-28T17:51:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。