論文の概要: Real-time Uncertainty Decomposition for Online Learning Control
- arxiv url: http://arxiv.org/abs/2010.02613v2
- Date: Tue, 24 Nov 2020 18:12:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 06:30:06.306645
- Title: Real-time Uncertainty Decomposition for Online Learning Control
- Title(参考訳): オンライン学習制御のためのリアルタイム不確かさ分解
- Authors: Jonas Umlauft, Armin Lederer, Thomas Beckers, Sandra Hirche
- Abstract要約: 本稿では,不確実性をモデリングするための新しい汎用手法を提案する。
これはアレータリック不確実性推定と直接結合することができ、リアルタイムで予測することができる。
この特性をモデルベースのクアッドコプター制御設定で利用し、制御器の利点を実証する。
- 参考スコア(独自算出の注目度): 9.727889758575564
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Safety-critical decisions based on machine learning models require a clear
understanding of the involved uncertainties to avoid hazardous or risky
situations. While aleatoric uncertainty can be explicitly modeled given a
parametric description, epistemic uncertainty rather describes the presence or
absence of training data. This paper proposes a novel generic method for
modeling epistemic uncertainty and shows its advantages over existing
approaches for neural networks on various data sets. It can be directly
combined with aleatoric uncertainty estimates and allows for prediction in
real-time as the inference is sample-free. We exploit this property in a
model-based quadcopter control setting and demonstrate how the controller
benefits from a differentiation between aleatoric and epistemic uncertainty in
online learning of thermal disturbances.
- Abstract(参考訳): 機械学習モデルに基づく安全クリティカルな決定は、危険または危険な状況を避けるために、関連する不確実性を明確に理解する必要がある。
aleatoric uncertainty はパラメトリックな記述から明示的にモデル化することができるが、認識論的不確実性はむしろ訓練データの有無を記述している。
本稿では, 様々なデータセット上のニューラルネットワークに対する既存のアプローチに対して, 認識の不確実性をモデル化するための新しい汎用的手法を提案する。
aleatoric uncertainty estimationと直接結合することができ、推論がサンプルフリーであるため、リアルタイムに予測することができる。
この特性をモデルに基づくクワッドコプター制御系で活用し,熱外乱のオンライン学習におけるアレテータと認識的不確かさの区別によるコントローラの利点を実証する。
関連論文リスト
- One step closer to unbiased aleatoric uncertainty estimation [71.55174353766289]
そこで本研究では,観測データのアクティブデノイズ化による新しい推定手法を提案する。
幅広い実験を行うことで,提案手法が標準手法よりも実際のデータ不確実性にはるかに近い近似を与えることを示す。
論文 参考訳(メタデータ) (2023-12-16T14:59:11Z) - ALUM: Adversarial Data Uncertainty Modeling from Latent Model
Uncertainty Compensation [25.67258563807856]
本稿では,モデル不確実性とデータ不確実性を扱うALUMという新しい手法を提案する。
提案するALUMはモデルに依存しないため,オーバーヘッドの少ない既存のディープモデルに容易に実装できる。
論文 参考訳(メタデータ) (2023-03-29T17:24:12Z) - Reliability-Aware Prediction via Uncertainty Learning for Person Image
Retrieval [51.83967175585896]
UALは、データ不確実性とモデル不確実性を同時に考慮し、信頼性に配慮した予測を提供することを目的としている。
データ不確実性はサンプル固有のノイズを捕捉する」一方、モデル不確実性はサンプルの予測に対するモデルの信頼を表現している。
論文 参考訳(メタデータ) (2022-10-24T17:53:20Z) - Probabilities Are Not Enough: Formal Controller Synthesis for Stochastic
Dynamical Models with Epistemic Uncertainty [68.00748155945047]
複雑な力学系のモデルにおける不確実性を捉えることは、安全なコントローラの設計に不可欠である。
いくつかのアプローチでは、安全と到達可能性に関する時間的仕様を満たすポリシーを形式的な抽象化を用いて合成する。
我々の貢献は、ノイズ、不確実なパラメータ、外乱を含む連続状態モデルに対する新しい抽象的制御法である。
論文 参考訳(メタデータ) (2022-10-12T07:57:03Z) - Dense Uncertainty Estimation via an Ensemble-based Conditional Latent
Variable Model [68.34559610536614]
我々は、アレータリック不確実性はデータの固有の特性であり、偏見のないオラクルモデルでのみ正確に推定できると論じる。
そこで本研究では,軌道不確実性推定のためのオラクルモデルを近似するために,列車時の新しいサンプリングと選択戦略を提案する。
以上の結果から,提案手法は精度の高い決定論的結果と確実な不確実性推定の両方を達成できることが示唆された。
論文 参考訳(メタデータ) (2021-11-22T08:54:10Z) - Adversarial Attack for Uncertainty Estimation: Identifying Critical
Regions in Neural Networks [0.0]
本稿では,ニューラルネットワークにおける決定境界付近のデータポイントをキャプチャする手法を提案する。
不確実性推定は、モデルのパラメータに摂動を与える以前の研究とは異なり、入力摂動から導かれる。
提案手法は,他の手法よりも優れた性能を示し,機械学習におけるモデル不確実性を捉えるリスクが低いことを示した。
論文 参考訳(メタデータ) (2021-07-15T21:30:26Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Temporal Difference Uncertainties as a Signal for Exploration [76.6341354269013]
強化学習における探索の効果的なアプローチは、最適な政策に対するエージェントの不確実性に依存することである。
本稿では,評価値のバイアスや時間的に矛盾する点を強調した。
本稿では,時間差誤差の分布の導出に依存する値関数の不確かさを推定する手法を提案する。
論文 参考訳(メタデータ) (2020-10-05T18:11:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。