論文の概要: Safe learning-based control via function-based uncertainty quantification
- arxiv url: http://arxiv.org/abs/2604.01173v1
- Date: Wed, 01 Apr 2026 17:23:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:32.118293
- Title: Safe learning-based control via function-based uncertainty quantification
- Title(参考訳): 関数に基づく不確実性定量化による安全な学習に基づく制御
- Authors: Abdullah Tokmak, Toni Karvonen, Thomas B. Schön, Dominik Baumann,
- Abstract要約: 不確実性定量化は、学習に基づく制御手法を安全クリティカルシステムに展開する上で必要である。
未知関数を、独立かつ同一に分散した実現が可能なランダム関数としてモデル化する。
これらの不確実性管を安全なベイズ最適化アルゴリズムに統合し、実際の古田振り子の制御パラメータを安全に調整する。
- 参考スコア(独自算出の注目度): 12.101454217337931
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Uncertainty quantification is essential when deploying learning-based control methods in safety-critical systems. This is commonly realized by constructing uncertainty tubes that enclose the unknown function of interest, e.g., the reward and constraint functions or the underlying dynamics model, with high probability. However, existing approaches for uncertainty quantification typically rely on restrictive assumptions on the unknown function, such as known bounds on functional norms or Lipschitz constants, and struggle with discontinuities. In this paper, we model the unknown function as a random function from which independent and identically distributed realizations can be generated, and construct uncertainty tubes via the scenario approach that hold with high probability and rely solely on the sampled realizations. We integrate these uncertainty tubes into a safe Bayesian optimization algorithm, which we then use to safely tune control parameters on a real Furuta pendulum.
- Abstract(参考訳): 不確実性定量化は、学習に基づく制御手法を安全クリティカルシステムに展開する上で必要である。
これは一般に、未知の関心関数、例えば報酬と制約関数、あるいは基礎となる力学モデルを含む不確実な管を高い確率で構築することで実現される。
しかしながら、不確実量化に対する既存のアプローチは、典型的には、函数ノルムの既知の境界やリプシッツ定数のような未知の函数上の制限的な仮定に依存し、不連続性と闘う。
本稿では,独立かつ同一に分散した実現が可能なランダム関数として未知関数をモデル化し,高い確率で確率を保ち,サンプリングされた実現のみに依存するシナリオアプローチによる不確実性管の構築を行う。
これらの不確実性管を安全なベイズ最適化アルゴリズムに統合し、実際の古田振り子の制御パラメータを安全に調整する。
関連論文リスト
- Optimal uncertainty bounds for multivariate kernel regression under bounded noise: A Gaussian process-based dual function [3.2093811507874768]
非保守的不確実性境界はノイズデータから潜在関数の信頼性予測に不可欠である。
本稿では,マルチアウトプットカーネルベース推定のための厳密な分布自由境界を提案する。
論文 参考訳(メタデータ) (2026-03-17T13:06:54Z) - Statistical Contraction for Chance-Constrained Trajectory Optimization of Non-Gaussian Stochastic Systems [0.0]
このフレームワークは共形推論を用いて任意の参照軌跡を囲む閉ループ力学に対する信頼セットを生成する。
適切な制約の締め付けにより、基準軌跡上の統計的に妥当な決定論的制約をトラクタブルに修正することができる。
これにより、安全クリティカルな現実世界のアプリケーションにおいて、ニューラルネットワークメトリクスのような学習ベースのモーションプランナとコントローラを活用、検証するフォーマルなパスが可能になる。
論文 参考訳(メタデータ) (2026-03-07T08:01:20Z) - Information-Theoretic Safe Bayesian Optimization [59.758009422067005]
そこでは、未知の(安全でない)制約に反するパラメータを評価することなく、未知の関数を最適化することを目的としている。
現在のほとんどのメソッドはドメインの離散化に依存しており、連続ケースに直接拡張することはできない。
本稿では,GP後部を直接利用して,最も情報に富む安全なパラメータを識別する情報理論的安全な探索基準を提案する。
論文 参考訳(メタデータ) (2024-02-23T14:31:10Z) - Information-Theoretic Safe Exploration with Gaussian Processes [89.31922008981735]
未知の(安全でない)制約に反するパラメータを評価できないような、逐次的な意思決定タスクについて検討する。
現在のほとんどのメソッドはドメインの離散化に依存しており、連続ケースに直接拡張することはできない。
本稿では,GP後部を直接利用して,最も情報に富む安全なパラメータを識別する情報理論的安全な探索基準を提案する。
論文 参考訳(メタデータ) (2022-12-09T15:23:58Z) - Probabilities Are Not Enough: Formal Controller Synthesis for Stochastic
Dynamical Models with Epistemic Uncertainty [68.00748155945047]
複雑な力学系のモデルにおける不確実性を捉えることは、安全なコントローラの設計に不可欠である。
いくつかのアプローチでは、安全と到達可能性に関する時間的仕様を満たすポリシーを形式的な抽象化を用いて合成する。
我々の貢献は、ノイズ、不確実なパラメータ、外乱を含む連続状態モデルに対する新しい抽象的制御法である。
論文 参考訳(メタデータ) (2022-10-12T07:57:03Z) - Deep Ensemble as a Gaussian Process Approximate Posterior [32.617549688656354]
Deep Ensemble (DE)は、ディープラーニングにおける不確実性定量化のためのベイズニューラルネットワークの効果的な代替手段である。
本稿では,機能的不整合を明示的に特徴付け,トレーニングデータと特定の事前信条を調整したDEの改良を提案する。
提案手法では,標準のDEよりもわずかにトレーニングコストを削減できるが,様々なシナリオにまたがるDEとその変種よりも不確実性の定量化を実現している。
論文 参考訳(メタデータ) (2022-04-30T05:25:44Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Deep Learning based Uncertainty Decomposition for Real-time Control [9.067368638784355]
本稿では,ディープラーニングを用いたトレーニングデータの欠如を検出する新しい手法を提案する。
合成および実世界のデータセットに対する既存のアプローチに対する利点を示す。
さらに、シミュレーションされたクアッドコプターにオンラインデータ効率制御を展開させる上で、この不確実性推定の実用性を実証する。
論文 参考訳(メタデータ) (2020-10-06T10:46:27Z) - Learning Control Barrier Functions from Expert Demonstrations [69.23675822701357]
制御障壁関数(CBF)に基づく安全な制御器合成のための学習に基づくアプローチを提案する。
最適化に基づくCBFの学習手法を解析し、基礎となる力学系のリプシッツ仮定の下で証明可能な安全保証を享受する。
私たちの知る限りでは、これらはデータから確実に安全な制御障壁関数を学習する最初の結果です。
論文 参考訳(メタデータ) (2020-04-07T12:29:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。