Fugu-MT 論文翻訳(概要): Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions

論文の概要: Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions

arxiv url: http://arxiv.org/abs/2208.10733v3
Date: Tue, 3 Sep 2024 23:41:14 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-07 07:20:22.480320
Title: Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions
Title（参考訳）: 制御バリア関数を用いた逐次確率論的オンライン学習
Authors: Fernando Castañeda, Jason J. Choi, Wonsuhk Jung, Bike Zhang, Claire J. Tomlin, Koushil Sreenath,
Abstract要約: CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
参考スコア（独自算出の注目度）: 60.26921219698514
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Learning-based control has recently shown great efficacy in performing complex tasks for various applications. However, to deploy it in real systems, it is of vital importance to guarantee the system will stay safe. Control Barrier Functions (CBFs) offer mathematical tools for designing safety-preserving controllers for systems with known dynamics. In this article, we first introduce a model-uncertainty-aware reformulation of CBF-based safety-critical controllers using Gaussian Process (GP) regression to close the gap between an approximate mathematical model and the real system, which results in a second-order cone program (SOCP)-based control design. We then present the pointwise feasibility conditions of the resulting safety controller, highlighting the level of richness that the available system information must meet to ensure safety. We use these conditions to devise an event-triggered online data collection strategy that ensures the recursive feasibility of the learned safety controller. Our method works by constantly reasoning about whether the current information is sufficient to ensure safety or if new measurements under active safe exploration are required to reduce the uncertainty. As a result, our proposed framework can guarantee the forward invariance of the safe set defined by the CBF with high probability, even if it contains a priori unexplored regions. We validate the proposed framework in two numerical simulation experiments.
Abstract（参考訳）: 学習に基づく制御は、最近、様々なアプリケーションで複雑なタスクを実行する上で大きな効果を示している。しかし、実際のシステムにデプロイするには、システムが安全であることを保証することが不可欠である。制御バリア関数(CBF)は、既知のダイナミクスを持つシステムの安全保存コントローラを設計するための数学的ツールを提供する。本稿では、まず、ガウス過程(GP)回帰を用いたCBFベースの安全クリティカルコントローラのモデル不確実性を考慮した再構成を導入し、近似数学モデルと実システムとのギャップを埋め、第二次コーンプログラム(SOCP)ベースの制御設計をもたらす。次に,得られた安全制御器のポイントワイズ実現可能性条件を提示し,安全確保のために利用可能なシステム情報が満たさなければならない富のレベルを強調した。我々は、これらの条件を用いて、学習した安全コントローラの再帰可能性を保証する、イベントトリガーによるオンラインデータ収集戦略を考案する。本手法は, 安全を確保するのに現在の情報が十分かどうか, あるいは, 不確実性を低減するために, アクティブセーフ探査における新しい測定が必要であるかどうかを常に推論することによって機能する。その結果,提案フレームワークは,事前未探索領域を含む場合でも,CBFが定義した安全集合の前方不変性を高い確率で保証することができる。提案手法を2つの数値シミュレーション実験で検証した。

関連論文リスト

Towards provable probabilistic safety for scalable embodied AI systems [79.31011047593492]
エンボディードAIシステムは、様々なアプリケーションでますます普及している。複雑な運用環境での安全性確保は依然として大きな課題である。このパースペクティブは、安全で大規模に実施されたAIシステムを安全クリティカルなアプリケーションに採用するための道筋を提供する。
論文参考訳（メタデータ） (2025-06-05T15:46:25Z)
Safely Learning Controlled Stochastic Dynamics [61.82896036131116]
システム力学の安全な探索と効率的な推定を可能にする手法を提案する。学習後、学習モデルはシステムのダイナミクスの予測を可能にし、任意の制御の安全性検証を可能にする。我々は、真の力学のソボレフ正則性を高めることにより、安全性と適応学習率の向上を理論的に保証する。
論文参考訳（メタデータ） (2025-06-03T11:17:07Z)
Risk-Aware Safe Reinforcement Learning for Control of Stochastic Linear Systems [7.952582509792973]
本稿では,離散時間線形システムに対するリスク対応型安全強化学習制御設計を提案する。また、RLコントローラ以外にリスクインフォームドセーフコントローラも学習し、RLとセーフコントローラを組み合わせて構成する。この制御指向アプローチは,データ要求を低減し,安全性違反の分散を低減できることが示されている。
論文参考訳（メタデータ） (2025-05-14T18:49:32Z)
A Domain-Agnostic Scalable AI Safety Ensuring Framework [8.086635708001166]
本稿では,AIシステムが特定の確率でユーザ定義の安全制約を満たすことを保証する新しいフレームワークを提案する。当社のアプローチでは,任意のAIモデルと最適化問題を組み合わせることで,パフォーマンスを維持しながら,アウトプットが安全要件を満たすことを保証する。本手法は,穏やかな条件下での確率論的安全性を保証するとともに,AIの安全性における最初のスケーリング法則を確立する。
論文参考訳（メタデータ） (2025-04-29T16:38:35Z)
Learning Vision-Based Neural Network Controllers with Semi-Probabilistic Safety Guarantees [24.650302053973142]
本稿では, 到達可能性解析と条件付き生成逆数ネットワークを統合した, 半確率的検証フレームワークを提案する。次に, 新たな安全損失関数, 安全対応型データサンプリング戦略, カリキュラム学習を活用した勾配学習手法を提案する。 X-Plane 11航空機の着陸シミュレーション, CARLAシミュレーションによる自律走行車線, F110thレーンの視覚的に豊かなミニチュア環境下での実証実験により, 本手法の有効性が証明された。
論文参考訳（メタデータ） (2025-02-28T21:16:42Z)
Safe Online Dynamics Learning with Initially Unknown Models and Infeasible Safety Certificates [45.72598064481916]
本稿では、制御バリア関数(CBF)2次コーンプログラムに基づく、堅牢な安全証明書を備えた学習ベースの設定について考察する。制御バリア関数証明書が実現可能ならば,その安全性を確保するため,本手法では,データ収集と制御バリア関数制約の実現可能性の回復のために,システムダイナミクスを探索する。
論文参考訳（メタデータ） (2023-11-03T14:23:57Z)
Searching for Optimal Runtime Assurance via Reachability and Reinforcement Learning [2.422636931175853]
あるプラントのランタイム保証システム(RTA)は、バックアップコントローラで安全性を確保しながら、信頼できないまたは実験的なコントローラの運動を可能にする。既存のRTA設計戦略は、過度に保守的であることで知られており、原則として、安全違反につながる可能性がある。本稿では、最適RTA設計問題を定式化し、それを解決するための新しいアプローチを提案する。
論文参考訳（メタデータ） (2023-10-06T14:45:57Z)
Meta-Learning Priors for Safe Bayesian Optimization [72.8349503901712]
メタ学習アルゴリズムであるF-PACOHを構築し,データ不足の設定において確実な定量化を実現する。コアコントリビューションとして、安全に適合した事前をデータ駆動で選択するための新しいフレームワークを開発する。ベンチマーク関数と高精度動作系において,我々のメタ学習先行が安全なBOアプローチの収束を加速することを示す。
論文参考訳（メタデータ） (2022-10-03T08:38:38Z)
Enforcing Hard Constraints with Soft Barriers: Safe Reinforcement Learning in Unknown Stochastic Environments [84.3830478851369]
本研究では,環境を協調的に学習し,制御ポリシーを最適化する安全な強化学習手法を提案する。本手法は, 安全性の制約を効果的に適用し, シミュレーションにより測定したシステム安全率においてCMDPベースのベースライン法を著しく上回っている。
論文参考訳（メタデータ） (2022-09-29T20:49:25Z)
Sample-efficient Safe Learning for Online Nonlinear Control with Control Barrier Functions [35.9713619595494]
強化学習と連続非線形制御は、複雑なシーケンシャルな意思決定タスクの複数の領域にうまく展開されている。学習過程の探索特性とモデル不確実性の存在を考えると、それらを安全クリティカルな制御タスクに適用することは困難である。本稿では,オンライン制御タスクを対象とした,効率のよいエピソード型安全な学習フレームワークを提案する。
論文参考訳（メタデータ） (2022-07-29T00:54:35Z)
ProBF: Learning Probabilistic Safety Certificates with Barrier Functions [31.203344483485843]
制御バリア関数は、地平系力学にアクセスできれば安全を保証できる便利なツールである。実際には、システムダイナミクスに関する不正確な知識があるため、安全でない振る舞いにつながる可能性があります。本手法の有効性をSegwayとQuadrotorのシミュレーション実験により示す。
論文参考訳（メタデータ） (2021-12-22T20:18:18Z)
Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文参考訳（メタデータ） (2021-11-18T23:21:00Z)
Pointwise Feasibility of Gaussian Process-based Safety-Critical Control under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文参考訳（メタデータ） (2021-06-13T23:08:49Z)
Learning Hybrid Control Barrier Functions from Data [66.37785052099423]
ハイブリッドシステムの安全な制御法則を得るための体系的なツールが欠如していることから,データから確実に安全な制御法則を学習するための最適化ベースのフレームワークを提案する。特に、システムダイナミクスが知られており、安全なシステム動作を示すデータが利用可能であるような設定を仮定する。
論文参考訳（メタデータ） (2020-11-08T23:55:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。