論文の概要: Optimizing Falsification for Learning-Based Control Systems: A Multi-Fidelity Bayesian Approach
- arxiv url: http://arxiv.org/abs/2409.08097v1
- Date: Thu, 12 Sep 2024 14:51:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-13 16:17:53.620986
- Title: Optimizing Falsification for Learning-Based Control Systems: A Multi-Fidelity Bayesian Approach
- Title(参考訳): 学習に基づく制御系に対するFalsificationの最適化:マルチフィデリティベイズ的アプローチ
- Authors: Zahra Shahrooei, Mykel J. Kochenderfer, Ali Baheri,
- Abstract要約: ファルシフィケーション問題は システムの安全要件に反する 反例を識別することです
本稿では,様々な精度でシミュレータを利用する多要素ベイズ最適化ファルシフィケーションフレームワークを提案する。
- 参考スコア(独自算出の注目度): 40.58350379106314
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Testing controllers in safety-critical systems is vital for ensuring their safety and preventing failures. In this paper, we address the falsification problem within learning-based closed-loop control systems through simulation. This problem involves the identification of counterexamples that violate system safety requirements and can be formulated as an optimization task based on these requirements. Using full-fidelity simulator data in this optimization problem can be computationally expensive. To improve efficiency, we propose a multi-fidelity Bayesian optimization falsification framework that harnesses simulators with varying levels of accuracy. Our proposed framework can transition between different simulators and establish meaningful relationships between them. Through multi-fidelity Bayesian optimization, we determine both the optimal system input likely to be a counterexample and the appropriate fidelity level for assessment. We evaluated our approach across various Gym environments, each featuring different levels of fidelity. Our experiments demonstrate that multi-fidelity Bayesian optimization is more computationally efficient than full-fidelity Bayesian optimization and other baseline methods in detecting counterexamples. A Python implementation of the algorithm is available at https://github.com/SAILRIT/MFBO_Falsification.
- Abstract(参考訳): 安全クリティカルなシステムにおけるコントローラのテストは、安全性の確保と障害の防止に不可欠である。
本稿では,学習に基づく閉ループ制御システムにおけるファルシフィケーション問題にシミュレーションを用いて対処する。
この問題は、システムの安全性要件に違反し、これらの要件に基づいて最適化タスクとして定式化できる反例を特定することを含む。
この最適化問題における完全忠実度シミュレータデータの利用は計算コストがかかる可能性がある。
効率を向上させるために,シミュレータを精度の異なるレベルに活用する多要素ベイズ最適化ファルシフィケーションフレームワークを提案する。
提案するフレームワークは,異なるシミュレータ間で遷移し,それらの間の有意義な関係を確立する。
マルチフィデリティベイズ最適化により、最適システム入力が逆例となる可能性があり、評価のための適切なフィデリティレベルが決定される。
様々なGym環境におけるアプローチの評価を行った。
実験により,マルチフィデリティベイズ最適化は,反例を検出するための完全フィデリティベイズ最適化や他のベースライン手法よりも計算効率がよいことを示した。
アルゴリズムのPython実装はhttps://github.com/SAILRIT/MFBO_Falsificationで公開されている。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - Towards Safe Multi-Task Bayesian Optimization [1.3654846342364308]
システムの物理モデルを減らすことは最適化プロセスに組み込むことができ、それを加速することができる。
これらのモデルは実際のシステムの近似を提供することができ、それらの評価は極めて安価である。
安全はベイズ最適化のようなオンライン最適化手法にとって重要な基準である。
論文 参考訳(メタデータ) (2023-12-12T13:59:26Z) - Federated Conditional Stochastic Optimization [110.513884892319]
条件付き最適化は、不変学習タスク、AUPRC、AMLなど、幅広い機械学習タスクで見られる。
本稿では,分散フェデレーション学習のためのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-04T01:47:37Z) - Falsification of Learning-Based Controllers through Multi-Fidelity
Bayesian Optimization [34.71695000650056]
ベイズ最適化を用いた多要素ファリシフィケーションフレームワークを提案する。
本手法では,低忠実度シミュレータからの安価な不正確な情報と高忠実度シミュレータからの高価で正確な情報とを自動的に切り替えることができる。
論文 参考訳(メタデータ) (2022-12-28T22:48:42Z) - Log Barriers for Safe Black-box Optimization with Application to Safe
Reinforcement Learning [72.97229770329214]
本稿では,学習時の安全性維持が不可欠である高次元非線形最適化問題に対する一般的なアプローチを提案する。
LBSGDと呼ばれるアプローチは、慎重に選択されたステップサイズで対数障壁近似を適用することに基づいている。
安全強化学習における政策課題の違反を最小限に抑えるためのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-07-21T11:14:47Z) - A Robust Multi-Objective Bayesian Optimization Framework Considering
Input Uncertainty [0.0]
エンジニアリング設計のような現実的なアプリケーションでは、設計者は複数の目的と入力の不確実性を考慮に入れたい場合が多い。
入力の不確実性を考慮した多目的最適化を効率的に行うための新しいベイズ最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-25T17:45:26Z) - Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。
まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。
次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文 参考訳(メタデータ) (2021-11-18T23:21:00Z) - Batch Multi-Fidelity Bayesian Optimization with Deep Auto-Regressive
Networks [17.370056935194786]
我々は,Deep Auto-Regressive Networks (BMBO-DARN) を用いたバッチ多重忠実ベイズ最適化を提案する。
ベイズニューラルネットワークの集合を用いて、完全自己回帰モデルを構築します。
我々は,忠実度を検索することなく,単純かつ効率的なバッチクエリ手法を開発した。
論文 参考訳(メタデータ) (2021-06-18T02:55:48Z) - Global Optimization of Objective Functions Represented by ReLU Networks [77.55969359556032]
ニューラルネットワークは複雑で非敵対的な関数を学ぶことができ、安全クリティカルな文脈でそれらの正しい振る舞いを保証することは困難である。
ネットワーク内の障害を見つけるための多くのアプローチ(例えば、敵の例)があるが、これらは障害の欠如を保証できない。
本稿では,最適化プロセスを検証手順に統合し,本手法よりも優れた性能を実現する手法を提案する。
論文 参考訳(メタデータ) (2020-10-07T08:19:48Z) - Multi-Fidelity Bayesian Optimization via Deep Neural Networks [19.699020509495437]
多くのアプリケーションでは、目的関数を複数の忠実度で評価することで、コストと精度のトレードオフを可能にする。
本稿では,DNN-MFBO(Deep Neural Network Multi-Fidelity Bayesian Optimization)を提案する。
本手法の利点は, 総合的なベンチマークデータセットと, 工学設計における実世界の応用の両方にある。
論文 参考訳(メタデータ) (2020-07-06T23:28:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。