論文の概要: Falsification of Learning-Based Controllers through Multi-Fidelity
Bayesian Optimization
- arxiv url: http://arxiv.org/abs/2212.14118v1
- Date: Wed, 28 Dec 2022 22:48:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 17:52:13.198636
- Title: Falsification of Learning-Based Controllers through Multi-Fidelity
Bayesian Optimization
- Title(参考訳): マルチフィデリティベイズ最適化による学習型制御系のファルシフィケーション
- Authors: Zahra Shahrooei, Mykel J. Kochenderfer, Ali Baheri
- Abstract要約: ベイズ最適化を用いた多要素ファリシフィケーションフレームワークを提案する。
本手法では,低忠実度シミュレータからの安価な不正確な情報と高忠実度シミュレータからの高価で正確な情報とを自動的に切り替えることができる。
- 参考スコア(独自算出の注目度): 34.71695000650056
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Simulation-based falsification is a practical testing method to increase
confidence that the system will meet safety requirements. Because full-fidelity
simulations can be computationally demanding, we investigate the use of
simulators with different levels of fidelity. As a first step, we express the
overall safety specification in terms of environmental parameters and structure
this safety specification as an optimization problem. We propose a
multi-fidelity falsification framework using Bayesian optimization, which is
able to determine at which level of fidelity we should conduct a safety
evaluation in addition to finding possible instances from the environment that
cause the system to fail. This method allows us to automatically switch between
inexpensive, inaccurate information from a low-fidelity simulator and
expensive, accurate information from a high-fidelity simulator in a
cost-effective way. Our experiments on various environments in simulation
demonstrate that multi-fidelity Bayesian optimization has falsification
performance comparable to single-fidelity Bayesian optimization but with much
lower cost.
- Abstract(参考訳): シミュレーションベースのファルシフィケーションは、システムが安全要件を満たす自信を高めるための実用的なテスト手法である。
忠実度シミュレーションは計算的に要求されるので,異なる忠実度レベルを持つシミュレータの利用について検討する。
第1ステップとして,環境パラメータの観点から全体安全仕様を表現し,この安全仕様を最適化問題として構成する。
我々は,システム障害の原因となる環境から可能なインスタンスを見つけることに加えて,どのレベルの忠実度で安全性評価を行うべきかを判断できるベイズ最適化を用いたマルチフィデリティ改ざんフレームワークを提案する。
本手法により,低忠実度シミュレータからの安価な不正確な情報と高忠実度シミュレータからの高価な正確な情報とを,低コストで自動的に切り替えることができる。
シミュレーションにおける各種環境に関する実験により,マルチフィデリティベイズ最適化は単一フィデリティベイズ最適化に匹敵するファルシフィケーション性能を持つが,はるかに低コストであることが示された。
関連論文リスト
- Optimizing Falsification for Learning-Based Control Systems: A Multi-Fidelity Bayesian Approach [40.58350379106314]
ファルシフィケーション問題は システムの安全要件に反する 反例を識別することです
本稿では,様々な精度でシミュレータを利用する多要素ベイズ最適化ファルシフィケーションフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-12T14:51:03Z) - Towards Safe Multi-Task Bayesian Optimization [1.3654846342364308]
システムの物理モデルを減らすことは最適化プロセスに組み込むことができ、それを加速することができる。
これらのモデルは実際のシステムの近似を提供することができ、それらの評価は極めて安価である。
安全はベイズ最適化のようなオンライン最適化手法にとって重要な基準である。
論文 参考訳(メタデータ) (2023-12-12T13:59:26Z) - SAVME: Efficient Safety Validation for Autonomous Systems Using
Meta-Learning [36.896695278624776]
メタ学習戦略とマルチアームバンディットフレームワークを統合したベイズ的手法を提案する。
我々は,最先端の3D運転シミュレータを用いて,自律走行車スタックに16の忠実度設定を組み込んだ方法論を紹介した。
従来の手法に比べて最大18倍の高速化を実現している。
論文 参考訳(メタデータ) (2023-09-21T20:41:47Z) - Near-optimal Policy Identification in Active Reinforcement Learning [84.27592560211909]
AE-LSVI はカーネル化された最小二乗値 RL (LSVI) アルゴリズムの新しい変種であり、楽観主義と悲観主義を組み合わせて活発な探索を行う。
AE-LSVIは初期状態に対するロバスト性が必要な場合、様々な環境で他のアルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-12-19T14:46:57Z) - Falsification of Cyber-Physical Systems using Bayesian Optimization [0.5407319151576264]
シミュレーションに基づくCPSのファルシフィケーションは、システムの正確性に対する信頼性を高めるための実用的なテスト手法である。
各シミュレーションは典型的に計算集約的であるため、仕様をファルシフィケーションするために必要なシミュレーションの数を減らすことが重要なステップである。
本研究では,入力信号のパラメトリゼーションと仕様評価の関係を記述したサロゲートモデルを,サンプル効率で学習するベイズ最適化(BO)について検討する。
論文 参考訳(メタデータ) (2022-09-14T15:52:19Z) - Log Barriers for Safe Black-box Optimization with Application to Safe
Reinforcement Learning [72.97229770329214]
本稿では,学習時の安全性維持が不可欠である高次元非線形最適化問題に対する一般的なアプローチを提案する。
LBSGDと呼ばれるアプローチは、慎重に選択されたステップサイズで対数障壁近似を適用することに基づいている。
安全強化学習における政策課題の違反を最小限に抑えるためのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-07-21T11:14:47Z) - Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。
まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。
次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文 参考訳(メタデータ) (2021-11-18T23:21:00Z) - Finding Failures in High-Fidelity Simulation using Adaptive Stress
Testing and the Backward Algorithm [35.076062292062325]
適応ストレステスト(アダプティブストレステスト、英: Adaptive stress testing、AST)は、強化学習を用いてシステムの最も起こりそうな障害を見つける手法である。
深い強化学習の解法を持つASTは、様々なシステムにまたがる障害を見つけるのに有効であることが示されている。
効率を向上させるために,まず低忠実度シミュレータで故障を検知する手法を提案する。
次に、単一の専門家によるデモンストレーションを使用してディープニューラルネットワークポリシーをトレーニングするバックワードアルゴリズムを使用して、低忠実度障害を高忠実度に適応させる。
論文 参考訳(メタデータ) (2021-07-27T16:54:04Z) - AutoSimulate: (Quickly) Learning Synthetic Data Generation [70.82315853981838]
目的の新たな微分可能近似に基づく最適な合成データ生成法を提案する。
提案手法は,学習データ生成の高速化(最大50Times$)と,実世界のテストデータセットの精度向上(+8.7%$)を実現している。
論文 参考訳(メタデータ) (2020-08-16T11:36:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。