論文の概要: Finding Failures in High-Fidelity Simulation using Adaptive Stress
Testing and the Backward Algorithm
- arxiv url: http://arxiv.org/abs/2107.12940v1
- Date: Tue, 27 Jul 2021 16:54:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-28 14:54:46.739951
- Title: Finding Failures in High-Fidelity Simulation using Adaptive Stress
Testing and the Backward Algorithm
- Title(参考訳): アダプティブストレステストと後方アルゴリズムを用いた高忠実度シミュレーションの故障検出
- Authors: Mark Koren and Ahmed Nassar and Mykel J. Kochenderfer
- Abstract要約: 適応ストレステスト(アダプティブストレステスト、英: Adaptive stress testing、AST)は、強化学習を用いてシステムの最も起こりそうな障害を見つける手法である。
深い強化学習の解法を持つASTは、様々なシステムにまたがる障害を見つけるのに有効であることが示されている。
効率を向上させるために,まず低忠実度シミュレータで故障を検知する手法を提案する。
次に、単一の専門家によるデモンストレーションを使用してディープニューラルネットワークポリシーをトレーニングするバックワードアルゴリズムを使用して、低忠実度障害を高忠実度に適応させる。
- 参考スコア(独自算出の注目度): 35.076062292062325
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Validating the safety of autonomous systems generally requires the use of
high-fidelity simulators that adequately capture the variability of real-world
scenarios. However, it is generally not feasible to exhaustively search the
space of simulation scenarios for failures. Adaptive stress testing (AST) is a
method that uses reinforcement learning to find the most likely failure of a
system. AST with a deep reinforcement learning solver has been shown to be
effective in finding failures across a range of different systems. This
approach generally involves running many simulations, which can be very
expensive when using a high-fidelity simulator. To improve efficiency, we
present a method that first finds failures in a low-fidelity simulator. It then
uses the backward algorithm, which trains a deep neural network policy using a
single expert demonstration, to adapt the low-fidelity failures to
high-fidelity. We have created a series of autonomous vehicle validation case
studies that represent some of the ways low-fidelity and high-fidelity
simulators can differ, such as time discretization. We demonstrate in a variety
of case studies that this new AST approach is able to find failures with
significantly fewer high-fidelity simulation steps than are needed when just
running AST directly in high-fidelity. As a proof of concept, we also
demonstrate AST on NVIDIA's DriveSim simulator, an industry state-of-the-art
high-fidelity simulator for finding failures in autonomous vehicles.
- Abstract(参考訳): 自律システムの安全性を検証するには、現実のシナリオの変数を適切にキャプチャする高忠実度シミュレータを使用する必要がある。
しかし、一般的に、失敗のシミュレーションシナリオの空間を徹底的に探索することは不可能である。
adaptive stress testing(アダプティブストレステスト、ast)は、強化学習を使用してシステムの最も可能性の高い障害を見つける手法である。
深い強化学習の解法を持つASTは、様々なシステムで障害を見つけるのに有効であることが示されている。
このアプローチは一般的に、高忠実度シミュレーターを使用する場合、非常にコストがかかる多くのシミュレーションを実行する。
効率を向上させるために,まず低忠実度シミュレータの故障を検出する手法を提案する。
次に、単一の専門家によるデモンストレーションを使用してディープニューラルネットワークポリシをトレーニングする後方アルゴリズムを使用して、低忠実度障害を高忠実度に適応する。
我々は、時間離散化など、低忠実度と高忠実度シミュレータの違いを示す一連の自動運転車検証ケーススタディを作成しました。
我々は,この新しいASTアプローチが,ASTを直接高忠実度で実行する場合に必要となるよりもはるかに少ない高忠実度シミュレーションステップで障害を見つけることができることを,さまざまなケーススタディで実証した。
概念実証として、自動運転車の故障を見つけるための最先端の高性能シミュレータであるNVIDIAのDriveSimシミュレータ上でASTを実証する。
関連論文リスト
- Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - The Power of Resets in Online Reinforcement Learning [73.64852266145387]
ローカルシミュレータアクセス(あるいはローカルプランニング)を用いたオンライン強化学習を通してシミュレータのパワーを探求する。
カバー性が低いMPPは,Qstar$-realizabilityのみのサンプル効率で学習可能であることを示す。
ローカルシミュレーターアクセス下では, 悪名高いExogenous Block MDP問題が抽出可能であることを示す。
論文 参考訳(メタデータ) (2024-04-23T18:09:53Z) - Bridging the Sim-to-Real Gap with Bayesian Inference [53.61496586090384]
データからロボットダイナミクスを学習するためのSIM-FSVGDを提案する。
我々は、ニューラルネットワークモデルのトレーニングを規則化するために、低忠実度物理プリエンスを使用します。
高性能RCレースカーシステムにおけるSIM-to-realギャップのブリッジ化におけるSIM-FSVGDの有効性を実証する。
論文 参考訳(メタデータ) (2024-03-25T11:29:32Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - SAVME: Efficient Safety Validation for Autonomous Systems Using
Meta-Learning [36.896695278624776]
メタ学習戦略とマルチアームバンディットフレームワークを統合したベイズ的手法を提案する。
我々は,最先端の3D運転シミュレータを用いて,自律走行車スタックに16の忠実度設定を組み込んだ方法論を紹介した。
従来の手法に比べて最大18倍の高速化を実現している。
論文 参考訳(メタデータ) (2023-09-21T20:41:47Z) - Adaptive Failure Search Using Critical States from Domain Experts [9.93890332477992]
フェールサーチは、シミュレーションまたは実世界のテストにおいて、かなりの走行距離をロギングすることで行うことができる。
ASTはマルコフ決定プロセスとして失敗探索の問題を提起する手法である。
ASTフレームワークにクリティカルステートを組み込むことで,安全性違反の増大を伴う障害シナリオが生成されることを示す。
論文 参考訳(メタデータ) (2023-04-01T18:14:41Z) - Simulation-to-reality UAV Fault Diagnosis with Deep Learning [20.182411473467656]
そこで本研究では,四重項の故障診断におけるシミュレーションと現実のギャップに対処する深層学習モデルを提案する。
提案手法はプロペラ断層の検出において96%の精度を実現する。
これは4段プロペラのシミュレーション・トゥ・リアル故障診断のための信頼性と効率のよい最初の方法である。
論文 参考訳(メタデータ) (2023-02-09T02:37:48Z) - Accelerated Policy Learning with Parallel Differentiable Simulation [59.665651562534755]
微分可能シミュレータと新しいポリシー学習アルゴリズム(SHAC)を提案する。
本アルゴリズムは,スムーズな批判機能により局所最小化の問題を軽減する。
現状のRLと微分可能なシミュレーションベースアルゴリズムと比較して,サンプル効率と壁面時間を大幅に改善した。
論文 参考訳(メタデータ) (2022-04-14T17:46:26Z) - Efficient and Effective Generation of Test Cases for Pedestrian
Detection -- Search-based Software Testing of Baidu Apollo in SVL [14.482670650074885]
本稿では,SVLシミュレータ内での自律走行プラットフォームであるBaidu Apolloの歩行者検出と緊急制動システムの試験について述べる。
本稿では,SVL環境におけるApolloの障害検出シナリオを生成する進化的自動テスト生成手法を提案する。
また,本手法の有効性と有効性を示すため,ベースラインランダム生成手法の結果も報告する。
論文 参考訳(メタデータ) (2021-09-16T13:11:53Z) - Towards Automated Safety Coverage and Testing for Autonomous Vehicles
with Reinforcement Learning [0.3683202928838613]
検証は、システムが日々の運転で遭遇する可能性のあるシナリオや状況において、自動運転車システムをテストに投入する。
本稿では,AVソフトウェア実装における障害事例と予期せぬ交通状況を生成するために強化学習(RL)を提案する。
論文 参考訳(メタデータ) (2020-05-22T19:00:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。