論文の概要: Adaptive Failure Search Using Critical States from Domain Experts
- arxiv url: http://arxiv.org/abs/2304.00365v1
- Date: Sat, 1 Apr 2023 18:14:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-04 18:37:02.714913
- Title: Adaptive Failure Search Using Critical States from Domain Experts
- Title(参考訳): ドメインエキスパートからの臨界状態を用いた適応的故障探索
- Authors: Peter Du, Katherine Driggs-Campbell
- Abstract要約: フェールサーチは、シミュレーションまたは実世界のテストにおいて、かなりの走行距離をロギングすることで行うことができる。
ASTはマルコフ決定プロセスとして失敗探索の問題を提起する手法である。
ASTフレームワークにクリティカルステートを組み込むことで,安全性違反の増大を伴う障害シナリオが生成されることを示す。
- 参考スコア(独自算出の注目度): 9.93890332477992
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Uncovering potential failure cases is a crucial step in the validation of
safety critical systems such as autonomous vehicles. Failure search may be done
through logging substantial vehicle miles in either simulation or real world
testing. Due to the sparsity of failure events, naive random search approaches
require significant amounts of vehicle operation hours to find potential system
weaknesses. As a result, adaptive searching techniques have been proposed to
efficiently explore and uncover failure trajectories of an autonomous policy in
simulation. Adaptive Stress Testing (AST) is one such method that poses the
problem of failure search as a Markov decision process and uses reinforcement
learning techniques to find high probability failures. However, this
formulation requires a probability model for the actions of all agents in the
environment. In systems where the environment actions are discrete and
dependencies among agents exist, it may be infeasible to fully characterize the
distribution or find a suitable proxy. This work proposes the use of a data
driven approach to learn a suitable classifier that tries to model how humans
identify {critical states and use this to guide failure search in AST. We show
that the incorporation of critical states into the AST framework generates
failure scenarios with increased safety violations in an autonomous driving
policy with a discrete action space.
- Abstract(参考訳): 潜在的な障害ケースを明らかにすることは、自動運転車のような安全クリティカルシステムを検証するための重要なステップである。
障害検索は、シミュレーションまたは実世界のテストでかなりの車両走行距離をログすることで行うことができる。
障害イベントのスパーシティのため、ナイーブなランダム探索アプローチでは、潜在的なシステムの弱点を見つけるためにかなりの時間を要する。
その結果,シミュレーションにおける自律的ポリシの障害軌跡を効率的に探索し,発見するための適応探索手法が提案されている。
アダプティブストレステスト(AST)はマルコフ決定プロセスとして障害探索の問題を提起する手法の一つであり、高確率故障を見つけるために強化学習技術を用いる。
しかし、この定式化は環境中の全てのエージェントの行動の確率モデルを必要とする。
環境アクションが離散的でエージェント間の依存関係が存在するシステムでは、分散を完全に特徴づけたり、適切なプロキシを見つけることは不可能である。
本研究は,データ駆動型手法を用いて,人間が<クリティカルな状態を特定する方法をモデル化し,ASTにおける障害探索をガイドする適切な分類法を学習することを提案する。
本稿では,ASTフレームワークにクリティカルステートを組み込むことにより,自律運転政策における安全違反の増加に伴う障害シナリオを発生させることを示す。
関連論文リスト
- SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - DARTH: Holistic Test-time Adaptation for Multiple Object Tracking [87.72019733473562]
複数物体追跡(MOT)は、自律運転における知覚システムの基本的構成要素である。
運転システムの安全性の追求にもかかわらず、テスト時間条件における領域シフトに対するMOT適応問題に対する解決策は提案されていない。
我々はMOTの総合的なテスト時間適応フレームワークであるDARTHを紹介する。
論文 参考訳(メタデータ) (2023-10-03T10:10:42Z) - Generating and Characterizing Scenarios for Safety Testing of Autonomous
Vehicles [86.9067793493874]
最先端運転シミュレータを用いて,テストシナリオを特徴付け,生成するための効率的なメカニズムを提案する。
次世代シミュレーション(NGSIM)プロジェクトにおける実運転データの特徴付けに本手法を用いる。
事故回避の複雑さに基づいてメトリクスを定義してシナリオをランク付けし、事故発生の可能性を最小限に抑えるための洞察を提供します。
論文 参考訳(メタデータ) (2021-03-12T17:00:23Z) - Discovering Avoidable Planner Failures of Autonomous Vehicles using
Counterfactual Analysis in Behaviorally Diverse Simulation [16.86782673205523]
本稿では,行動学的に多様な交通参加者をシミュレートする上で,近年の進歩を生かしたプランナーテストフレームワークを提案する。
提案手法は,多岐にわたる重要な計画立案者の失敗を見出すことができることを示す。
論文 参考訳(メタデータ) (2020-11-24T09:44:23Z) - Efficient falsification approach for autonomous vehicle validation using
a parameter optimisation technique based on reinforcement learning [6.198523595657983]
自律走行車(AV)の大規模展開は、まだ解決されていない多くの安全上の課題にもかかわらず、差し迫っているように見える。
交通参加者とダイナミックワールドの行動の不確実性は、先進的な自律システムにおいて反応を引き起こす。
本稿では,システム・アンダー・テストを評価するための効率的なファルシフィケーション手法を提案する。
論文 参考訳(メタデータ) (2020-11-16T02:56:13Z) - Evaluating the Safety of Deep Reinforcement Learning Models using
Semi-Formal Verification [81.32981236437395]
本稿では,区間分析に基づく半形式的意思決定手法を提案する。
本手法は, 標準ベンチマークに比較して, 形式検証に対して比較結果を得る。
提案手法は, 意思決定モデルにおける安全性特性を効果的に評価することを可能にする。
論文 参考訳(メタデータ) (2020-10-19T11:18:06Z) - Neural Bridge Sampling for Evaluating Safety-Critical Autonomous Systems [34.945482759378734]
シミュレーションの安全性評価には確率論的アプローチを用いており、危険事象の確率を計算することに関心がある。
探索, 利用, 最適化技術を組み合わせて, 故障モードを見つけ, 発生率を推定する新しいレアイベントシミュレーション手法を開発した。
論文 参考訳(メタデータ) (2020-08-24T17:46:27Z) - Can Autonomous Vehicles Identify, Recover From, and Adapt to
Distribution Shifts? [104.04999499189402]
トレーニング外の配布(OOD)シナリオは、デプロイ時にエージェントを学ぶ上で一般的な課題である。
インプロバスト模倣計画(RIP)と呼ばれる不確実性を考慮した計画手法を提案する。
提案手法は,OODシーンにおける過信および破滅的な外挿を低減し,分布変化を検知し,回復することができる。
分散シフトを伴うタスク群に対する駆動エージェントのロバスト性を評価するために,自動走行車ノベルシーンベンチマークであるtexttCARNOVEL を導入する。
論文 参考訳(メタデータ) (2020-06-26T11:07:32Z) - Guided Uncertainty-Aware Policy Optimization: Combining Learning and
Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。
強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。
本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文 参考訳(メタデータ) (2020-05-21T19:47:05Z) - Scalable Autonomous Vehicle Safety Validation through Dynamic
Programming and Scene Decomposition [37.61747231296097]
本稿では、近似動的プログラミングを用いて、自律的なポリシの障害に対する分布を推定する新しい安全性検証手法を提案する。
両実験とも, ベースラインアプローチと比較して, 故障数の増加が見られた。
論文 参考訳(メタデータ) (2020-04-14T21:03:50Z) - Efficient statistical validation with edge cases to evaluate Highly
Automated Vehicles [6.198523595657983]
自動運転車の大規模展開は、まだ解決されていない多くの安全上の課題にもかかわらず、差し迫っているようだ。
既存の標準は、検証が要求をカバーするテストケースのセットだけを必要とする決定論的プロセスに焦点を当てています。
本稿では, 自動生成テストケースを最悪のシナリオに偏り付け, システムの挙動の統計的特性を計算するための新しい手法を提案する。
論文 参考訳(メタデータ) (2020-03-04T04:35:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。