論文の概要: DeepQTest: Testing Autonomous Driving Systems with Reinforcement
Learning and Real-world Weather Data
- arxiv url: http://arxiv.org/abs/2310.05170v1
- Date: Sun, 8 Oct 2023 13:59:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 11:54:42.426342
- Title: DeepQTest: Testing Autonomous Driving Systems with Reinforcement
Learning and Real-world Weather Data
- Title(参考訳): DeepQTest: 強化学習と現実の気象データによる自律走行システムのテスト
- Authors: Chengjie Lu, Tao Yue, Man Zhang, Shaukat Ali
- Abstract要約: 強化学習(RL)を用いた自律走行システム(ADS)の新しいテスト手法を提案する。
DeepQTestはRLを使用して環境構成を学習する。
生成されたシナリオの現実性を保証するため、DeepQTestは現実的な制約セットを定義し、実際の気象条件を導入する。
- 参考スコア(独自算出の注目度): 12.106514312408228
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous driving systems (ADSs) are capable of sensing the environment and
making driving decisions autonomously. These systems are safety-critical, and
testing them is one of the important approaches to ensure their safety.
However, due to the inherent complexity of ADSs and the high dimensionality of
their operating environment, the number of possible test scenarios for ADSs is
infinite. Besides, the operating environment of ADSs is dynamic, continuously
evolving, and full of uncertainties, which requires a testing approach adaptive
to the environment. In addition, existing ADS testing techniques have limited
effectiveness in ensuring the realism of test scenarios, especially the realism
of weather conditions and their changes over time. Recently, reinforcement
learning (RL) has demonstrated great potential in addressing challenging
problems, especially those requiring constant adaptations to dynamic
environments. To this end, we present DeepQTest, a novel ADS testing approach
that uses RL to learn environment configurations with a high chance of
revealing abnormal ADS behaviors. Specifically, DeepQTest employs Deep
Q-Learning and adopts three safety and comfort measures to construct the reward
functions. To ensure the realism of generated scenarios, DeepQTest defines a
set of realistic constraints and introduces real-world weather conditions into
the simulated environment. We employed three comparison baselines, i.e.,
random, greedy, and a state-of-the-art RL-based approach DeepCOllision, for
evaluating DeepQTest on an industrial-scale ADS. Evaluation results show that
DeepQTest demonstrated significantly better effectiveness in terms of
generating scenarios leading to collisions and ensuring scenario realism
compared with the baselines. In addition, among the three reward functions
implemented in DeepQTest, Time-To-Collision is recommended as the best design
according to our study.
- Abstract(参考訳): 自律運転システム(ADS)は環境を感知し、自律的に運転決定を行うことができる。
これらのシステムは安全性に重要であり、テストは安全性を確保するための重要なアプローチの1つである。
しかし, ADS の複雑さと動作環境の高次元性のため, ADS のテストシナリオの数は無限である。
さらに、ADSの運用環境は動的で、継続的に進化し、不確実性に満ちており、環境に適応したテストアプローチが必要である。
さらに、既存のADSテスト技術は、テストシナリオ、特に気象条件のリアリズムとその経時変化を確実にする上で、限られた効果がある。
近年、強化学習(RL)は、特に動的環境への一定の適応を必要とする問題に対処する大きな可能性を示している。
この目的のために,RL を用いて環境構成を学習し,異常な ADS の挙動を明らかにする新しい ADS テスト手法である DeepQTest を提案する。
具体的には、DeepQTestはDeep Q-Learningを採用し、報酬関数を構築するために3つの安全性と快適な対策を採用している。
生成されたシナリオの現実性を保証するため、DeepQTestは現実的な制約セットを定義し、シミュレーション環境に実際の気象条件を導入する。
産業規模広告におけるdeepqtestの評価には,ランダム,欲欲,最先端のrlベースアプローチであるdeepcollisionの3つの比較ベースラインを用いた。
評価結果から,DeepQTestは,衝突につながるシナリオの生成や,ベースラインと比較してシナリオリアリズムの確保において,極めて優れた有効性を示した。
また,DeepQTestで実装された3つの報酬関数のうち,Time-To-Collisionが最適設計として推奨されている。
関連論文リスト
- Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - First-principles Based 3D Virtual Simulation Testing for Discovering
SOTIF Corner Cases of Autonomous Driving [5.582213904792781]
本稿では,第1原理に基づくセンサモデリングと環境相互作用手法を提案し,それをCARLAシミュレータに統合する。
メタヒューリスティックアルゴリズムは、いくつかの経験的洞察に基づいて設計され、シードシナリオと突然変異の両方を導く。
シミュレーションのセットアップは同じで、我々のアルゴリズムは最先端の作業の約4倍のコーナーケースを発見できる。
論文 参考訳(メタデータ) (2024-01-22T12:02:32Z) - DroneReqValidator: Facilitating High Fidelity Simulation Testing for
Uncrewed Aerial Systems Developers [8.290044674335473]
sUAS開発者はシミュレーションテストを通じてアプリケーションの信頼性と安全性を検証することを目指している。
実世界の環境の動的な性質は、フィールドテストによってのみ明らかにされる可能性のある、ユニークなソフトウェア欠陥を引き起こす。
DroneReqValidator(DRV)は、小型無人航空機(SUAV)シミュレーションエコシステムを提供する。
論文 参考訳(メタデータ) (2023-07-31T22:13:57Z) - Boundary State Generation for Testing and Improvement of Autonomous Driving Systems [8.670873561640903]
本稿では,自律運転システム(ADS)テストのための新しいテストジェネレータであるGENBOについて述べる。
このような境界条件を用いて、初期トレーニングデータセットを拡張し、テスト中のDNNモデルを再訓練する。
評価結果から,再学習モデルでは,元のDNNモデルに対して,異なる評価トラックに対して平均で最大3倍の成功率を示した。
論文 参考訳(メタデータ) (2023-07-20T05:07:51Z) - A Requirements-Driven Platform for Validating Field Operations of Small
Uncrewed Aerial Vehicles [48.67061953896227]
DroneReqValidator (DRV)は、sUAS開発者が運用コンテキストを定義し、複数のsUASミッション要件を設定し、安全性特性を指定し、独自のsUASアプリケーションを高忠実な3D環境にデプロイすることを可能にする。
DRVモニタリングシステムは、sUASと環境からランタイムデータを収集し、安全特性のコンプライアンスを分析し、違反をキャプチャする。
論文 参考訳(メタデータ) (2023-07-01T02:03:49Z) - Many-Objective Reinforcement Learning for Online Testing of DNN-Enabled
Systems [0.6690874707758508]
ディープニューラルネットワーク(DNN)は、自律ダイビングシステム(ADS)のようなサイバー物理システムにおいて現実世界のタスクを実行するために広く利用されている。
このようなDNN-Enabled Systems(DES)の正しい動作を保証することが重要なトピックである。
オンラインテストは、そのようなシステムをクローズドループでアプリケーション環境(シミュレーションまたは現実)でテストするための有望なモードの1つです。
本稿では,強化学習(RL)と多目的探索を組み合わせることで,これらの課題に対処する新しいオンラインテスト手法であるMORLOTを提案する。
論文 参考訳(メタデータ) (2022-10-27T13:53:37Z) - Learning to Walk Autonomously via Reset-Free Quality-Diversity [73.08073762433376]
品質多様性アルゴリズムは、多様かつ高いパフォーマンスのスキルからなる大規模で複雑な行動レパートリーを発見することができる。
既存のQDアルゴリズムは、手動による人間の監督と介入を必要とするエピソードリセットと同様に、多数の評価を必要とする。
本稿では,オープンエンド環境におけるロボットの自律学習に向けたステップとして,リセットフリー品質多様性最適化(RF-QD)を提案する。
論文 参考訳(メタデータ) (2022-04-07T14:07:51Z) - Benchmarking Safe Deep Reinforcement Learning in Aquatic Navigation [78.17108227614928]
本研究では,水文ナビゲーションに着目した安全強化学習のためのベンチマーク環境を提案する。
価値に基づく政策段階の深層強化学習(DRL)について考察する。
また,学習したモデルの振る舞いを所望の特性の集合上で検証する検証戦略を提案する。
論文 参考訳(メタデータ) (2021-12-16T16:53:56Z) - A Survey on Scenario-Based Testing for Automated Driving Systems in
High-Fidelity Simulation [26.10081199009559]
道路上でシステムをテストすることは、現実世界と望ましいアプローチに最も近いが、非常にコストがかかる。
一般的な選択肢は、ADSのパフォーマンスを、よく設計されたシナリオ、すなわちシナリオベースのテストで評価することである。
高忠実度シミュレータはこの設定で、何のシナリオかをテストする際の柔軟性と利便性を最大化するために広く使われている。
論文 参考訳(メタデータ) (2021-12-02T03:41:33Z) - Attribute-Guided Adversarial Training for Robustness to Natural
Perturbations [64.35805267250682]
本稿では,属性空間への分類器の露出を最大化するために,新しいサンプルを生成することを学習する逆学習手法を提案する。
我々のアプローチは、ディープニューラルネットワークが自然に発生する摂動に対して堅牢であることを可能にする。
論文 参考訳(メタデータ) (2020-12-03T10:17:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。