論文の概要: Evaluating Decision Optimality of Autonomous Driving via Metamorphic
Testing
- arxiv url: http://arxiv.org/abs/2402.18393v1
- Date: Wed, 28 Feb 2024 15:13:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-29 14:37:00.197337
- Title: Evaluating Decision Optimality of Autonomous Driving via Metamorphic
Testing
- Title(参考訳): 変成試験による自律運転の意思決定最適性の評価
- Authors: Mingfei Cheng, Yuan Zhou, Xiaofei Xie, Junjie Wang, Guozhu Meng,
Kairui Yang
- Abstract要約: 自律運転システム(ADS)の意思決定品質の評価に焦点をあてる。
非最適決定シナリオ(NoDS)を検出するための最初の方法を提案する。
我々は,NoDSを効率的に生成するための新しいフレームワークであるDecictorを開発した。
- 参考スコア(独自算出の注目度): 27.79913561898762
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous Driving System (ADS) testing is crucial in ADS development, with
the current primary focus being on safety. However, the evaluation of
non-safety-critical performance, particularly the ADS's ability to make optimal
decisions and produce optimal paths for autonomous vehicles (AVs), is equally
vital to ensure the intelligence and reduce risks of AVs. Currently, there is
little work dedicated to assessing ADSs' optimal decision-making performance
due to the lack of corresponding oracles and the difficulty in generating
scenarios with non-optimal decisions. In this paper, we focus on evaluating the
decision-making quality of an ADS and propose the first method for detecting
non-optimal decision scenarios (NoDSs), where the ADS does not compute optimal
paths for AVs. Firstly, to deal with the oracle problem, we propose a novel
metamorphic relation (MR) aimed at exposing violations of optimal decisions.
The MR identifies the property that the ADS should retain optimal decisions
when the optimal path remains unaffected by non-invasive changes. Subsequently,
we develop a new framework, Decictor, designed to generate NoDSs efficiently.
Decictor comprises three main components: Non-invasive Mutation, MR Check, and
Feedback. The Non-invasive Mutation ensures that the original optimal path in
the mutated scenarios is not affected, while the MR Check is responsible for
determining whether non-optimal decisions are made. To enhance the
effectiveness of identifying NoDSs, we design a feedback metric that combines
both spatial and temporal aspects of the AV's movement. We evaluate Decictor on
Baidu Apollo, an open-source and production-grade ADS. The experimental results
validate the effectiveness of Decictor in detecting non-optimal decisions of
ADSs. Our work provides valuable and original insights into evaluating the
non-safety-critical performance of ADSs.
- Abstract(参考訳): 自動運転システム(ads)テストは、広告開発において不可欠であり、現在の主な焦点は安全性である。
しかしながら、安全でない性能の評価、特にADSが最適な判断を下し、自動運転車(AV)の最適経路を創出する能力は、AIVのインテリジェンスを確保し、リスクを減らすために等しく不可欠である。
現在、対応するオラクルの欠如や、最適でない決定を伴うシナリオを生成するのに困難があるため、ADSの最適意思決定性能を評価する作業はほとんど行われていない。
本稿では,ADSの意思決定品質を評価することに集中し,ADSがAVの最適経路を計算しない非最適決定シナリオ(NoDS)を検出するための最初の方法を提案する。
まず, オラクル問題に対処するために, 最適決定の違反を明らかにすることを目的とした新しいメタモルフィック関係(MR)を提案する。
MRは、非侵襲的な変化によって最適な経路が影響を受けない場合、ADSが最適決定を維持すべきであるという特性を特定する。
その後,nodsを効率的に生成するための新しいフレームワークdecictorを開発した。
decictorは、非侵襲突然変異、mrチェック、フィードバックの3つの主成分からなる。
非侵襲的変異は、変異したシナリオにおける元の最適経路が影響を受けないことを保証するが、mrチェックは非最適決定が行われるかどうかを決定する責任がある。
nodssを識別する効果を高めるために,av動作の空間的側面と時間的側面の両方を組み合わせたフィードバックメトリックを設計する。
我々は、オープンソースおよびプロダクショングレードのADSであるBaidu Apollo上でDecictorを評価する。
その結果, ADSの非最適判定におけるDecictorの有効性が検証された。
我々の研究は、ADSの非安全クリティカルな性能を評価する上で、価値ある独自の洞察を提供する。
関連論文リスト
- Uncertainty-Penalized Direct Preference Optimization [52.387088396044206]
我々は、優先不確実性ペナル化スキームを導入し、DPOの悲観的な枠組みを開発する。
ペナル化は、不確実なサンプルの損失勾配を減衰させる損失の補正として機能する。
我々は,バニラDPOと比較して全体的な性能が向上し,高い不確実性選択/拒絶反応によるプロンプトの完成度も向上した。
論文 参考訳(メタデータ) (2024-10-26T14:24:37Z) - Improving Explainable Object-induced Model through Uncertainty for
Automated Vehicles [13.514721609660521]
最近の説明可能な自動車両(AV)は、動作の説明を提供しながら、固有の不確実性に関連する重要な情報を無視している。
本研究は、意思決定の場面におけるオブジェクトの役割を優先する「対象誘導型」モデルアプローチに基づく。
また、不確実性によって導かれる先進的なトレーニング戦略についても検討する。
論文 参考訳(メタデータ) (2024-02-23T19:14:57Z) - Safety Assessment of Vehicle Characteristics Variations in Autonomous
Driving Systems [8.978712831628068]
本稿では,車載運転システム(ADS)の安全性に影響を与える車両特性設定の最小値を求める手法を提案する。
ADSを2台採用し,運転シミュレータを2台使用した。
論文 参考訳(メタデータ) (2023-11-24T13:13:29Z) - A Counterfactual Safety Margin Perspective on the Scoring of Autonomous
Vehicles' Riskiness [52.27309191283943]
本稿では,異なるAVの行動のリスクを評価するためのデータ駆動型フレームワークを提案する。
本稿では,衝突を引き起こす可能性のある名目行動から最小限の偏差を示す,対実的安全マージンの概念を提案する。
論文 参考訳(メタデータ) (2023-08-02T09:48:08Z) - Integrated Sensing, Computation, and Communication for UAV-assisted
Federated Edge Learning [52.7230652428711]
フェデレーションエッジ学習(FEEL)は、エッジデバイスとサーバ間の定期的な通信を通じて、プライバシ保護モデルトレーニングを可能にする。
無人航空機(UAV)搭載エッジデバイスは、効率的なデータ収集における柔軟性と移動性のため、FEELにとって特に有利である。
論文 参考訳(メタデータ) (2023-06-05T16:01:33Z) - RISE: Robust Individualized Decision Learning with Sensitive Variables [1.5293427903448025]
素直なベースラインは、決定規則を学習する際の繊細な変数を無視し、重大な不確実性と偏見をもたらすことである。
本稿では、オフライントレーニング中に機密変数を組み込む決定学習フレームワークを提案するが、モデル展開中に学習された決定ルールの入力には含まない。
論文 参考訳(メタデータ) (2022-11-12T04:31:38Z) - Uncertainty-Driven Action Quality Assessment [67.20617610820857]
本稿では,複数の判定スコアの多様性を捉えるために,不確実性駆動型AQA (UD-AQA) という新しい確率モデルを提案する。
我々は,AQA回帰損失の再重み付けに使用される各予測の不確かさを推定する。
提案手法は,オリンピックイベントMTL-AQAとFineDivingの3つのベンチマークと,手術スキルJIGSAWSデータセットの3つのベンチマークで比較結果を得た。
論文 参考訳(メタデータ) (2022-07-29T07:21:15Z) - R(Det)^2: Randomized Decision Routing for Object Detection [64.48369663018376]
本稿では,決定木とディープニューラルネットワークをエンドツーエンドの学習方法で組み合わせたオブジェクト検出手法を提案する。
効率的な学習を容易にするために,ノード選択型および連想型損失を伴うランダム化決定経路を提案する。
このアプローチをオブジェクト検出のためのランダム化決定ルーティングとして、R(Det)$2$と略す。
論文 参考訳(メタデータ) (2022-04-02T07:54:58Z) - Towards robust sensing for Autonomous Vehicles: An adversarial
perspective [82.83630604517249]
結果として得られる決定が摂動に対して堅牢であることは、最も重要なことです。
敵対的摂動は、意図的に環境や感覚測定の修正を施したものである。
より安全なシステムの構築とデプロイには,センサーシステムの脆弱性を慎重に評価する必要がある。
論文 参考訳(メタデータ) (2020-07-14T05:25:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。