論文の概要: Pass-Fail Criteria for Scenario-Based Testing of Automated Driving
Systems
- arxiv url: http://arxiv.org/abs/2005.09417v2
- Date: Tue, 26 May 2020 14:15:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-19 08:14:01.923449
- Title: Pass-Fail Criteria for Scenario-Based Testing of Automated Driving
Systems
- Title(参考訳): 自動走行システムのシナリオベーステストにおけるパスフェイル基準
- Authors: Robert Myers, Zeyn Saigol
- Abstract要約: 本稿では,通常運転時の自動走行システムの動作安全性を評価するための枠組みを提案する。
リスクベースのルールは、1つのテストケースからパス/フェイルを決定できない。
これは、多くの個々のテストにおける統計的パフォーマンスを考慮に入れている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The MUSICC project has created a proof-of-concept scenario database to be
used as part of a type approval process for the verification of automated
driving systems (ADS). This process must include a highly automated means of
evaluating test results, as manual review at the scale required is impractical.
This paper sets out a framework for assessing an ADS's behavioural safety in
normal operation (i.e. performance of the dynamic driving task without
component failures or malicious actions). Five top-level evaluation criteria
for ADS performance are identified. Implementing these requires two types of
outcome scoring rule: prescriptive (measurable rules which must always be
followed) and risk-based (undesirable outcomes which must not occur too often).
Scoring rules are defined in a programming language and will be stored as part
of the scenario description.
Risk-based rules cannot give a pass/fail decision from a single test case.
Instead, a framework is defined to reach a decision for each functional
scenario (set of test cases with common features). This considers statistical
performance across many individual tests. Implications of this framework for
hypothesis testing and scenario selection are identified.
- Abstract(参考訳): MUSICCプロジェクトは、自動走行システム(ADS)の検証のための型承認プロセスの一部として使用される概念実証シナリオデータベースを開発した。
このプロセスにはテスト結果を評価する高度に自動化された手段が含まれなければならない。
本稿では,ADSの動作安全性を正常な動作(例えば,コンポーネント障害や悪意のある動作を伴わない動的駆動タスクの性能)で評価するための枠組みを提案する。
ADS評価の上位評価基準を5つ同定した。
これらを実装するには、規範的(常に従わなければならない測定可能なルール)とリスクベース(あまり起こらない予期せぬ結果)の2つのタイプの結果スコアリングルールが必要です。
Scoringルールはプログラミング言語で定義され、シナリオ記述の一部として保存される。
リスクベースのルールは、1つのテストケースからパス/フェイルを決定できない。
その代わり、フレームワークは各機能シナリオ(共通の機能を持つテストケースの集合)の決定に達するように定義されます。
これは、多くの個々のテストにおける統計的パフォーマンスを考慮する。
仮説テストとシナリオ選択のためのこのフレームワークの意義を同定する。
関連論文リスト
- Automatically Adaptive Conformal Risk Control [49.95190019041905]
本稿では,テストサンプルの難易度に適応して,統計的リスクの近似的条件制御を実現する手法を提案する。
我々のフレームワークは、ユーザが提供するコンディショニングイベントに基づく従来のコンディショニングリスク制御を超えて、コンディショニングに適した関数クラスのアルゴリズム的、データ駆動決定を行う。
論文 参考訳(メタデータ) (2024-06-25T08:29:32Z) - GOOSE: Goal-Conditioned Reinforcement Learning for Safety-Critical Scenario Generation [0.14999444543328289]
ゴール条件付きシナリオ生成(Goal-conditioned Scenario Generation、GOOSE)は、ゴール条件付き強化学習(RL)アプローチで、安全クリティカルなシナリオを自動的に生成する。
安全クリティカルな事象につながるシナリオを生成する上でのGOOSEの有効性を実証する。
論文 参考訳(メタデータ) (2024-06-06T08:59:08Z) - Efficient Weighting Schemes for Auditing Instant-Runoff Voting Elections [57.67176250198289]
AWAIREは、適応的に重み付けされたテスト統計量であり、本質的には、テストに有効な仮説のセットを「学習」する。
我々は、より広範囲にスキームと設定を検討し、実践のための効率的な選択を特定し、推奨する。
現在のAWAIRE実装の制限は、少数の候補者に限られている。
論文 参考訳(メタデータ) (2024-02-18T10:13:01Z) - Few-Shot Scenario Testing for Autonomous Vehicles Based on Neighborhood Coverage and Similarity [8.97909097472183]
大規模展開の前には、自律走行車(AV)の安全性能の試験と評価が不可欠である。
特定のAVに対して許容されるテストシナリオの数は、テスト予算と時間に対する厳格な制約によって著しく制限されています。
フェーショットテスト(FST)問題が初めてこの問題を定式化し、この問題に対処するための体系的なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-02T04:47:14Z) - Evaluating the Fairness of Discriminative Foundation Models in Computer
Vision [51.176061115977774]
本稿では,CLIP (Contrastive Language-Pretraining) などの差別基盤モデルのバイアス評価のための新しい分類法を提案する。
そして、これらのモデルにおけるバイアスを緩和するための既存の手法を分類学に関して体系的に評価する。
具体的には,ゼロショット分類,画像検索,画像キャプションなど,OpenAIのCLIPとOpenCLIPモデルをキーアプリケーションとして評価する。
論文 参考訳(メタデータ) (2023-10-18T10:32:39Z) - Conservative Estimation of Perception Relevance of Dynamic Objects for
Safe Trajectories in Automotive Scenarios [0.0]
関連性の概念はいまだ十分に定義されておらず、特定されていない。
本稿では,ハイウェイ領域における衝突安全への模範的適用により,この課題を克服する新しい手法を提案する。
本稿では、動的対象が知覚に関連し、完全な評価のために考慮する必要がある、保守的な推定法を提案する。
論文 参考訳(メタデータ) (2023-07-20T13:43:48Z) - Tree-Based Scenario Classification: A Formal Framework for Coverage
Analysis on Test Drives of Autonomous Vehicles [0.0]
シナリオベースのテストでは、関連する(運転)シナリオがテストの基礎になります。
シナリオの集合を分類し、記録されたテストドライブにおけるこれらのシナリオのカバレッジを測定するというオープンな課題に対処する。
論文 参考訳(メタデータ) (2023-07-11T08:30:57Z) - Robust Continual Test-time Adaptation: Instance-aware BN and
Prediction-balanced Memory [58.72445309519892]
テストデータストリーム以外のデータストリームに対して堅牢な新しいテスト時間適応方式を提案する。
a)分布外サンプルの正規化を修正するIABN(Instance-Aware Batch Normalization)と、(b)クラスバランスのない方法で非i.d.ストリームからのデータストリームをシミュレートするPBRS(Predict- Balanced Reservoir Sampling)である。
論文 参考訳(メタデータ) (2022-08-10T03:05:46Z) - Uncertainty-Driven Action Quality Assessment [67.20617610820857]
本稿では,複数の判定スコアの多様性を捉えるために,不確実性駆動型AQA (UD-AQA) という新しい確率モデルを提案する。
我々は,AQA回帰損失の再重み付けに使用される各予測の不確かさを推定する。
提案手法は,オリンピックイベントMTL-AQAとFineDivingの3つのベンチマークと,手術スキルJIGSAWSデータセットの3つのベンチマークで比較結果を得た。
論文 参考訳(メタデータ) (2022-07-29T07:21:15Z) - Pre-training Is (Almost) All You Need: An Application to Commonsense
Reasoning [61.32992639292889]
事前学習されたトランスモデルの微調整は、一般的なNLPタスクを解決するための標準的なアプローチとなっている。
そこで本研究では,可視性ランキングタスクをフルテキスト形式でキャストする新たなスコアリング手法を提案する。
提案手法は, ランダム再起動にまたがって, より安定した学習段階を提供することを示す。
論文 参考訳(メタデータ) (2020-04-29T10:54:40Z) - Efficient statistical validation with edge cases to evaluate Highly
Automated Vehicles [6.198523595657983]
自動運転車の大規模展開は、まだ解決されていない多くの安全上の課題にもかかわらず、差し迫っているようだ。
既存の標準は、検証が要求をカバーするテストケースのセットだけを必要とする決定論的プロセスに焦点を当てています。
本稿では, 自動生成テストケースを最悪のシナリオに偏り付け, システムの挙動の統計的特性を計算するための新しい手法を提案する。
論文 参考訳(メタデータ) (2020-03-04T04:35:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。