論文の概要: Causality-aware Safety Testing for Autonomous Driving Systems
- arxiv url: http://arxiv.org/abs/2506.08688v1
- Date: Tue, 10 Jun 2025 10:53:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 15:11:42.35912
- Title: Causality-aware Safety Testing for Autonomous Driving Systems
- Title(参考訳): 自律運転システムの因果性を考慮した安全試験
- Authors: Wenbing Tang, Mingfei Cheng, Renzhi Wang, Yuan Zhou, Chengwei Liu, Yang Liu, Zuohua Ding,
- Abstract要約: 総合的な評価には、異なる条件下でさまざまな種類の違反を引き起こす可能性のある、さまざまなシナリオにわたるテストが必要である。
本稿では,自律運転システムの効率的な総合的なテストを実現するためのファジリング手法を提案する。
- 参考スコア(独自算出の注目度): 12.138537069776884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Simulation-based testing is essential for evaluating the safety of Autonomous Driving Systems (ADSs). Comprehensive evaluation requires testing across diverse scenarios that can trigger various types of violations under different conditions. While existing methods typically focus on individual diversity metrics, such as input scenarios, ADS-generated motion commands, and system violations, they often fail to capture the complex interrelationships among these elements. This oversight leads to gaps in testing coverage, potentially missing critical issues in the ADS under evaluation. However, quantifying these interrelationships presents a significant challenge. In this paper, we propose a novel causality-aware fuzzing technique, Causal-Fuzzer, to enable efficient and comprehensive testing of ADSs by exploring causally diverse scenarios. The core of Causal-Fuzzer is constructing a causal graph to model the interrelationships among the diversities of input scenarios, ADS motion commands, and system violations. Then the causal graph will guide the process of critical scenario generation. Specifically, Causal-Fuzzer proposes (1) a causality-based feedback mechanism that quantifies the combined diversity of test scenarios by assessing whether they activate new causal relationships, and (2) a causality-driven mutation strategy that prioritizes mutations on input scenario elements with higher causal impact on ego action changes and violation occurrence, rather than treating all elements equally. We evaluated Causal-Fuzzer on an industry-grade ADS Apollo, with a high-fidelity. Our empirical results demonstrate that Causal-Fuzzer significantly outperforms existing methods in (1) identifying a greater diversity of violations, (2) providing enhanced testing sufficiency with improved coverage of causal relationships, and (3) achieving greater efficiency in detecting the first critical scenarios.
- Abstract(参考訳): シミュレーションに基づくテストは、自律運転システム(ADS)の安全性を評価する上で不可欠である。
総合的な評価には、異なる条件下でさまざまな種類の違反を引き起こす可能性のある、さまざまなシナリオにわたるテストが必要である。
既存の手法では、入力シナリオ、ADS生成モーションコマンド、システム違反など、個々の多様性のメトリクスに重点を置いているが、これらの要素間の複雑な相互関係を捉えるのに失敗することが多い。
この監視は、テストカバレッジのギャップを招き、評価中のADSに重大な問題がある可能性がある。
しかし、これらの相互関係の定量化は重要な課題である。
本稿では,因果的多様なシナリオを探索し,ADSの効率的かつ包括的テストを可能にするために,因果的認識型ファジリング技術Causal-Fuzzerを提案する。
Causal-Fuzzerの中核は、入力シナリオ、ADSモーションコマンド、システム違反の多様性間の相互関係をモデル化する因果グラフを構築している。
次に、因果グラフが重要なシナリオ生成のプロセスを導く。
具体的には,(1)新たな因果関係を活性化するかどうかを評価することによって,テストシナリオの複合的な多様性を定量的に評価する因果的フィードバック機構,(2)エゴ行動の変化や違反の発生により高い因果的影響を持つ入力シナリオ要素の変異を優先する因果的突然変異戦略を提案する。
産業用ADSアポロのカウサル・ファッザーを高忠実度で評価した。
以上の結果から,(1)違反の多様性の確認,(2)因果関係のカバレッジの向上による検査効率の向上,(3)重要シナリオの検出における効率の向上などにおいて,カウサル・ファッザーが既存手法よりも優れていたことが示唆された。
関連論文リスト
- Data Fusion for Partial Identification of Causal Effects [62.56890808004615]
本稿では,研究者が重要な疑問に答えられるような,新しい部分的識別フレームワークを提案する。
因果効果は肯定的か否定的か?
本研究の枠組みをSTARプロジェクトに適用し,第3級の標準試験性能に対する教室規模の影響について検討する。
論文 参考訳(メタデータ) (2025-05-30T07:13:01Z) - Linear Control of Test Awareness Reveals Differential Compliance in Reasoning Models [13.379003220832825]
推論にフォーカスした大規模言語モデル(LLM)は、評価されていることを検知すると、その振る舞いを変えることがある。
このような「テスト意識」がモデル行動、特に安全性のアライメントにどのように影響するかについて、最初の定量的研究を行った。
論文 参考訳(メタデータ) (2025-05-20T17:03:12Z) - SimADFuzz: Simulation-Feedback Fuzz Testing for Autonomous Driving Systems [5.738863204900633]
SimADFuzzは、自律運転システムにおける違反を明らかにする高品質なシナリオを生成するように設計された、新しいフレームワークである。
SimADFuzzは、シナリオ選択を最適化するために、ADS違反の可能性を評価する違反予測モデルを採用している。
総合的な実験により、SimADFuzzは32以上のユニークな違反を識別することで最先端のファズーより優れていることが示された。
論文 参考訳(メタデータ) (2024-12-18T12:49:57Z) - Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting Framework [77.45983464131977]
我々は、RAGモデルの予測が誤りであり、現実のアプリケーションにおいて制御不能なリスクをもたらす可能性がどの程度あるかに焦点を当てる。
本研究は,RAGの予測に影響を及ぼす2つの重要な潜伏要因を明らかにする。
我々は,これらの要因をモデルに誘導し,その応答に与える影響を解析する,反実的プロンプトフレームワークを開発した。
論文 参考訳(メタデータ) (2024-09-24T14:52:14Z) - Model Stealing Attack against Graph Classification with Authenticity, Uncertainty and Diversity [80.16488817177182]
GNNは、クエリ許可を通じてターゲットモデルを複製するための悪行であるモデル盗難攻撃に対して脆弱である。
異なるシナリオに対応するために,3つのモデルステルス攻撃を導入する。
論文 参考訳(メタデータ) (2023-12-18T05:42:31Z) - BehAVExplor: Behavior Diversity Guided Testing for Autonomous Driving
Systems [27.223488110349567]
自律運転システム(ADS)のテストは、信頼性と安全性を確保するための重要なタスクである。
既存の手法は主に安全違反の検索に重点を置いており、生成したテストケースの多様性は無視されている。
本研究では,エゴ車両の挙動を探索し,多様な違反を検出するために,行動誘導型ファジリング技術(BehAVExplor)を提案する。
論文 参考訳(メタデータ) (2023-07-14T17:24:39Z) - Selective and Features based Adversarial Example Detection [12.443388374869745]
Deep Neural Networks (DNN) を中継するセキュリティに敏感なアプリケーションは、Adversarial Examples (AE) を生成するために作られた小さな摂動に弱い。
本稿では,マルチタスク学習環境における選択的予測,モデルレイヤの出力処理,知識伝達概念を用いた教師なし検出機構を提案する。
実験の結果,提案手法は,ホワイトボックスシナリオにおけるテスト攻撃に対する最先端手法と同等の結果を得られ,ブラックボックスとグレーボックスシナリオの精度が向上した。
論文 参考訳(メタデータ) (2021-03-09T11:06:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。