論文の概要: STADA: Specification-based Testing for Autonomous Driving Agents
- arxiv url: http://arxiv.org/abs/2603.10940v1
- Date: Wed, 11 Mar 2026 16:26:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 16:22:33.055007
- Title: STADA: Specification-based Testing for Autonomous Driving Agents
- Title(参考訳): STADA: 自律運転エージェントのための仕様ベースのテスト
- Authors: Joy Saha, Trey Woodlief, Sebastian Elbaum, Matthew B. Dwyer,
- Abstract要約: STADAは、自動運転エージェントのための仕様ベースのテスト生成フレームワークである。
時間論理(LTLf)で表される形式仕様によって定義されたシナリオの空間を生成する。
- 参考スコア(独自算出の注目度): 16.871708543325514
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Simulation-based testing has become a standard approach to validating autonomous driving agents prior to real-world deployment. A high-quality validation campaign will exercise an agent in diverse contexts comprised of varying static environments, e.g., lanes, intersections, signage, and dynamic elements, e.g., vehicles and pedestrians. To achieve this, existing test generation techniques rely on template-based, manually constructed, or random scenario generation. When applied to validate formally specified safety requirements, such methods either require significant human effort or run the risk of missing important behavior related to the requirement. To address this gap, we present STADA, a Specification-based Test generation framework for Autonomous Driving Agents that systematically generates the space of scenarios defined by a formal specification expressed in temporal logic (LTLf). Given a specification, STADA constructs all distinct initial scenes, a diverse space of continuations of those scenes, and simulations that reflect the behaviors of the specification. Evaluation of STADA on a variety of LTLf specifications formalized in SCENEFLOW using three complementary coverage criteria demonstrates that STADA yields more than 2x higher coverage than the best baseline on the finest criteria and a 75% increase for the coarsest criteria. Moreover, it matches the coverage of the best baseline with 6 times fewer simulations. While set in the context of autonomous driving, the approach is applicable to other domains with rich simulation environments.
- Abstract(参考訳): シミュレーションベースのテストは、実世界のデプロイに先立って、自律運転エージェントを検証するための標準的なアプローチになっている。
高品質な検証キャンペーンは、さまざまな静的環境(例えば、車線、交差点、標識、動的要素(例えば、車や歩行者)で構成されるさまざまな状況でエージェントを訓練する。
これを実現するために、既存のテスト生成技術はテンプレートベースの、手動で構築された、ランダムなシナリオ生成に依存している。
公式に指定された安全要件を検証するために適用された場合、そのような方法は、重大な人的努力を必要とするか、その要件に関連する重要な行動の欠如のリスクを負う。
このギャップに対処するために,時相論理(LTLf)で表される形式仕様で定義されたシナリオの空間を体系的に生成する,自律運転エージェントのための仕様ベースのテスト生成フレームワークであるSTADAを提案する。
仕様が与えられた場合、STADAは、すべての異なる初期シーン、それらのシーンの継続空間、および仕様の振る舞いを反映したシミュレーションを構築します。
SCENEFLOW で定式化された様々な LTLf 仕様に対する STADA の評価は、3つの相補的カバレッジ基準を用いて、STADA が最高基準基準の 2 倍以上のカバレッジを獲得し、最も粗い基準の 75% が増加することを示した。
さらに、最高のベースラインのカバレッジを6倍のシミュレーションで比較する。
自律運転の文脈で設定されているが、この手法はリッチなシミュレーション環境を持つ他の領域に適用できる。
関連論文リスト
- Declarative Scenario-based Testing with RoadLogic [2.2107822884016404]
宣言型OS2仕様と実行可能なシミュレーションを橋渡しするRoadLogicを提案する。
結果は、RoadLogicが数分で、現実的で、仕様に満足するシミュレーションを一貫して生成していることを示している。
論文 参考訳(メタデータ) (2026-03-10T10:11:09Z) - Req2Road: A GenAI Pipeline for SDV Test Artifact Generation and On-Vehicle Execution [24.305511228249486]
大規模言語モデルと視覚言語モデルは、信号と行動論理を抽出するために使用される。
パイプラインは検索拡張生成を使用して、マッピング前に候補VSS信号をプリセレクトする。
本稿では,SDVサブシステムのためのエンドツーエンド要求-テストパイプラインの実現可能性とアーキテクチャ実証について述べる。
論文 参考訳(メタデータ) (2026-02-17T14:03:35Z) - Model-Based Policy Adaptation for Closed-Loop End-to-End Autonomous Driving [54.46325690390831]
本稿では,事前学習したE2E運転エージェントのロバスト性と安全性を高めるための汎用フレームワークとして,モデルベースポリシー適応(MPA)を提案する。
MPAは、ジオメトリ一貫性のあるシミュレーションエンジンを用いて、まず様々な対物軌道を生成する。
MPAは拡散ベースのポリシーアダプタを訓練し、基本方針の予測を洗練させ、Q値モデルを多段階に分けて長期的な結果を評価する。
論文 参考訳(メタデータ) (2025-11-26T17:01:41Z) - Steerable Adversarial Scenario Generation through Test-Time Preference Alignment [58.37104890690234]
対立シナリオ生成は、自律運転システムの安全性評価のためのコスト効率の良いアプローチである。
textbfSteerable textbfAdversarial scenario textbfGEnerator (SAGE) という新しいフレームワークを導入する。
SAGEは、逆境とリアリズムの間のトレードオフを、再トレーニングなしできめ細かいテストタイムコントロールを可能にします。
論文 参考訳(メタデータ) (2025-09-24T13:27:35Z) - Constrained Decoding for Robotics Foundation Models [12.916330118607918]
本稿では,自動回帰ロボット基盤モデルのための制約付き復号化フレームワークであるSafeDecを紹介する。
タスク固有の安全ルールはSignal Temporal Logic (STL) 公式として表現され、最小限のオーバーヘッドで推論時に強制される。
提案手法は,実行時に仮定された動的条件下でのSTL仕様を,再トレーニングなしで確実に満たすものである。
論文 参考訳(メタデータ) (2025-09-01T19:17:40Z) - Test Automation for Interactive Scenarios via Promptable Traffic Simulation [48.240394447516664]
本稿では,対話型シナリオにおけるAVプランナ評価のための,現実的かつ安全クリティカルな人間の行動を生成する自動化手法を提案する。
我々は低次元目標位置を用いて複雑な人間の行動のパラメータ化を行い、それをプロンプト可能な交通シミュレータProSimに入力する。
テスト生成を自動化するために,目標領域を探索し,ベイズ最適化を用いて安全クリティカルな動作を効率的に識別するプロンプト生成モジュールを導入する。
論文 参考訳(メタデータ) (2025-06-01T22:29:32Z) - Generating Out-Of-Distribution Scenarios Using Language Models [58.47597351184034]
大規模言語モデル(LLM)は自動運転において有望であることを示している。
本稿では,多様なOF-Distribution(OOD)駆動シナリオを生成するためのフレームワークを提案する。
我々は、広範囲なシミュレーションを通じてフレームワークを評価し、新しい"OOD-ness"メトリクスを導入する。
論文 参考訳(メタデータ) (2024-11-25T16:38:17Z) - GOOSE: Goal-Conditioned Reinforcement Learning for Safety-Critical Scenario Generation [0.14999444543328289]
ゴール条件付きシナリオ生成(Goal-conditioned Scenario Generation、GOOSE)は、ゴール条件付き強化学習(RL)アプローチで、安全クリティカルなシナリオを自動的に生成する。
安全クリティカルな事象につながるシナリオを生成する上でのGOOSEの有効性を実証する。
論文 参考訳(メタデータ) (2024-06-06T08:59:08Z) - Towards Scenario-based Safety Validation for Autonomous Trains with Deep
Generative Models [0.0]
シナリオベース検証のための深層生成モデルを用いたデータシミュレーションの有用性に関する実践経験を報告する。
本研究では,鉄道シーンをより深い生成モデルで意味論的に編集し,限られた量の試験データをより代表的なものにする能力を実証する。
論文 参考訳(メタデータ) (2023-10-16T17:55:14Z) - A Requirements-Driven Platform for Validating Field Operations of Small
Uncrewed Aerial Vehicles [48.67061953896227]
DroneReqValidator (DRV)は、sUAS開発者が運用コンテキストを定義し、複数のsUASミッション要件を設定し、安全性特性を指定し、独自のsUASアプリケーションを高忠実な3D環境にデプロイすることを可能にする。
DRVモニタリングシステムは、sUASと環境からランタイムデータを収集し、安全特性のコンプライアンスを分析し、違反をキャプチャする。
論文 参考訳(メタデータ) (2023-07-01T02:03:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。