論文の概要: Dynasto: Validity-Aware Dynamic-Static Parameter Optimization for Autonomous Driving Testing
- arxiv url: http://arxiv.org/abs/2603.21427v1
- Date: Sun, 22 Mar 2026 22:35:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.412937
- Title: Dynasto: Validity-Aware Dynamic-Static Parameter Optimization for Autonomous Driving Testing
- Title(参考訳): Dynasto: 自律走行テストのための妥当性を考慮した動的静的パラメータ最適化
- Authors: Dmytro Humeniuk, Mohammad Hamdaqa, Houssem Ben Braiek, Amel Bennaceur, Foutse Khomh,
- Abstract要約: 自律運転システムにおける安全クリティカルな障害を明らかにするための2段階のテスト手法であるDynastoを提案する。
まず、時間論理に基づく妥当性基準を用いた強化学習を用いて、敵エージェントを訓練する。
第二に、遺伝的アルゴリズムは、敵の失敗を誘発する振る舞いを再生しながら初期条件を探索し、RLエージェントだけでは発見できない追加の失敗を明らかにする。
- 参考スコア(独自算出の注目度): 6.969678532857503
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extensive simulation-based testing is important for assuring the safety of autonomous driving systems (ADS). However, generating safety-critical traffic scenarios remains challenging because failures often arise from rare, complex interactions with surrounding vehicles. Existing automatic scenario-generation approaches frequently fail to distinguish genuine ADS faults from collisions caused by implausible or invalid adversarial behaviors, and they typically optimize either scenario initialization or agent behavior in isolation. We propose Dynasto, a two-step testing approach that jointly optimizes initial scenario parameters and dynamic adversarial behaviors to uncover realistic safety-critical failures. First, we train an adversarial agent using reinforcement learning (RL) with temporal-logic-based validity criteria and a safe-distance model inspired by ISO 34502 to promote behaviorally plausible failures. Second, a genetic algorithm (GA) searches over initial conditions while replaying the adversary's failure-inducing behaviors to reveal additional failures that the RL agent alone does not uncover. Finally, a graph-based clustering pipeline groups failures into representative modes based on semantic event sequences. Our evaluation experiments in HighwayEnv across two ADS controllers show that Dynasto finds 60%-70% more valid failures than an RL-only adversary under the same evaluation budget. With clustering, we obtain about 12 interpretable failure modes per system under test, revealing valid failures driven by weaknesses in ego-controller behavior. These results indicate that coordinated dynamic-static optimization with explicit validity constraints is effective for exposing safety-relevant failures in ADS testing.
- Abstract(参考訳): 大規模なシミュレーションに基づくテストは、自律運転システムの安全性を確保する上で重要である。
しかし、周囲の車両との稀で複雑な相互作用によって障害が発生するため、安全クリティカルな交通シナリオの生成は依然として困難である。
既存のシナリオ生成アプローチは、しばしば真のADS障害と、不可解または無効な敵の振る舞いによる衝突を区別することができない。
我々は,現実的な安全クリティカルな障害を明らかにするために,初期シナリオパラメータと動的対向動作を協調的に最適化する二段階テスト手法Dynastoを提案する。
まず、時間論理に基づく妥当性基準と、ISO 34502にインスパイアされた安全な距離モデルを用いた強化学習(RL)を用いた敵エージェントを訓練し、行動学的に妥当な障害を促進させる。
第二に、遺伝的アルゴリズム(GA)は、敵の障害誘発行動を再現しながら初期条件を探索し、RLエージェントだけでは発見できない追加の障害を明らかにする。
最後に、グラフベースのクラスタリングパイプラインは、セマンティックイベントシーケンスに基づいて、障害を代表モードにグループ化する。
HighwayEnv における2つの ADS コントローラを用いた評価実験により,Dynasto は RL のみの敵よりも 60%-70% の有効故障が認められた。
クラスタリングにより、テスト中のシステム毎に約12の解釈可能な障害モードが得られ、エゴコントローラの動作の弱点によって引き起こされる有効な障害が明らかになる。
これらの結果は, ADS試験における安全性関連故障の暴露に有効であることを示す。
関連論文リスト
- ADV-0: Closed-Loop Min-Max Adversarial Training for Long-Tail Robustness in Autonomous Driving [63.980630608984605]
本稿では、ゼロサムマルコフゲームとして、駆動ポリシー(ディフェンダー)と敵エージェント(アタックラー)の相互作用を扱うクローズドループのmin-max最適化フレームワークであるADV-0を提案する。
これを実現するため,我々は動的敵の進化を反復的な選好学習とし,この最適性を効率的に近似し,アルゴリズムに依存しない解をゲームに提供する。
実験により、多様な安全クリティカルな障害を効果的に露呈し、学習方針と運動プランナーの両方の一般化可能性を大幅に向上させることが示されている。
論文 参考訳(メタデータ) (2026-03-16T12:58:31Z) - Alignment Tipping Process: How Self-Evolution Pushes LLM Agents Off the Rails [103.05296856071931]
本稿では,自己進化型大規模言語モデル(LLM)エージェントに特有の,アライメント・ティッピング・プロセス(ATP)を同定する。
ATPは、連続的な相互作用によってエージェントが訓練中に確立されたアライメント制約を放棄し、強化された自己関心の戦略を支持するときに生じる。
実験の結果、アライメントの利点は自己進化の下で急速に低下し、最初は整合性のない状態に収束したモデルであることが判明した。
論文 参考訳(メタデータ) (2025-10-06T14:48:39Z) - Steerable Adversarial Scenario Generation through Test-Time Preference Alignment [58.37104890690234]
対立シナリオ生成は、自律運転システムの安全性評価のためのコスト効率の良いアプローチである。
textbfSteerable textbfAdversarial scenario textbfGEnerator (SAGE) という新しいフレームワークを導入する。
SAGEは、逆境とリアリズムの間のトレードオフを、再トレーニングなしできめ細かいテストタイムコントロールを可能にします。
論文 参考訳(メタデータ) (2025-09-24T13:27:35Z) - Anomalous Decision Discovery using Inverse Reinforcement Learning [3.3675535571071746]
異常検出は、知覚システムを通じて異常な行動を特定することによって、自律走行車(AV)において重要な役割を果たす。
現在のアプローチは、しばしば定義済みのしきい値や教師付き学習パラダイムに依存するが、目に見えないシナリオに直面すると効果が低下する。
異常検出のための新しいIRLフレームワークである Trajectory-Reward Guided Adaptive Pre-training (TRAP) を提案する。
論文 参考訳(メタデータ) (2025-07-06T17:01:02Z) - Active Test-time Vision-Language Navigation [60.69722522420299]
ATENAは、不確実なナビゲーション結果に対するエピソードフィードバックを通じて、実用的な人間とロボットのインタラクションを可能にする、テスト時のアクティブな学習フレームワークである。
特にATENAは、成功エピソードにおける確実性を高め、失敗エピソードにおいてそれを減らすことを学び、不確実性の校正を改善している。
さらに,自信ある予測に基づいて,エージェントがナビゲーション結果を評価することができる自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-07T02:24:44Z) - Black-Box Adversarial Attack on Vision Language Models for Autonomous Driving [65.61999354218628]
我々は、自律運転システムにおいて、視覚言語モデル(VLM)をターゲットとしたブラックボックス敵攻撃を設計する第一歩を踏み出す。
セマンティクスの生成と注入による低レベル推論の分解を目標とするカスケーディング・アディバーショナル・ディスラプション(CAD)を提案する。
本稿では,高レベルリスクシナリオの理解と構築に代理VLMを活用することで,動的適応に対処するリスクシーンインジェクションを提案する。
論文 参考訳(メタデータ) (2025-01-23T11:10:02Z) - Generating Critical Scenarios for Testing Automated Driving Systems [5.975915967339764]
AVASTRAは、自律運転システムをテストするための現実的な重要なシナリオを生成するための強化学習ベースのアプローチである。
その結果、AVASTRAは、30%から115%の衝突シナリオを発生させることで、最先端のアプローチを上回る能力を示している。
論文 参考訳(メタデータ) (2024-12-03T16:59:30Z) - BehAVExplor: Behavior Diversity Guided Testing for Autonomous Driving
Systems [27.223488110349567]
自律運転システム(ADS)のテストは、信頼性と安全性を確保するための重要なタスクである。
既存の手法は主に安全違反の検索に重点を置いており、生成したテストケースの多様性は無視されている。
本研究では,エゴ車両の挙動を探索し,多様な違反を検出するために,行動誘導型ファジリング技術(BehAVExplor)を提案する。
論文 参考訳(メタデータ) (2023-07-14T17:24:39Z) - Realistic Safety-critical Scenarios Search for Autonomous Driving System
via Behavior Tree [8.286351881735191]
本研究では,行動木に基づくテストフレームワークであるMatrix-Fuzzerを提案し,現実的な安全クリティカルなテストシナリオを自動的に生成する。
提案手法では, 安全クリティカルシナリオのタイプが最も多いが, ベースラインアルゴリズムと比較して, 全体の30%程度しか生成できない。
論文 参考訳(メタデータ) (2023-05-11T06:53:03Z) - Adaptive Failure Search Using Critical States from Domain Experts [9.93890332477992]
フェールサーチは、シミュレーションまたは実世界のテストにおいて、かなりの走行距離をロギングすることで行うことができる。
ASTはマルコフ決定プロセスとして失敗探索の問題を提起する手法である。
ASTフレームワークにクリティカルステートを組み込むことで,安全性違反の増大を伴う障害シナリオが生成されることを示す。
論文 参考訳(メタデータ) (2023-04-01T18:14:41Z) - Policy Smoothing for Provably Robust Reinforcement Learning [109.90239627115336]
入力のノルム有界対向摂動に対する強化学習の証明可能な堅牢性について検討する。
我々は、スムーズなポリシーによって得られる全報酬が、入力の摂動のノルムバウンドな逆数の下で一定の閾値以下に収まらないことを保証した証明書を生成する。
論文 参考訳(メタデータ) (2021-06-21T21:42:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。