論文の概要: Evaluation as Evolution: Transforming Adversarial Diffusion into Closed-Loop Curricula for Autonomous Vehicles
- arxiv url: http://arxiv.org/abs/2604.07378v1
- Date: Wed, 08 Apr 2026 01:34:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.42715
- Title: Evaluation as Evolution: Transforming Adversarial Diffusion into Closed-Loop Curricula for Autonomous Vehicles
- Title(参考訳): 進化としての評価: 自動運転車の対向拡散をクローズドループキュリキュラに変換する
- Authors: Yicheng Guo, Jiaqi Liu, Chengkai Xu, Peng Hang, Jian Sun,
- Abstract要約: 本研究では,敵対的生成を適応的な進化カリキュラムに変換するクローズドループフレームワークであるAccess as Evolution(E2$)を紹介する。
我々は、トポロジ駆動型サポート選択を利用して重要な相互作用エージェントを特定し、トポロジカルアンチョリングを導入し、プロセスの安定化を図る。
実験的に、$E2$はnuScenesデータセットで9.01%、nuPlanデータセットで最大21.43%の衝突故障発見を改善する。
- 参考スコア(独自算出の注目度): 43.930171390617055
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous vehicles in interactive traffic environments are often limited by the scarcity of safety-critical tail events in static datasets, which biases learned policies toward average-case behaviors and reduces robustness. Existing evaluation methods attempt to address this through adversarial stress testing, but are predominantly open-loop and post-hoc, making it difficult to incorporate discovered failures back into the training process. We introduce Evaluation as Evolution ($E^2$), a closed-loop framework that transforms adversarial generation from a static validation step into an adaptive evolutionary curriculum. Specifically, $E^2$ formulates adversarial scenario synthesis as transport-regularized sparse control over a learned reverse-time SDE prior. To make this high-dimensional generation tractable, we utilize topology-driven support selection to identify critical interacting agents, and introduce Topological Anchoring to stabilize the process. This approach enables the targeted discovery of failure cases while strictly constraining deviations from realistic data distributions. Empirically, $E^2$ improves collision failure discovery by 9.01% on the nuScenes dataset and up to 21.43% on the nuPlan dataset over the strongest baselines, while maintaining low invalidity and high realism. It further yields substantial robustness gains when the resulting boundary cases are recycled for closed-loop policy fine-tuning.
- Abstract(参考訳): 対話的な交通環境における自動運転車は、静的データセットにおける安全クリティカルなテールイベントの不足によって制限されることが多い。
既存の評価手法は、敵のストレステストを通じてこの問題に対処しようとするが、主にオープンループとポストホックであり、発見された失敗をトレーニングプロセスに組み込むのが困難である。
静的な検証段階から適応的な進化カリキュラムに変換するクローズドループフレームワークであるAccess as Evolution(E^2$)を紹介する。
具体的には、$E^2$は、学習された逆時間SDEに対する輸送規則化されたスパース制御として、逆シナリオ合成を定式化する。
この高次元生成を可能にするために、トポロジー駆動型サポート選択を用いて重要な相互作用エージェントを識別し、トポロジカルアンチョリングを導入してプロセスの安定化を図る。
このアプローチは、現実的なデータ分布からの逸脱を厳格に制限しながら、障害ケースをターゲットとした発見を可能にする。
実証的に、$E^2$は、nuScenesデータセットで9.01%、最強のベースラインでnuPlanデータセットで最大21.43%の衝突故障発見を改善し、低い無効性と高いリアリズムを維持している。
さらに、結果として生じる境界ケースがクローズドループポリシーの微調整のためにリサイクルされると、かなりの堅牢性を得る。
関連論文リスト
- Rectify, Don't Regret: Avoiding Pitfalls of Differentiable Simulation in Trajectory Prediction [8.730908751307737]
現在のオープンループ軌道モデルは、小さな初期偏差が複雑なエラーを発生させるため、現実の自動運転に苦慮している。
シミュレーションステップ間のグラフを明示的に除去するために、分離された後退水平方向のロールアウトを導入する。
我々の手法はより堅牢な回復戦略をもたらし、目標衝突を最大33.24%削減する。
論文 参考訳(メタデータ) (2026-03-24T16:28:09Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - ELLIPSE: Evidential Learning for Robust Waypoints and Uncertainties [15.18822929289763]
出力ウェイポイントと多変量学習者t予測分布を1つの前方パスで推定する手法であるtextitELLIPSE を提案する。
専門家の軌道付近での摂動を呈する視点下でのコシフトによる過信を低減するため,我々は軽量な領域拡張手順を導入する。
textitELLIPSEはタスク成功率と不確実性の両方をベースラインと比較して改善することを示す。
論文 参考訳(メタデータ) (2026-03-04T20:29:19Z) - Model-Based Policy Adaptation for Closed-Loop End-to-End Autonomous Driving [54.46325690390831]
本稿では,事前学習したE2E運転エージェントのロバスト性と安全性を高めるための汎用フレームワークとして,モデルベースポリシー適応(MPA)を提案する。
MPAは、ジオメトリ一貫性のあるシミュレーションエンジンを用いて、まず様々な対物軌道を生成する。
MPAは拡散ベースのポリシーアダプタを訓練し、基本方針の予測を洗練させ、Q値モデルを多段階に分けて長期的な結果を評価する。
論文 参考訳(メタデータ) (2025-11-26T17:01:41Z) - ResAD: Normalized Residual Trajectory Modeling for End-to-End Autonomous Driving [64.42138266293202]
ResADは正規化された残留軌道モデリングフレームワークである。
学習タスクを再編成し、慣性参照からの残留偏差を予測する。
NAVSIMベンチマークでは、ResADはバニラ拡散ポリシーを用いて最先端のPDMS 88.6を達成している。
論文 参考訳(メタデータ) (2025-10-09T17:59:36Z) - Uncertainty-Aware Trajectory Prediction via Rule-Regularized Heteroscedastic Deep Classification [3.126303871979975]
ShiFT (Spectral Heteroscedastic Informed Forecasting for Trajectories) は、よく校正された不確実性モデリングと情報前処理を組み合わせた新しいフレームワークである。
我々のモデルは、本質的に不確実性が高い交差点のような複雑なシナリオで優れている。
論文 参考訳(メタデータ) (2025-04-17T17:24:50Z) - Time-series Generation by Contrastive Imitation [87.51882102248395]
モーメントマッチングの目的によってモチベーションされ、複合的エラーを軽減し、局所的(しかし前方的な)遷移ポリシーを最適化する。
推論において、学習されたポリシーは反復的なサンプリングのジェネレータとして機能し、学習されたエネルギーはサンプルの品質を評価するための軌道レベル尺度として機能する。
論文 参考訳(メタデータ) (2023-11-02T16:45:25Z) - Off-Policy Evaluation for Large Action Spaces via Policy Convolution [60.6953713877886]
ポリシ・コンボリューション(Policy Convolution)のファミリーは、アクション内の潜在構造を使用して、ログとターゲットポリシを戦略的に畳み込みます。
合成およびベンチマークデータセットの実験では、PCを使用する場合の平均二乗誤差(MSE)が顕著に改善されている。
論文 参考訳(メタデータ) (2023-10-24T01:00:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。