論文の概要: Real-Time Evaluation of Autonomous Systems under Adversarial Attacks
- arxiv url: http://arxiv.org/abs/2605.03491v1
- Date: Tue, 05 May 2026 08:30:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.83693
- Title: Real-Time Evaluation of Autonomous Systems under Adversarial Attacks
- Title(参考訳): 敵攻撃時の自律システムのリアルタイム評価
- Authors: Adithya Mohan, Xujun Xie, Venkatesh Thirugnana Sambandham, Torsten Schön,
- Abstract要約: 本研究は,実世界の交差点運転データに基づくオフライン軌道学習および対向ロバストネス評価フレームワークを提案する。
我々は、MLP(Multi-Layer Perceptron)ベースの行動クローン(BC)、トランスフォーマーベースのオブジェクトトークン化BC、逆強化学習(IRL)の3つの学習パラダイムを訓練し比較する。
予測時間ロバスト性は、複数の交叉シナリオをまたいだ勾配に基づく逆摂動に対して、訓練されたポリシーを適用することによって評価される。
- 参考スコア(独自算出の注目度): 0.29360071145551064
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most evaluations of autonomous driving policies under adversarial conditions are conducted in simulation, due to cost efficiency and the absence of physical risk. However, purely virtual testing fails to capture structural inconsistencies, supervision constraints, and state-representation effects that arise in real-world data and fundamentally shape policy robustness. This work presents an offline trajectory-learning and adversarial robustness evaluation framework grounded in real-world intersection driving data. Within a controlled data contract, we train and compare three trajectory-learning paradigms: Multi-Layer Perceptron (MLP)-based Behavior Cloning (BC), Transformer-based object-tokenized BC, and inverse reinforcement learning (IRL) formulated within a Generative Adversarial Imitation Learning (GAIL) framework. Models are evaluated using Average Displacement Error (ADE) and Final Displacement Error (FDE). Inference-time robustness is assessed by subjecting trained policies to gradient-based adversarial perturbations across multiple intersection scenarios, yielding a structured robustness evaluation matrix. Results show that state-structure design and architectural inductive biases critically influence adversarial stability, leading to markedly different robustness profiles despite comparable nominal prediction accuracy (ADE < 0.08). Inference-time Projected Gradient Descent (PGD) attacks induce final displacement errors of up to approximately 8 meters. The proposed framework establishes a scalable benchmark for studying offline trajectory learning and adversarial robustness in real-world autonomous driving settings.
- Abstract(参考訳): 対向的な条件下での自律運転政策の評価は,コスト効率と物理的リスクの欠如によりシミュレーションで行われている。
しかし、純粋に仮想テストは、現実世界のデータに生じる構造上の不整合、監督上の制約、および状態表現の影響を捉えることができず、基本的にポリシーの堅牢性を形作る。
本研究は,実世界の交差点運転データに基づくオフライン軌道学習および対向ロバストネス評価フレームワークを提案する。
制御されたデータコントラクト内では、MLP(Multi-Layer Perceptron)ベースの行動クローン(BC)、トランスフォーマーベースのオブジェクトトークン化BC、およびGAIL(Generative Adversarial Imitation Learning)フレームワークで定式化された逆強化学習(IRL)という3つの軌道学習パラダイムを訓練し比較する。
平均変位誤差(ADE)と最終変位誤差(FDE)を用いてモデルを評価する。
予測時間ロバストネスは、複数の交叉シナリオにまたがる勾配に基づく対角摂動に訓練されたポリシーを適用して評価され、構造化されたロバストネス評価行列が得られる。
その結果、状態構造設計とアーキテクチャの帰納バイアスが敵の安定性に重大な影響を及ぼし、同等の精度(ADE < 0.08)にもかかわらず、顕著に異なるロバスト性プロファイルが得られた。
PGD(Inference-time Projected Gradient Descent)攻撃は、最大8mの最終的な変位誤差を引き起こす。
提案フレームワークは,実世界の自律運転環境におけるオフライン軌道学習と対向ロバスト性を研究するためのスケーラブルなベンチマークを確立する。
関連論文リスト
- Evaluation as Evolution: Transforming Adversarial Diffusion into Closed-Loop Curricula for Autonomous Vehicles [43.930171390617055]
本研究では,敵対的生成を適応的な進化カリキュラムに変換するクローズドループフレームワークであるAccess as Evolution(E2$)を紹介する。
我々は、トポロジ駆動型サポート選択を利用して重要な相互作用エージェントを特定し、トポロジカルアンチョリングを導入し、プロセスの安定化を図る。
実験的に、$E2$はnuScenesデータセットで9.01%、nuPlanデータセットで最大21.43%の衝突故障発見を改善する。
論文 参考訳(メタデータ) (2026-04-08T01:34:05Z) - Explainable Autonomous Cyber Defense using Adversarial Multi-Agent Reinforcement Learning [2.0391237204597368]
本稿では,自律型サイバー防御のための因果的マルチエージェント決定フレームワーク(C-MADF)を提案する。
C-MADFは因果モデリングと敵対的二重政治制御を統合している。
現実世界のCICIoT2023データセットでは、C-MADFは偽陽性率を11.2%、9.7%、そして8.4%と3つの最先端文献のベースラインを1.8%に下げている。
論文 参考訳(メタデータ) (2026-04-06T05:40:43Z) - Sim2Act: Robust Simulation-to-Decision Learning via Adversarial Calibration and Group-Relative Perturbation [54.29523408543184]
シミュレーションと意思決定の学習は、現実世界の展開を危険にさらすことなく、デジタル環境で安全なポリシートレーニングを可能にする。
既存のアプローチでは、平均的なシミュレーションの忠実さを改善するか、保守的な正規化を採用するかに重点を置いている。
提案するSim2Actは,シミュレータとポリシーのロバスト性の両方に対処するロバストなシミュレーション・トゥ・意思決定フレームワークである。
論文 参考訳(メタデータ) (2026-03-10T00:51:47Z) - Not All Preferences Are Created Equal: Stability-Aware and Gradient-Efficient Alignment for Reasoning Models [52.48582333951919]
ポリシー更新の信号対雑音比を最大化することにより、アライメントの信頼性を高めるために設計された動的フレームワークを提案する。
SAGE(Stability-Aware Gradient Efficiency)は、モデル能力に基づいて候補プールをリフレッシュする粗いきめ細かいカリキュラムメカニズムを統合する。
複数の数学的推論ベンチマークの実験により、SAGEは収束を著しく加速し、静的ベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-02-01T12:56:10Z) - Model-Based Policy Adaptation for Closed-Loop End-to-End Autonomous Driving [54.46325690390831]
本稿では,事前学習したE2E運転エージェントのロバスト性と安全性を高めるための汎用フレームワークとして,モデルベースポリシー適応(MPA)を提案する。
MPAは、ジオメトリ一貫性のあるシミュレーションエンジンを用いて、まず様々な対物軌道を生成する。
MPAは拡散ベースのポリシーアダプタを訓練し、基本方針の予測を洗練させ、Q値モデルを多段階に分けて長期的な結果を評価する。
論文 参考訳(メタデータ) (2025-11-26T17:01:41Z) - Scalable Offline Metrics for Autonomous Driving [12.613436727986652]
オフラインモデルのパフォーマンスからオンライン設定への外挿は依然として課題だ。
これらの設定では、一見小さなエラーが複雑になり、テスト時間違反や衝突を引き起こします。
シミュレーションで分析したところ、オフラインとオンラインのセッティングの相関は以前の研究よりさらに悪化していた。
論文 参考訳(メタデータ) (2025-10-09T17:59:57Z) - ResAD: Normalized Residual Trajectory Modeling for End-to-End Autonomous Driving [64.42138266293202]
ResADは正規化された残留軌道モデリングフレームワークである。
学習タスクを再編成し、慣性参照からの残留偏差を予測する。
NAVSIMベンチマークでは、ResADはバニラ拡散ポリシーを用いて最先端のPDMS 88.6を達成している。
論文 参考訳(メタデータ) (2025-10-09T17:59:36Z) - Steerable Adversarial Scenario Generation through Test-Time Preference Alignment [58.37104890690234]
対立シナリオ生成は、自律運転システムの安全性評価のためのコスト効率の良いアプローチである。
textbfSteerable textbfAdversarial scenario textbfGEnerator (SAGE) という新しいフレームワークを導入する。
SAGEは、逆境とリアリズムの間のトレードオフを、再トレーニングなしできめ細かいテストタイムコントロールを可能にします。
論文 参考訳(メタデータ) (2025-09-24T13:27:35Z) - RIFT: Group-Relative RL Fine-Tuning for Realistic and Controllable Traffic Simulation [13.319344167881383]
データ駆動シミュレーターにおいて、模擬学習事前学習を行う2段階のAV中心シミュレーションフレームワークを導入する。
次に、物理に基づくシミュレータで微調整を学習し、スタイルレベルの制御性を向上する。
微調整段階において,新しいグループ関連RL微調整戦略であるRIFTを提案する。
論文 参考訳(メタデータ) (2025-05-06T09:12:37Z) - Offline Robotic World Model: Learning Robotic Policies without a Physics Simulator [50.191655141020505]
強化学習(Reinforcement Learning, RL)は、ロボット制御において目覚ましい能力を示してきたが、高いサンプルの複雑さ、安全性の懸念、そしてシム・トゥ・リアルのギャップのため、依然として困難である。
物理シミュレータに頼らずに政策学習を改善するために不確実性を明示的に推定するモデルベースアプローチであるオフラインロボット世界モデル(RWM-O)を導入する。
論文 参考訳(メタデータ) (2025-04-23T12:58:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。