論文の概要: Adversarial Flow Matching for Imperceptible Attacks on End-to-End Autonomous Driving
- arxiv url: http://arxiv.org/abs/2605.00880v1
- Date: Sun, 26 Apr 2026 09:12:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.442025
- Title: Adversarial Flow Matching for Imperceptible Attacks on End-to-End Autonomous Driving
- Title(参考訳): エンド・ツー・エンド自動運転における非知覚的攻撃に対する逆流マッチング
- Authors: Xinyu Zeng, Xiangkun He, Lei Tao, Chen Lv, Hong Cheng,
- Abstract要約: Adversarial Flow Matching (AFM)は、E2E ADモデルでTransformer構造上の脆弱性を利用する新しいグレーボックス攻撃フレームワークである。
AFMは、最先端の視覚的非受容性を維持しながら、攻撃の有効性と非受容性の間の優れたトレードオフを達成する。
- 参考スコア(独自算出の注目度): 42.892609033099774
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous driving (AD) is evolving towards end-to-end (E2E) frameworks through two primary paradigms: monolithic models exemplified by Vision-Language-Action (VLA), and specialized modular architectures. Despite their divergent designs, both paradigms increasingly rely on Transformer backbones for complex reasoning, potentially causing a shared vulnerability: visually imperceptible perturbations can manipulate E2E AD models into hazardous maneuvers by targeting the Transformer module. Most existing adversarial attack approaches against AD systems operate under white-box or black-box settings; yet, they typically necessitate full model transparency, or suffer from either prohibitive query latency or limited attack transferability. In this paper, we propose Adversarial Flow Matching (AFM), a novel gray-box attack framework that exploits Transformer structural vulnerabilities in E2E AD models. AFM enables efficient one-step generation of adversarial examples via a neural average velocity field. Additionally, the proposed technique yields effective and visually imperceptible attacks by synergistically perturbing the generative latent space and the neural average velocity field. Extensive experiments demonstrate that AFM achieves a superior trade-off between attack effectiveness and imperceptibility: it substantially degrades the performance of both VLA and modular AD agents across various scenarios compared to baselines, while maintaining state-of-the-art visual imperceptibility. Furthermore, adversarial examples generated by AFM exhibit robust cross-model transferability, indicating that AFM closely approximates a black-box attack setting while requiring only the prior knowledge that the target AD model incorporates a Transformer-based module.
- Abstract(参考訳): 自律運転(AD)は、VLA(Vision-Language-Action)で実証されたモノリシックモデルと、特殊なモジュールアーキテクチャという、2つの主要なパラダイムを通じて、エンドツーエンド(E2E)フレームワークへと進化している。
両パラダイムは分離した設計にもかかわらず、複雑な推論のためにトランスフォーマーのバックボーンをますます頼りにしており、共有された脆弱性を引き起こしている可能性がある: 視覚的に知覚できない摂動はトランスフォーマーモジュールを標的にすることでE2E ADモデルを危険な操作に操作することができる。
既存のADシステムに対する攻撃アプローチは、ホワイトボックスやブラックボックスの設定で運用されているが、通常は完全なモデルの透明性を必要とする。
本稿では,E2E ADモデルにおけるトランスフォーマー構造的脆弱性を利用した新しいグレーボックス攻撃フレームワークであるAdversarial Flow Matching (AFM)を提案する。
AFMは、ニューラル平均速度場を介して、敵例の効率的な1ステップ生成を可能にする。
さらに、提案手法は、生成潜在空間とニューラル平均速度場を相乗的に摂動させることにより、効果的で視覚的に知覚できない攻撃を与える。
大規模な実験により、AFMは攻撃の有効性と非受容性の間に優れたトレードオフを達成し、ベースラインと比較してVLAとモジュールADエージェントの性能を著しく低下させ、最先端の視覚的不受容性を維持しながら、様々なシナリオで性能を低下させる。
さらに、AFMが生成した敵の例は堅牢なクロスモデル転送可能性を示し、AFMがターゲットADモデルにTransformerベースのモジュールが組み込まれているという事前の知識だけを必要としながら、ブラックボックス攻撃設定に近づいたことを示している。
関連論文リスト
- When Robots Obey the Patch: Universal Transferable Patch Attacks on Vision-Language-Action Models [81.7618160628979]
VLA(Vision-Language-Action)モデルは敵の攻撃に弱いが、普遍的かつ移動可能な攻撃は未発見のままである。
UPA-RFAS(Universal Patch Attack via Robust Feature, Attention, and Semantics)は、単一の物理的パッチを共有機能空間で学習する統合フレームワークである。
多様なVLAモデル、操作スイート、物理実行の実験は、UPA-RFASがモデル、タスク、視点を一貫して移行していることを示している。
論文 参考訳(メタデータ) (2025-11-26T09:16:32Z) - From Pretrain to Pain: Adversarial Vulnerability of Video Foundation Models Without Task Knowledge [57.379583179331426]
本稿では、ダウンストリームモデルやオープンソースのVFMから微調整されたMLLMを攻撃することによる、新規で実用的な敵の脅威シナリオについて検討する。
本稿では,VFMの時間的表現ダイナミクスを利用して効果的な摂動を発生させる,時間的対応型対向攻撃手法であるTransferable Video Attack (TVA)を提案する。
TVAは高価なサロゲートモデルのトレーニングやドメイン固有のデータへのアクセスを回避し、より実用的で効率的な攻撃戦略を提供する。
論文 参考訳(メタデータ) (2025-11-10T12:42:32Z) - Universal Camouflage Attack on Vision-Language Models for Autonomous Driving [67.34987318443761]
自動運転のためのビジュアル言語モデリングが、有望な研究方向として浮上している。
VLM-ADは、敵の攻撃による深刻なセキュリティ脅威に弱いままである。
VLM-ADのための最初のユニバーサルカモフラージュ攻撃フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-24T14:52:01Z) - Enhancing Adversarial Transferability with Adversarial Weight Tuning [50.01825144613307]
敵対的な例(AE)は、人間の観察者に対して良心を抱きながらモデルを誤解させた。
AWTは、勾配に基づく攻撃法とモデルに基づく攻撃法を組み合わせて、AEの転送可能性を高めるデータフリーチューニング手法である。
論文 参考訳(メタデータ) (2024-08-18T13:31:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。