Fugu-MT 論文翻訳(概要): Black-Box Adversarial Attack on Vision Language Models for Autonomous Driving

論文の概要: Black-Box Adversarial Attack on Vision Language Models for Autonomous Driving

arxiv url: http://arxiv.org/abs/2501.13563v1
Date: Thu, 23 Jan 2025 11:10:02 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-24 19:17:07.255095
Title: Black-Box Adversarial Attack on Vision Language Models for Autonomous Driving
Title（参考訳）: 自動走行のための視覚言語モデルに対するブラックボックス対応攻撃
Authors: Lu Wang, Tianyuan Zhang, Yang Qu, Siyuan Liang, Yuwei Chen, Aishan Liu, Xianglong Liu, Dacheng Tao,
Abstract要約: 我々は、自律運転システムにおいて、視覚言語モデル(VLM)をターゲットとしたブラックボックス敵攻撃を設計する第一歩を踏み出す。セマンティクスの生成と注入による低レベル推論の分解を目標とするカスケーディング・アディバーショナル・ディスラプション(CAD)を提案する。本稿では,高レベルリスクシナリオの理解と構築に代理VLMを活用することで,動的適応に対処するリスクシーンインジェクションを提案する。
参考スコア（独自算出の注目度）: 65.61999354218628
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Vision-language models (VLMs) have significantly advanced autonomous driving (AD) by enhancing reasoning capabilities; however, these models remain highly susceptible to adversarial attacks. While existing research has explored white-box attacks to some extent, the more practical and challenging black-box scenarios remain largely underexplored due to their inherent difficulty. In this paper, we take the first step toward designing black-box adversarial attacks specifically targeting VLMs in AD. We identify two key challenges for achieving effective black-box attacks in this context: the effectiveness across driving reasoning chains in AD systems and the dynamic nature of driving scenarios. To address this, we propose Cascading Adversarial Disruption (CAD). It first introduces Decision Chain Disruption, which targets low-level reasoning breakdown by generating and injecting deceptive semantics, ensuring the perturbations remain effective across the entire decision-making chain. Building on this, we present Risky Scene Induction, which addresses dynamic adaptation by leveraging a surrogate VLM to understand and construct high-level risky scenarios that are likely to result in critical errors in the current driving contexts. Extensive experiments conducted on multiple AD VLMs and benchmarks demonstrate that CAD achieves state-of-the-art attack effectiveness, significantly outperforming existing methods (+13.43% on average). Moreover, we validate its practical applicability through real-world attacks on AD vehicles powered by VLMs, where the route completion rate drops by 61.11% and the vehicle crashes directly into the obstacle vehicle with adversarial patches. Finally, we release CADA dataset, comprising 18,808 adversarial visual-question-answer pairs, to facilitate further evaluation and research in this critical domain. Our codes and dataset will be available after paper's acceptance.
Abstract（参考訳）: 視覚言語モデル(VLM)は推論能力を高めることにより、かなり高度な自律運転(AD)を持つが、これらのモデルは敵の攻撃に対して非常に影響を受けやすいままである。既存の研究はホワイトボックス攻撃をある程度研究してきたが、より実用的で挑戦的なブラックボックスのシナリオは、その固有の難しさのために、ほとんど未発見のままである。本稿では,AD における VLM を対象とするブラックボックス攻撃の設計に向けた第一歩を踏み出す。この文脈で有効なブラックボックス攻撃を実現するための2つの重要な課題は、ADシステムにおける推論チェーンの駆動効果と、駆動シナリオの動的性質である。そこで我々はCascading Adversarial Disruption (CAD)を提案する。まず、決定連鎖破壊(Decision Chain Disruption)を紹介します。これは、偽のセマンティクスの生成と注入によって、低レベルの推論の分解を目標とし、意思決定チェーン全体にわたって摂動が有効であることを保証します。これに基づいてリスクシーンインジェクション(リスクシーンインジェクション)を提案する。これは、サロゲートVLMを活用して、現在の運転状況において致命的なエラーとなる可能性のある高レベルのリスクシナリオを理解し、構築することで、動的適応に対処する。複数のAD VLMとベンチマークで実施された大規模な実験は、CADが最先端の攻撃効果を達成し、既存の手法(平均では+13.43%)よりもはるかに優れていることを示した。さらに,VLMを用いたAD車両に対する現実的な攻撃により,経路完了率が61.11%低下し,車両が対向パッチで障害物車両に直接衝突するという現実的な適用性を検証した。最後に,18,808対の対角的視覚-問合せ対からなるCADAデータセットをリリースし,この重要な領域におけるさらなる評価と研究を容易にする。私たちのコードとデータセットは、論文の受理後に利用可能になります。

関連論文リスト

Reasoning-Augmented Conversation for Multi-Turn Jailbreak Attacks on Large Language Models [53.580928907886324]
Reasoning-Augmented Conversationは、新しいマルチターンジェイルブレイクフレームワークである。有害なクエリを良心的な推論タスクに再構成する。 RACEは,複雑な会話シナリオにおいて,最先端攻撃の有効性を実現する。
論文参考訳（メタデータ） (2025-02-16T09:27:44Z)
LLM-attacker: Enhancing Closed-loop Adversarial Scenario Generation for Autonomous Driving with Large Language Models [39.139025989575686]
大規模言語モデル(LLM)を利用したアクセルループ逆シナリオ生成フレームワーク交通参加者の行動を操作して安全クリティカルな事象を誘発する逆シナリオ生成法が開発されている。 LLM攻撃者は、他の方法よりも危険なシナリオを作成でき、それを用いて訓練されたADSは、通常のシナリオでのトレーニングの半分の衝突率を達成する。
論文参考訳（メタデータ） (2025-01-27T08:18:52Z)
Visual Adversarial Attack on Vision-Language Models for Autonomous Driving [34.520523134588345]
視覚言語モデル(VLM)は推論能力を高めることにより、かなり高度な自律運転(AD)を持つ。これらのモデルは、敵の攻撃に対して非常に脆弱なままである。本稿では,ADVLMに特化して設計された最初の視覚的敵攻撃フレームワークであるADvLMを提案する。
論文参考訳（メタデータ） (2024-11-27T12:09:43Z)
Chain of Attack: On the Robustness of Vision-Language Models Against Transfer-Based Adversarial Attacks [34.40254709148148]
事前学習された視覚言語モデル(VLM)は、画像および自然言語理解において顕著な性能を示した。彼らの潜在的な安全性と堅牢性の問題は、敵がシステムを回避し、悪意のある攻撃を通じて有害なコンテンツを生成することを懸念する。本稿では,マルチモーダルなセマンティック・アップデートに基づいて,敵対的事例の生成を反復的に促進するアタック・チェーン(CoA)を提案する。
論文参考訳（メタデータ） (2024-11-24T05:28:07Z)
Steering Away from Harm: An Adaptive Approach to Defending Vision Language Model Against Jailbreaks [16.508109544083496]
視覚言語モデル(VLM)は、敵の攻撃にさらされると意図しない有害なコンテンツを生成できる。既存の防御(例えば、入力前処理、敵の訓練、応答評価に基づく手法)は、実世界の展開には実用的ではないことが多い。本稿では,VLM攻撃に対する対向的特徴方向からモデルを誘導し,効果的かつ効果的な防御法であるASTRAを提案する。
論文参考訳（メタデータ） (2024-11-23T02:17:17Z)
Towards Transferable Attacks Against Vision-LLMs in Autonomous Driving with Typography [21.632703081999036]
Vision-Large-Language-Models (Vision-LLMs)は、自律走行(AD)システムに統合されつつある。我々は,ビジョンLLMの意思決定能力に頼って,ADシステムに対するタイポグラフィー攻撃を活用することを提案する。
論文参考訳（メタデータ） (2024-05-23T04:52:02Z)
CANEDERLI: On The Impact of Adversarial Training and Transferability on CAN Intrusion Detection Systems [17.351539765989433]
車両と外部ネットワークの統合が拡大し、コントロールエリアネットワーク(CAN)の内部バスをターゲットにした攻撃が急増した。対策として,様々な侵入検知システム(IDS)が文献で提案されている。これらのシステムのほとんどは、機械学習(ML)やディープラーニング(DL)モデルのような、データ駆動のアプローチに依存しています。本稿では,CANベースのIDSをセキュアにするための新しいフレームワークであるCANEDERLIを提案する。
論文参考訳（メタデータ） (2024-04-06T14:54:11Z)
Multi-granular Adversarial Attacks against Black-box Neural Ranking Models [111.58315434849047]
多粒性摂動を取り入れた高品質な逆数例を作成する。我々は,多粒体攻撃を逐次的意思決定プロセスに変換する。本手法は,攻撃の有効性と非受容性の両方において,一般的なベースラインを超えている。
論文参考訳（メタデータ） (2024-04-02T02:08:29Z)
Pre-trained Trojan Attacks for Visual Recognition [106.13792185398863]
PVM(Pre-trained Vision Model)は、下流タスクを微調整する際、例外的なパフォーマンスのため、主要なコンポーネントとなっている。本稿では,PVMにバックドアを埋め込んだトロイの木馬攻撃を提案する。バックドア攻撃の成功において、クロスタスクアクティベーションとショートカット接続がもたらす課題を強調します。
論文参考訳（メタデータ） (2023-12-23T05:51:40Z)
Benchmarking and Defending Against Indirect Prompt Injection Attacks on Large Language Models [79.0183835295533]
我々は,このような脆弱性のリスクを評価するために,BIPIAと呼ばれる間接的インジェクション攻撃のための最初のベンチマークを導入した。我々の分析では、LLMが情報コンテキストと動作可能な命令を区別できないことと、外部コンテンツ内での命令の実行を回避できないことの2つの主要な要因を同定した。ブラックボックスとホワイトボックスという2つの新しい防御機構と、これらの脆弱性に対処するための明確なリマインダーを提案する。
論文参考訳（メタデータ） (2023-12-21T01:08:39Z)
On Evaluating Adversarial Robustness of Large Vision-Language Models [64.66104342002882]
大規模視覚言語モデル(VLM)のロバスト性を,最も現実的で高リスクな環境で評価する。特に,CLIP や BLIP などの事前学習モデルに対して,まず攻撃対象のサンプルを作成する。これらのVLM上のブラックボックスクエリは、ターゲットの回避の効果をさらに向上させることができる。
論文参考訳（メタデータ） (2023-05-26T13:49:44Z)
Downlink Power Allocation in Massive MIMO via Deep Learning: Adversarial Attacks and Training [62.77129284830945]
本稿では,無線環境における回帰問題を考察し,敵攻撃がDLベースのアプローチを損なう可能性があることを示す。また,攻撃に対するDLベースの無線システムの堅牢性が著しく向上することを示す。
論文参考訳（メタデータ） (2022-06-14T04:55:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。