論文の概要: SABER: A Stealthy Agentic Black-Box Attack Framework for Vision-Language-Action Models
- arxiv url: http://arxiv.org/abs/2603.24935v1
- Date: Thu, 26 Mar 2026 01:56:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.045235
- Title: SABER: A Stealthy Agentic Black-Box Attack Framework for Vision-Language-Action Models
- Title(参考訳): SABER:視覚言語アクションモデルのためのステルスエージェントブラックボックス攻撃フレームワーク
- Authors: Xiyang Wu, Guangyao Shi, Qingzi Wang, Zongxia Li, Amrit Singh Bedi, Dinesh Manocha,
- Abstract要約: SABERは、VLAモデルに対する命令ベースの敵攻撃を自動的に生成するエージェント中心のアプローチである。
SABERはタスク成功率を20.6%減らし,アクションシーケンス長を55%増し,制約違反を33%減らした。
- 参考スコア(独自算出の注目度): 55.48982086345088
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vision-language-action (VLA) models enable robots to follow natural-language instructions grounded in visual observations, but the instruction channel also introduces a critical vulnerability: small textual perturbations can alter downstream robot behavior. Systematic robustness evaluation therefore requires a black-box attacker that can generate minimal yet effective instruction edits across diverse VLA models. To this end, we present SABER, an agent-centric approach for automatically generating instruction-based adversarial attacks on VLA models under bounded edit budgets. SABER uses a GRPO-trained ReAct attacker to generate small, plausible adversarial instruction edits using character-, token-, and prompt-level tools under a bounded edit budget that induces targeted behavioral degradation, including task failure, unnecessarily long execution, and increased constraint violations. On the LIBERO benchmark across six state-of-the-art VLA models, SABER reduces task success by 20.6%, increases action-sequence length by 55%, and raises constraint violations by 33%, while requiring 21.1% fewer tool calls and 54.7% fewer character edits than strong GPT-based baselines. These results show that small, plausible instruction edits are sufficient to substantially degrade robot execution, and that an agentic black-box pipeline offers a practical, scalable, and adaptive approach for red-teaming robotic foundation models.
- Abstract(参考訳): VLA(Vision-Language-action)モデルは、ロボットが視覚的な観察に基づく自然言語の指示に従うことを可能にする。
したがって、体系的な堅牢性評価には、様々なVLAモデルにまたがる最小限の効果的な命令編集を生成するブラックボックス攻撃が必要である。
そこで本研究では,有界編集予算下でのVLAモデルに対する命令ベースの敵攻撃を自動的に生成するエージェント中心のアプローチであるSABERを提案する。
SABERはGRPO訓練されたReActアタッカーを使用して、タスク障害、不要な長期実行、制約違反の増加を含む、目標とした動作劣化を誘発する境界付き編集予算の下で、文字、トークン、およびプロンプトレベルのツールを使用して、小さく、妥当な敵の命令編集を生成する。
6つの最先端VLAモデルのLIBEROベンチマークでは、タスク成功率を20.6%削減し、アクションシーケンス長を55%増加させ、制約違反を33%増加させ、21.1%のツールコールと54.7%の文字編集を必要とする。
これらの結果から,ロボット実行を著しく劣化させるためには,小型で信頼性の高い命令編集が十分であり,エージェントブラックボックスパイプラインは,ロボット基礎モデルの実用的でスケーラブルで適応的なアプローチを提供することが示された。
関連論文リスト
- AtomVLA: Scalable Post-Training for Robotic Manipulation via Predictive Latent World Models [9.608633915316252]
VLA(Vision-Language-Action)モデルでは、一般化可能なロボット操作の可能性を示している。
現在のパラダイムは、教師付き微調整中の粗大でハイレベルなタスク命令に依存している。
スケーラブルなオフライン後トレーニングパイプラインと統合された,最初のサブタスク対応VLAフレームワークである方法を提案する。
論文 参考訳(メタデータ) (2026-03-09T15:52:48Z) - CARE: Multi-Task Pretraining for Latent Continuous Action Representation in Robot Control [39.17038025776311]
CAREは、ロボットタスク実行のためのVLAモデルをトレーニングするために設計されたフレームワークである。
CAREはビデオテキストペアのみを活用することで、明示的なアクションラベルの必要性を排除している。
結果は, ロボット制御におけるCAREのスケーラビリティ, 解釈可能性, 有効性を示す。
論文 参考訳(メタデータ) (2026-01-30T02:28:32Z) - Automated Red-Teaming Framework for Large Language Model Security Assessment: A Comprehensive Attack Generation and Detection System [4.864011355064205]
本稿では,大規模言語モデル(LLM)におけるセキュリティ脆弱性を明らかにするための,敵のプロンプトを生成し,実行し,評価する自動リピートフレームワークを提案する。
本フレームワークは,メタプロンプトに基づく攻撃合成,マルチモーダル脆弱性検出,および6つの主要な脅威カテゴリにまたがる標準化された評価プロトコルを統合する。
GPT-OSS-20Bモデルの実験では、21の重大度と12の新たな攻撃パターンを含む47の異なる脆弱性が明らかになった。
論文 参考訳(メタデータ) (2025-12-21T19:12:44Z) - TabVLA: Targeted Backdoor Attacks on Vision-Language-Action Models [63.51290426425441]
バックドア付きVLAエージェントは、プレインジェクトされたバックドアによって隠蔽的にトリガーされ、敵のアクションを実行することができる。
我々は,VLAモデルに対するターゲットバックドア攻撃について検討し,ブラックボックスファインチューニングによる攻撃を可能にする新しいフレームワークであるTabVLAを紹介した。
我々の研究は、バックドア操作をターゲットにしたVLAモデルの脆弱性を強調し、より高度な防御の必要性を強調します。
論文 参考訳(メタデータ) (2025-10-13T02:45:48Z) - Contrastive Representation Regularization for Vision-Language-Action Models [64.10170453130324]
本稿では,ビジョン・ランゲージ・アクション(VLA)モデルの表現正規化であるロボット状態認識コントラスト損失(RS-CL)を紹介する。
特に、RS-CLは、状態間の相対的な距離をソフト・インスペクションとして使用することにより、ロボットの受容状態とより密に表現する。
実験の結果,RS-CLは最先端VLAモデルの操作性能を大幅に向上することが示された。
論文 参考訳(メタデータ) (2025-10-02T06:41:22Z) - FreezeVLA: Action-Freezing Attacks against Vision-Language-Action Models [124.02734355214325]
Vision-Language-Action(VLA)モデルはロボティクスの急速な進歩を加速している。
敵画像はVLAモデルを「凍結」し、その後の命令を無視する。
FreezeVLAは、min-maxバイレベル最適化を通じて、アクション凍結攻撃を生成し、評価する。
論文 参考訳(メタデータ) (2025-09-24T08:15:28Z) - Exploring the Adversarial Vulnerabilities of Vision-Language-Action Models in Robotics [68.36528819227641]
本稿では,ビジョン・ランゲージ・アクション(VLA)モデルのロバスト性を体系的に評価する。
本研究では,ロボット行動の不安定化に空間的基盤を活用する2つの未目標攻撃目標と,ロボット軌道を操作する目標攻撃目標を導入する。
我々は、カメラの視野に小さなカラフルなパッチを配置し、デジタルと物理の両方の環境で効果的に攻撃を実行する逆パッチ生成アプローチを設計する。
論文 参考訳(メタデータ) (2024-11-18T01:52:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。