論文の概要: Tex3D: Objects as Attack Surfaces via Adversarial 3D Textures for Vision-Language-Action Models
- arxiv url: http://arxiv.org/abs/2604.01618v1
- Date: Thu, 02 Apr 2026 04:55:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.363379
- Title: Tex3D: Objects as Attack Surfaces via Adversarial 3D Textures for Vision-Language-Action Models
- Title(参考訳): Tex3D:ビジョン・ランゲージ・アクションモデルのための逆3次元テクスチャによる攻撃面としての物体
- Authors: Jiawei Chen, Simin Huang, Jiawei Du, Shuaihang Chen, Yu Tian, Mingjie Wei, Chao Yu, Zhaoxia Yin,
- Abstract要約: 本稿では,FBD(Fbeground-Background Decoupling)を導入し,両面アライメントによるテクスチャ最適化を実現する。
本稿では,行動クリティカルなフレームを優先するトラジェクティブ・アウェア・アドリア最適化(TAAO)を提案する。
Tex3Dは、複数の操作タスク間でVLA性能を著しく低下させ、最大96.7%のタスク故障率を達成する。
- 参考スコア(独自算出の注目度): 24.367080151871487
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vision-language-action (VLA) models have shown strong performance in robotic manipulation, yet their robustness to physically realizable adversarial attacks remains underexplored. Existing studies reveal vulnerabilities through language perturbations and 2D visual attacks, but these attack surfaces are either less representative of real deployment or limited in physical realism. In contrast, adversarial 3D textures pose a more physically plausible and damaging threat, as they are naturally attached to manipulated objects and are easier to deploy in physical environments. Bringing adversarial 3D textures to VLA systems is nevertheless nontrivial. A central obstacle is that standard 3D simulators do not provide a differentiable optimization path from the VLA objective function back to object appearance, making it difficult to optimize through an end-to-end manner. To address this, we introduce Foreground-Background Decoupling (FBD), which enables differentiable texture optimization through dual-renderer alignment while preserving the original simulation environment. To further ensure that the attack remains effective across long-horizon and diverse viewpoints in the physical world, we propose Trajectory-Aware Adversarial Optimization (TAAO), which prioritizes behaviorally critical frames and stabilizes optimization with a vertex-based parameterization. Built on these designs, we present Tex3D, the first framework for end-to-end optimization of 3D adversarial textures directly within the VLA simulation environment. Experiments in both simulation and real-robot settings show that Tex3D significantly degrades VLA performance across multiple manipulation tasks, achieving task failure rates of up to 96.7\%. Our empirical results expose critical vulnerabilities of VLA systems to physically grounded 3D adversarial attacks and highlight the need for robustness-aware training.
- Abstract(参考訳): 視覚言語アクション(VLA)モデルは、ロボット操作において強力な性能を示しているが、物理的に実現可能な敵攻撃に対する堅牢性は、まだ探索されていない。
既存の研究では、言語摂動と2次元視覚攻撃による脆弱性が明らかにされているが、これらの攻撃面は実際の展開を代表していないか、物理的リアリズムに制限されているかのいずれかである。
対照的に、敵の3Dテクスチャは、自然に操作された物体に付着し、物理的環境への展開が容易であるため、より物理的に可塑性で有害な脅威を引き起こす。
敵の3DテクスチャをVLAシステムに持ち込むことは、それでも簡単ではない。
中心的な障害は、標準の3Dシミュレータは、VLAの目的関数からオブジェクトの外観への微分可能な最適化パスを提供していないため、エンドツーエンドの方法での最適化が難しいことである。
そこで本研究では,FBD(フォアグラウンド・バックグラウンド・デカップリング)を導入し,元のシミュレーション環境を保ちながら,デュアルレンダアライメントによるテクスチャ最適化を実現する。
そこで本研究では,行動クリティカルなフレームを優先し,頂点に基づくパラメータ化によって最適化を安定化するTrajectory-Aware Adversarial Optimization (TAAO)を提案する。
これらの設計に基づいて構築されたTex3Dは,VLAシミュレーション環境内で直接3次元対角テクスチャをエンドツーエンドに最適化する最初のフレームワークである。
シミュレーションと実ロボット設定の両方の実験により、Tex3Dは複数の操作タスク間でのVLA性能を著しく低下させ、最大96.7\%のタスク故障率を達成した。
我々の経験的結果は、VLAシステムの物理的に接地された3次元敵攻撃に対する致命的な脆弱性を明らかにし、ロバストネスを意識したトレーニングの必要性を強調している。
関連論文リスト
- R-PGA: Robust Physical Adversarial Camouflage Generation via Relightable 3D Gaussian Splatting [59.29134814041703]
物理的敵対的なカモフラージュは、自律運転システムに深刻なセキュリティ上の脅威をもたらす。
現在の手法は、様々な幾何学的(例えば、視線構成)とラジオメトリックのバリエーションにまたがる一般化に失敗する。
Relightable Physical 3D Gaussian Splatting framework (R-PGA)を提案する。
論文 参考訳(メタデータ) (2026-03-27T04:38:04Z) - From Spatial to Actions: Grounding Vision-Language-Action Model in Spatial Foundation Priors [54.84863164684646]
既存の視覚言語アクション(VLA)モデルは3Dの現実世界で機能するが、通常は2Dエンコーダ上に構築される。
本研究では,アクションヘッドにリッチな3次元空間トークンを注入する新しいパラダイムであるFALCONを紹介する。
論文 参考訳(メタデータ) (2025-10-20T11:26:45Z) - 3DGAA: Realistic and Robust 3D Gaussian-based Adversarial Attack for Autonomous Driving [17.849564138275845]
本稿では,新しい対向オブジェクト生成フレームワークである3D Gaussian-based Adrial Attack (3DGAA)を提案する。
パッチやテクスチャ最適化に依存する以前の作品とは異なり、3DGAAは幾何学的属性と外見的属性の両方を共同で摂動する。
3DGAAは検出mAPを87.21%から7.38%に減らし、既存の3D物理攻撃を著しく上回っている。
論文 参考訳(メタデータ) (2025-07-14T07:27:52Z) - 3D Gaussian Splatting Driven Multi-View Robust Physical Adversarial Camouflage Generation [50.03578546845548]
物理敵攻撃法は、ディープニューラルネットワークの脆弱性を露呈し、自律運転のような安全クリティカルなシナリオに重大な脅威をもたらす。
カモフラージュをベースとした物理的な攻撃は、パッチベースの攻撃よりも有望なアプローチであり、複雑な物理的環境においてより強力な対逆効果を提供する。
本稿では,PGAと命名された3Dガウススティング(3DGS)に基づく物理的攻撃フレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-02T05:10:16Z) - R3D2: Realistic 3D Asset Insertion via Diffusion for Autonomous Driving Simulation [78.26308457952636]
本稿では,自律運転シミュレーションの限界を克服する軽量な1ステップ拡散モデルであるR3D2を紹介する。
シャドウや一貫した照明など、妥当なレンダリング効果を生み出すことで、既存のシーンに完全な3Dアセットを現実的に挿入することができる。
R3D2は挿入されたアセットの現実性を大幅に向上させ,テキストから3Dへのアセット挿入やクロスシーン/データセットオブジェクト転送といったユースケースを可能にした。
論文 参考訳(メタデータ) (2025-06-09T14:50:19Z) - Atlas3D: Physically Constrained Self-Supporting Text-to-3D for Simulation and Fabrication [50.541882834405946]
我々は,テキストから3Dへの自動的実装であるAtlas3Dを紹介する。
提案手法は,新しい微分可能シミュレーションに基づく損失関数と,物理的にインスパイアされた正規化を組み合わせたものである。
我々は、Atlas3Dの有効性を広範囲な生成タスクを通して検証し、シミュレーションと実環境の両方で結果の3Dモデルを検証する。
論文 参考訳(メタデータ) (2024-05-28T18:33:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。