論文の概要: Cross-Modal Phantom: Coordinated Camera-LiDAR Spoofing Against Multi-Sensor Fusion in Autonomous Vehicles
- arxiv url: http://arxiv.org/abs/2604.21841v1
- Date: Thu, 23 Apr 2026 16:32:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.765747
- Title: Cross-Modal Phantom: Coordinated Camera-LiDAR Spoofing Against Multi-Sensor Fusion in Autonomous Vehicles
- Title(参考訳): クロスモーダルファントム:自律走行車におけるマルチセンサーフュージョンに対するカメラ-LiDARの対応
- Authors: Shahriar Rahman Khan, Raiful Hasan,
- Abstract要約: 我々は,マルチセンサ・フュージョンの冗長性を回避できるかどうかを,クロスセンサの整合性を利用して検討する。
我々は,3次元空間に配置した視点認識画像パッチと合成LiDAR点クラスタを挿入することで,センサレベルの結果をシミュレートする。
400KITTIのシーンを大規模に評価したところ、コーディネートされたスプーフィングは85.5%の攻撃率で最先端の知覚モデルであることがわかった。
- 参考スコア(独自算出の注目度): 2.1485350418225244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous Vehicles (AVs) increasingly depend on Multi-Sensor Fusion (MSF) to combine complementary modalities such as cameras and LiDAR for robust perception. While this redundancy is intended to safeguard against single-sensor failures, the fusion process itself introduces a subtle and underexplored vulnerability. In this work, we investigate whether an attacker can bypass MSF's redundancy by fabricating cross-sensor consistency, making multiple sensors agree on the same false object. We design a coordinated, data-level (early-fusion) attack that emulates the outcome of two synchronized physical spoofing sources: an infrared (IR) projection that induces a false camera detection and a LiDAR signal injection that produces a matching 3D point cluster. Rather than implementing the physical attack hardware, we simulate its sensor-level outcomes by inserting perspective-aware image patches and synthetic LiDAR point clusters aligned in 3D space. This approach preserves the perceptual effects that real IR and IEMI-based spoofing would create at the sensor output. Using 400 KITTI scenes, our large-scale evaluation shows that the coordinated spoofing deceives a state-of-the-art perception model with an 85.5% successful attack rate. These findings provide the first quantitative evidence that malicious cross-modal consistency can compromise MSF-based perception, revealing a critical vulnerability in the core data-fusion logic of modern autonomous vehicle systems.
- Abstract(参考訳): 自律走行車(AV)は、カメラやLiDARのような相補的なモダリティを組み合わせるために、MSF(Multi-Sensor Fusion)にますます依存している。
この冗長性は単一センサーの障害に対する防御を目的としているが、融合プロセス自体は微妙で未発見の脆弱性を導入している。
本研究では,複数のセンサが同一の偽物体に一致するようにして,クロスセンサの整合性を作製することにより,攻撃者がMRFの冗長性を回避できるかどうかを検討する。
我々は、2つの同期された物理的スプーフィングソースの結果をエミュレートする座標されたデータレベル(初期核融合)攻撃を設計する。
物理的攻撃ハードウェアを実装する代わりに、3次元空間に並んだ視点認識画像パッチと合成LiDAR点クラスタを挿入することにより、センサレベルの結果のシミュレートを行う。
このアプローチは、実際のIRとIEMIベースのスプーフィングがセンサー出力で生み出す知覚効果を保存する。
400KITTIのシーンを用いて大規模な評価を行ったところ、コーディネートされたスプーフィングは85.5%の攻撃率で最先端の知覚モデルであることがわかった。
これらの発見は、悪意のあるクロスモーダル一貫性がMSFベースの認識を損なう可能性を示す最初の定量的証拠となり、現代の自動運転車システムのコアデータ融合ロジックに重大な脆弱性が明らかとなった。
関連論文リスト
- SoK: The Next Frontier in AV Security: Systematizing Perception Attacks and the Emerging Threat of Multi-Sensor Fusion [4.2011410580007515]
SoKは、自動運転車に対する知覚層攻撃に関する48の研究を体系化している。
センサタイプ,攻撃ステージ,メディア,知覚モジュールによって構成された20個の攻撃ベクトルの統一分類法を開発した。
我々は,赤外線とライダースプーフィングを組み合わせた概念実証シミュレーションにより,融合レベルの脆弱性を検証する。
論文 参考訳(メタデータ) (2026-04-22T14:37:57Z) - UP-Fuse: Uncertainty-guided LiDAR-Camera Fusion for 3D Panoptic Segmentation [17.310791153991975]
本稿では,新しい不確実性を考慮した融合フレームワークUP-Fuseを紹介する。
生のLiDARデータはまずレンジビューに投影され、LiDARエンコーダによってエンコードされる。
カメラ機能は同時に抽出され、同じ共有空間に投影される。
論文 参考訳(メタデータ) (2026-02-22T21:34:29Z) - ForensicsSAM: Toward Robust and Unified Image Forgery Detection and Localization Resisting to Adversarial Attack [56.0056378072843]
高い転送性を持つ逆画像は上流モデルでのみ作成可能であることを示す。
本稿では,IFDLフレームワークを組み込んだForensicsSAMを提案する。
論文 参考訳(メタデータ) (2025-08-10T16:03:44Z) - Temporal Misalignment Attacks against Multimodal Perception in Autonomous Driving [23.83773255227831]
DejaVuは車載ネットワークを利用して、センサストリーム間の遅延を誘導し、微妙な時間的ミスアライメントを生成する攻撃である。
包括的攻撃分析により,センサのタスク特異的な不均衡感が明らかになった。
シングルフレームのLiDAR遅延では、攻撃者は車検出のmAPを最大88.5%削減し、3フレームのカメラ遅延、車滴の多重物体追跡精度(MOTA)を73%削減できる。
論文 参考訳(メタデータ) (2025-07-12T00:44:26Z) - Multi-Modal 3D Object Detection by Box Matching [109.43430123791684]
マルチモーダル3次元検出のためのボックスマッチング(FBMNet)による新しいフュージョンネットワークを提案する。
3Dオブジェクトと2Dオブジェクトの提案を学習することで、ROI特徴を組み合わせることで、検出のための融合を効果的に行うことができる。
論文 参考訳(メタデータ) (2023-05-12T18:08:51Z) - Benchmarking the Robustness of LiDAR-Camera Fusion for 3D Object
Detection [58.81316192862618]
自律運転における3D知覚のための2つの重要なセンサーは、カメラとLiDARである。
これら2つのモダリティを融合させることで、3次元知覚モデルの性能を大幅に向上させることができる。
我々は、最先端の核融合法を初めてベンチマークした。
論文 参考訳(メタデータ) (2022-05-30T09:35:37Z) - Sensor Adversarial Traits: Analyzing Robustness of 3D Object Detection
Sensor Fusion Models [16.823829387723524]
我々は,高性能でオープンソースのセンサ融合モデルアーキテクチャの強靭性を敵攻撃に対して解析する。
LIDARセンサーを使用しているにもかかわらず、このモデルは、意図的に構築された画像ベースの敵攻撃に対して脆弱であることがわかった。
論文 参考訳(メタデータ) (2021-09-13T23:38:42Z) - Invisible for both Camera and LiDAR: Security of Multi-Sensor Fusion
based Perception in Autonomous Driving Under Physical-World Attacks [62.923992740383966]
本稿では,MDFに基づくADシステムにおけるセキュリティ問題の最初の研究について述べる。
物理的に実現可能な逆3Dプリントオブジェクトを生成し、ADシステムが検出に失敗してクラッシュする。
以上の結果から,攻撃は様々なオブジェクトタイプおよびMSFに対して90%以上の成功率を達成した。
論文 参考訳(メタデータ) (2021-06-17T05:11:07Z) - Exploring Adversarial Robustness of Multi-Sensor Perception Systems in
Self Driving [87.3492357041748]
本稿では,敵物体をホスト車両の上に配置することで,マルチセンサ検出の実用的感受性を示す。
実験の結果, 攻撃が成功した原因は主に画像の特徴が損なわれやすいことが判明した。
よりロバストなマルチモーダル知覚システムに向けて,特徴分断を伴う敵対的訓練が,このような攻撃に対するロバスト性を大幅に高めることを示す。
論文 参考訳(メタデータ) (2021-01-17T21:15:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。