Fugu-MT 論文翻訳(概要): Giving AI a Headache: Acoustic Adversarial Attacks to Computer Vision Applications

論文の概要: Giving AI a Headache: Acoustic Adversarial Attacks to Computer Vision Applications

arxiv url: http://arxiv.org/abs/2606.14658v1
Date: Fri, 12 Jun 2026 17:22:53 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-15 16:00:43.011118
Title: Giving AI a Headache: Acoustic Adversarial Attacks to Computer Vision Applications
Title（参考訳）: AIに頭痛を与える - コンピュータビジョンアプリケーションに対するアコースティック・アタック
Authors: Nicole Villavicencio-Garduño, Maksim Ekin Eren, Milo Prisbrey, Ben Migliori, Michael Teti,
Abstract要約: 音波振動は, 内部安定化機構を介し, 実物の動きを誘導できることを示す。動きは、安定化システムが扱うように設計された条件の外に落ちるため、システムはフレームにアーティファクトを導入し、AIベースのCVモデルにミス分類、ターゲットミス、幻覚を発生させる。
参考スコア（独自算出の注目度）: 0.8808021343665321
License: http://creativecommons.org/publicdomain/zero/1.0/
Abstract: Artificial Intelligence (AI) is increasingly used to automate a variety of real-world computer vision (CV) applications, such as autonomous vehicle control, facial recognition, and security cameras. Recent research has shown that acoustic vibration can induce real physical motion in cameras, interfering with their internal stabilization mechanisms. Because the motion falls outside the conditions the stabilization system was designed to handle, the system introduces artifacts into the frame, causing AI-based CV models to misclassify, miss targets, or hallucinate objects. Previous work used ultrasonic frequencies (>20 kHz) to perform short-range attacks, which limits them to short distances due to the attenuation exhibited by high frequencies. In this work, we investigate acoustic attacks using lower frequencies in the audible range (<20 kHz), and we further expand our analysis to include how various image and object features are affected by the attacks. Specifically, we performed physical experiments to demonstrate the viability of our attacks on an off-the-shelf object detection model (YOLO11) by resonating a commercially available camera with various frequencies. Based on our results, we provide insights into several factors that make an AI CV system more vulnerable to these attacks, which could help inform the development of future mitigation strategies.
Abstract（参考訳）: 人工知能(AI)は、自動運転車の制御、顔認識、セキュリティカメラなど、様々な現実世界のコンピュータビジョン(CV)アプリケーションを自動化するためにますます使われている。近年の研究では、音波振動はカメラの内部安定化機構を介し、実際の物理運動を誘導できることが示されている。動きは、安定化システムが扱うように設計された条件の外に落ちるため、システムはフレームにアーティファクトを導入し、AIベースのCVモデルにミス分類、ターゲットミス、幻覚を発生させる。従来は超音波周波数(>20 kHz)を使用して短距離攻撃を行い、高周波数で現れる減衰のために短距離に制限されていた。本研究では, 可聴域 (20kHz) における低周波音波を用いた音響攻撃について検討し, さらに解析を拡大し, 様々な画像・物体の特徴が攻撃に与える影響について考察する。具体的には、市販カメラに様々な周波数で共鳴させることで、オフザシェルフ物体検出モデル(YOLO11)に対する攻撃の有効性を示す物理実験を行った。この結果に基づき,AI CV システムをこれらの攻撃に対してより脆弱にするためのいくつかの要因に関する洞察を提供する。

関連論文リスト

FreezeVLA: Action-Freezing Attacks against Vision-Language-Action Models [124.02734355214325]
Vision-Language-Action(VLA)モデルはロボティクスの急速な進歩を加速している。敵画像はVLAモデルを「凍結」し、その後の命令を無視する。 FreezeVLAは、min-maxバイレベル最適化を通じて、アクション凍結攻撃を生成し、評価する。
論文参考訳（メタデータ） (2025-09-24T08:15:28Z)
ANNIE: Be Careful of Your Robots [48.89876809734855]
エンボディドAIシステムに対する敵の安全攻撃に関する最初の体系的研究について述べる。すべての安全カテゴリーで攻撃の成功率は50%を超えている。結果は、実証済みのAIシステムにおいて、これまで未調査だったが、非常に連続的な攻撃面を露呈する。
論文参考訳（メタデータ） (2025-09-03T15:00:28Z)
Measuring the Robustness of Audio Deepfake Detectors [59.09338266364506]
この研究は、16の一般的な汚職に対する10のオーディオディープフェイク検出モデルの頑健さを体系的に評価する。従来のディープラーニングモデルと最先端の基礎モデルの両方を用いて、4つのユニークな観察を行う。
論文参考訳（メタデータ） (2025-03-21T23:21:17Z)
Exploring the Adversarial Vulnerabilities of Vision-Language-Action Models in Robotics [68.36528819227641]
本稿では,ビジョン・ランゲージ・アクション(VLA)モデルのロバスト性を体系的に評価する。本研究では,ロボット行動の不安定化に空間的基盤を活用する2つの未目標攻撃目標と,ロボット軌道を操作する目標攻撃目標を導入する。我々は、カメラの視野に小さなカラフルなパッチを配置し、デジタルと物理の両方の環境で効果的に攻撃を実行する逆パッチ生成アプローチを設計する。
論文参考訳（メタデータ） (2024-11-18T01:52:20Z)
Hidden in Plain Sound: Environmental Backdoor Poisoning Attacks on Whisper, and Mitigations [3.5639148953570836]
本研究では,異なる環境トリガー音を異なる長さのフレーズにマッピングする新しい中毒手法を提案する。我々は、最も人気のあるトランスフォーマーベースのSRモデルであるWhisperで、我々の攻撃に対して非常に脆弱であることを示す。本稿では,この攻撃を抑えるため,防衛機構として,最先端音声活動検出(VAD)モデルであるSilero VAD(Silero VAD)について検討する。
論文参考訳（メタデータ） (2024-09-19T08:21:52Z)
Low-Frequency Black-Box Backdoor Attack via Evolutionary Algorithm [12.711880028935315]
畳み込みニューラルネットワーク(CNN)はコンピュータビジョンタスクで成功したが、バックドア攻撃に弱い。周波数スペクトルの低周波成分を最小限に摂動させる強力な低周波ブラックボックスバックドアアタック(LFBA)を提案する。実世界のデータセットの実験は、画像処理操作と最先端のバックドア防御に対するLFBAの有効性と堅牢性を検証する。
論文参考訳（メタデータ） (2024-02-23T23:36:36Z)
Why Don't You Clean Your Glasses? Perception Attacks with Dynamic Optical Perturbations [17.761200546223442]
敵の攻撃を物理的世界に適応させることが、攻撃者にとって望ましい。 EvilEyeは、ディスプレイを透過的に利用し、ダイナミックな物理的逆転の例を生成する、中間者認識攻撃である。
論文参考訳（メタデータ） (2023-07-24T21:16:38Z)
FIBA: Frequency-Injection based Backdoor Attack in Medical Image Analysis [82.2511780233828]
本稿では,様々な医療画像解析タスクにおいて,攻撃を行うことのできる新しい周波数注入型バックドアアタック法(FIBA)を提案する。具体的には、FIBAは、両方の画像のスペクトル振幅を線形に組み合わせることで、トリガー画像の低周波情報を有毒画像に注入できる周波数領域のトリガー関数を利用する。
論文参考訳（メタデータ） (2021-12-02T11:52:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。