論文の概要: A Portable and Stealthy Inaudible Voice Attack Based on Acoustic Metamaterials
- arxiv url: http://arxiv.org/abs/2501.15031v1
- Date: Sat, 25 Jan 2025 02:27:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 13:53:41.337330
- Title: A Portable and Stealthy Inaudible Voice Attack Based on Acoustic Metamaterials
- Title(参考訳): 音響メタマテリアルに基づく可搬的で頑健な難聴音声アタック
- Authors: Zhiyuan Ning, Juan He, Zhanyong Tang, Weihang Hu, Xiaojiang Chen,
- Abstract要約: 本稿では,音声制御システムにおいて,音響メタマテリアルを活用するための最初のアプローチであるMETAATTACKを提案する。
METAATTACKは、バッグに入れるのに十分な小型のポータブルデバイスを用いて、より長い攻撃範囲と高精度を実現する。
私たちは、MeTAATTACKがSiri、Alexa、Google Assistant、XiaoAI、Xiaoyiなど、音声制御されたパーソナルアシスタントの代表的アシスタントに対して、難解な攻撃を開始するのに使えることを示した。
- 参考スコア(独自算出の注目度): 5.569342520617105
- License:
- Abstract: We present METAATTACK, the first approach to leverage acoustic metamaterials for inaudible attacks for voice control systems. Compared to the state-of-the-art inaudible attacks requiring complex and large speaker setups, METAATTACK achieves a longer attacking range and higher accuracy using a compact, portable device small enough to be put into a carry bag. These improvements in portability and stealth have led to the practical applicability of inaudible attacks and their adaptation to a wider range of scenarios. We demonstrate how the recent advancement in metamaterials can be utilized to design a voice attack system with carefully selected implementation parameters and commercial off-the-shelf components. We showcase that METAATTACK can be used to launch inaudible attacks for representative voice-controlled personal assistants, including Siri, Alexa, Google Assistant, XiaoAI, and Xiaoyi. The average word accuracy of all assistants is 76%, with a range of 8.85 m.
- Abstract(参考訳): 本稿では,音声制御システムにおいて,音響メタマテリアルを活用するための最初のアプローチであるMETAATTACKを提案する。
METAATTACKは、複雑で大規模なスピーカー装置を必要とする最先端の難聴攻撃と比較して、バッグに入れられるほどコンパクトでポータブルなデバイスを使用して、より長い攻撃範囲と高い精度を達成する。
これらのポータビリティとステルスの改善は、難解な攻撃の実践的適用と、より広範なシナリオへの適応につながった。
本稿では,メタマテリアルの最近の進歩を利用して,慎重に選択された実装パラメータと市販オフザシェルフコンポーネントを備えた音声攻撃システムを設計する方法を示す。
私たちは、MeTAATTACKがSiri、Alexa、Google Assistant、XiaoAI、Xiaoyiなど、音声制御されたパーソナルアシスタントの代表的アシスタントに対して、難解な攻撃を開始するのに使えることを示した。
全アシスタントの平均単語精度は76%で、射程は8.85mである。
関連論文リスト
- Audio Is the Achilles' Heel: Red Teaming Audio Large Multimodal Models [50.89022445197919]
我々は、オープンソースのオーディオLMMが有害な音声質問に対して平均69.14%の攻撃成功率を被っていることを示す。
Gemini-1.5-Proの音声固有のジェイルブレイクは、有害なクエリベンチマークで70.67%の攻撃成功率を達成した。
論文 参考訳(メタデータ) (2024-10-31T12:11:17Z) - Adversarial Agents For Attacking Inaudible Voice Activated Devices [0.0]
本論文は、新しいインターネット・オブ・シングの構成に強化学習を適用した。
音声アクティベートデバイスに対する難聴攻撃の分析では,10点中7.6点のアラーム危険因子が確認された。
2024年までに、この新たな攻撃面は、地球上の人々よりも多くのデジタル音声アシスタントを含んでいるかもしれない。
論文 参考訳(メタデータ) (2023-07-23T02:18:30Z) - Push-Pull: Characterizing the Adversarial Robustness for Audio-Visual
Active Speaker Detection [88.74863771919445]
我々は、音声のみ、視覚のみ、および音声-視覚的敵対攻撃下でのAVASDモデルの脆弱性を明らかにする。
また,攻撃者が現実的な相手を見つけるのを困難にするため,新たな音声・視覚的相互作用損失(AVIL)を提案する。
論文 参考訳(メタデータ) (2022-10-03T08:10:12Z) - Deepfake audio detection by speaker verification [79.99653758293277]
本研究では,話者の生体特性のみを活用する新しい検出手法を提案する。
提案手法は,既成話者検証ツールに基づいて実装することができる。
そこで我々は,3つの一般的なテストセット上で,優れた性能,高い一般化能力,高ロバスト性を有する音声障害に対する高ロバスト性を検証した。
論文 参考訳(メタデータ) (2022-09-28T13:46:29Z) - Meta-TTS: Meta-Learning for Few-Shot Speaker Adaptive Text-to-Speech [62.95422526044178]
マルチスピーカTSモデルのトレーニングアルゴリズムとして,MAML(Model Agnostic Meta-Learning)を用いる。
その結果,Meta-TTSは話者適応ベースラインよりも適応ステップが少ない少数のサンプルから高い話者類似性音声を合成できることが示唆された。
論文 参考訳(メタデータ) (2021-11-07T09:53:31Z) - Robust Sensor Fusion Algorithms Against VoiceCommand Attacks in
Autonomous Vehicles [8.35945218644081]
そこで本研究では,非可聴コマンド攻撃を防御するマルチモーダル深層学習分類システムを提案する。
提案手法の有効性を確認し,最良の分類精度は89.2%に達した。
論文 参考訳(メタデータ) (2021-04-20T10:08:46Z) - Dynamic Acoustic Unit Augmentation With BPE-Dropout for Low-Resource
End-to-End Speech Recognition [62.94773371761236]
我々は、OOVレートの高い低リソースセットアップで効果的なエンドツーエンドASRシステムを構築することを検討します。
本稿では,BPE-dropout法に基づく動的音響ユニット拡張法を提案する。
我々の単言語トルココンフォーマーは22.2%の文字誤り率(CER)と38.9%の単語誤り率(WER)の競争結果を確立した。
論文 参考訳(メタデータ) (2021-03-12T10:10:13Z) - WaveGuard: Understanding and Mitigating Audio Adversarial Examples [12.010555227327743]
本稿では,ASRシステムに対する敵入力を検出するフレームワークであるWaveGuardを紹介する。
本フレームワークは,音声変換機能を組み込んで原音声と変換音声のasr転写を解析し,逆入力を検出する。
論文 参考訳(メタデータ) (2021-03-04T21:44:37Z) - Cortical Features for Defense Against Adversarial Audio Attacks [55.61885805423492]
本稿では,聴覚野の計算モデルを用いて,音声に対する敵対的攻撃に対する防御手法を提案する。
また,大脳皮質の特徴は,普遍的な敵の例に対する防御に有効であることを示す。
論文 参考訳(メタデータ) (2021-01-30T21:21:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。