論文の概要: AS2T: Arbitrary Source-To-Target Adversarial Attack on Speaker
Recognition Systems
- arxiv url: http://arxiv.org/abs/2206.03351v1
- Date: Tue, 7 Jun 2022 14:38:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-08 16:48:59.736073
- Title: AS2T: Arbitrary Source-To-Target Adversarial Attack on Speaker
Recognition Systems
- Title(参考訳): AS2T: 話者認識システムにおける任意ソース対ターゲットアタック
- Authors: Guangke Chen and Zhe Zhao and Fu Song and Sen Chen and Lingling Fan
and Yang Liu
- Abstract要約: 近年の研究では、敵対的攻撃に対する話者認識システム(SRS)の脆弱性が照らされている。
すべての設定をカバーするこのドメインの最初の攻撃であるAS2Tを紹介します。
本研究は, 無線通信において発生した可能性のある歪みについて検討し, 異なるパラメータの異なる変換関数を用いて, その歪みをモデル化し, 逆声の発生に組み込む。
- 参考スコア(独自算出の注目度): 15.013763364096638
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent work has illuminated the vulnerability of speaker recognition systems
(SRSs) against adversarial attacks, raising significant security concerns in
deploying SRSs. However, they considered only a few settings (e.g., some
combinations of source and target speakers), leaving many interesting and
important settings in real-world attack scenarios alone. In this work, we
present AS2T, the first attack in this domain which covers all the settings,
thus allows the adversary to craft adversarial voices using arbitrary source
and target speakers for any of three main recognition tasks. Since none of the
existing loss functions can be applied to all the settings, we explore many
candidate loss functions for each setting including the existing and newly
designed ones. We thoroughly evaluate their efficacy and find that some
existing loss functions are suboptimal. Then, to improve the robustness of AS2T
towards practical over-the-air attack, we study the possible distortions
occurred in over-the-air transmission, utilize different transformation
functions with different parameters to model those distortions, and incorporate
them into the generation of adversarial voices. Our simulated over-the-air
evaluation validates the effectiveness of our solution in producing robust
adversarial voices which remain effective under various hardware devices and
various acoustic environments with different reverberation, ambient noises, and
noise levels. Finally, we leverage AS2T to perform thus far the largest-scale
evaluation to understand transferability among 14 diverse SRSs. The
transferability analysis provides many interesting and useful insights which
challenge several findings and conclusion drawn in previous works in the image
domain. Our study also sheds light on future directions of adversarial attacks
in the speaker recognition domain.
- Abstract(参考訳): 最近の研究は、話者認識システム(SRS)の敵攻撃に対する脆弱性を照らし、SRSの展開において重大なセキュリティ上の懸念を提起している。
しかし、いくつかの設定(例えば、ソースとターゲットのスピーカーの組み合わせ)しか考慮せず、実際の攻撃シナリオだけに多くの興味深い重要な設定を残した。
本研究では,このドメインにおける最初の攻撃であるAS2Tを提案する。この攻撃により,敵は任意の音源を用いて敵の声を作成でき,ターゲット話者は3つの主要な認識タスクのいずれかをこなすことができる。
すべての設定に既存の損失関数は適用できないので、既存および新規に設計されたものを含め、各設定の候補損失関数を探索する。
我々はそれらの効果を徹底的に評価し、既存の損失関数が準最適であることを示す。
そこで,AS2Tの強靭性を向上させるため,無線通信における歪みの可能性を調査し,異なるパラメータの異なる変換関数を用いてその歪みをモデル化し,対向音声の生成に組み込む。
実験により, 各種ハードウェア装置や各種音響環境において, 異なる残響, 環境騒音, 騒音レベルにおいて有効である頑健な対向音声を合成する手法の有効性が検証された。
最後に,AS2Tを用いてこれまでで最大規模の評価を行い,14種類のSRS間の転送可能性について検討した。
転写可能性解析は、画像領域における以前の研究で得られたいくつかの発見と結論に挑戦する興味深い、有用な洞察を提供する。
本研究は,話者認識領域における敵攻撃の今後の方向性についても明らかにした。
関連論文リスト
- ALIF: Low-Cost Adversarial Audio Attacks on Black-Box Speech Platforms using Linguistic Features [25.28307679567351]
ALIFは、最初のブラックボックス対応言語機能ベースのアタックパイプラインである。
本稿では,デジタルドメインと物理再生環境の両方で攻撃を開始するためのALIF-OTLおよびALIF-OTAスキームを提案する。
論文 参考訳(メタデータ) (2024-08-03T15:30:16Z) - MLCA-AVSR: Multi-Layer Cross Attention Fusion based Audio-Visual Speech Recognition [62.89464258519723]
異なるレベルのオーディオ/視覚エンコーダに融合することで、各モードの表現を促進する多層クロスアテンション融合に基づくAVSR手法を提案する。
提案手法は第1位システムを超え,新たなSOTA cpCERの29.13%をこのデータセット上に構築する。
論文 参考訳(メタデータ) (2024-01-07T08:59:32Z) - QFA2SR: Query-Free Adversarial Transfer Attacks to Speaker Recognition
Systems [7.924452626448202]
話者認識システム(SRS)に対する現在の敵攻撃は、ターゲットのSRSに対して、ホワイトボックスアクセスまたは重いブラックボックスクエリを必要とする。
対向音声の転送可能性を活用することにより,QFA2SRを提案する。
QFA2SRは、それぞれ60%、46%、ターゲット転送性70%の広帯域音声アシスタントに対して、空中起動時に非常に効果的である。
論文 参考訳(メタデータ) (2023-05-23T14:20:13Z) - Spatial-Frequency Discriminability for Revealing Adversarial Perturbations [53.279716307171604]
敵の摂動に対するディープニューラルネットワークの脆弱性は、コンピュータビジョンコミュニティで広く認識されている。
現在のアルゴリズムは、通常、自然および敵対的なデータの識別的分解を通じて、敵のパターンを検出する。
空間周波数Krawtchouk分解に基づく識別検出器を提案する。
論文 参考訳(メタデータ) (2023-05-18T10:18:59Z) - Leveraging Domain Features for Detecting Adversarial Attacks Against
Deep Speech Recognition in Noise [18.19207291891767]
ディープASRシステムに対する敵攻撃は非常に成功している。
この作業では、フィルタバンクベースの機能を活用して、攻撃特性をより正確に把握し、検出を改善する。
逆フィルタバンクの機能は、クリーンな環境とノイズの多い環境の両方でよく機能する。
論文 参考訳(メタデータ) (2022-11-03T07:25:45Z) - Learning Transferable Adversarial Robust Representations via Multi-view
Consistency [57.73073964318167]
デュアルエンコーダを用いたメタ逆多視点表現学習フレームワークを提案する。
未確認領域からの少数ショット学習タスクにおけるフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2022-10-19T11:48:01Z) - Push-Pull: Characterizing the Adversarial Robustness for Audio-Visual
Active Speaker Detection [88.74863771919445]
我々は、音声のみ、視覚のみ、および音声-視覚的敵対攻撃下でのAVASDモデルの脆弱性を明らかにする。
また,攻撃者が現実的な相手を見つけるのを困難にするため,新たな音声・視覚的相互作用損失(AVIL)を提案する。
論文 参考訳(メタデータ) (2022-10-03T08:10:12Z) - End-to-End Binaural Speech Synthesis [71.1869877389535]
本稿では,低ビットレート音声システムと強力なデコーダを組み合わせたエンドツーエンド音声合成システムを提案する。
実感的な聴覚シーンを作るために必要な環境効果を捉える上で, 対人的損失がもたらす効果を実証する。
論文 参考訳(メタデータ) (2022-07-08T05:18:36Z) - Towards Understanding and Mitigating Audio Adversarial Examples for
Speaker Recognition [13.163192823774624]
話者認識システム(SRS)は、最近、敵の攻撃に対して脆弱であることが示され、重大なセキュリティ上の懸念が提起されている。
話者認識に対する先進的な7つの攻撃を用いて、22の多様な変換を行い、徹底的に評価する。
提案手法は, 完全ホワイトボックス環境において, 対人訓練と組み合わせた特徴レベル変換が, 単独の対人訓練に比べ, より効果的であることを示す。
論文 参考訳(メタデータ) (2022-06-07T15:38:27Z) - Characterizing the adversarial vulnerability of speech self-supervised
learning [95.03389072594243]
我々は,ゼロ知識とリミテッド知識の両方の敵からの攻撃の下で,そのようなパラダイムの敵対的脆弱性を調査するための最初の試みを行う。
実験結果から, SUPERB が提案するパラダイムは, 限られた知識を持つ敵に対して脆弱であることが示唆された。
論文 参考訳(メタデータ) (2021-11-08T08:44:04Z) - WaveGuard: Understanding and Mitigating Audio Adversarial Examples [12.010555227327743]
本稿では,ASRシステムに対する敵入力を検出するフレームワークであるWaveGuardを紹介する。
本フレームワークは,音声変換機能を組み込んで原音声と変換音声のasr転写を解析し,逆入力を検出する。
論文 参考訳(メタデータ) (2021-03-04T21:44:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。