論文の概要: Attacks as Defenses: Designing Robust Audio CAPTCHAs Using Attacks on
Automatic Speech Recognition Systems
- arxiv url: http://arxiv.org/abs/2203.05408v1
- Date: Thu, 10 Mar 2022 15:04:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-11 18:44:18.199618
- Title: Attacks as Defenses: Designing Robust Audio CAPTCHAs Using Attacks on
Automatic Speech Recognition Systems
- Title(参考訳): 防衛としての攻撃:自動音声認識システムにおける攻撃を用いたロバストオーディオCAPTCHAの設計
- Authors: Hadi Abdullah, Aditya Karlekar, Saurabh Prasad, Muhammad Sajidur
Rahman, Logan Blue, Luke A. Bauer, Vincent Bindschaedler, Patrick Traynor
- Abstract要約: 近年,ロバストで原理駆動型オーディオディフェンスの構築にインスピレーションを与えるために,音声・テキストシステムに対する攻撃について検討している。
本稿では,比較的知的な(ユーザスタディを通じて評価)かつ,自動書き起こしが難しい新しいメカニズムを提案する。
音声サンプルは,音声合成システムにおいてCAPTCHAとして検出される確率が高い。
- 参考スコア(独自算出の注目度): 10.825333820047758
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Audio CAPTCHAs are supposed to provide a strong defense for online resources;
however, advances in speech-to-text mechanisms have rendered these defenses
ineffective. Audio CAPTCHAs cannot simply be abandoned, as they are
specifically named by the W3C as important enablers of accessibility.
Accordingly, demonstrably more robust audio CAPTCHAs are important to the
future of a secure and accessible Web. We look to recent literature on attacks
on speech-to-text systems for inspiration for the construction of robust,
principle-driven audio defenses. We begin by comparing 20 recent attack papers,
classifying and measuring their suitability to serve as the basis of new
"robust to transcription" but "easy for humans to understand" CAPTCHAs. After
showing that none of these attacks alone are sufficient, we propose a new
mechanism that is both comparatively intelligible (evaluated through a user
study) and hard to automatically transcribe (i.e., $P({\rm transcription}) = 4
\times 10^{-5}$). Finally, we demonstrate that our audio samples have a high
probability of being detected as CAPTCHAs when given to speech-to-text systems
($P({\rm evasion}) = 1.77 \times 10^{-4}$). In so doing, we not only
demonstrate a CAPTCHA that is approximately four orders of magnitude more
difficult to crack, but that such systems can be designed based on the insights
gained from attack papers using the differences between the ways that humans
and computers process audio.
- Abstract(参考訳): 音声CAPTCHAは、オンラインリソースの強力な防御を提供すると考えられているが、音声とテキストのメカニズムの進歩により、これらの防御は効果がない。
オーディオCAPTCHAはW3Cによってアクセシビリティーの重要な実現手段として特別に命名されているため、単に放棄することはできない。
したがって、より堅牢なCAPTCHAは、安全でアクセスしやすいWebの未来にとって重要である。
我々は,ロバストで原理駆動型オーディオディフェンスの構築にインスピレーションを与えるために,音声テキストシステムに対する攻撃に関する最近の文献を考察する。
我々は、最近の20件の攻撃論文を比較して、新しい「転写ロバスト」の基礎として、CAPTCHAを「人間が理解しやすくする」ために、それらの適合性を分類し、測定することから始める。
これらの攻撃だけでは不十分であることが証明された後、我々は比較的知的な(ユーザスタディによって評価される)かつ自動転写が難しい(つまり$P({\rm transcription}) = 4 \times 10^{-5}$)新しいメカニズムを提案する。
最後に、音声サンプルが、音声テキストシステム(P({\rm evasion}) = 1.77 \times 10^{-4}$)に対して、CAPTCHAとして検出される確率が高いことを示す。
このようにして、我々は、およそ4桁のクラックが難しいcaptchaを示すだけでなく、人間とコンピュータがオーディオを処理する方法の違いを利用して攻撃論文から得られた洞察に基づいて、このようなシステムを設計できることを示した。
関連論文リスト
- D-CAPTCHA++: A Study of Resilience of Deepfake CAPTCHA under Transferable Imperceptible Adversarial Attack [1.7811840395202345]
近年の研究では、実際の通話と偽の通話を区別するチャレンジ応答プロトコルに基づくD-CAPTCHAシステムを提案する。
本研究では,このシステムのレジリエンスについて検討し,より堅牢なD-CAPTCHA++を導入し,フェイクコールに対する防御を行う。
論文 参考訳(メタデータ) (2024-09-11T16:25:02Z) - Towards Unsupervised Speech Recognition Without Pronunciation Models [57.222729245842054]
ほとんどの言語では、音声認識システムを効果的に訓練するのに十分なペア音声とテキストデータがない。
本稿では、教師なしASRシステムを開発するために、音素レキシコンへの依存を除去することを提案する。
音声合成とテキスト・テキスト・マスクによるトークン埋込から教師なし音声認識が実現可能であることを実験的に実証した。
論文 参考訳(メタデータ) (2024-06-12T16:30:58Z) - VALL-E R: Robust and Efficient Zero-Shot Text-to-Speech Synthesis via Monotonic Alignment [101.2489492032816]
VALL-E Rは、堅牢で効率的なゼロショットテキスト音声合成システムである。
この研究は、失語症に罹患した人々のためのスピーチの作成を含む有意義なプロジェクトに適用される可能性がある。
論文 参考訳(メタデータ) (2024-06-12T04:09:44Z) - Unveiling Vulnerability of Self-Attention [61.85150061213987]
事前訓練された言語モデル(PLM)は、マイナーな単語変更に対して脆弱であることが示されている。
本稿では,変圧器を用いたPSMの基本構造,自己注意機構について検討する。
構造的摂動によってSAを効果的に堅牢にする新しい平滑化技術である textitS-Attend を導入する。
論文 参考訳(メタデータ) (2024-02-26T10:31:45Z) - A Survey of Adversarial CAPTCHAs on its History, Classification and
Generation [69.36242543069123]
本稿では, 逆CAPTCHAの定義を拡張し, 逆CAPTCHAの分類法を提案する。
また, 敵CAPTCHAの防御に使用可能な防御方法も分析し, 敵CAPTCHAに対する潜在的な脅威を示す。
論文 参考訳(メタデータ) (2023-11-22T08:44:58Z) - Vulnerability analysis of captcha using Deep learning [0.0]
本研究ではCAPTCHA生成システムの欠陥と脆弱性について検討する。
これを実現するために、我々は畳み込みニューラルネットワークであるCapNetを開発した。
提案プラットフォームは,数値およびアルファ数値CAPTCHAの両方を評価することができる
論文 参考訳(メタデータ) (2023-02-18T17:45:11Z) - Unsupervised Text-to-Speech Synthesis by Unsupervised Automatic Speech
Recognition [60.84668086976436]
教師なし音声合成システム(TTS)は、言語中の任意の文章に対応する音声波形を生成することを学習する。
本稿では、教師なし自動音声認識(ASR)の最近の進歩を活用して、教師なしTSシステムを提案する。
教師なしシステムでは、7つの言語で約10~20時間の音声で教師付きシステムに匹敵する性能を達成できる。
論文 参考訳(メタデータ) (2022-03-29T17:57:53Z) - Robust Text CAPTCHAs Using Adversarial Examples [129.29523847765952]
Robust Text CAPTCHA (RTC) という,ユーザフレンドリーなテキストベースのCAPTCHA生成法を提案する。
第1段階では、前景と背景はランダムにサンプルされたフォントと背景画像で構成される。
第2段階では、CAPTCHAの解法をより妨害するために、高転送可能な逆攻撃をテキストCAPTCHAに適用する。
論文 参考訳(メタデータ) (2021-01-07T11:03:07Z) - Capture the Bot: Using Adversarial Examples to Improve CAPTCHA
Robustness to Bot Attacks [4.498333418544154]
本稿では,新しいCAPTCHA方式であるCAPTUREを紹介する。
実験により,CAPTUREは人間による解決が容易なCAPTCHAを生成できることを示した。
論文 参考訳(メタデータ) (2020-10-30T11:39:04Z) - An End-to-End Attack on Text-based CAPTCHAs Based on Cycle-Consistent
Generative Adversarial Network [4.955311532191887]
本稿では,サイクル一貫性のある生成対向ネットワークをベースとした,効率的かつ簡便なエンドツーエンド攻撃手法を提案する。
いくつかの設定パラメータを変更するだけで、一般的なテキストベースのCAPTCHAスキームを攻撃できる。
提案手法は,10のWebサイトが展開するCAPTCHAスキームを効率的に分解する。
論文 参考訳(メタデータ) (2020-08-26T14:57:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。