論文の概要: Disappeared Command: Spoofing Attack On Automatic Speech Recognition
Systems with Sound Masking
- arxiv url: http://arxiv.org/abs/2204.08977v1
- Date: Tue, 19 Apr 2022 16:26:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-20 15:11:11.699077
- Title: Disappeared Command: Spoofing Attack On Automatic Speech Recognition
Systems with Sound Masking
- Title(参考訳): 消音コマンド:音声マスキングを用いた自動音声認識システムに対するスプーフィング攻撃
- Authors: Jinghui Xu, Jiangshan Zhang, Jifeng Zhu and Yong Yang
- Abstract要約: 音声インターフェースは、多くのアプリケーションやスマートデバイスの入力として、ますます広く使われている。
DNNは微妙な乱れによって容易に妨害され、音声によって制御されるインテリジェントな音声アプリケーションにとって非常に危険である誤認識を生じさせる。
- 参考スコア(独自算出の注目度): 2.9308762189250746
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of deep learning technology has greatly promoted the
performance improvement of automatic speech recognition (ASR) technology, which
has demonstrated an ability comparable to human hearing in many tasks. Voice
interfaces are becoming more and more widely used as input for many
applications and smart devices. However, existing research has shown that DNN
is easily disturbed by slight disturbances and makes false recognition, which
is extremely dangerous for intelligent voice applications controlled by voice.
- Abstract(参考訳): ディープラーニング技術の開発は、多くのタスクにおいて人間の聴覚に匹敵する能力を示す自動音声認識(ASR)技術の性能向上を大いに促進してきた。
音声インターフェースは多くのアプリケーションやスマートデバイスの入力としてますます広く使われている。
しかし、既存の研究によれば、dnnはわずかな障害によって容易に妨害され、誤認識されるため、音声によって制御されるインテリジェントな音声アプリケーションでは極めて危険である。
関連論文リスト
- Towards Unsupervised Speech Recognition Without Pronunciation Models [57.222729245842054]
ほとんどの言語では、音声認識システムを効果的に訓練するのに十分なペア音声とテキストデータがない。
本稿では、教師なしASRシステムを開発するために、音素レキシコンへの依存を除去することを提案する。
音声合成とテキスト・テキスト・マスクによるトークン埋込から教師なし音声認識が実現可能であることを実験的に実証した。
論文 参考訳(メタデータ) (2024-06-12T16:30:58Z) - Phoneme-Based Proactive Anti-Eavesdropping with Controlled Recording Privilege [26.3587130339825]
本稿では,情報マスキングのアイデアを取り入れた新しい音素ベースノイズを提案する。
本システムでは,すべての音声認識システムにおいて,録音の認識精度を50%以下に抑えることができる。
論文 参考訳(メタデータ) (2024-01-28T16:56:56Z) - Efficient Multimodal Neural Networks for Trigger-less Voice Assistants [0.8209843760716959]
本稿では,スマートウォッチ用ニューラルネットワークを用いたマルチモーダルフュージョンシステムを提案する。
このシステムは、音声とジェスチャーデータの時間的相関をよりよく理解し、正確な呼び出しにつながる。
軽量で、スマートウォッチなどの低消費電力デバイスにデプロイ可能で、起動時間も速い。
論文 参考訳(メタデータ) (2023-05-20T02:52:02Z) - SottoVoce: An Ultrasound Imaging-Based Silent Speech Interaction Using
Deep Neural Networks [18.968402215723]
ユーザの無声発話を検出するシステムを提案する。
提案システムは,ユーザの発話音声を使わずに発話内容を認識する。
また,音声認識の精度を向上させるために,ユーザが口頭の動きを調整できることも確認した。
論文 参考訳(メタデータ) (2023-03-03T07:46:35Z) - Deepfake audio detection by speaker verification [79.99653758293277]
本研究では,話者の生体特性のみを活用する新しい検出手法を提案する。
提案手法は,既成話者検証ツールに基づいて実装することができる。
そこで我々は,3つの一般的なテストセット上で,優れた性能,高い一般化能力,高ロバスト性を有する音声障害に対する高ロバスト性を検証した。
論文 参考訳(メタデータ) (2022-09-28T13:46:29Z) - Adversarial Attacks on Speech Recognition Systems for Mission-Critical
Applications: A Survey [8.86498196260453]
AI(Adversarial Artificial Intelligence)は、AIと機械学習の研究コミュニティにおける脅威の増大である。
本稿では,既存の音声認識技術について概説し,これらのシステムに対する敵攻撃と防御の有効性について検討する。
本論文は、研究者や実践者が課題を理解し、自らを位置づけ、究極的にはミッションクリティカルな応用のための既存の音声認識モデルを改善するのに役立てることが期待されている。
論文 参考訳(メタデータ) (2022-02-22T00:29:40Z) - Recent Progress in the CUHK Dysarthric Speech Recognition System [66.69024814159447]
障害音声は、現在のデータ集約型ディープニューラルネットワーク(DNN)に基づく自動音声認識技術に対して、幅広い課題を提示している。
本稿では,香港の中国大学における音声認識システムの性能向上に向けた最近の研究成果について述べる。
論文 参考訳(メタデータ) (2022-01-15T13:02:40Z) - Speech Enhancement for Wake-Up-Word detection in Voice Assistants [60.103753056973815]
キースポッティング、特にWake-Up-Word(WUW)検出は音声アシスタントにとって非常に重要なタスクである。
本稿では,WUW検出に適応した音声強調モデルを提案する。
これらのノイズの存在下で、認識率を高め、誤報を減らすことを目的としている。
論文 参考訳(メタデータ) (2021-01-29T18:44:05Z) - Speaker De-identification System using Autoencoders and Adversarial
Training [58.720142291102135]
本稿では,対人訓練とオートエンコーダに基づく話者識別システムを提案する。
実験結果から, 対向学習とオートエンコーダを組み合わせることで, 話者検証システムの誤り率が同等になることがわかった。
論文 参考訳(メタデータ) (2020-11-09T19:22:05Z) - TinySpeech: Attention Condensers for Deep Speech Recognition Neural
Networks on Edge Devices [71.68436132514542]
エッジ上でのオンデバイス音声認識のための低フットプリント,高効率深層ニューラルネットワーク構築のためのアテンションコンデンサの概念を紹介する。
その有効性を説明するために,デバイス上での音声認識に適した低精度深層ニューラルネットワークTinySpeechを導入する。
論文 参考訳(メタデータ) (2020-08-10T16:34:52Z) - A Deep Learning based Wearable Healthcare IoT Device for AI-enabled
Hearing Assistance Automation [6.283190933140046]
本研究は、聴覚障害や聴覚障害に苦しむ人々を支援するAI対応IoT(Internet of Things)デバイスを提案する。
Googleのオンライン音声認識サービスを活用して、受信した会話をテキストに変換し、眼鏡に取り付けられたマイクロディスプレイに展開し、会話内容を聴覚障害者に表示するサーバアプリケーションを作成する。
論文 参考訳(メタデータ) (2020-05-16T19:42:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。