論文の概要: Phoneme-Based Proactive Anti-Eavesdropping with Controlled Recording Privilege
- arxiv url: http://arxiv.org/abs/2401.15704v1
- Date: Sun, 28 Jan 2024 16:56:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-18 08:07:41.664351
- Title: Phoneme-Based Proactive Anti-Eavesdropping with Controlled Recording Privilege
- Title(参考訳): 制御された録音プリビレージを用いた音素ベースプロアクティブアンチイーブドロップ
- Authors: Peng Huang, Yao Wei, Peng Cheng, Zhongjie Ba, Li Lu, Feng Lin, Yang Wang, Kui Ren,
- Abstract要約: 本稿では,情報マスキングのアイデアを取り入れた新しい音素ベースノイズを提案する。
本システムでは,すべての音声認識システムにおいて,録音の認識精度を50%以下に抑えることができる。
- 参考スコア(独自算出の注目度): 26.3587130339825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The widespread smart devices raise people's concerns of being eavesdropped on. To enhance voice privacy, recent studies exploit the nonlinearity in microphone to jam audio recorders with inaudible ultrasound. However, existing solutions solely rely on energetic masking. Their simple-form noise leads to several problems, such as high energy requirements and being easily removed by speech enhancement techniques. Besides, most of these solutions do not support authorized recording, which restricts their usage scenarios. In this paper, we design an efficient yet robust system that can jam microphones while preserving authorized recording. Specifically, we propose a novel phoneme-based noise with the idea of informational masking, which can distract both machines and humans and is resistant to denoising techniques. Besides, we optimize the noise transmission strategy for broader coverage and implement a hardware prototype of our system. Experimental results show that our system can reduce the recognition accuracy of recordings to below 50\% under all tested speech recognition systems, which is much better than existing solutions.
- Abstract(参考訳): スマートデバイスの普及により、人々が盗聴されることへの懸念が高まる。
音声のプライバシーを高めるために,マイクロホンの非線形性を利用して音声レコーダーを難聴超音波で妨害する手法が近年研究されている。
しかし、既存の解はエネルギーマスキングにのみ依存する。
これらの単純な形状のノイズは、高エネルギー要求や音声強調技術によって容易に除去されるなど、いくつかの問題を引き起こす。
さらに、これらのソリューションのほとんどは認証された記録をサポートしておらず、使用シナリオを制限している。
本稿では,認証記録を保存しながら,マイクロホンを妨害できる効率的かつロバストなシステムを設計する。
具体的には,情報マスキングのアイデアを取り入れた新しい音素ベースノイズを提案する。
さらに,より広い範囲の騒音伝達戦略を最適化し,システムのハードウェアプロトタイプを実装した。
実験の結果,既存のシステムよりもはるかに優れている全音声認識システムにおいて,録音の認識精度を50%以下に抑えることができることがわかった。
関連論文リスト
- Safeguarding Voice Privacy: Harnessing Near-Ultrasonic Interference To Protect Against Unauthorized Audio Recording [0.0]
本稿では,音声認識アルゴリズム(ASR)の音場近傍からの干渉に対する感受性について検討する。
現代の音声アクティベートデバイスで使われている最も一般的なマイクロフォンでは、ほぼ超音波周波数を聴覚スペクトルに不注意に復調する致命的な脆弱性が露呈する。
本研究は,この脆弱性の悪用から発声システムを保護するために,堅牢な対策を開発する必要性を浮き彫りにした。
論文 参考訳(メタデータ) (2024-04-07T00:49:19Z) - Proactive Detection of Voice Cloning with Localized Watermarking [50.13539630769929]
本稿では,AI生成音声の局所検出に特化して設計された,最初の音声透かし技術であるAudioSealを紹介する。
AudioSealは、ローカライゼーションロスと共同でトレーニングされたジェネレータ/検出器アーキテクチャを使用して、サンプルレベルまでローカライズされた透かし検出を可能にする。
AudioSealは、実生活のオーディオ操作に対する堅牢性と、自動的および人的評価指標に基づく非知覚性の観点から、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-30T18:56:22Z) - In-Ear-Voice: Towards Milli-Watt Audio Enhancement With Bone-Conduction
Microphones for In-Ear Sensing Platforms [8.946335367620698]
本稿では,新しいMEMS骨伝導マイクロホンをベースとした低消費電力ワイヤレスイヤホン用カスタム研究プラットフォームの設計と実装について述べる。
このようなマイクは、装着者の音声をはるかに分離して記録することができ、パーソナライズされた音声活動の検出とさらなる音声強調アプリケーションを可能にする。
論文 参考訳(メタデータ) (2023-09-05T17:04:09Z) - SottoVoce: An Ultrasound Imaging-Based Silent Speech Interaction Using
Deep Neural Networks [18.968402215723]
ユーザの無声発話を検出するシステムを提案する。
提案システムは,ユーザの発話音声を使わずに発話内容を認識する。
また,音声認識の精度を向上させるために,ユーザが口頭の動きを調整できることも確認した。
論文 参考訳(メタデータ) (2023-03-03T07:46:35Z) - Deepfake audio detection by speaker verification [79.99653758293277]
本研究では,話者の生体特性のみを活用する新しい検出手法を提案する。
提案手法は,既成話者検証ツールに基づいて実装することができる。
そこで我々は,3つの一般的なテストセット上で,優れた性能,高い一般化能力,高ロバスト性を有する音声障害に対する高ロバスト性を検証した。
論文 参考訳(メタデータ) (2022-09-28T13:46:29Z) - SuperVoice: Text-Independent Speaker Verification Using Ultrasound
Energy in Human Speech [10.354590276508283]
ボイスアクティベートシステムは、さまざまなデスクトップ、モバイル、IoT(Internet-of-Things)デバイスに統合されている。
既存の話者検証技術は、音声コマンドの可聴周波数範囲から抽出した分光学的特徴により、個々の話者を識別する。
本稿では,特徴融合機構を備えた2ストリームアーキテクチャを用いた話者検証システム SUPERVOICE を提案する。
論文 参考訳(メタデータ) (2022-05-28T18:00:50Z) - Disappeared Command: Spoofing Attack On Automatic Speech Recognition
Systems with Sound Masking [2.9308762189250746]
音声インターフェースは、多くのアプリケーションやスマートデバイスの入力として、ますます広く使われている。
DNNは微妙な乱れによって容易に妨害され、音声によって制御されるインテリジェントな音声アプリケーションにとって非常に危険である誤認識を生じさせる。
論文 参考訳(メタデータ) (2022-04-19T16:26:34Z) - Improving Noise Robustness of Contrastive Speech Representation Learning
with Speech Reconstruction [109.44933866397123]
実環境における音声認識システムの実現には,雑音の堅牢性が不可欠である。
雑音認識のための自己教師型フレームワークにより学習したノイズロスト表現を用いる。
ラベル付きデータのわずか16%で報告された最高の教師付きアプローチに匹敵するパフォーマンスを実現した。
論文 参考訳(メタデータ) (2021-10-28T20:39:02Z) - Speech Enhancement for Wake-Up-Word detection in Voice Assistants [60.103753056973815]
キースポッティング、特にWake-Up-Word(WUW)検出は音声アシスタントにとって非常に重要なタスクである。
本稿では,WUW検出に適応した音声強調モデルを提案する。
これらのノイズの存在下で、認識率を高め、誤報を減らすことを目的としている。
論文 参考訳(メタデータ) (2021-01-29T18:44:05Z) - VoiceFilter-Lite: Streaming Targeted Voice Separation for On-Device
Speech Recognition [60.462770498366524]
ターゲットユーザからの音声信号のみを保存するためにデバイス上で実行される単一チャネルソース分離モデルであるVoiceFilter-Liteを導入する。
本研究では,そのようなモデルを8ビット整数モデルとして量子化し,リアルタイムに実行可能であることを示す。
論文 参考訳(メタデータ) (2020-09-09T14:26:56Z) - TinySpeech: Attention Condensers for Deep Speech Recognition Neural
Networks on Edge Devices [71.68436132514542]
エッジ上でのオンデバイス音声認識のための低フットプリント,高効率深層ニューラルネットワーク構築のためのアテンションコンデンサの概念を紹介する。
その有効性を説明するために,デバイス上での音声認識に適した低精度深層ニューラルネットワークTinySpeechを導入する。
論文 参考訳(メタデータ) (2020-08-10T16:34:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。