Fugu-MT 論文翻訳(概要): Phoneme-Based Proactive Anti-Eavesdropping with Controlled Recording Privilege

論文の概要: Phoneme-Based Proactive Anti-Eavesdropping with Controlled Recording Privilege

arxiv url: http://arxiv.org/abs/2401.15704v1
Date: Sun, 28 Jan 2024 16:56:56 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-18 08:07:41.664351
Title: Phoneme-Based Proactive Anti-Eavesdropping with Controlled Recording Privilege
Title（参考訳）: 制御された録音プリビレージを用いた音素ベースプロアクティブアンチイーブドロップ
Authors: Peng Huang, Yao Wei, Peng Cheng, Zhongjie Ba, Li Lu, Feng Lin, Yang Wang, Kui Ren,
Abstract要約: 本稿では,情報マスキングのアイデアを取り入れた新しい音素ベースノイズを提案する。本システムでは,すべての音声認識システムにおいて,録音の認識精度を50%以下に抑えることができる。
参考スコア（独自算出の注目度）: 26.3587130339825
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The widespread smart devices raise people's concerns of being eavesdropped on. To enhance voice privacy, recent studies exploit the nonlinearity in microphone to jam audio recorders with inaudible ultrasound. However, existing solutions solely rely on energetic masking. Their simple-form noise leads to several problems, such as high energy requirements and being easily removed by speech enhancement techniques. Besides, most of these solutions do not support authorized recording, which restricts their usage scenarios. In this paper, we design an efficient yet robust system that can jam microphones while preserving authorized recording. Specifically, we propose a novel phoneme-based noise with the idea of informational masking, which can distract both machines and humans and is resistant to denoising techniques. Besides, we optimize the noise transmission strategy for broader coverage and implement a hardware prototype of our system. Experimental results show that our system can reduce the recognition accuracy of recordings to below 50\% under all tested speech recognition systems, which is much better than existing solutions.
Abstract（参考訳）: スマートデバイスの普及により、人々が盗聴されることへの懸念が高まる。音声のプライバシーを高めるために,マイクロホンの非線形性を利用して音声レコーダーを難聴超音波で妨害する手法が近年研究されている。しかし、既存の解はエネルギーマスキングにのみ依存する。これらの単純な形状のノイズは、高エネルギー要求や音声強調技術によって容易に除去されるなど、いくつかの問題を引き起こす。さらに、これらのソリューションのほとんどは認証された記録をサポートしておらず、使用シナリオを制限している。本稿では,認証記録を保存しながら,マイクロホンを妨害できる効率的かつロバストなシステムを設計する。具体的には,情報マスキングのアイデアを取り入れた新しい音素ベースノイズを提案する。さらに,より広い範囲の騒音伝達戦略を最適化し,システムのハードウェアプロトタイプを実装した。実験の結果,既存のシステムよりもはるかに優れている全音声認識システムにおいて,録音の認識精度を50%以下に抑えることができることがわかった。

関連論文リスト

WavInWav: Time-domain Speech Hiding via Invertible Neural Network [78.85443308774484]
従来の音声隠蔽法は、秘密の音声を復元する際に不満足な品質をもたらすことが多い。フローベースの非可逆ニューラルネットワークを使用して、ステゴオーディオ、カバーオーディオ、シークレットオーディオの直接的なリンクを確立する。また、隠れたデータを不正アクセスから保護するための暗号化技術も追加します。
論文参考訳（メタデータ） (2025-10-03T11:36:16Z)
TAPS: Throat and Acoustic Paired Speech Dataset for Deep Learning-Based Speech Enhancement [0.0]
スロートマイクは、そのノイズ抑制特性を解決し、音声を録音する際のノイズを低減する。音波が皮膚や組織を通過すると、高周波情報が減衰し、音声の明瞭度が低下する。近年の深層学習アプローチでは喉頭マイクロホン記録の強化が期待されているが,標準化されたデータセットの欠如によりさらなる進歩が制限されている。喉頭と音響のペア音声データセット (TAPS) を導入し, 喉頭と音響マイクロホンを用いた60人の韓国語話者からのペア音声の収集を行った。
論文参考訳（メタデータ） (2025-02-17T06:29:11Z)
VocalCrypt: Novel Active Defense Against Deepfake Voice Based on Masking Effect [2.417762825674103]
AI音声クローンの急速な進歩は、機械学習によって推進され、テキスト音声(TTS)と音声変換(VC)の分野に大きな影響を与えている。本研究では,SFSをベースとした擬似音色(ジャミング情報)を人間の耳に知覚できない音声セグメントに埋め込む,新たなアクティブディフェンス手法であるVocalCryptを提案する。 VocalCryptは、対向雑音の組み込みなど既存の手法と比較して、ロバスト性やリアルタイム性能を大幅に向上させる。
論文参考訳（メタデータ） (2025-02-14T17:43:01Z)
Detecting the Undetectable: Assessing the Efficacy of Current Spoof Detection Methods Against Seamless Speech Edits [82.8859060022651]
音声入力編集(SINE)データセットをVoiceboxで作成する。本手法を用いて編集した音声は従来のカット・アンド・ペースト法よりも検出が困難であることを確認した。人的困難にもかかわらず, 自己監督型検出器は検出, 局所化, 一般化において顕著な性能を発揮することを示す実験結果が得られた。
論文参考訳（メタデータ） (2025-01-07T14:17:47Z)
Safeguarding Voice Privacy: Harnessing Near-Ultrasonic Interference To Protect Against Unauthorized Audio Recording [0.0]
本稿では,音声認識アルゴリズム(ASR)の音場近傍からの干渉に対する感受性について検討する。現代の音声アクティベートデバイスで使われている最も一般的なマイクロフォンでは、ほぼ超音波周波数を聴覚スペクトルに不注意に復調する致命的な脆弱性が露呈する。本研究は,この脆弱性の悪用から発声システムを保護するために,堅牢な対策を開発する必要性を浮き彫りにした。
論文参考訳（メタデータ） (2024-04-07T00:49:19Z)
Proactive Detection of Voice Cloning with Localized Watermarking [50.13539630769929]
本稿では,AI生成音声の局所検出に特化して設計された,最初の音声透かし技術であるAudioSealを紹介する。 AudioSealは、ローカライゼーションロスと共同でトレーニングされたジェネレータ/検出器アーキテクチャを使用して、サンプルレベルまでローカライズされた透かし検出を可能にする。 AudioSealは、実生活のオーディオ操作に対する堅牢性と、自動的および人的評価指標に基づく非知覚性の観点から、最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-01-30T18:56:22Z)
In-Ear-Voice: Towards Milli-Watt Audio Enhancement With Bone-Conduction Microphones for In-Ear Sensing Platforms [8.946335367620698]
本稿では,新しいMEMS骨伝導マイクロホンをベースとした低消費電力ワイヤレスイヤホン用カスタム研究プラットフォームの設計と実装について述べる。このようなマイクは、装着者の音声をはるかに分離して記録することができ、パーソナライズされた音声活動の検出とさらなる音声強調アプリケーションを可能にする。
論文参考訳（メタデータ） (2023-09-05T17:04:09Z)
SottoVoce: An Ultrasound Imaging-Based Silent Speech Interaction Using Deep Neural Networks [18.968402215723]
ユーザの無声発話を検出するシステムを提案する。提案システムは,ユーザの発話音声を使わずに発話内容を認識する。また,音声認識の精度を向上させるために,ユーザが口頭の動きを調整できることも確認した。
論文参考訳（メタデータ） (2023-03-03T07:46:35Z)
Deepfake audio detection by speaker verification [79.99653758293277]
本研究では,話者の生体特性のみを活用する新しい検出手法を提案する。提案手法は,既成話者検証ツールに基づいて実装することができる。そこで我々は,3つの一般的なテストセット上で,優れた性能,高い一般化能力,高ロバスト性を有する音声障害に対する高ロバスト性を検証した。
論文参考訳（メタデータ） (2022-09-28T13:46:29Z)
SuperVoice: Text-Independent Speaker Verification Using Ultrasound Energy in Human Speech [10.354590276508283]
ボイスアクティベートシステムは、さまざまなデスクトップ、モバイル、IoT(Internet-of-Things)デバイスに統合されている。既存の話者検証技術は、音声コマンドの可聴周波数範囲から抽出した分光学的特徴により、個々の話者を識別する。本稿では,特徴融合機構を備えた2ストリームアーキテクチャを用いた話者検証システム SUPERVOICE を提案する。
論文参考訳（メタデータ） (2022-05-28T18:00:50Z)
Disappeared Command: Spoofing Attack On Automatic Speech Recognition Systems with Sound Masking [2.9308762189250746]
音声インターフェースは、多くのアプリケーションやスマートデバイスの入力として、ますます広く使われている。 DNNは微妙な乱れによって容易に妨害され、音声によって制御されるインテリジェントな音声アプリケーションにとって非常に危険である誤認識を生じさせる。
論文参考訳（メタデータ） (2022-04-19T16:26:34Z)
Improving Noise Robustness of Contrastive Speech Representation Learning with Speech Reconstruction [109.44933866397123]
実環境における音声認識システムの実現には,雑音の堅牢性が不可欠である。雑音認識のための自己教師型フレームワークにより学習したノイズロスト表現を用いる。ラベル付きデータのわずか16%で報告された最高の教師付きアプローチに匹敵するパフォーマンスを実現した。
論文参考訳（メタデータ） (2021-10-28T20:39:02Z)
Speech Enhancement for Wake-Up-Word detection in Voice Assistants [60.103753056973815]
キースポッティング、特にWake-Up-Word(WUW)検出は音声アシスタントにとって非常に重要なタスクである。本稿では,WUW検出に適応した音声強調モデルを提案する。これらのノイズの存在下で、認識率を高め、誤報を減らすことを目的としている。
論文参考訳（メタデータ） (2021-01-29T18:44:05Z)
VoiceFilter-Lite: Streaming Targeted Voice Separation for On-Device Speech Recognition [60.462770498366524]
ターゲットユーザからの音声信号のみを保存するためにデバイス上で実行される単一チャネルソース分離モデルであるVoiceFilter-Liteを導入する。本研究では,そのようなモデルを8ビット整数モデルとして量子化し,リアルタイムに実行可能であることを示す。
論文参考訳（メタデータ） (2020-09-09T14:26:56Z)
TinySpeech: Attention Condensers for Deep Speech Recognition Neural Networks on Edge Devices [71.68436132514542]
エッジ上でのオンデバイス音声認識のための低フットプリント,高効率深層ニューラルネットワーク構築のためのアテンションコンデンサの概念を紹介する。その有効性を説明するために,デバイス上での音声認識に適した低精度深層ニューラルネットワークTinySpeechを導入する。
論文参考訳（メタデータ） (2020-08-10T16:34:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。