論文の概要: Configurable Privacy-Preserving Automatic Speech Recognition
- arxiv url: http://arxiv.org/abs/2104.00766v1
- Date: Thu, 1 Apr 2021 21:03:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 13:56:07.477369
- Title: Configurable Privacy-Preserving Automatic Speech Recognition
- Title(参考訳): 設定可能なプライバシー保護自動音声認識
- Authors: Ranya Aloufi, Hamed Haddadi, David Boyle
- Abstract要約: 音声支援システムにおけるモジュラ自動音声認識がプライバシーを向上するかどうかを検討する。
プライバシの懸念と,システムの各ステージに様々な最先端技術を適用する効果を示す。
これはASRを組み込んだプライバシー保護アプリケーションに新たな機会をもたらすと我々は主張する。
- 参考スコア(独自算出の注目度): 5.730142956540673
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Voice assistive technologies have given rise to far-reaching privacy and
security concerns. In this paper we investigate whether modular automatic
speech recognition (ASR) can improve privacy in voice assistive systems by
combining independently trained separation, recognition, and discretization
modules to design configurable privacy-preserving ASR systems. We evaluate
privacy concerns and the effects of applying various state-of-the-art
techniques at each stage of the system, and report results using task-specific
metrics (i.e. WER, ABX, and accuracy). We show that overlapping speech inputs
to ASR systems present further privacy concerns, and how these may be mitigated
using speech separation and optimization techniques. Our discretization module
is shown to minimize paralinguistics privacy leakage from ASR acoustic models
to levels commensurate with random guessing. We show that voice privacy can be
configurable, and argue this presents new opportunities for privacy-preserving
applications incorporating ASR.
- Abstract(参考訳): 音声アシスタント技術は、プライバシーとセキュリティの懸念をはるかに高めている。
本稿では,モジュール型自動音声認識(ASR)が独立に訓練された分離・認識・離散化モジュールを組み合わせることで,音声支援システムのプライバシーを向上できるかどうかを検討する。
プライバシの懸念と,システムの各段階における各種技術の適用効果を評価し,タスク固有の指標(すなわち,タスク固有の指標)を用いて結果を報告する。
WER, ABX, and accuracy)。
ASRシステムへの重なり合う音声入力は、さらなるプライバシー上の懸念を生じさせ、これらを音声分離と最適化技術を用いて緩和する方法を示す。
我々の離散化モジュールは、ASR音響モデルからランダムな推測に相応しいレベルへのパラ言語的プライバシー漏洩を最小限に抑える。
音声プライバシーは設定可能であることを示し、これがASRを取り入れたプライバシー保護アプリケーションに新たな機会をもたらすと論じている。
関連論文リスト
- Representation Learning for Audio Privacy Preservation using Source
Separation and Robust Adversarial Learning [16.1694012177079]
本稿では,プライバシ保護における2つの一般的なアプローチ – ソース分離と逆表現学習 – の統合を提案する。
提案システムは,音声録音と非音声録音の区別を防止するために,音声録音の潜在表現を学習する。
論文 参考訳(メタデータ) (2023-08-09T13:50:00Z) - Long-term Conversation Analysis: Exploring Utility and Privacy [12.380029887841175]
入力特徴量削減,スペクトル平滑化,およびMcAdams係数に基づく低コスト話者匿名化技術に基づくプライバシー保護機能抽出手法について検討する。
我々は、McAdams係数とスペクトル平滑化の組み合わせが、プライバシーを改善しつつ実用性を維持していることを示す。
論文 参考訳(メタデータ) (2023-06-28T10:10:57Z) - A Randomized Approach for Tight Privacy Accounting [63.67296945525791]
推定検証リリース(EVR)と呼ばれる新しい差分プライバシーパラダイムを提案する。
EVRパラダイムは、まずメカニズムのプライバシパラメータを推定し、その保証を満たすかどうかを確認し、最後にクエリ出力を解放する。
我々の実証的な評価は、新たに提案されたEVRパラダイムが、プライバシ保護機械学習のユーティリティプライバシトレードオフを改善することを示している。
論文 参考訳(メタデータ) (2023-04-17T00:38:01Z) - Anonymizing Speech with Generative Adversarial Networks to Preserve
Speaker Privacy [22.84840887071428]
話者匿名化は、音声録音における音声を変化させることで話者の同一性を隠蔽することを目的としている。
これは一般的に、個人の保護とダウンストリームアプリケーションにおけるデータのユーザビリティとの間の、プライバシーとユーティリティのトレードオフが伴う。
本稿では,ワッサースタイン距離をコスト関数として生成した逆数ネットワークを用いて話者埋め込みを生成することで,この問題に対処することを提案する。
論文 参考訳(メタデータ) (2022-10-13T13:12:42Z) - An Experimental Study on Private Aggregation of Teacher Ensemble
Learning for End-to-End Speech Recognition [51.232523987916636]
差分プライバシー(DP)は、プライバシーデータにノイズのある歪みを課すことで、深層モデルのトレーニングに使用されるユーザー情報を保護するための1つのデータ保護手段である。
本研究では、PATE学習を動的パターン、すなわち音声を扱うように拡張し、音響データの漏洩を避けるために、ASRに関する最初の実験を行う。
論文 参考訳(メタデータ) (2022-10-11T16:55:54Z) - SPAct: Self-supervised Privacy Preservation for Action Recognition [73.79886509500409]
アクション認識におけるプライバシー漏洩を緩和するための既存のアプローチは、ビデオデータセットのアクションラベルとともに、プライバシラベルを必要とする。
自己教師付き学習(SSL)の最近の進歩は、未ラベルデータの未発見の可能性を解き放ちつつある。
本稿では、プライバシーラベルを必要とせず、自己管理的な方法で、入力ビデオからプライバシー情報を除去する新しいトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-29T02:56:40Z) - Speech Pattern based Black-box Model Watermarking for Automatic Speech
Recognition [83.2274907780273]
音声認識モデルのためのブラックボックス透かし方式を設計する方法はまだ未解決の問題である。
ASRモデルのIPを保護するための最初のブラックボックスモデル透かしフレームワークを提案する。
最先端のオープンソースASRシステムであるDeepSpeechの実験は、提案された透かし方式の有効性を実証している。
論文 参考訳(メタデータ) (2021-10-19T09:01:41Z) - Voice Privacy with Smart Digital Assistants in Educational Settings [1.8369974607582578]
ソースにおける音声プライバシーのための実用的で効率的なフレームワークを設計・評価する。
このアプローチでは、話者識別(SID)と音声変換法を組み合わせて、音声を記録するデバイス上でユーザのアイデンティティをランダムに偽装する。
我々は、単語誤り率の観点から変換のASR性能を評価し、入力音声の内容を保存する上で、このフレームワークの約束を示す。
論文 参考訳(メタデータ) (2021-03-24T19:58:45Z) - Speaker De-identification System using Autoencoders and Adversarial
Training [58.720142291102135]
本稿では,対人訓練とオートエンコーダに基づく話者識別システムを提案する。
実験結果から, 対向学習とオートエンコーダを組み合わせることで, 話者検証システムの誤り率が同等になることがわかった。
論文 参考訳(メタデータ) (2020-11-09T19:22:05Z) - Paralinguistic Privacy Protection at the Edge [5.349852254138085]
EDGYは高次元音声データを変換・フィルタリングする表現学習フレームワークで,クラウドへのオフロードに先立ってエッジの感度特性を識別・保持する。
その結果, EDGYは数ミリ秒で動作し, ABXスコアは0.2%向上し, 生音声信号から言語表現を学習する際のペナルティは最小限に抑えられた。
論文 参考訳(メタデータ) (2020-11-04T14:11:35Z) - Private Reinforcement Learning with PAC and Regret Guarantees [69.4202374491817]
エピソード強化学習(RL)のためのプライバシー保護探索ポリシーを設計する。
まず、共同微分プライバシー(JDP)の概念を用いた有意義なプライバシー定式化を提供する。
そこで我々は,強いPACと後悔境界を同時に達成し,JDP保証を享受する,プライベートな楽観主義に基づく学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-09-18T20:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。