論文の概要: Speaker De-identification System using Autoencoders and Adversarial
Training
- arxiv url: http://arxiv.org/abs/2011.04696v1
- Date: Mon, 9 Nov 2020 19:22:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 02:02:28.048138
- Title: Speaker De-identification System using Autoencoders and Adversarial
Training
- Title(参考訳): オートエンコーダとadversarial trainingを用いた話者識別システム
- Authors: Fernando M. Espinoza-Cuadros, Juan M. Perero-Codosero, Javier
Ant\'on-Mart\'in, Luis A. Hern\'andez-G\'omez
- Abstract要約: 本稿では,対人訓練とオートエンコーダに基づく話者識別システムを提案する。
実験結果から, 対向学習とオートエンコーダを組み合わせることで, 話者検証システムの誤り率が同等になることがわかった。
- 参考スコア(独自算出の注目度): 58.720142291102135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The fast increase of web services and mobile apps, which collect personal
data from users, increases the risk that their privacy may be severely
compromised. In particular, the increasing variety of spoken language
interfaces and voice assistants empowered by the vertiginous breakthroughs in
Deep Learning are prompting important concerns in the European Union to
preserve speech data privacy. For instance, an attacker can record speech from
users and impersonate them to get access to systems requiring voice
identification. Hacking speaker profiles from users is also possible by means
of existing technology to extract speaker, linguistic (e.g., dialect) and
paralinguistic features (e.g., age) from the speech signal. In order to
mitigate these weaknesses, in this paper, we propose a speaker
de-identification system based on adversarial training and autoencoders in
order to suppress speaker, gender, and accent information from speech.
Experimental results show that combining adversarial learning and autoencoders
increase the equal error rate of a speaker verification system while preserving
the intelligibility of the anonymized spoken content.
- Abstract(参考訳): ユーザーから個人データを収集するウェブサービスやモバイルアプリの急速な増加は、プライバシーが深刻な侵害を受けるリスクを増大させる。
特に、ディープラーニングの目覚ましいブレークスルーによって強化された、さまざまな音声言語インターフェースと音声アシスタントは、euにおいて音声データのプライバシを維持するための重要な懸念を招いている。
例えば、攻撃者はユーザーからの音声を録音し、音声識別を必要とするシステムへのアクセスを偽造することができる。
音声信号から話者、言語(方言など)、およびパラ言語的特徴(年齢など)を抽出する既存の技術によって、ユーザから話者プロファイルをハックすることも可能である。
そこで本稿では,これらの弱点を軽減すべく,音声からの話者・性別・アクセント情報を抑制するために,敵対的訓練と自動エンコーダに基づく話者識別システムを提案する。
実験結果から, 対向学習とオートエンコーダの併用は, 匿名化音声コンテンツの可知性を保ちながら, 話者検証システムの等価な誤り率を増大させることが示された。
関連論文リスト
- Accent conversion using discrete units with parallel data synthesized from controllable accented TTS [56.18382038512251]
アクセント変換(AC)の目的は、コンテンツと話者のアイデンティティを保ちながら、アクセントを変換することである。
従来の手法では、推論中に参照発話が必要であったり、話者のアイデンティティを十分に保持していなかったり、ネイティブでないアクセントごとにのみトレーニング可能な1対1のシステムを使用していた。
本稿では,これらの問題を克服するために,多くのアクセントをネイティブに変換する,有望なACモデルを提案する。
論文 参考訳(メタデータ) (2024-09-30T19:52:10Z) - Anonymizing Speech: Evaluating and Designing Speaker Anonymization
Techniques [1.2691047660244337]
音声ユーザインタフェースの利用が増加し、音声データの収集と保存が急増した。
本論文は、音声の匿名化と匿名化の程度を評価するためのソリューションを提案する。
論文 参考訳(メタデータ) (2023-08-05T16:14:17Z) - DeID-VC: Speaker De-identification via Zero-shot Pseudo Voice Conversion [0.0]
DeID-VCは、実際の話者を擬似話者に変換する話者識別システムである。
PSGの助けを借りて、DeID-VCは独自の擬似話者を話者レベルや発話レベルに割り当てることができる。
論文 参考訳(メタデータ) (2022-09-09T21:13:08Z) - Differentially Private Speaker Anonymization [44.90119821614047]
実世界の発話を共有することが、音声ベースのサービスのトレーニングと展開の鍵となる。
話者匿名化は、言語的および韻律的属性をそのまま残しながら、発話から話者情報を除去することを目的としている。
言語的属性と韻律的属性は依然として話者情報を含んでいる。
論文 参考訳(メタデータ) (2022-02-23T23:20:30Z) - Protecting gender and identity with disentangled speech representations [49.00162808063399]
音声における性情報保護は,話者識別情報のモデル化よりも効果的であることを示す。
性別情報をエンコードし、2つの敏感な生体識別子を解読する新しい方法を提示する。
論文 参考訳(メタデータ) (2021-04-22T13:31:41Z) - Voice Privacy with Smart Digital Assistants in Educational Settings [1.8369974607582578]
ソースにおける音声プライバシーのための実用的で効率的なフレームワークを設計・評価する。
このアプローチでは、話者識別(SID)と音声変換法を組み合わせて、音声を記録するデバイス上でユーザのアイデンティティをランダムに偽装する。
我々は、単語誤り率の観点から変換のASR性能を評価し、入力音声の内容を保存する上で、このフレームワークの約束を示す。
論文 参考訳(メタデータ) (2021-03-24T19:58:45Z) - UniSpeech: Unified Speech Representation Learning with Labeled and
Unlabeled Data [54.733889961024445]
ラベル付きデータとラベル付きデータの両方を用いて音声表現を学習するためのUniSpeechという統合事前学習手法を提案する。
公立CommonVoiceコーパス上での言語間表現学習におけるUniSpeechの有効性を評価する。
論文 参考訳(メタデータ) (2021-01-19T12:53:43Z) - Adversarial Disentanglement of Speaker Representation for
Attribute-Driven Privacy Preservation [17.344080729609026]
話者音声表現における属性駆動プライバシー保存の概念について紹介する。
これにより、悪意のあるインターセプターやアプリケーションプロバイダに1つ以上の個人的な側面を隠すことができる。
本稿では,話者属性の音声表現に絡み合った逆自動符号化手法を提案し,その隠蔽を可能にする。
論文 参考訳(メタデータ) (2020-12-08T14:47:23Z) - Speech Enhancement using Self-Adaptation and Multi-Head Self-Attention [70.82604384963679]
本稿では,補助的話者認識機能を用いた音声強調のための自己適応手法について検討する。
テスト発話から直接適応に用いる話者表現を抽出する。
論文 参考訳(メタデータ) (2020-02-14T05:05:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。