論文の概要: Improving on-device speaker verification using federated learning with
privacy
- arxiv url: http://arxiv.org/abs/2008.02651v1
- Date: Thu, 6 Aug 2020 13:37:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-11-02 07:03:57.619918
- Title: Improving on-device speaker verification using federated learning with
privacy
- Title(参考訳): プライバシーを考慮した連合学習によるオンデバイス話者照合の改善
- Authors: Filip Granqvist, Matt Seigel, Rogier van Dalen, \'Aine Cahill, Stephen
Shum, Matthias Paulik
- Abstract要約: 話者特性に関する情報は、話者認識精度を向上させる側情報として有用である。
本稿では,プライバシ保護学習が話者認証システムをどのように改善するかを検討する。
- 参考スコア(独自算出の注目度): 5.321241042620525
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Information on speaker characteristics can be useful as side information in
improving speaker recognition accuracy. However, such information is often
private. This paper investigates how privacy-preserving learning can improve a
speaker verification system, by enabling the use of privacy-sensitive speaker
data to train an auxiliary classification model that predicts vocal
characteristics of speakers. In particular, this paper explores the utility
achieved by approaches which combine different federated learning and
differential privacy mechanisms. These approaches make it possible to train a
central model while protecting user privacy, with users' data remaining on
their devices. Furthermore, they make learning on a large population of
speakers possible, ensuring good coverage of speaker characteristics when
training a model. The auxiliary model described here uses features extracted
from phrases which trigger a speaker verification system. From these features,
the model predicts speaker characteristic labels considered useful as side
information. The knowledge of the auxiliary model is distilled into a speaker
verification system using multi-task learning, with the side information labels
predicted by this auxiliary model being the additional task. This approach
results in a 6% relative improvement in equal error rate over a baseline
system.
- Abstract(参考訳): 話者特性に関する情報は、話者認識精度を向上させる側情報として有用である。
しかし、そのような情報はしばしば非公開である。
本稿では,プライバシーに敏感な話者データを用いて,話者の声質を予測する補助的分類モデルを訓練することにより,プライバシー保全学習が話者照合システムをどのように改善できるかを検討する。
特に,異なるフェデレーション学習と差分プライバシー機構を組み合わせたアプローチによって達成される有用性について検討する。
これらのアプローチにより、ユーザのプライバシを保護しながら、ユーザのデータをデバイスに残しながら、中央モデルをトレーニングすることが可能になる。
さらに,モデル学習時の話者特性を良好に把握し,多数の話者の学習を可能にする。
ここで述べる補助モデルは、話者検証システムを起動するフレーズから抽出した特徴を用いる。
これらの特徴から,副次情報として有用な話者特性ラベルを予測する。
補助モデルの知識をマルチタスク学習を用いた話者検証システムに蒸留し,副モデルによって予測される側情報ラベルを付加課題とする。
このアプローチでは、ベースラインシステムに対するエラー率の相対的に6%向上する。
関連論文リスト
- Improving Speaker Diarization using Semantic Information: Joint Pairwise
Constraints Propagation [53.01238689626378]
本稿では,話者ダイアリゼーションシステムにおける意味情報を活用する新しい手法を提案する。
音声言語理解モジュールを導入し、話者関連意味情報を抽出する。
本稿では,これらの制約を話者ダイアリゼーションパイプラインに統合する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-09-19T09:13:30Z) - Self-supervised Fine-tuning for Improved Content Representations by
Speaker-invariant Clustering [78.2927924732142]
話者不変クラスタリング(Spin)を自己教師付き学習手法として提案する。
Spinは、単一のGPU上で45分間の微調整で、スピーカー情報を切り離し、コンテンツ表現を保存する。
論文 参考訳(メタデータ) (2023-05-18T15:59:36Z) - Self supervised learning for robust voice cloning [3.7989740031754806]
自己教師型フレームワークで学習した特徴を用いて,高品質な音声表現を生成する。
学習した特徴は、事前訓練された発話レベルの埋め込みや、非減衰タコトロンアーキテクチャへの入力として使用される。
この手法により、ラベルなしマルチスピーカデータセットでモデルをトレーニングし、未知の話者埋め込みを用いて話者の声を模倣することができる。
論文 参考訳(メタデータ) (2022-04-07T13:05:24Z) - Improving speaker de-identification with functional data analysis of f0
trajectories [10.809893662563926]
フォーマント修正は、訓練データを必要としない話者識別のための、シンプルで効果的な方法である。
本研究は, 簡易な定式化シフトに加えて, 関数データ解析に基づくf0トラジェクトリを操作する新しい話者識別手法を提案する。
提案手法は,音素的に制御可能なピッチ特性を最適に識別し,フォルマントに基づく話者識別を最大25%改善する。
論文 参考訳(メタデータ) (2022-03-31T01:34:15Z) - Self-supervised Speaker Recognition Training Using Human-Machine
Dialogues [22.262550043863445]
顧客とスマートスピーカーデバイス間の対話を利用して、話者認識モデルを事前訓練する方法を検討する。
本稿では,その音響的均一性に基づいて対話から選択的に学習する効果的な拒絶機構を提案する。
実験により,提案手法は従来よりも優れた性能向上をもたらすことが示された。
論文 参考訳(メタデータ) (2022-02-07T19:44:54Z) - Retrieving Speaker Information from Personalized Acoustic Models for
Speech Recognition [5.1229352884025845]
本稿では,この話者に局所的に適応したニューラル音響モデルの重み行列変化を利用して,話者の性別を復元できることを示す。
本稿では,この話者に局所的に適応したニューラル音響モデルの重み行列変化を利用するだけで,話者の性別を復元することができることを示す。
論文 参考訳(メタデータ) (2021-11-07T22:17:52Z) - Speaker De-identification System using Autoencoders and Adversarial
Training [58.720142291102135]
本稿では,対人訓練とオートエンコーダに基づく話者識別システムを提案する。
実験結果から, 対向学習とオートエンコーダを組み合わせることで, 話者検証システムの誤り率が同等になることがわかった。
論文 参考訳(メタデータ) (2020-11-09T19:22:05Z) - Leveraging speaker attribute information using multi task learning for
speaker verification and diarization [33.60058873783114]
対象アプリケーションに不適合な音声コーパスに対してのみ利用できる場合であっても,補助ラベル情報を利用するためのフレームワークを提案する。
本研究では,2種類の話者属性情報を活用することで,検証作業とダイアリゼーション作業の両方において,深層話者埋め込みの性能を向上させることを示す。
論文 参考訳(メタデータ) (2020-10-27T13:10:51Z) - Augmentation adversarial training for self-supervised speaker
recognition [49.47756927090593]
話者ラベルのない頑健な話者認識モデルを訓練する。
VoxCelebとVOiCESデータセットの実験は、セルフスーパービジョンを使用した以前の作業よりも大幅に改善されている。
論文 参考訳(メタデータ) (2020-07-23T15:49:52Z) - Speaker Diarization with Lexical Information [59.983797884955]
本研究では,音声認識による語彙情報を活用した話者ダイアリゼーション手法を提案する。
本稿では,話者クラスタリングプロセスに単語レベルの話者回転確率を組み込んだ話者ダイアリゼーションシステムを提案し,全体的なダイアリゼーション精度を向上させる。
論文 参考訳(メタデータ) (2020-04-13T17:16:56Z) - Speech Enhancement using Self-Adaptation and Multi-Head Self-Attention [70.82604384963679]
本稿では,補助的話者認識機能を用いた音声強調のための自己適応手法について検討する。
テスト発話から直接適応に用いる話者表現を抽出する。
論文 参考訳(メタデータ) (2020-02-14T05:05:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。