論文の概要: Probing the Feasibility of Multilingual Speaker Anonymization
- arxiv url: http://arxiv.org/abs/2407.02937v1
- Date: Wed, 3 Jul 2024 09:12:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 14:55:24.574281
- Title: Probing the Feasibility of Multilingual Speaker Anonymization
- Title(参考訳): 多言語話者匿名化の可能性について
- Authors: Sarina Meyer, Florian Lux, Ngoc Thang Vu,
- Abstract要約: 最先端の匿名化システムを9言語に拡張する。
プライバシー攻撃や音声劣化に対する匿名化音声の堅牢性をテストする実験は、全ての言語でこのシステムの全体的な成功を示している。
- 参考スコア(独自算出の注目度): 28.445925953669825
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In speaker anonymization, speech recordings are modified in a way that the identity of the speaker remains hidden. While this technology could help to protect the privacy of individuals around the globe, current research restricts this by focusing almost exclusively on English data. In this study, we extend a state-of-the-art anonymization system to nine languages by transforming language-dependent components to their multilingual counterparts. Experiments testing the robustness of the anonymized speech against privacy attacks and speech deterioration show an overall success of this system for all languages. The results suggest that speaker embeddings trained on English data can be applied across languages, and that the anonymization performance for a language is mainly affected by the quality of the speech synthesis component used for it.
- Abstract(参考訳): 話者匿名化では、話者の身元が隠されているように音声記録が修正される。
この技術は世界中の個人のプライバシーを守るのに役立つが、現在の研究は、ほとんど英語のデータに焦点を絞ることで、これを制限している。
本研究では,言語に依存したコンポーネントを多言語に変換することで,最先端の匿名化システムを9言語に拡張する。
プライバシー攻撃や音声劣化に対する匿名化音声の堅牢性をテストする実験は、全言語でこのシステムの全体的な成功を示している。
その結果、英語データに基づく話者埋め込みは言語間で適用可能であり、言語における匿名化性能は、主にそれに用いる音声合成成分の品質に影響されることが示唆された。
関連論文リスト
- Cross-Lingual Transfer Learning for Speech Translation [7.802021866251242]
ゼロショットの言語間移動は、様々なNLPタスクで実証されている。
音声に基づくモデルが同じ伝達能力を示すかどうかを考察する。
論文 参考訳(メタデータ) (2024-07-01T09:51:48Z) - Anonymizing Speech: Evaluating and Designing Speaker Anonymization
Techniques [1.2691047660244337]
音声ユーザインタフェースの利用が増加し、音声データの収集と保存が急増した。
本論文は、音声の匿名化と匿名化の程度を評価するためのソリューションを提案する。
論文 参考訳(メタデータ) (2023-08-05T16:14:17Z) - Scaling Speech Technology to 1,000+ Languages [66.31120979098483]
MMS(Massively Multilingual Speech)プロジェクトは、タスクに応じてサポート言語を10~40倍増やす。
主な材料は、一般に公開されている宗教文書の読解に基づく新しいデータセットである。
我々は,1,406言語,1,107言語用1つの多言語自動音声認識モデル,同一言語用音声合成モデル,4,017言語用言語識別モデルについて,事前学習したwav2vec 2.0モデルを構築した。
論文 参考訳(メタデータ) (2023-05-22T22:09:41Z) - Evaluation of Speaker Anonymization on Emotional Speech [9.223908421919733]
音声データには、話者のアイデンティティや感情状態など、さまざまな個人情報が含まれている。
最近の研究は、音声のプライバシーを守るという話題に対処している。
VoicePrivacy 2020 Challenge(VPC)は、話者の匿名化に関するものだ。
論文 参考訳(メタデータ) (2023-04-15T20:50:29Z) - Differentially Private Speaker Anonymization [44.90119821614047]
実世界の発話を共有することが、音声ベースのサービスのトレーニングと展開の鍵となる。
話者匿名化は、言語的および韻律的属性をそのまま残しながら、発話から話者情報を除去することを目的としている。
言語的属性と韻律的属性は依然として話者情報を含んでいる。
論文 参考訳(メタデータ) (2022-02-23T23:20:30Z) - Cross-lingual Transfer for Speech Processing using Acoustic Language
Similarity [81.51206991542242]
言語間の移動は、このデジタル分割を橋渡しする魅力的な方法を提供する。
現在の言語間アルゴリズムは、テキストベースのタスクや音声関連タスクを低リソース言語で実現している。
本稿では,数百の言語をまたがる音響的言語間移動対を効率的に同定する言語類似性手法を提案する。
論文 参考訳(メタデータ) (2021-11-02T01:55:17Z) - Mandarin-English Code-switching Speech Recognition with Self-supervised
Speech Representation Models [55.82292352607321]
コードスイッチング(英: Code-switching, CS)は、複数の言語が文内で使用される日常会話において一般的である。
本稿では、最近成功した自己教師付き学習(SSL)手法を用いて、CSを使わずに多くのラベルなし音声データを活用する。
論文 参考訳(メタデータ) (2021-10-07T14:43:35Z) - Speaker De-identification System using Autoencoders and Adversarial
Training [58.720142291102135]
本稿では,対人訓練とオートエンコーダに基づく話者識別システムを提案する。
実験結果から, 対向学習とオートエンコーダを組み合わせることで, 話者検証システムの誤り率が同等になることがわかった。
論文 参考訳(メタデータ) (2020-11-09T19:22:05Z) - Self-Supervised Representations Improve End-to-End Speech Translation [57.641761472372814]
自己教師付き事前学習機能により,翻訳性能が一貫的に向上することを示す。
言語間の変換は、チューニングの必要なく、あるいはほとんどチューニングすることなく、さまざまな言語に拡張することができる。
論文 参考訳(メタデータ) (2020-06-22T10:28:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。