論文の概要: On the invertibility of a voice privacy system using embedding
alignement
- arxiv url: http://arxiv.org/abs/2110.05431v1
- Date: Fri, 8 Oct 2021 14:43:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-12 20:49:38.648525
- Title: On the invertibility of a voice privacy system using embedding
alignement
- Title(参考訳): 埋め込みアライメントを用いた音声プライバシーシステムの可逆性について
- Authors: Pierre Champion (MULTISPEECH, LIUM), Thomas Thebaud (LIUM), Ga\"el Le
Lan, Anthony Larcher (LIUM), Denis Jouvet (MULTISPEECH)
- Abstract要約: 本稿では,組込みアライメント技術を用いた音声匿名化システムにおける各種攻撃シナリオについて検討する。
最適な回転を計算し、この近似結果と公式のVoice Privacy Challenge結果を比較する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper explores various attack scenarios on a voice anonymization system
using embeddings alignment techniques. We use Wasserstein-Procrustes (an
algorithm initially designed for unsupervised translation) or Procrustes
analysis to match two sets of x-vectors, before and after voice anonymization,
to mimic this transformation as a rotation function. We compute the optimal
rotation and compare the results of this approximation to the official Voice
Privacy Challenge results. We show that a complex system like the baseline of
the Voice Privacy Challenge can be approximated by a rotation, estimated using
a limited set of x-vectors. This paper studies the space of solutions for voice
anonymization within the specific scope of rotations. Rotations being
reversible, the proposed method can recover up to 62% of the speaker identities
from anonymized embeddings.
- Abstract(参考訳): 本稿では,組込みアライメント技術を用いた音声匿名化システムにおける各種攻撃シナリオについて検討する。
wasserstein-procrustes(当初は教師なし翻訳のために設計されたアルゴリズム)やprocrustes分析を使用して、音声匿名化前後の2組のx-ベクトルとマッチングし、この変換を回転関数として模倣する。
最適な回転を計算し、この近似の結果を公式の音声プライバシーチャレンジ結果と比較する。
音声プライバシーチャレンジのベースラインのような複雑なシステムは,xベクトルの限られたセットを用いて,回転によって近似できることを示す。
本稿では,回転の特定の範囲における音声匿名化の解の空間について検討する。
回転は可逆的であり、提案手法は匿名埋め込みから最大62%の話者識別を回復することができる。
関連論文リスト
- Vocoder drift compensation by x-vector alignment in speaker
anonymisation [11.480724899031149]
本稿では,いわゆるボコーダドリフトの起源を考察し,代用したxベクターと言語内容,イントネーション,韻律の本来の表現とのミスマッチによるものであることを示す。
また、ボコーダドリフト補償に対する元来のアプローチも報告されている。
論文 参考訳(メタデータ) (2023-07-17T11:38:35Z) - Speaker Embedding-aware Neural Diarization: a Novel Framework for
Overlapped Speech Diarization in the Meeting Scenario [51.5031673695118]
重なり合う音声のダイアリゼーションを単一ラベル予測問題として再構成する。
話者埋め込み認識型ニューラルダイアリゼーション(SEND)システムを提案する。
論文 参考訳(メタデータ) (2022-03-18T06:40:39Z) - Invertible Voice Conversion [12.095003816544919]
本稿では,音声変換のための非可逆ディープラーニングフレームワークINVVCを提案する。
ソースの同一性をトレース可能な,可逆的なフレームワークを開発した。
提案手法を並列学習データを用いて1対1の音声変換と多対1の音声変換に適用する。
論文 参考訳(メタデータ) (2022-01-26T00:25:27Z) - Multi-Discriminator Sobolev Defense-GAN Against Adversarial Attacks for
End-to-End Speech Systems [78.5097679815944]
本稿では,最先端音声テキストシステムのためのエンドツーエンド攻撃に対する防御手法を提案する。
まず,短時間フーリエ変換を用いた2次元スペクトルを用いた音声信号の表現を行う。
第二に、スペクトログラム部分空間射影演算を用いて安全ベクトルを反復的に発見する。
第3に,ソボレフ積分確率計量で学習した新しいganアーキテクチャを用いて,このような安全なベクトルを持つスペクトログラムを合成する。
論文 参考訳(メタデータ) (2021-03-15T01:11:13Z) - Speaker Anonymization with Distribution-Preserving X-Vector Generation
for the VoicePrivacy Challenge 2020 [19.420608243033794]
本稿では,VoicePrivacy Challenge 2020への提出として,分散保存音声匿名化手法を提案する。
提案手法は, 有機話者Xベクトルの相似性分布をより正確に追従するXベクトルを生成する方法を示す。
論文 参考訳(メタデータ) (2020-10-26T09:53:56Z) - Design Choices for X-vector Based Speaker Anonymization [48.46018902334472]
第1回VoicePrivacy Challengeのベースラインとして,フレキシブルな擬似話者選択手法を提案する。
LibriSpeechから派生したデータセットを使用して実験を行い、プライバシとユーティリティの観点から設計選択の最適な組み合わせを見つける。
論文 参考訳(メタデータ) (2020-05-18T11:32:14Z) - Neural Syntactic Preordering for Controlled Paraphrase Generation [57.5316011554622]
私たちの研究は、構文変換を使用して、ソース文をソフトに"リオーダー"し、神経パラフレージングモデルをガイドします。
まず、入力文が与えられた場合、エンコーダ・デコーダモデルを用いて、実行可能な構文再構成のセットを導出する。
次に、提案した各再構成を用いて位置埋め込みのシーケンスを生成し、最終的なエンコーダ-デコーダパラフレーズモデルが特定の順序でソース語に従属することを奨励する。
論文 参考訳(メタデータ) (2020-05-05T09:02:25Z) - End-to-End Whisper to Natural Speech Conversion using Modified
Transformer Network [0.8399688944263843]
シーケンス・ツー・シーケンス・アプローチを用いて、whisper-to-natural-speech変換を導入する。
本稿では,メル周波数ケプストラム係数やスムーズなスペクトル特徴などの異なる特徴について検討する。
提案するネットワークは、機能間変換のための教師ありアプローチを用いて、エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2020-04-20T14:47:46Z) - Spatially Adaptive Inference with Stochastic Feature Sampling and
Interpolation [72.40827239394565]
スパースサンプリングされた場所のみの機能を計算することを提案する。
次に、効率的な手順で特徴写像を密に再構築する。
提案したネットワークは、様々なコンピュータビジョンタスクの精度を維持しながら、かなりの計算を省くために実験的に示されている。
論文 参考訳(メタデータ) (2020-03-19T15:36:31Z) - Continuous speech separation: dataset and analysis [52.10378896407332]
自然な会話では、音声信号は連続的であり、重複成分と重複成分の両方を含む。
本稿では,連続音声分離アルゴリズムを評価するためのデータセットとプロトコルについて述べる。
論文 参考訳(メタデータ) (2020-01-30T18:01:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。