論文の概要: On the Generation and Removal of Speaker Adversarial Perturbation for Voice-Privacy Protection
- arxiv url: http://arxiv.org/abs/2412.09195v1
- Date: Thu, 12 Dec 2024 11:46:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-13 13:30:35.925203
- Title: On the Generation and Removal of Speaker Adversarial Perturbation for Voice-Privacy Protection
- Title(参考訳): 声質保護のための話者対人摂動の生成と除去について
- Authors: Chenyang Guo, Liping Chen, Zhuhai Li, Kong Aik Lee, Zhen-Hua Ling, Wu Guo,
- Abstract要約: 近年の音声プライバシ保護の進歩は,話者の音声属性を隠蔽する同じ手法の肯定的な使用例を示している。
本稿では,逆方向の摂動を発生させるエンティティを除去し,元の音声を復元する可逆性について検討する。
同様の手法は、捜査員が音声保護されたスピーチを匿名化し、犯罪者の身元をセキュリティと法医学的分析で復元するためにも用いられる。
- 参考スコア(独自算出の注目度): 45.49915832081347
- License:
- Abstract: Neural networks are commonly known to be vulnerable to adversarial attacks mounted through subtle perturbation on the input data. Recent development in voice-privacy protection has shown the positive use cases of the same technique to conceal speaker's voice attribute with additive perturbation signal generated by an adversarial network. This paper examines the reversibility property where an entity generating the adversarial perturbations is authorized to remove them and restore original speech (e.g., the speaker him/herself). A similar technique could also be used by an investigator to deanonymize a voice-protected speech to restore criminals' identities in security and forensic analysis. In this setting, the perturbation generative module is assumed to be known in the removal process. To this end, a joint training of perturbation generation and removal modules is proposed. Experimental results on the LibriSpeech dataset demonstrated that the subtle perturbations added to the original speech can be predicted from the anonymized speech while achieving the goal of privacy protection. By removing these perturbations from the anonymized sample, the original speech can be restored. Audio samples can be found in \url{https://voiceprivacy.github.io/Perturbation-Generation-Removal/}.
- Abstract(参考訳): ニューラルネットワークは、入力データの微妙な摂動によって実装された敵攻撃に対して脆弱であることが一般的に知られている。
近年の音声プライバシ保護の進歩は, 対向ネットワークが生み出す付加的な摂動信号で話者の音声属性を隠蔽する手法として, 同じ手法が有効であることを示している。
本稿では,逆方向の摂動を発生させる物体を除去し,元の音声(例えば,話し手)を復元する可逆性について検討する。
同様の手法は、捜査員が音声保護されたスピーチを匿名化し、犯罪者の身元をセキュリティと法医学的分析で復元するためにも用いられる。
この設定では、摂動生成モジュールは除去過程において知られていると仮定される。
この目的のために,摂動発生・除去モジュールの連成訓練を提案する。
LibriSpeechデータセットの実験結果は、プライバシー保護の目標を達成しつつ、匿名化された音声から元の音声に付加された微妙な摂動を予測できることを実証した。
匿名化サンプルからこれらの摂動を取り除くことにより、元の音声を復元することができる。
オーディオサンプルは \url{https://voiceprivacy.github.io/Perturbation-Generation-Removal/} で見ることができる。
関連論文リスト
- Asynchronous Voice Anonymization Using Adversarial Perturbation On Speaker Embedding [46.25816642820348]
我々は、人間の知覚を維持しながら、音声認識に対して音声属性を変更することに重点を置いている。
話者ゆがみ機構を組み込んだ音声生成フレームワークを用いて匿名化音声を生成する。
LibriSpeechデータセットで行った実験では、話者の属性は、その人の知覚が処理された発話の60.71%で保存されていることが判明した。
論文 参考訳(メタデータ) (2024-06-12T13:33:24Z) - Anonymizing Speech with Generative Adversarial Networks to Preserve
Speaker Privacy [22.84840887071428]
話者匿名化は、音声録音における音声を変化させることで話者の同一性を隠蔽することを目的としている。
これは一般的に、個人の保護とダウンストリームアプリケーションにおけるデータのユーザビリティとの間の、プライバシーとユーティリティのトレードオフが伴う。
本稿では,ワッサースタイン距離をコスト関数として生成した逆数ネットワークを用いて話者埋め込みを生成することで,この問題に対処することを提案する。
論文 参考訳(メタデータ) (2022-10-13T13:12:42Z) - Are disentangled representations all you need to build speaker
anonymization systems? [0.0]
音声信号には、話者のアイデンティティなど、多くの機密情報が含まれている。
話者匿名化は、音源話者の身元をそのまま残しながら、音声信号を変換し、音源話者の身元を除去することを目的としている。
論文 参考訳(メタデータ) (2022-08-22T07:51:47Z) - Generating gender-ambiguous voices for privacy-preserving speech
recognition [38.733077459065704]
我々は、話者の性別やアイデンティティを隠蔽する音声を合成する生成的敵ネットワークGenGANを提案する。
我々は、性別情報のみにジェネレータを条件とし、信号歪みとプライバシ保護の間の敵対的損失を利用する。
論文 参考訳(メタデータ) (2022-07-03T14:23:02Z) - Differentially Private Speaker Anonymization [44.90119821614047]
実世界の発話を共有することが、音声ベースのサービスのトレーニングと展開の鍵となる。
話者匿名化は、言語的および韻律的属性をそのまま残しながら、発話から話者情報を除去することを目的としている。
言語的属性と韻律的属性は依然として話者情報を含んでいる。
論文 参考訳(メタデータ) (2022-02-23T23:20:30Z) - Protecting gender and identity with disentangled speech representations [49.00162808063399]
音声における性情報保護は,話者識別情報のモデル化よりも効果的であることを示す。
性別情報をエンコードし、2つの敏感な生体識別子を解読する新しい方法を提示する。
論文 参考訳(メタデータ) (2021-04-22T13:31:41Z) - Speaker De-identification System using Autoencoders and Adversarial
Training [58.720142291102135]
本稿では,対人訓練とオートエンコーダに基づく話者識別システムを提案する。
実験結果から, 対向学習とオートエンコーダを組み合わせることで, 話者検証システムの誤り率が同等になることがわかった。
論文 参考訳(メタデータ) (2020-11-09T19:22:05Z) - Backdoor Attack against Speaker Verification [86.43395230456339]
学習データを汚染することにより,話者検証モデルに隠れたバックドアを注入できることを示す。
また,既存のバックドア攻撃が話者認証攻撃に直接適用できないことも実証した。
論文 参考訳(メタデータ) (2020-10-22T11:10:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。