論文の概要: SegReConcat: A Data Augmentation Method for Voice Anonymization Attack
- arxiv url: http://arxiv.org/abs/2508.18907v1
- Date: Tue, 26 Aug 2025 10:26:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.804357
- Title: SegReConcat: A Data Augmentation Method for Voice Anonymization Attack
- Title(参考訳): SegReConcat: 音声匿名化攻撃のためのデータ拡張方法
- Authors: Ridwan Arefeen, Xiaoxiao Miao, Rong Tong, Aik Beng Ng, Simon See,
- Abstract要約: 音声の匿名化は、音声データの有用性を維持しながら話者の同一性を隠蔽しようとする。
自動話者検証システムの攻撃側強化のためのデータ拡張手法であるSegReConcatを提案する。
- 参考スコア(独自算出の注目度): 20.139879210234533
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Anonymization of voice seeks to conceal the identity of the speaker while maintaining the utility of speech data. However, residual speaker cues often persist, which pose privacy risks. We propose SegReConcat, a data augmentation method for attacker-side enhancement of automatic speaker verification systems. SegReConcat segments anonymized speech at the word level, rearranges segments using random or similarity-based strategies to disrupt long-term contextual cues, and concatenates them with the original utterance, allowing an attacker to learn source speaker traits from multiple perspectives. The proposed method has been evaluated in the VoicePrivacy Attacker Challenge 2024 framework across seven anonymization systems, SegReConcat improves de-anonymization on five out of seven systems.
- Abstract(参考訳): 音声の匿名化は、音声データの有用性を維持しながら話者の同一性を隠蔽しようとする。
しかし、残留話者の手がかりはしばしば持続し、プライバシー上のリスクを生じさせる。
自動話者検証システムの攻撃側強化のためのデータ拡張手法であるSegReConcatを提案する。
SegReConcatは、単語レベルで匿名化された音声をセグメント化し、ランダムまたは類似性に基づく戦略を用いてセグメントを並べ替えて、長期的文脈的手がかりを妨害し、それらを元の発話と結合させ、攻撃者が複数の視点からソース話者特性を学習できるようにする。
提案手法は7つの匿名化システムにまたがるVoicePrivacy Attacker Challenge 2024で評価されており、SegReConcatは7つのシステムのうち5つの匿名化を改善する。
関連論文リスト
- A Benchmark for Multi-speaker Anonymization [9.990701310620368]
本稿では,マルチ話者匿名化ベンチマークを提案する。
また、重複する会話のプライバシー漏洩についても論じる。
非オーバーラップシミュレーションと実世界のデータセットによる実験は、マルチスピーカー匿名化システムの有効性を実証している。
論文 参考訳(メタデータ) (2024-07-08T04:48:43Z) - Asynchronous Voice Anonymization Using Adversarial Perturbation On Speaker Embedding [46.25816642820348]
我々は、人間の知覚を維持しながら、音声認識に対して音声属性を変更することに重点を置いている。
話者ゆがみ機構を組み込んだ音声生成フレームワークを用いて匿名化音声を生成する。
LibriSpeechデータセットで行った実験では、話者の属性は、その人の知覚が処理された発話の60.71%で保存されていることが判明した。
論文 参考訳(メタデータ) (2024-06-12T13:33:24Z) - Anonymizing Speech: Evaluating and Designing Speaker Anonymization
Techniques [1.2691047660244337]
音声ユーザインタフェースの利用が増加し、音声データの収集と保存が急増した。
本論文は、音声の匿名化と匿名化の程度を評価するためのソリューションを提案する。
論文 参考訳(メタデータ) (2023-08-05T16:14:17Z) - Self-supervised Fine-tuning for Improved Content Representations by
Speaker-invariant Clustering [78.2927924732142]
話者不変クラスタリング(Spin)を自己教師付き学習手法として提案する。
Spinは、単一のGPU上で45分間の微調整で、スピーカー情報を切り離し、コンテンツ表現を保存する。
論文 参考訳(メタデータ) (2023-05-18T15:59:36Z) - Speaker De-identification System using Autoencoders and Adversarial
Training [58.720142291102135]
本稿では,対人訓練とオートエンコーダに基づく話者識別システムを提案する。
実験結果から, 対向学習とオートエンコーダを組み合わせることで, 話者検証システムの誤り率が同等になることがわかった。
論文 参考訳(メタデータ) (2020-11-09T19:22:05Z) - Design Choices for X-vector Based Speaker Anonymization [48.46018902334472]
第1回VoicePrivacy Challengeのベースラインとして,フレキシブルな擬似話者選択手法を提案する。
LibriSpeechから派生したデータセットを使用して実験を行い、プライバシとユーティリティの観点から設計選択の最適な組み合わせを見つける。
論文 参考訳(メタデータ) (2020-05-18T11:32:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。