論文の概要: A Large-Scale Per-Speaker Analysis of Re-identification Risk in Speech Anonymization
- arxiv url: http://arxiv.org/abs/2606.07210v1
- Date: Fri, 05 Jun 2026 12:21:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.730968
- Title: A Large-Scale Per-Speaker Analysis of Re-identification Risk in Speech Anonymization
- Title(参考訳): 音声匿名化における話者ごとの大規模再識別リスクの分析
- Authors: Orane Dufour, Paul Magron, Mickael Rouvier, Emmanuel Vincent,
- Abstract要約: 我々は,最悪のシナリオ下で,リンク可能性に基づくメトリクスを用いて,話者ごとの大規模プライバシー分析を行う。
5000人近い話者が複数の匿名化システム、アタッカーアーキテクチャ、会話の長さで評価されている。
- 参考スコア(独自算出の注目度): 14.038986003108201
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Speech anonymization is commonly evaluated using averagecase metrics such as the equal error rate, which can hide large disparities in re-identification risks across individuals. In this paper, we conduct a large-scale per-speaker privacy analysis using a linkability-based metric under a worst-case scenario. Nearly 5,000 speakers are evaluated across multiple anonymization systems, attacker architectures, and conversation lengths. While linkability scores are highly polarized at the speaker level, the sets of easy to re-identify and hard to re-identify speakers vary substantially across configurations. We show that no single factor explains speaker vulnerability. Instead, the re-identification risk emerges from the interaction between the attacker, the anonymizer, and the amount of available speech. These results challenge the notion of intrinsic speaker-level privacy risks and emphasize the need for evaluation protocols that are explicitly conditioned on the attacker and anonymizer.
- Abstract(参考訳): 音声の匿名化は、個人間の再識別リスクの大きな相違を隠蔽する等、平均的なエラー率を用いて一般的に評価される。
本稿では,最悪のシナリオ下でリンク可能性に基づくメトリクスを用いて,話者ごとの大規模プライバシー分析を行う。
5000人近い話者が複数の匿名化システム、アタッカーアーキテクチャ、会話の長さで評価されている。
接続性スコアは話者レベルで高度に偏極化されているが、話者を再同定し易く、話者を再同定し難いセットは構成によって大きく異なる。
話者の脆弱性を説明する要因はひとつもありません。
代わりに、攻撃者、匿名化者、利用可能な音声の量との相互作用から、再識別のリスクが生じる。
これらの結果は、固有の話者レベルのプライバシーリスクの概念に挑戦し、攻撃者や匿名化者に対して明示的に規定された評価プロトコルの必要性を強調している。
関連論文リスト
- Boundary-targeted Membership Inference Attacks on Safety Classifiers [70.20833439671131]
安全分類器は、セルフハームとメンタルヘルスの議論を含むセンシティブなデータセットに基づいて訓練される。
低信頼例を識別する新たな境界目標選択戦略を導入する。
実験により、相手は会話の19%を安全分類器が5%の偽陽性率でユーザーの苦痛を示すようにフラグ付けして回復できることが示された。
これは最先端のMIAメソッドだけで攻撃するより3.5ドル高い。
論文 参考訳(メタデータ) (2026-05-21T12:05:22Z) - VoxGuard: Evaluating User and Attribute Privacy in Speech via Membership Inference Attacks [51.68795949691009]
差分プライバシとメンバシップ推論に基づくフレームワークであるVoxGuardを紹介した。
属性については, 匿名化後も, 性別やアクセントをほぼ完全精度で再現できることが示唆された。
以上の結果から,EERはリークを著しく過小評価し,低FPR評価の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-09-22T20:57:48Z) - A Benchmark for Multi-speaker Anonymization [9.990701310620368]
本稿では,マルチ話者匿名化ベンチマークを提案する。
また、重複する会話のプライバシー漏洩についても論じる。
非オーバーラップシミュレーションと実世界のデータセットによる実験は、マルチスピーカー匿名化システムの有効性を実証している。
論文 参考訳(メタデータ) (2024-07-08T04:48:43Z) - Towards Probing Speech-Specific Risks in Large Multimodal Models: A Taxonomy, Benchmark, and Insights [50.89022445197919]
本研究は,8つのリスクカテゴリーを敵意(悪意的皮肉と脅し),悪意的模倣(年齢,性別,民族),ステレオタイプ的バイアス(年齢,性別,民族)を対象とする音声特異的リスク分類法を提案する。
分類に基づいて,これらのリスクのカテゴリを検出するために,現在のLMM能力を評価するための小規模データセットを作成する。
論文 参考訳(メタデータ) (2024-06-25T10:08:45Z) - Anonymizing Speech: Evaluating and Designing Speaker Anonymization
Techniques [1.2691047660244337]
音声ユーザインタフェースの利用が増加し、音声データの収集と保存が急増した。
本論文は、音声の匿名化と匿名化の程度を評価するためのソリューションを提案する。
論文 参考訳(メタデータ) (2023-08-05T16:14:17Z) - Speaker De-identification System using Autoencoders and Adversarial
Training [58.720142291102135]
本稿では,対人訓練とオートエンコーダに基づく話者識別システムを提案する。
実験結果から, 対向学習とオートエンコーダを組み合わせることで, 話者検証システムの誤り率が同等になることがわかった。
論文 参考訳(メタデータ) (2020-11-09T19:22:05Z) - Design Choices for X-vector Based Speaker Anonymization [48.46018902334472]
第1回VoicePrivacy Challengeのベースラインとして,フレキシブルな擬似話者選択手法を提案する。
LibriSpeechから派生したデータセットを使用して実験を行い、プライバシとユーティリティの観点から設計選択の最適な組み合わせを見つける。
論文 参考訳(メタデータ) (2020-05-18T11:32:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。