論文の概要: Membership Inference Attacks Against Self-supervised Speech Models
- arxiv url: http://arxiv.org/abs/2111.05113v1
- Date: Tue, 9 Nov 2021 13:00:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-10 16:21:58.588635
- Title: Membership Inference Attacks Against Self-supervised Speech Models
- Title(参考訳): 自己教師型音声モデルに対する会員推測攻撃
- Authors: Wei-Cheng Tseng, Wei-Tsung Kao, Hung-yi Lee
- Abstract要約: 連続音声における自己教師付き学習(SSL)が注目されている。
ブラックボックスアクセス下でのMIA(Commanship Inference Attacks)を用いたSSL音声モデルに対する最初のプライバシ分析を行う。
- 参考スコア(独自算出の注目度): 62.73937175625953
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recently, adapting the idea of self-supervised learning (SSL) on continuous
speech has started gaining attention. SSL models pre-trained on a huge amount
of unlabeled audio can generate general-purpose representations that benefit a
wide variety of speech processing tasks. Despite their ubiquitous deployment,
however, the potential privacy risks of these models have not been well
investigated. In this paper, we present the first privacy analysis on several
SSL speech models using Membership Inference Attacks (MIA) under black-box
access. The experiment results show that these pre-trained models are
vulnerable to MIA and prone to membership information leakage with high
adversarial advantage scores in both utterance-level and speaker-level.
Furthermore, we also conduct several ablation studies to understand the factors
that contribute to the success of MIA.
- Abstract(参考訳): 近年,自己教師型学習(SSL)の概念を連続音声に適用する動きが注目されている。
大量の未ラベル音声で事前トレーニングされたSSLモデルは、幅広い音声処理タスクの恩恵を受ける汎用表現を生成することができる。
しかし、ユビキタスな展開にもかかわらず、これらのモデルの潜在的なプライバシーリスクは十分に調査されていない。
本稿では,複数のSSL音声モデルに対して,ブラックボックスアクセス下でのMIAを用いた最初のプライバシ解析を行う。
実験の結果,これらの事前学習モデルでは,発話レベルと話者レベルの両方において,メンバシップ情報漏えいの影響を受けやすいことがわかった。
さらに,ミアの成功に寄与する因子を理解するため,いくつかのアブレーション研究を行った。
関連論文リスト
- What Do Self-Supervised Speech and Speaker Models Learn? New Findings
From a Cross Model Layer-Wise Analysis [44.93152068353389]
自己教師付き学習(SSL)は、意味のある音声表現を学習するために注目を集めている。
話者SSLモデルは、主に話者表現のための発話レベルの訓練目標を採用する。
論文 参考訳(メタデータ) (2024-01-31T07:23:22Z) - Self-supervised Neural Factor Analysis for Disentangling Utterance-level
Speech Representations [30.293081541301746]
wav2vecやHuBERTのような自己教師付き学習(SSL)音声モデルは、音声認識における最先端の性能を実証している。
この問題は,不整合表現の欠如と発話レベルの学習目標が原因である。
我々のモデルは、SUPERBベンチマークの全ての発話レベル非意味タスクにおいて、ラベル付きデータのわずか20%で、現在の最高のモデルであるWavLMより優れています。
論文 参考訳(メタデータ) (2023-05-14T08:26:24Z) - Why does Self-Supervised Learning for Speech Recognition Benefit Speaker
Recognition? [86.53044183309824]
話者関連課題における自己教師型学習の成功につながる要因について検討する。
Voxceleb-1データセットにおける実験結果から,SVタスクに対するSSLの利点は,マスクによる予測損失,データスケール,モデルサイズの組み合わせによるものであることが示唆された。
論文 参考訳(メタデータ) (2022-04-27T08:35:57Z) - Self-Supervised Learning for speech recognition with Intermediate layer
supervision [52.93758711230248]
自己教師付き学習(ILS-SSL)のための中間層スーパービジョンを提案する。
ILS-SSLは、中間層にSSL損失を追加することで、可能な限りコンテンツ情報に集中させます。
LibriSpeech の他のテストセットの実験により,本手法は HuBERT を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2021-12-16T10:45:05Z) - Characterizing the adversarial vulnerability of speech self-supervised
learning [95.03389072594243]
我々は,ゼロ知識とリミテッド知識の両方の敵からの攻撃の下で,そのようなパラダイムの敵対的脆弱性を調査するための最初の試みを行う。
実験結果から, SUPERB が提案するパラダイムは, 限られた知識を持つ敵に対して脆弱であることが示唆された。
論文 参考訳(メタデータ) (2021-11-08T08:44:04Z) - UniSpeech-SAT: Universal Speech Representation Learning with Speaker
Aware Pre-Training [72.004873454347]
教師なし話者情報抽出の2つの手法が導入された。
SUPERBベンチマークによる実験結果から,提案方式は最先端の性能を実現することが示された。
トレーニングデータセットを94万時間公開オーディオデータにスケールアップし、さらなるパフォーマンス向上を実現しています。
論文 参考訳(メタデータ) (2021-10-12T05:43:30Z) - Self-supervised Text-independent Speaker Verification using Prototypical
Momentum Contrastive Learning [58.14807331265752]
モーメントの対比学習によって話者埋め込みがより良く学習できることを示す。
自己監視フレームワークを、データのごく一部しかラベル付けされない半監視シナリオに一般化します。
論文 参考訳(メタデータ) (2020-12-13T23:23:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。