論文の概要: Beyond Neural-on-Neural Approaches to Speaker Gender Protection
- arxiv url: http://arxiv.org/abs/2306.17700v1
- Date: Fri, 30 Jun 2023 14:26:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-03 12:07:39.401848
- Title: Beyond Neural-on-Neural Approaches to Speaker Gender Protection
- Title(参考訳): ニューラル・オン・ニューラルなジェンダー保護へのアプローチ
- Authors: Loes van Bemmel, Zhuoran Liu, Nik Vaessen, Martha Larson
- Abstract要約: 音声特徴に基づく性別推定攻撃の検査の重要性を示す。
研究者らは音声の特徴を利用して、保護的な修正が音声信号をどのように変化させるかを理解するべきだと論じている。
- 参考スコア(独自算出の注目度): 2.741893145546753
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent research has proposed approaches that modify speech to defend against
gender inference attacks. The goal of these protection algorithms is to control
the availability of information about a speaker's gender, a privacy-sensitive
attribute. Currently, the common practice for developing and testing gender
protection algorithms is "neural-on-neural", i.e., perturbations are generated
and tested with a neural network. In this paper, we propose to go beyond this
practice to strengthen the study of gender protection. First, we demonstrate
the importance of testing gender inference attacks that are based on speech
features historically developed by speech scientists, alongside the
conventionally used neural classifiers. Next, we argue that researchers should
use speech features to gain insight into how protective modifications change
the speech signal. Finally, we point out that gender-protection algorithms
should be compared with novel "vocal adversaries", human-executed voice
adaptations, in order to improve interpretability and enable before-the-mic
protection.
- Abstract(参考訳): 最近の研究では、性推論攻撃から守るために音声を修飾する手法が提案されている。
これらの保護アルゴリズムの目標は、プライバシーに敏感な属性である話者の性別に関する情報の可用性を制御することである。
現在、ジェンダー保護アルゴリズムの開発とテストの一般的な実践は「ニューラル・オン・ニューラル(neural-on-neural)」である。
本稿では、ジェンダー保護の研究を強化するために、この実践を超越することを提案する。
まず,従来のニューラル分類器と並行して,言語科学者が歴史的に開発した音声特徴に基づく性推論攻撃をテストすることの重要性を実証する。
次に、研究者は音声の特徴を利用して、保護的な修正が音声信号をどのように変化させるかを理解するべきであると論じる。
最後に,性別保護アルゴリズムは,解釈性の向上と事前保護の実現のために,新たな「声の敵」である人間による音声適応と比較されるべきである,と指摘する。
関連論文リスト
- No Pitch Left Behind: Addressing Gender Unbalance in Automatic Speech
Recognition through Pitch Manipulation [20.731375136671605]
本稿では,基本周波数(f0)とホルマントを操作するデータ拡張手法を提案する。
この手法は、表現不足の女性話者の声をシミュレートすることにより、性別間のデータ不均衡を低減する。
自発性英語音声の実験では,女性話者の発話に対して,WERの相対的な改善が9.87%に達することが示された。
論文 参考訳(メタデータ) (2023-10-10T12:55:22Z) - Measuring Equality in Machine Learning Security Defenses: A Case Study
in Speech Recognition [56.69875958980474]
この研究は、学習したシステムを守るためのアプローチと、異なるサブ人口間でのセキュリティ防衛がパフォーマンス上の不平等をもたらす方法を検討する。
提案された多くの手法は、虚偽の拒絶やロバストネストレーニングの不平等といった直接的な害を引き起こす可能性がある。
本稿では, ランダム化スムースメントとニューラルリジェクションの2つの防御法の比較を行い, マイノリティ集団のサンプリング機構により, ランダム化スムースメントがより公平であることを見出した。
論文 参考訳(メタデータ) (2023-02-17T16:19:26Z) - Overlapped speech and gender detection with WavLM pre-trained features [6.054285771277486]
本稿では,フランス音声メディアにおける女性と男性間の相互作用を研究するために,重なり合う発話と性別の検出に焦点を当てる。
本稿では,膨大な音声データに基づいて事前学習を行うことの利点を生かしたWavLMモデルを提案する。
ニューラルGDは、フランスの放送ニュースALLIESデータの性別バランスの取れたサブセットに基づいてWavLM入力で訓練され、97.9%の精度が得られる。
論文 参考訳(メタデータ) (2022-09-09T08:00:47Z) - Generating gender-ambiguous voices for privacy-preserving speech
recognition [38.733077459065704]
我々は、話者の性別やアイデンティティを隠蔽する音声を合成する生成的敵ネットワークGenGANを提案する。
我々は、性別情報のみにジェネレータを条件とし、信号歪みとプライバシ保護の間の敵対的損失を利用する。
論文 参考訳(メタデータ) (2022-07-03T14:23:02Z) - Toward a realistic model of speech processing in the brain with
self-supervised learning [67.7130239674153]
生波形で訓練された自己教師型アルゴリズムは有望な候補である。
We show that Wav2Vec 2.0 learns brain-like representations with little as 600 hours of unlabelled speech。
論文 参考訳(メタデータ) (2022-06-03T17:01:46Z) - Robust Federated Learning Against Adversarial Attacks for Speech Emotion
Recognition [12.024098046435796]
音声データは、インターネット・オブ・シング・アプリケーションのサーバにアップロードされ、処理されると保護できない。
ディープニューラルネットワークは、人間と区別できない敵の摂動に弱いことが証明されている。
本稿では,データと深層ニューラルネットワークの両方を保護するための新しい対角学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-09T13:19:26Z) - Searching for an Effective Defender: Benchmarking Defense against
Adversarial Word Substitution [83.84968082791444]
ディープニューラルネットワークは、意図的に構築された敵の例に対して脆弱である。
ニューラルNLPモデルに対する敵対的単語置換攻撃を防御する様々な方法が提案されている。
論文 参考訳(メタデータ) (2021-08-29T08:11:36Z) - Protecting gender and identity with disentangled speech representations [49.00162808063399]
音声における性情報保護は,話者識別情報のモデル化よりも効果的であることを示す。
性別情報をエンコードし、2つの敏感な生体識別子を解読する新しい方法を提示する。
論文 参考訳(メタデータ) (2021-04-22T13:31:41Z) - A Review of Speaker Diarization: Recent Advances with Deep Learning [78.20151731627958]
スピーカーダイアリゼーションは、スピーカーのアイデンティティに対応するクラスでオーディオまたはビデオ録画をラベル付けするタスクです。
ディープラーニング技術の台頭に伴い、話者ダイアリゼーションのためのさらなる急速な進歩がなされている。
話者ダイアリゼーションシステムが音声認識アプリケーションとどのように統合されているかについて議論する。
論文 参考訳(メタデータ) (2021-01-24T01:28:05Z) - Gender Stereotype Reinforcement: Measuring the Gender Bias Conveyed by
Ranking Algorithms [68.85295025020942]
本稿では,性別ステレオタイプをサポートする検索エンジンの傾向を定量化するジェンダーステレオタイプ強化(GSR)尺度を提案する。
GSRは、表現上の害を定量化できる情報検索のための、最初の特別に調整された尺度である。
論文 参考訳(メタデータ) (2020-09-02T20:45:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。