論文の概要: "OK Aura, Be Fair With Me": Demographics-Agnostic Training for Bias Mitigation in Wake-up Word Detection
- arxiv url: http://arxiv.org/abs/2604.05830v1
- Date: Tue, 07 Apr 2026 13:02:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.834721
- Title: "OK Aura, Be Fair With Me": Demographics-Agnostic Training for Bias Mitigation in Wake-up Word Detection
- Title(参考訳): 「OK Aura, Be Fair with Me」:覚醒語検出におけるバイアス軽減のためのデモグラフィック非依存トレーニング
- Authors: Fernando López, Paula Delgado-Santos, Pablo Gómez, David Solans, Jordi Luque,
- Abstract要約: 本研究は, 性別, 年齢, アクセントの異なる話者間でのパフォーマンス格差を軽減するために, 人口動態に依存しない訓練手法の有効性について検討した。
評価手法の1つは、性別が39.94%、年齢が83.65%、アクセントが40.48%の予測格差を減少させる。
- 参考スコア(独自算出の注目度): 40.06814247417912
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Voice-based interfaces are widely used; however, achieving fair Wake-up Word detection across diverse speaker populations remains a critical challenge due to persistent demographic biases. This study evaluates the effectiveness of demographics-agnostic training techniques in mitigating performance disparities among speakers of varying sex, age, and accent. We utilize the OK Aura database for our experiments, employing a training methodology that excludes demographic labels, which are reserved for evaluation purposes. We explore (i) data augmentation techniques to enhance model generalization and (ii) knowledge distillation of pre-trained foundational speech models. The experimental results indicate that these demographics-agnostic training techniques markedly reduce demographic bias, leading to a more equitable performance profile across different speaker groups. Specifically, one of the evaluated techniques achieves a Predictive Disparity reduction of 39.94\% for sex, 83.65\% for age, and 40.48\% for accent when compared to the baseline. This study highlights the effectiveness of label-agnostic methodologies in fostering fairness in Wake-up Word detection.
- Abstract(参考訳): 音声ベースのインタフェースは広く使われているが、様々な話者の集団にわたって公平にウェイクアップされた単語検出を実現することは、永続的な人口統計バイアスのため、依然として重要な課題である。
本研究は, 性別, 年齢, アクセントの異なる話者間でのパフォーマンス格差を軽減するために, 人口動態に依存しない訓練手法の有効性について検討した。
評価のために予約された人口統計ラベルを除外したトレーニング手法を用いて,OK Auraデータベースを実験に利用した。
探究
一 モデル一般化・拡張のためのデータ拡張技術
(II)事前学習した基礎音声モデルの知識蒸留
実験結果から、これらの人口動態に依存しない訓練手法は、人口統計バイアスを著しく低減し、異なる話者群にまたがるより公平なパフォーマンスプロファイルをもたらすことが示唆された。
具体的には、評価手法の1つは、性別で39.94\%、年齢で83.65\%、ベースラインと比較してアクセントで40.48\%の予測格差を減少させる。
本研究は,Wake-up Word 検出において,ラベルに依存しない手法が公平性向上に有効であることを示す。
関連論文リスト
- Mitigating Subgroup Disparities in Multi-Label Speech Emotion Recognition: A Pseudo-Labeling and Unsupervised Learning Approach [53.824673312331626]
Implicit Demography Inference (IDI)モジュールは、k平均クラスタリングを用いて、音声感情認識(SER)におけるバイアスを軽減する
実験により、擬似ラベルIDIはサブグループの格差を減らし、フェアネスの指標を28%以上改善することが示された。
教師なしのIDIは、SERのパフォーマンスが3.6%未満のフェアネス指標を4.6%以上改善する。
論文 参考訳(メタデータ) (2025-05-20T14:50:44Z) - Demographic Attributes Prediction from Speech Using WavLM Embeddings [25.00298717665857]
本稿では, 年齢, 性別, 母語, 教育, 国などの人口動態特性を音声から推定するために, WavLM の特徴に基づく一般的な分類法を提案する。
提案フレームワークは,年齢予測のための平均絶対誤差(MAE)が4.94で,性別分類のための99.81%以上の精度で達成されている。
論文 参考訳(メタデータ) (2025-02-17T16:43:47Z) - A Data-Centric Approach to Detecting and Mitigating Demographic Bias in Pediatric Mental Health Text: A Case Study in Anxiety Detection [3.874958704454859]
臨床テキストにおけるジェンダーベースのコンテンツ格差に対処するデータ中心型脱バイアスフレームワークを開発した。
我々のアプローチは、テキストで訓練されたAI医療モデルのバイアスを軽減する効果的な戦略を示す。
論文 参考訳(メタデータ) (2024-12-30T20:00:22Z) - Everyone deserves their voice to be heard: Analyzing Predictive Gender Bias in ASR Models Applied to Dutch Speech Data [13.91630413828167]
本研究は,オランダ語音声データに基づくWhisperモデルの性能格差の同定に焦点をあてる。
性別グループ間の単語誤り率,文字誤り率,BERTに基づく意味的類似性を解析した。
論文 参考訳(メタデータ) (2024-11-14T13:29:09Z) - Sonos Voice Control Bias Assessment Dataset: A Methodology for Demographic Bias Assessment in Voice Assistants [10.227469020901232]
本稿ではSonos Voice Control Bias Assessmentデータセットを紹介する。
1,038人のスピーカー、166時間、170kのオーディオサンプル、9,040のユニークなラベル付き文字起こし。
その結果、年齢、方言、民族によって統計的に有意な差が見られた。
論文 参考訳(メタデータ) (2024-05-14T12:53:32Z) - Gender Biases in Automatic Evaluation Metrics for Image Captioning [87.15170977240643]
画像キャプションタスクのためのモデルに基づく評価指標において、性別バイアスの体系的研究を行う。
偏りのある世代と偏りのない世代を区別できないことを含む、これらの偏りのあるメトリクスを使用することによる負の結果を実証する。
人間の判断と相関を損なうことなく、測定バイアスを緩和する簡便で効果的な方法を提案する。
論文 参考訳(メタデータ) (2023-05-24T04:27:40Z) - Toward Fairness in Speech Recognition: Discovery and mitigation of
performance disparities [10.917512121301135]
製品規模のAIアシスタント音声認識システムから得られたデータを用いて,性能格差の発見と緩和の両面での最初の発見を報告する。
公平さを緩和するために、表現不足のコホートのオーバーサンプリングや、追加入力変数による話者コホートメンバシップのモデル化は、トップとボトムのパフォーマンスのコホート間のギャップを減少させる。
論文 参考訳(メタデータ) (2022-07-22T21:33:29Z) - Balancing out Bias: Achieving Fairness Through Training Reweighting [58.201275105195485]
自然言語処理におけるバイアスは、性別や人種などの著者の特徴を学習するモデルから生じる。
既存のバイアスの緩和と測定方法は、著者の人口統計学と言語変数の相関を直接考慮していない。
本稿では,インスタンス再重み付けを用いたバイアス対策法を提案する。
論文 参考訳(メタデータ) (2021-09-16T23:40:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。