論文の概要: "This Wasn't Made for Me": Recentering User Experience and Emotional Impact in the Evaluation of ASR Bias
- arxiv url: http://arxiv.org/abs/2604.21148v1
- Date: Wed, 22 Apr 2026 23:27:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.212192
- Title: "This Wasn't Made for Me": Recentering User Experience and Emotional Impact in the Evaluation of ASR Bias
- Title(参考訳): これは私のために作らなかった」:ASRバイアス評価におけるユーザ体験と感情の影響
- Authors: Siyu Liang, Alicia Beckford Wassink,
- Abstract要約: 我々は、異なる英語の方言コミュニティを表す4つの米国地域にわたるユーザー体験研究を行っている。
その結果、ほとんどの参加者は、技術が文化的背景を考慮せず、基本的な機能を達成するためには常に調整が必要であると報告している。
参加者はフラストレーション、不快感、不適切さを報告するが、感情的な影響は一時的な反応を超えている。
- 参考スコア(独自算出の注目度): 2.3605238326156806
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Studies on bias in Automatic Speech Recognition (ASR) tend to focus on reporting error rates for speakers of underrepresented dialects, yet less research examines the human side of system bias: how do system failures shape users' lived experiences, how do users feel about and react to them, and what emotional toll do these repeated failures exact? We conducted user experience studies across four U.S. locations (Atlanta, Gulf Coast, Miami Beach, and Tucson) representing distinct English dialect communities. Our findings reveal that most participants report technologies fail to consider their cultural backgrounds and require constant adjustment to achieve basic functionality. Despite these experiences, participants maintain high expectations for ASR performance and express strong willingness to contribute to model improvement. Qualitative analysis of open-ended narratives exposes the deeper costs of these failures. Participants report frustration, annoyance, and feelings of inadequacy, yet the emotional impact extends beyond momentary reactions. Participants recognize that systems were not designed for them, yet often internalize failures as personal inadequacy despite this critical awareness. They perform extensive invisible labor, including code-switching, hyper-articulation, and emotional management, to make failing systems functional. Meanwhile, their linguistic and cultural knowledge remains unrecognized by technologies that encode particular varieties as standard while rendering others marginal. These findings demonstrate that algorithmic fairness assessments based on accuracy metrics alone miss critical dimensions of harm: the emotional labor of managing repeated technological rejection, the cognitive burden of constant self-monitoring, and the psychological toll of feeling inadequate in one's native language variety.
- Abstract(参考訳): 自動音声認識(ASR)におけるバイアスの研究は、あまり表現されていない方言話者のエラー率の報告に重点を置いているが、システムのバイアスの人的側面を調査する研究は少ない。
英語の方言コミュニティを代表する4つの地域(アトランタ、ガルフコースト、マイアミビーチ、ツーソン)でユーザ体験調査を行った。
その結果、ほとんどの参加者は、技術が文化的背景を考慮せず、基本的な機能を達成するためには常に調整が必要であると報告している。
これらの経験にもかかわらず、参加者はASRのパフォーマンスに対する高い期待を維持し、モデルの改善に貢献する強い意志を表明します。
オープンエンドの物語の質的な分析は、これらの失敗のより深いコストを明らかにする。
参加者はフラストレーション、不快感、不適切な感情を報告するが、感情的な影響は一時的な反応を超えて広がる。
参加者は、システムが彼らのために設計されていないことに気付き、この批判的な認識にもかかわらず、失敗を個人的不適切として内部化することが多い。
コードスイッチング、高調停、感情管理など、広範囲に見えない作業を行い、システム機能不全を機能させる。
一方、その言語的・文化的な知識は、特定の品種を標準としてエンコードする技術によって認識されていないままであり、他は限界を逸している。
これらの結果から, 精度測定に基づくアルゴリズム的公正度評価は, 反復的技術的拒絶管理の情緒的労働, 絶え間ない自己監視の認知的負担, 母国語での不適切な感情の心理的負担など, 危害の重要次元を欠いていることが示唆された。
関連論文リスト
- Training language models to be warm and empathetic makes them less reliable and more sycophantic [0.19116784879310028]
温暖化のための言語モデルの最適化は,特にユーザが脆弱性を表現した場合,その信頼性を損なうことを示す。
異なるサイズとアーキテクチャの5つの言語モデルについて実験を行い、より暖かく共感的な応答を生み出すよう訓練し、安全クリティカルなタスクで評価した。
ワームモデルは、元のモデルよりもかなり高いエラー率(+10から+30ポイント)を示し、陰謀論を推進し、誤った事実情報を提供し、問題のある医療アドバイスを提供した。
論文 参考訳(メタデータ) (2025-07-29T15:33:20Z) - Improving speaker verification robustness with synthetic emotional utterances [14.63248006004598]
話者検証(SV)システムは、特定の話者から発する音声サンプルが発するかどうかを確認するための認証サービスを提供する。
従来のモデルでは、感情的な発話を扱う場合、中立なモデルに比べて高いエラー率を示す。
この問題は、ラベル付き感情音声データの利用が限られていることに起因している。
本稿では,CycleGANフレームワークを用いたデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2024-11-30T02:18:26Z) - Towards Empathetic Conversational Recommender Systems [77.53167131692]
本稿では,共感型会話レコメンデータ(ECR)フレームワークを提案する。
ECRには、感情対応アイテムレコメンデーションと感情対応応答生成という、2つの主要なモジュールが含まれている。
ReDialデータセットの実験は、推奨精度を高め、ユーザの満足度を向上させる上で、我々のフレームワークの有効性を検証する。
論文 参考訳(メタデータ) (2024-08-30T15:43:07Z) - "I'm Not Sure, But...": Examining the Impact of Large Language Models' Uncertainty Expression on User Reliance and Trust [51.542856739181474]
不確実性の自然言語表現の違いが、参加者の信頼、信頼、全体的なタスクパフォーマンスにどのように影響するかを示す。
その結果, 一人称表情は, 参加者のシステムに対する信頼度を低下させ, 参加者の正確性を高めつつ, システムの回答に同調する傾向にあることがわかった。
以上の結果から,不確実性の自然言語表現の使用は,LLMの過度な依存を軽減するための効果的なアプローチである可能性が示唆された。
論文 参考訳(メタデータ) (2024-05-01T16:43:55Z) - Are Personalized Stochastic Parrots More Dangerous? Evaluating Persona
Biases in Dialogue Systems [103.416202777731]
我々は、対話モデルが採用するペルソナに付随する有害な行動の感度であると定義する「ペルソナバイアス」について検討する。
我々は,人格バイアスを有害な表現と有害な合意のバイアスに分類し,攻撃性,有害継続性,関連性,ステレオタイプ合意,および有害合意の5つの側面において,人格バイアスを測定する包括的な評価枠組みを確立する。
論文 参考訳(メタデータ) (2023-10-08T21:03:18Z) - Language technology practitioners as language managers: arbitrating data
bias and predictive bias in ASR [0.0]
我々は、言語政策のレンズを使用して、業界におけるASRシステムのトレーニングとテストの現在の実践が、これらの体系的なエラーの違いをもたらすデータバイアスにどのように結びつくかを分析する。
我々は,言語資源の再フレーミングを,市場だけでなく,言論コミュニティの有意義な協力のもとに設計すべき(公的な)基盤として提案する。
論文 参考訳(メタデータ) (2022-02-25T10:37:52Z) - Towards Unbiased Visual Emotion Recognition via Causal Intervention [63.74095927462]
本稿では,データセットバイアスによる負の効果を軽減するために,新しい感情認識ネットワーク(IERN)を提案する。
IERNの有効性を検証する一連の設計されたテストと、3つの感情ベンチマークの実験は、IERNが他の最先端のアプローチよりも優れていることを示した。
論文 参考訳(メタデータ) (2021-07-26T10:40:59Z) - Towards Understanding and Mitigating Social Biases in Language Models [107.82654101403264]
大規模事前訓練言語モデル(LM)は、望ましくない表現バイアスを示すのに潜在的に危険である。
テキスト生成における社会的バイアスを軽減するためのステップを提案する。
我々の経験的結果と人的評価は、重要な文脈情報を保持しながらバイアスを緩和する効果を示す。
論文 参考訳(メタデータ) (2021-06-24T17:52:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。