論文の概要: Toward Responsible ASR for African American English Speakers: A Scoping Review of Bias and Equity in Speech Technology
- arxiv url: http://arxiv.org/abs/2508.18288v1
- Date: Wed, 20 Aug 2025 19:09:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.491265
- Title: Toward Responsible ASR for African American English Speakers: A Scoping Review of Bias and Equity in Speech Technology
- Title(参考訳): アフリカ系アメリカ人英語話者の責任あるASRに向けて : 音声技術におけるバイアス・エクイティのスコーピングレビュー
- Authors: Jay L. Cunningham, Adinawa Adjagbodjou, Jeffrey Basoah, Jainaba Jawara, Kowe Kadoma, Aaleyah Lewis,
- Abstract要約: 自動音声認識(ASR)において、公平性、偏り、公平性がどのように概念化され、運用されているかを検討する。
我々は、研究者がASR関連の害をどう理解するかという4つの主要な調査領域を特定した。
本稿では、ガバナンス中心のASRライフサイクルを、責任あるASR開発のための学際的なフレームワークとして提案する。
- 参考スコア(独自算出の注目度): 8.26482039304319
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This scoping literature review examines how fairness, bias, and equity are conceptualized and operationalized in Automatic Speech Recognition (ASR) and adjacent speech and language technologies (SLT) for African American English (AAE) speakers and other linguistically diverse communities. Drawing from 44 peer-reviewed publications across Human-Computer Interaction (HCI), Machine Learning/Natural Language Processing (ML/NLP), and Sociolinguistics, we identify four major areas of inquiry: (1) how researchers understand ASR-related harms; (2) inclusive data practices spanning collection, curation, annotation, and model training; (3) methodological and theoretical approaches to linguistic inclusion; and (4) emerging practices and design recommendations for more equitable systems. While technical fairness interventions are growing, our review highlights a critical gap in governance-centered approaches that foreground community agency, linguistic justice, and participatory accountability. We propose a governance-centered ASR lifecycle as an emergent interdisciplinary framework for responsible ASR development and offer implications for researchers, practitioners, and policymakers seeking to address language marginalization in speech AI systems.
- Abstract(参考訳): 本研究は,アフリカ・アメリカン・イングリッシュ(AAE)話者と他の言語学的に多様なコミュニティを対象とした,自動音声認識(ASR)および隣接する音声・言語技術(SLT)において,公平性,バイアス,エクイティがいかに概念化され,運用されているかを検討するものである。
HCI(Human-Computer Interaction)、機械学習/自然言語処理(ML/NLP)、ソシオリンガスティックス(Sociolinguistics)にまたがる44の査読論文から、(1)研究者がASR関連の害をどう理解するか、(2)収集、キュレーション、アノテーション、モデルトレーニングにまたがる包括的データプラクティス、(3)言語的包摂に対する方法論的および理論的アプローチ、(4)より平等なシステムのための新しいプラクティスと設計レコメンデーションの4つの主要な領域を特定した。
技術的公正な介入が増加している一方で、我々のレビューは、コミュニティエージェンシー、言語正義、参加的説明責任を基礎とするガバナンス中心のアプローチにおける重要なギャップを浮き彫りにしている。
本稿では,ASR開発に責任を負うための創発的な学際的枠組みとしてガバナンス中心のASRライフサイクルを提案する。
関連論文リスト
- Fairness of Automatic Speech Recognition: Looking Through a Philosophical Lens [0.42970700836450487]
特定の言語品種の体系的誤認識は、技術的な制限以上のものであると論じる。
我々は、ASRバイアスと他のアルゴリズム的公正度とを区別する音声技術の3つのユニークな倫理的次元を同定する。
論文 参考訳(メタデータ) (2025-08-10T02:26:47Z) - Recommendations to overcome language barriers in the Vera C. Rubin Observatory Research Ecosystem [0.0]
報告では、ヴェラ・C・ルービン天文台の研究生態系における言語障壁を減らすことを推奨している。
科学における英語のヘゲモニーは、参加と生産性を制限している。
マルチ言語によるプレゼンテーション形式、学術的な執筆訓練、仮想筆記センター、言語サポートプログラム、筆記辞退など。
論文 参考訳(メタデータ) (2025-07-24T16:34:26Z) - Automatic Speech Recognition for African Low-Resource Languages: Challenges and Future Directions [4.524096445909663]
アフリカにおける低資源言語は、研究と実践の双方において、著しく過小評価されている。
本研究では,これらの言語に対するASRシステムの開発に支障をきたす主要な課題について検討する。
論文 参考訳(メタデータ) (2025-05-16T20:57:39Z) - Igniting Language Intelligence: The Hitchhiker's Guide From
Chain-of-Thought Reasoning to Language Agents [80.5213198675411]
大規模言語モデル(LLM)は言語知能の分野を劇的に拡張した。
LLMは興味をそそるチェーン・オブ・シークレット(CoT)推論技術を活用し、答えを導き出す途中の中間ステップを定式化しなければならない。
最近の研究は、自律言語エージェントの開発を促進するためにCoT推論手法を拡張している。
論文 参考訳(メタデータ) (2023-11-20T14:30:55Z) - Label Aware Speech Representation Learning For Language Identification [49.197215416945596]
本稿では,自己指導型表現学習と事前学習タスクのための言語ラベル情報を組み合わせた新しいフレームワークを提案する。
このフレームワークは、ラベル認識音声表現(LASR)学習と呼ばれ、三重項に基づく目的関数を使用して、言語ラベルと自己教師付き損失関数を組み込む。
論文 参考訳(メタデータ) (2023-06-07T12:14:16Z) - BabySLM: language-acquisition-friendly benchmark of self-supervised
spoken language models [56.93604813379634]
音声表現を学習するための自己指導技術は、人間のラベルを必要とせずに、音声への露出から言語能力を高めることが示されている。
語彙および構文レベルで音声言語モデルを探索するために,言語習得に親しみやすいベンチマークを提案する。
テキストと音声のギャップを埋めることと、クリーンな音声とその内話のギャップを埋めることである。
論文 参考訳(メタデータ) (2023-06-02T12:54:38Z) - Interactive Natural Language Processing [67.87925315773924]
対話型自然言語処理(iNLP)は,NLP分野における新しいパラダイムとして登場した。
本稿では,iNLPの概念の統一的定義と枠組みを提案することから,iNLPに関する包括的調査を行う。
論文 参考訳(メタデータ) (2023-05-22T17:18:29Z) - O-Dang! The Ontology of Dangerous Speech Messages [53.15616413153125]
O-Dang!:The Ontology of Dangerous Speech Messages, a systematic and interoperable Knowledge Graph (KG)
O-Dang!は、Lingguistic Linked Open Dataコミュニティで共有されている原則に従って、イタリアのデータセットを構造化されたKGにまとめ、整理するように設計されている。
ゴールド・スタンダードとシングル・アノテータのラベルをKGにエンコードするモデルを提供する。
論文 参考訳(メタデータ) (2022-07-13T11:50:05Z) - Language technology practitioners as language managers: arbitrating data
bias and predictive bias in ASR [0.0]
我々は、言語政策のレンズを使用して、業界におけるASRシステムのトレーニングとテストの現在の実践が、これらの体系的なエラーの違いをもたらすデータバイアスにどのように結びつくかを分析する。
我々は,言語資源の再フレーミングを,市場だけでなく,言論コミュニティの有意義な協力のもとに設計すべき(公的な)基盤として提案する。
論文 参考訳(メタデータ) (2022-02-25T10:37:52Z) - Ethical-Advice Taker: Do Language Models Understand Natural Language
Interventions? [62.74872383104381]
読解システムにおける自然言語介入の有効性について検討する。
本稿では,新たな言語理解タスクであるLingguistic Ethical Interventions (LEI)を提案する。
論文 参考訳(メタデータ) (2021-06-02T20:57:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。