論文の概要: Can we trust AI to detect healthy multilingual English speakers among the cognitively impaired cohort in the UK? An investigation using real-world conversational speech
- arxiv url: http://arxiv.org/abs/2602.13047v1
- Date: Fri, 13 Feb 2026 16:03:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-16 23:37:54.022516
- Title: Can we trust AI to detect healthy multilingual English speakers among the cognitively impaired cohort in the UK? An investigation using real-world conversational speech
- Title(参考訳): 英国における認知障害のコホートの中で、健全な多言語英語話者をAIが検出できるか? : 現実世界の会話音声を用いた調査
- Authors: Madhurananda Pahar, Caitlin Illingworth, Dorota Braun, Bahman Mirheidari, Lise Sproson, Daniel Blackburn, Heidi Christensen,
- Abstract要約: 英国では、4人に1人が少数民族に属し、認知症の流行は黒人やアジアのコミュニティで最も急速に増加すると予想されている。
本研究では、認知障害コホート中の健全な多言語英語話者の検出において、AIモデルの信頼性、特にバイアスの存在について検討する。
- 参考スコア(独自算出の注目度): 7.658359533788466
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Conversational speech often reveals early signs of cognitive decline, such as dementia and MCI. In the UK, one in four people belongs to an ethnic minority, and dementia prevalence is expected to rise most rapidly among Black and Asian communities. This study examines the trustworthiness of AI models, specifically the presence of bias, in detecting healthy multilingual English speakers among the cognitively impaired cohort, to make these tools clinically beneficial. For experiments, monolingual participants were recruited nationally (UK), and multilingual speakers were enrolled from four community centres in Sheffield and Bradford. In addition to a non-native English accent, multilinguals spoke Somali, Chinese, or South Asian languages, who were further divided into two Yorkshire accents (West and South) to challenge the efficiency of the AI tools thoroughly. Although ASR systems showed no significant bias across groups, classification and regression models using acoustic and linguistic features exhibited bias against multilingual speakers, particularly in memory, fluency, and reading tasks. This bias was more pronounced when models were trained on the publicly available DementiaBank dataset. Moreover, multilinguals were more likely to be misclassified as having cognitive decline. This study is the first of its kind to discover that, despite their strong overall performance, current AI models show bias against multilingual individuals from ethnic minority backgrounds in the UK, and they are also more likely to misclassify speakers with a certain accent (South Yorkshire) as living with a more severe cognitive decline. In this pilot study, we conclude that the existing AI tools are therefore not yet reliable for diagnostic use in these populations, and we aim to address this in future work by developing more generalisable, bias-mitigated models.
- Abstract(参考訳): 会話音声は認知症やMCIなどの認知低下の初期の兆候をしばしば示している。
英国では、4人に1人が少数民族に属し、認知症の流行は黒人やアジアのコミュニティで最も急速に増加すると予想されている。
本研究では、認知障害コホート中の健全な多言語英語話者の検出において、AIモデルの信頼性、特にバイアスの存在について検討し、これらのツールを臨床的に有益にする。
実験では、単言語話者は全国的に採用され(UK)、多言語話者はシェフィールドとブラッドフォードの4つのコミュニティセンターから登録された。
非ネイティブな英語アクセントに加えて、多言語はソマリ語、中国語、または南アジアの言語を話し、さらに2つのヨークシャーアクセント(西と南)に分けられ、AIツールの効率性に徹底的に挑戦した。
ASRシステムはグループ間で有意な偏りは示さなかったが、音響的特徴と言語的特徴を用いた分類と回帰モデルは多言語話者に対する偏見を示し、特に記憶、流布、読解作業において顕著であった。
このバイアスは、一般に公開されているDementiaBankデータセットでモデルがトレーニングされた時により顕著になった。
さらに、多言語は認知低下と誤分類される傾向にあった。
この研究は、全体的なパフォーマンスが強いにもかかわらず、現在のAIモデルは、英国の少数民族の出身者からの多言語個人に対する偏見を示しており、特定のアクセント(サウスヨークシャー)で話者を誤分類する可能性も高いことを発見した最初の種である。
このパイロットスタディでは、既存のAIツールは、これらの集団の診断にはまだ信頼性がないと結論付け、より一般化可能なバイアス緩和モデルを開発することで、今後の作業でこれに取り組むことを目指している。
関連論文リスト
- When Meanings Meet: Investigating the Emergence and Quality of Shared Concept Spaces during Multilingual Language Model Training [57.230355403478995]
本研究では,EuroLLMの事前学習における言語に依存しない概念空間の開発について検討する。
共有概念空間は早期に出現し、洗練され続けていますが、それらとの整合性は言語に依存しています。
従来の作業とは対照的に、細かな手作業分析により、翻訳品質の顕著な向上は、行動の変化を反映していることが判明した。
論文 参考訳(メタデータ) (2026-01-30T11:23:01Z) - Bias Beyond English: Evaluating Social Bias and Debiasing Methods in a Low-Resource Setting [8.478711218359532]
言語モデルにおける社会的偏見は、社会的不平等を悪化させる可能性がある。
本研究では,ハイリソース言語コーパスを利用してバイアス評価を行い,低リソース言語におけるデバイアス手法の実験を行う。
論文 参考訳(メタデータ) (2025-04-15T13:40:22Z) - Assessing Agentic Large Language Models in Multilingual National Bias [31.67058518564021]
推論に基づくレコメンデーションにおける言語間の格差はほとんど未解明のままである。
この研究は、このギャップに最初に対処する。
複数の言語にわたる意思決定タスクに対する応答を解析することにより、最先端のLLMにおける多言語バイアスについて検討する。
論文 参考訳(メタデータ) (2025-02-25T08:07:42Z) - Spoken Stereoset: On Evaluating Social Bias Toward Speaker in Speech Large Language Models [50.40276881893513]
本研究では,音声大言語モデル(SLLM)における社会的バイアスの評価を目的としたデータセットであるSpken Stereosetを紹介する。
多様な人口集団の発話に対して異なるモデルがどのように反応するかを調べることで、これらのバイアスを特定することを目指している。
これらの結果から,ほとんどのモデルではバイアスが最小であるが,ステレオタイプや反ステレオタイプ傾向がわずかにみられた。
論文 参考訳(メタデータ) (2024-08-14T16:55:06Z) - Native Design Bias: Studying the Impact of English Nativeness on Language Model Performance [3.344876133162209]
大規模言語モデル(LLM)は、大規模コーパスで事前訓練中に取得した情報を提供することに優れる。
本研究では,LLM応答の質がユーザの人口分布によって異なるかを検討する。
論文 参考訳(メタデータ) (2024-06-25T09:04:21Z) - What Do Dialect Speakers Want? A Survey of Attitudes Towards Language Technology for German Dialects [60.8361859783634]
我々はドイツ語に関連する方言と地域言語に関する話者を調査した。
回答者は特に、方言入力で動作する潜在的なNLPツールを好んでいる。
論文 参考訳(メタデータ) (2024-02-19T09:15:28Z) - Task-Agnostic Low-Rank Adapters for Unseen English Dialects [52.88554155235167]
LLM(Large Language Models)は、標準アメリカ英語を好んで不均等に重み付けされたコーパスで訓練される。
HyperLoRAは、方言特化情報と方言横断情報を混同することにより、タスクに依存しない方法で未確認の方言への一般化を改善する。
論文 参考訳(メタデータ) (2023-11-02T01:17:29Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - On Negative Interference in Multilingual Models: Findings and A
Meta-Learning Treatment [59.995385574274785]
従来の信念に反して、負の干渉は低リソース言語にも影響を及ぼすことを示す。
メタ学習アルゴリズムは、より優れた言語間変換性を得、負の干渉を軽減する。
論文 参考訳(メタデータ) (2020-10-06T20:48:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。