論文の概要: Auditing demographic bias in AI-based emergency police dispatch: a cross-lingual evaluation of eleven large language models
- arxiv url: http://arxiv.org/abs/2605.01451v1
- Date: Sat, 02 May 2026 14:00:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.78044
- Title: Auditing demographic bias in AI-based emergency police dispatch: a cross-lingual evaluation of eleven large language models
- Title(参考訳): AIに基づく救急警察派遣における人口統計バイアス:11大言語モデルの言語横断的評価
- Authors: William Guey, Wei Zhang, Pierrick Bougault, Yi Wang, Bertan Ucar, Vitor D. de Moura, José O. Gomes,
- Abstract要約: 本稿では,警察プライオリティ・ディスパッチ・システムを運用するための言語間監査フレームワークを提案する。
事故の重大さがあいまいな場合に、人口統計バイアスが体系的に現れることがわかりました。
ジェンダーバイアスは中国語では顕著に増幅されるが、人種バイアスは英語ではより顕著である。
- 参考スコア(独自算出の注目度): 3.85700834433791
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) are rapidly being integrated into high-stakes public safety systems, including emergency call triage and dispatch decision support, yet their demographic fairness in this context remains largely untested. Here we introduce a cross-lingual audit framework that operationalizes the Police Priority Dispatch System as a five-level ordinal classification task and applies a controlled minimal-pair design to isolate the effect of demographic cues. Across 19,800 model outputs spanning 11 frontier models, 15 scenario pairs, three demographic categories (religious appearance, gender, and race), and two languages (English and Mandarin Chinese), we find that demographic bias emerges systematically when incident severity is ambiguous but largely disappears when the operational priority is clearly determined by call content. Bias magnitude varies by demographic axis, with the largest effects observed for religious appearance, followed by gender and race. Critically, bias does not transfer consistently across languages: gender bias is substantially amplified in Mandarin Chinese, whereas race bias is more pronounced in English, revealing cross-lingual asymmetries that aggregate analyses obscure. In several scenarios, demographic cues produce counter-directional effects, challenging simple stereotype-amplification accounts of model behavior. These findings suggest that bias in LLM-based dispatch is not a fixed property of models alone, but arises from the interaction between demographic signals, contextual ambiguity, and language. Beyond these empirical results, the proposed framework provides a scalable audit infrastructure that enables deploying agencies to evaluate candidate models on jurisdiction-relevant scenarios prior to real-world adoption.
- Abstract(参考訳): 大規模言語モデル(LLM)は、緊急呼び出しのトリアージやディスパッチ決定支援など、高度の公共安全システムに急速に統合されているが、この文脈における彼らの人口統計学的公正性はほとんどテストされていない。
ここでは,警察プライオリティ・ディスパッチ・システムを5段階の序列分類タスクとして運用する言語横断型監査フレームワークを導入し,人口統計学的方法の効果を分離するための最小ペア設計を適用した。
19,800のモデルアウトプットは,11つのフロンティアモデル,15のシナリオペア,3つの人口カテゴリー(宗教的外観,性別,人種),および2つの言語(英語とマンダリン中国語)にまたがる。
バイアスの規模は人口軸によって異なり、宗教的な外観で観察される最大の影響は性別と人種である。
性バイアスは中国語で実質的に増幅されるが、人種バイアスは英語でより発音され、分析を曖昧に集約する言語横断の非対称性が明らかになる。
いくつかのシナリオにおいて、人口統計学の手がかりは、モデル行動の単純なステレオタイプ増幅の説明に挑戦する対向効果をもたらす。
これらの結果は, LLMに基づくディスパッチのバイアスは, モデルのみの固定特性ではなく, 人口統計信号, 文脈的あいまいさ, 言語間の相互作用から生じることを示唆している。
これらの経験的な結果以外にも、提案フレームワークはスケーラブルな監査インフラを提供しており、実際の採用に先立って、代理店が管轄権関連シナリオの候補モデルを評価できるようにする。
関連論文リスト
- ImplicitBBQ: Benchmarking Implicit Bias in Large Language Models through Characteristic Based Cues [8.68634179512072]
あいまいな文脈における暗示バイアスは、オープンウェイトモデルにおける明示バイアスより6倍以上高い。
暗黙の偏見を84%減少させる数発のプロンプトでさえ、他の次元の4倍の偏見を残している。
モデルプロバイダと研究者のためのコードとデータセットをリリースし、潜在的な緩和テクニックをベンチマークします。
論文 参考訳(メタデータ) (2026-04-02T11:43:10Z) - Assessing Agentic Large Language Models in Multilingual National Bias [31.67058518564021]
推論に基づくレコメンデーションにおける言語間の格差はほとんど未解明のままである。
この研究は、このギャップに最初に対処する。
複数の言語にわたる意思決定タスクに対する応答を解析することにより、最先端のLLMにおける多言語バイアスについて検討する。
論文 参考訳(メタデータ) (2025-02-25T08:07:42Z) - Data Matters Most: Auditing Social Bias in Contrastive Vision Language Models [28.944990804599893]
CLIPとOpenCLIPを比較することで、モデルサイズ、トレーニングデータスケール、トレーニングデータソースの3つの設計要素を分離します。
また、Bias Prompts、Prompt Array、SANERの3つのポストホック、テストタイムのデバイアス戦略を評価します。
論文 参考訳(メタデータ) (2025-01-22T21:08:30Z) - The Root Shapes the Fruit: On the Persistence of Gender-Exclusive Harms in Aligned Language Models [91.86718720024825]
我々はトランスジェンダー、ノンバイナリ、その他のジェンダー・ディバースのアイデンティティを中心とし、アライメント手順が既存のジェンダー・ディバースバイアスとどのように相互作用するかを検討する。
以上の結果から,DPO対応モデルは特に教師付き微調整に敏感であることが示唆された。
DPOとより広範なアライメントプラクティスに合わせたレコメンデーションで締めくくります。
論文 参考訳(メタデータ) (2024-11-06T06:50:50Z) - Social Bias Probing: Fairness Benchmarking for Language Models [38.180696489079985]
本稿では,社会的偏見を考慮した言語モデル構築のための新しい枠組みを提案する。
既存のフェアネスコレクションの制限に対処するために設計された大規模なベンチマークであるSoFaをキュレートする。
我々は、言語モデル内のバイアスが認識されるよりもニュアンスが高いことを示し、これまで認識されていたよりもより広く符号化されたバイアスの範囲を示している。
論文 参考訳(メタデータ) (2023-11-15T16:35:59Z) - Balancing out Bias: Achieving Fairness Through Training Reweighting [58.201275105195485]
自然言語処理におけるバイアスは、性別や人種などの著者の特徴を学習するモデルから生じる。
既存のバイアスの緩和と測定方法は、著者の人口統計学と言語変数の相関を直接考慮していない。
本稿では,インスタンス再重み付けを用いたバイアス対策法を提案する。
論文 参考訳(メタデータ) (2021-09-16T23:40:28Z) - Towards Understanding and Mitigating Social Biases in Language Models [107.82654101403264]
大規模事前訓練言語モデル(LM)は、望ましくない表現バイアスを示すのに潜在的に危険である。
テキスト生成における社会的バイアスを軽減するためのステップを提案する。
我々の経験的結果と人的評価は、重要な文脈情報を保持しながらバイアスを緩和する効果を示す。
論文 参考訳(メタデータ) (2021-06-24T17:52:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。