論文の概要: Advancing Equitable AI: Evaluating Cultural Expressiveness in LLMs for Latin American Contexts
- arxiv url: http://arxiv.org/abs/2511.04090v1
- Date: Thu, 06 Nov 2025 06:00:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 20:17:53.324109
- Title: Advancing Equitable AI: Evaluating Cultural Expressiveness in LLMs for Latin American Contexts
- Title(参考訳): 等価AIの進化:ラテンアメリカの文脈におけるLLMの文化的表現性の評価
- Authors: Brigitte A. Mora-Reyes, Jennifer A. Drewyor, Abel A. Reyes-Angulo,
- Abstract要約: 本稿では,ラテンアメリカにおける多様な文脈のAI表現について検討する。
スペイン語、ポルトガル語、先住民族の言語に対する英語の優位性がバイアスを持続させるかを強調します。
我々は、ラテンアメリカの歴史、土着の知識、多言語を反映したデータセットを優先順位付けすることで、公平なAIを提唱する。
- 参考スコア(独自算出の注目度): 3.8233569758620054
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artificial intelligence (AI) systems often reflect biases from economically advanced regions, marginalizing contexts in economically developing regions like Latin America due to imbalanced datasets. This paper examines AI representations of diverse Latin American contexts, revealing disparities between data from economically advanced and developing regions. We highlight how the dominance of English over Spanish, Portuguese, and indigenous languages such as Quechua and Nahuatl perpetuates biases, framing Latin American perspectives through a Western lens. To address this, we introduce a culturally aware dataset rooted in Latin American history and socio-political contexts, challenging Eurocentric models. We evaluate six language models on questions testing cultural context awareness, using a novel Cultural Expressiveness metric, statistical tests, and linguistic analyses. Our findings show that some models better capture Latin American perspectives, while others exhibit significant sentiment misalignment (p < 0.001). Fine-tuning Mistral-7B with our dataset improves its cultural expressiveness by 42.9%, advancing equitable AI development. We advocate for equitable AI by prioritizing datasets that reflect Latin American history, indigenous knowledge, and diverse languages, while emphasizing community-centered approaches to amplify marginalized voices.
- Abstract(参考訳): 人工知能(AI)システムは、しばしば経済的に先進的な地域からのバイアスを反映し、不均衡なデータセットのためにラテンアメリカのような経済的に発展している地域での文脈を疎外する。
本稿では、ラテンアメリカにおける多様な文脈のAI表現について検討し、経済的に発達した地域と発展途上の地域のデータの相違を明らかにする。
我々は、ケチュア語やナワトル語のようなスペイン語、ポルトガル語、先住民族の言語に対する英語の優位性が、西洋のレンズを通してラテンアメリカの視点をゆがめ、バイアスを持続させる方法について強調する。
これを解決するために、ラテンアメリカの歴史と社会・政治の文脈に根ざした文化的に意識されたデータセットを導入し、ユーロ中心モデルに挑戦する。
文化表現性尺度,統計検査,言語分析を用いて,文化的文脈認識を検証した質問に対する6つの言語モデルの評価を行った。
その結果、一部のモデルではラテンアメリカの視点をよりよく捉え、他のモデルでは感情的不一致(p < 0.001)が見られた。
我々のデータセットを用いた微調整Mistral-7Bは、その文化的表現性を42.9%改善し、公平なAI開発を進める。
我々は、ラテンアメリカの歴史、土着の知識、多言語を反映したデータセットを優先順位付けし、コミュニティ中心の音声を増幅するアプローチを強調し、公平なAIを提唱する。
関連論文リスト
- MMA-ASIA: A Multilingual and Multimodal Alignment Framework for Culturally-Grounded Evaluation [91.22008265721952]
MMA-ASIAは、アジア8か国と10か国を対象とする人為的、多言語的、マルチモーダルなベンチマークに重点を置いている。
これは、テキスト、画像(視覚的質問応答)、音声の3つのモードにまたがる入力レベルで整列された最初のデータセットである。
i) 国間の文化的認識格差、(ii) 言語間の整合性、(iii) 言語間の整合性、(iv) 文化知識の一般化、(v) 基礎的妥当性を評価する5次元評価プロトコルを提案する。
論文 参考訳(メタデータ) (2025-10-07T14:12:12Z) - Cross-Cultural Transfer of Commonsense Reasoning in LLMs: Evidence from the Arab World [68.19795061447044]
本稿では,アラブ世界におけるコモンセンス推論の異文化間移動について検討する。
アラブ13カ国を対象とした文化基盤のコモンセンス推論データセットを用いて,軽量アライメント手法の評価を行った。
以上の結果から,他国の文化特有例は12例に過ぎず,他国の文化特有例を平均10%向上させることができた。
論文 参考訳(メタデータ) (2025-09-23T17:24:14Z) - SESGO: Spanish Evaluation of Stereotypical Generative Outputs [1.1549572298362782]
本稿では,多言語大言語モデル(LLM)におけるバイアス評価における限界ギャップについて論じる。
現在の評価は、主に米国英語中心であり、他の言語や文化の文脈で潜在的に危害が及ばないままである。
教科学習における社会的偏見を検出するための,新しい文化的な枠組みを提案する。
論文 参考訳(メタデータ) (2025-09-03T14:04:51Z) - Towards culturally-appropriate conversational AI for health in the majority world: An exploratory study with citizens and professionals in Latin America [45.28398871440121]
我々は、デジタルヘルスにおける文化的不整合の潜在的な領域について、豊かで人間中心の理解を構築することを目的としている。
以上の結果から,文化概念の学術的境界は,基礎レベルで意味を失うことが示唆された。
我々は、単にデータを増やすのではなく、より多くのリレーショナル性と寛容性を求めることができる「健康のための多言語会話型AI」のフレームワークを紹介します。
論文 参考訳(メタデータ) (2025-07-02T13:48:25Z) - MAKIEval: A Multilingual Automatic WiKidata-based Framework for Cultural Awareness Evaluation for LLMs [37.98920430188422]
MAKIEvalは、大規模言語モデルにおける文化的認識を評価するための自動多言語フレームワークである。
モデル出力における文化的実体を自動的に識別し、構造化された知識にリンクする。
オープンソースのシステムとプロプライエタリシステムの両方を対象とする,世界のさまざまな場所で開発された7つのLLMを評価した。
論文 参考訳(メタデータ) (2025-05-27T19:29:40Z) - AI as a deliberative partner fosters intercultural empathy for Americans but fails for Latin American participants [4.641694322213005]
異文化間の協議は、肯定的な感情的関与を通じて、アメリカの参加者の間で文化間の共感を高めた。
参加者主導のフィードバックの分析では、AIのラテンアメリカ文脈の表現において、ユーザが直接フラグを立て、文化的に不適切なAI応答を説明した。
我々の研究は、同じAIシステムが、別の文化グループに対して同時に文化間の理解を促進する方法を明らかにすることによって、議論理論とAIアライメント研究の両方を前進させる。
論文 参考訳(メタデータ) (2025-04-04T17:15:01Z) - CultureVLM: Characterizing and Improving Cultural Understanding of Vision-Language Models for over 100 Countries [63.00147630084146]
視覚言語モデル(VLM)は高度な人間とAIの相互作用を持つが、文化的な理解に苦慮している。
CultureVerseは大規模なマルチモーダルベンチマークで、682の文化的概念、188の国/地域、15の文化的概念、3の質問タイプをカバーしている。
本稿では,文化理解の大幅な向上を実現するために,我々のデータセットを微調整したVLMのシリーズであるCultureVLMを提案する。
論文 参考訳(メタデータ) (2025-01-02T14:42:37Z) - CIVICS: Building a Dataset for Examining Culturally-Informed Values in Large Language Models [59.22460740026037]
大規模言語モデル(LLM)の社会的・文化的変動を評価するためのデータセット「CIVICS:文化インフォームド・バリュース・インクルーシブ・コーパス・フォー・ソシエティ・インパクト」
我々は、LGBTQIの権利、社会福祉、移民、障害権利、代理など、特定の社会的に敏感なトピックに対処する、手作りの多言語プロンプトのデータセットを作成します。
論文 参考訳(メタデータ) (2024-05-22T20:19:10Z) - No Filter: Cultural and Socioeconomic Diversity in Contrastive Vision-Language Models [38.932610459192105]
コントラッシブ・ビジョン言語モデル(VLM)における文化的・社会経済的多様性の研究
我々の研究は、より包括的なマルチモーダルシステムを構築するために、多様なデータを使うことの価値を浮き彫りにしている。
論文 参考訳(メタデータ) (2024-05-22T16:04:22Z) - Not All Countries Celebrate Thanksgiving: On the Cultural Dominance in
Large Language Models [89.94270049334479]
本稿では,大規模言語モデル(LLM)における文化的優位性について述べる。
LLMは、ユーザーが非英語で尋ねるときに期待する文化とは無関係な、不適切な英語文化関連の回答を提供することが多い。
論文 参考訳(メタデータ) (2023-10-19T05:38:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。