論文の概要: When English Rewrites Local Knowledge: Global Narrative Dominance in Large Language Models
- arxiv url: http://arxiv.org/abs/2605.30481v1
- Date: Thu, 28 May 2026 18:58:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-01 20:56:50.185601
- Title: When English Rewrites Local Knowledge: Global Narrative Dominance in Large Language Models
- Title(参考訳): 英語が局所的な知識を書き直すとき:大言語モデルにおけるグローバルなナラティブ支配
- Authors: Md Arid Hasan, Ruwad Naswan, Farhan Samir, Sharifa Sultana, Syed Ishtiaque Ahmed,
- Abstract要約: 大規模言語モデル(LLM)は言語間知識インターフェースとして広く使われている。
文化に根ざした質問は、しばしば現地の文脈よりも世界的な支配的な物語を反映している。
バングラ語-英語-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ/問合せ-問合せ-問合せ/問合せ-問合せ/問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-答
- 参考スコア(独自算出の注目度): 17.6283905669333
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large language models (LLMs) are widely used as cross-lingual knowledge interfaces. However, culturally grounded questions often reflect globally dominant narratives rather than local contexts. We study this failure mode as \textit{global narrative dominance} in Bangla, a low-resource cultural context. We introduce \texttt{CulturalNB}, a dataset of 717 manually curated Bengali cultural instances with parallel Bangla--English question--answer pairs and supporting evidence, metadata, and sociocultural annotations. Using question-only and evidence-based prompting, we evaluate nine state-of-the-art LLMs with human and two independent LLM judges across metrics for cross-lingual consistency, language anchoring, global substitution, institutional bias, and epistemic perspective coverage. Results show that questions asked in English systematically increase global substitution and institutional framing while reducing local perspective coverage. Local evidence improves factual consistency and perspective coverage, but does not eliminate language-induced epistemic shifts. These findings suggest that cultural failures in LLMs are not only missing-knowledge errors but also failures of grounding and narrative prioritization.
- Abstract(参考訳): 大規模言語モデル(LLM)は言語間知識インターフェースとして広く使われている。
しかし、文化に根ざした質問は、しばしば現地の文脈よりも世界的な支配的な物語を反映している。
我々は,この障害モードを,低リソースの文化的文脈であるバングラにおける「textit{global narrative dominance}」として研究する。
バングラ語と英語の問合せと、エビデンス、メタデータ、社会文化的アノテーションをサポートする717件のベンガル文化事例のデータセットである「texttt{CulturalNB}」を紹介した。
質問専用およびエビデンスベースのプロンプトを用いて,言語間の一貫性,言語アンカー,グローバル置換,制度的バイアス,疫学的視点のカバレッジといった指標から,人間と2人の独立LLM判事による9つの最先端LLMの評価を行った。
その結果、英語で質問された質問は、地域視点のカバレッジを減らしながら、グローバルな置換と制度的なフレーミングを体系的に増加させることが示されている。
局所的な証拠は、事実の一貫性と視点のカバレッジを改善するが、言語によって引き起こされるてんかんのシフトを排除しない。
これらの結果は, LLMにおける文化的失敗は, 欠落した知識の誤りだけでなく, 接地や物語の優先順位付けの失敗でもあることを示唆している。
関連論文リスト
- JuICE: A Benchmark for Evaluating LLM-Judge in Identifying Cultural Errors [38.543532383605545]
長文の言語応答における文化的・言語的誤りに関する,7,470のスパンレベルアノテーションのデータセットであるJuICEを提示する。
最強のLDMジャッジでさえ、誤ったスパン検出タスクにおいてF1の0.52しか達成していない。
文化的評価は, 文化的意味の深さと位置を考慮に入れた枠組みに向けて, 表面レベルの検出を超えて, 頑健な文化的評価を行なわなければならないことが示唆された。
論文 参考訳(メタデータ) (2026-05-26T12:45:21Z) - Cross-Lingual Consensus: Aligning Multilingual Cultural Knowledge via Multilingual Self-Consistency [1.338174941551702]
大規模言語モデル(LLM)は、言語間での大幅なパフォーマンスの相違を示す。
本稿では,この知識ギャップを埋める新たな自己教師型フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-21T08:11:01Z) - Mind the Gap: Pitfalls of LLM Alignment with Asian Public Opinion [8.443928474148114]
大規模言語モデル(LLM)は、多言語で多文化的な設定で徐々に展開されている。
本研究は、宗教のセンシティブな領域を、より広いアライメントのためのプリズムとして重視する。
一般的なモデルは一般に広い社会問題に関する世論と一致しているが、宗教的視点を正確に表現することができない。
論文 参考訳(メタデータ) (2026-03-06T13:29:54Z) - MyCulture: Exploring Malaysia's Diverse Culture under Low-Resource Language Constraints [7.822567458977689]
MyCultureは、マレーシアの文化に関する大規模言語モデル(LLM)を総合的に評価するために設計されたベンチマークである。
従来のベンチマークとは異なり、MyCultureは未定義のオプションなしで、新しいオープンエンドの複数選択質問フォーマットを採用している。
構造化された出力と自由形式出力のモデル性能を比較して構造バイアスを解析し、多言語的プロンプト変動による言語バイアスを評価する。
論文 参考訳(メタデータ) (2025-08-07T14:17:43Z) - Global MMLU: Understanding and Addressing Cultural and Linguistic Biases in Multilingual Evaluation [71.59208664920452]
多言語データセットの文化的バイアスは、グローバルベンチマークとしての有効性に重大な課題をもたらす。
MMLUの進歩は西洋中心の概念の学習に大きく依存しており、文化に敏感な知識を必要とする質問の28%がそうである。
改良されたMMLUであるGlobal MMLUをリリースし,42言語を対象に評価を行った。
論文 参考訳(メタデータ) (2024-12-04T13:27:09Z) - LLMs' Reading Comprehension Is Affected by Parametric Knowledge and Struggles with Hypothetical Statements [59.71218039095155]
言語モデルの自然言語理解(NLU)能力を評価するための主要な手段として、読解理解(RC)があげられる。
文脈がモデルの内部知識と一致している場合、モデルの回答がコンテキスト理解に由来するのか、あるいは内部情報から生じるのかを識別することは困難である。
この問題に対処するために、架空の事実や実体に基づいて、想像上のデータにRCを使うことを提案する。
論文 参考訳(メタデータ) (2024-04-09T13:08:56Z) - Not All Countries Celebrate Thanksgiving: On the Cultural Dominance in
Large Language Models [89.94270049334479]
本稿では,大規模言語モデル(LLM)における文化的優位性について述べる。
LLMは、ユーザーが非英語で尋ねるときに期待する文化とは無関係な、不適切な英語文化関連の回答を提供することが多い。
論文 参考訳(メタデータ) (2023-10-19T05:38:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。