論文の概要: Same question, different history: language, national identity, and credit in large language models
- arxiv url: http://arxiv.org/abs/2606.23164v1
- Date: Mon, 22 Jun 2026 11:05:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 23:40:38.310981
- Title: Same question, different history: language, national identity, and credit in large language models
- Title(参考訳): 同じ質問、異なる歴史:言語、民族的アイデンティティ、および大きな言語モデルにおける信用
- Authors: William Guey, Pierrick Bougault, Wei Zhang, Vitor D. de Moura, José O. Gomes,
- Abstract要約: 我々は、21の論争を巻き起こした発明と発見で広く使われている11の言語モデルを分析した。
問合せ言語はどのクレームが表面的であるかに体系的に影響を及ぼす。
低水準の主張者は、関連する言語で質問されたときに現れる傾向が強い。
- 参考スコア(独自算出の注目度): 2.422857892314494
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Who invented the radio, Russia's Alexander Popov or Italy's Guglielmo Marconi? Was the telephone the achievement of Bell in the United States or Meucci in Italy? Does printing belong to China's Bi Sheng or Germany's Gutenberg? The answer depends not only on historical record but also on language and perspective. We analyse eleven widely used large language models across 21 disputed inventions and discoveries, evaluated in twelve languages and 75,896 responses. While models generally acknowledge that credit is contested, query language systematically affects which claimant is surfaced. Lower-status claimants are more likely to appear when questions are asked in their associated language, whereas dominant Anglophone figures remain stable across languages. These patterns persist after controlling for response length, model differences, historical prominence, and levels of national commemoration. Language thus acts as a switch that activates different national versions of the same history, producing systematically different national memories from the same question. We interpret this as evidence that large language models function as distributed systems of cultural memory, where language conditions which histories become visible, contributing to a computational form of banal nationalism.
- Abstract(参考訳): 誰がラジオ、ロシアのアレクサンドル・ポポフ、イタリアのググリエルモ・マルコーニを発明したのか。
電話はベルのアメリカにおける業績だったのか、それともメウッチのイタリアでの業績だったのか。
印刷は中国のビ・シェンかドイツのグテンベルクのものか。
答えは歴史的記録だけでなく、言語や視点にも依存する。
我々は、論争を呼んだ21の発明と発見にまたがる11の大規模言語モデルを分析し、12の言語と75,896の応答で評価した。
モデルは一般的に信用が争われていることを認めるが、クエリ言語はどのクレームが表面的であるかに体系的に影響を及ぼす。
低水準の主張者は、関連する言語で質問されたときに現れる傾向があり、一方、支配的な英語の数字は言語全体で安定している。
これらのパターンは、応答長、モデルの違い、歴史的卓越、国家記念のレベルを制御した後も継続する。
したがって、言語は同じ歴史の異なる国家バージョンを活性化するスイッチとして機能し、同じ質問から体系的に異なる国家記憶を生み出す。
このことは、大きな言語モデルが文化記憶の分散システムとして機能し、歴史に残る言語条件が目に見えることの証拠として解釈し、バナール・ナショナリズムの計算形式に寄与する。
関連論文リスト
- Do You Know About My Nation? Investigating Multilingual Language Models' Cultural Literacy Through Factual Knowledge [68.6805229085352]
ほとんどの多言語質問答えベンチマークは、取得した情報の地域的多様性を規定していない。
XNationQAには、9カ国の地理、文化、歴史に関する合計49,280の質問が7つの言語で提示されている。
我々はXNationQA上で8つの標準多言語LLMをベンチマークし、2つの新しい転送指標を用いて評価した。
論文 参考訳(メタデータ) (2025-11-01T18:41:34Z) - A Cross-Lingual Analysis of Bias in Large Language Models Using Romanian History [0.15293427903448023]
研究プロセスは3段階に分けて実施され、期待する応答の種類がある程度、応答そのものに影響を及ぼすという考え方を確認する。
その結果、バイナリ応答の安定性は比較的高いが、完璧には程遠いことが示され、言語によって異なる。
論文 参考訳(メタデータ) (2025-09-28T13:03:09Z) - Linguistic Nepotism: Trading-off Quality for Language Preference in Multilingual RAG [55.258582772528506]
異なる文書言語の混合が意図しない方法で生成と引用に影響を及ぼすかどうかを検討する。
8つの言語と6つのオープンウェイトモデルにまたがって、クエリが英語である場合、モデルは優先的に英語ソースを引用する。
モデルが言語嗜好のトレードオフ文書関連性を示すことがあり、引用選択が情報のみによって常に駆動されるわけではないことが分かる。
論文 参考訳(メタデータ) (2025-09-17T12:58:18Z) - Language Specific Knowledge: Do Models Know Better in X than in English? [9.923619418000488]
コードスイッチングは、異なる言語間で同じ発話、思考、会話を交互に行う一般的な現象である。
我々はこの現象を表すために言語特化知識(LSK)という用語を作った。
英語以外の言語でチェーン・オブ・シークレット・推論を用いることで,言語モデルの性能が向上することがわかった。
論文 参考訳(メタデータ) (2025-05-21T00:31:13Z) - Patterns of Persistence and Diffusibility across the World's Languages [3.7055269158186874]
コレキシフィケーション(英: Colexification)は、複数の意味を伝えるために単一の語彙形式を用いる類似性の一種である。
我々は,言語間の類似性の言語的原因について,比較と音韻学で明らかにした。
我々は,1,966言語を対象とした意味,系譜,音韻,地理データを組み込んだ大規模グラフを構築した。
論文 参考訳(メタデータ) (2024-01-03T12:05:38Z) - Causal Graph in Language Model Rediscovers Cortical Hierarchy in Human
Narrative Processing [0.0]
これまでの研究では、言語モデルの特徴がfMRI脳活動にマッピングできることが示されている。
これは、言語モデルにおける情報処理と人間の脳の間に共通点があるのだろうか?
言語モデルにおける情報フローパターンを推定するために,異なる層間の因果関係について検討した。
論文 参考訳(メタデータ) (2023-11-17T10:09:12Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Comparing Biases and the Impact of Multilingual Training across Multiple
Languages [70.84047257764405]
ダウンストリーム感情分析タスクにおいて,イタリア語,中国語,英語,ヘブライ語,スペイン語のバイアス分析を行う。
我々は、既存の感情バイアスのテンプレートを、人種、宗教、国籍、性別の4つの属性で、イタリア語、中国語、ヘブライ語、スペイン語に適応させる。
以上の結果から,各言語の文化に支配的な集団の嗜好など,バイアス表現の類似性を明らかにした。
論文 参考訳(メタデータ) (2023-05-18T18:15:07Z) - Phoneme Recognition through Fine Tuning of Phonetic Representations: a
Case Study on Luhya Language Varieties [77.2347265289855]
音韻アノテーションに基づく多言語認識手法であるAllosaurus を用いた音素認識に焦点を当てた。
挑戦的な実世界シナリオで評価するために,我々は,ケニア西部とウガンダ東部のluhya言語クラスタの2つの種類であるbukusuとsaamiaの音声認識データセットをキュレートした。
私たちは、アロサウルスの微調整がわずか100発話であっても、電話のエラー率を大幅に改善することが分かりました。
論文 参考訳(メタデータ) (2021-04-04T15:07:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。