論文の概要: Language Bias under Conflicting Information in Multilingual LLMs
- arxiv url: http://arxiv.org/abs/2604.07123v1
- Date: Wed, 08 Apr 2026 14:18:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.576855
- Title: Language Bias under Conflicting Information in Multilingual LLMs
- Title(参考訳): 多言語LLMにおける競合情報に基づく言語バイアス
- Authors: Robert Östling, Murathan Kurfalı,
- Abstract要約: 大きな言語モデル(LLM)は、質問に答えるときに矛盾する情報を統合する過程においてバイアスを含むことが示されている。
ここでは、矛盾する各情報に対してどの言語が使われているかに関して、そのようなバイアスが存在するかどうかを問う。
GPT-5.2を含む全てのLCMが競合を無視し、ほとんどのケースで可能な答えの1つだけを確実に主張することを発見した。
言語が好まれるモデルには一貫したバイアスがあり、ロシア語に対する一般的な偏見と、より長い文脈において、中国語を好んでいる。
- 参考スコア(独自算出の注目度): 0.17188280334580197
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) have been shown to contain biases in the process of integrating conflicting information when answering questions. Here we ask whether such biases also exist with respect to which language is used for each conflicting piece of information. To answer this question, we extend the conflicting needles in a haystack paradigm to a multilingual setting and perform a comprehensive set of evaluations with naturalistic news domain data in five different languages, for a range of multilingual LLMs of different sizes. We find that all LLMs tested, including GPT-5.2, ignore the conflict and confidently assert only one of the possible answers in the large majority of cases. Furthermore, there is a consistent bias across models in which languages are preferred, with a general bias against Russian and, for the longest context lengths, in favor of Chinese. Both of these patterns are consistent between models trained inside and outside of mainland China, though somewhat stronger in the former category.
- Abstract(参考訳): 大きな言語モデル(LLM)は、質問に答えるときに矛盾する情報を統合する過程においてバイアスを含むことが示されている。
ここでは、矛盾する各情報にどの言語が使われているかに関して、そのようなバイアスが存在するかどうかを問う。
この問題に対処するため,干ばつパラダイムにおける対立する針を多言語設定に拡張し,異なる大きさの多言語LLMに対して,自然主義的なニュースドメインデータを用いた総合的な評価を行う。
GPT-5.2を含む全てのLCMが競合を無視し、ほとんどのケースで可能な答えの1つだけを確実に主張することを発見した。
さらに、言語が好まれるモデルに一貫した偏見があり、ロシア語に対する一般的な偏見と、最長の文脈長において、中国語を好んでいる。
これらのパターンはどちらも、中国本土の内外で訓練されたモデルと一致しているが、以前のカテゴリではやや強い。
関連論文リスト
- Cross-Language Bias Examination in Large Language Models [37.21579885190632]
本研究では,大規模言語モデルにおけるバイアス評価のための,革新的な多言語バイアス評価フレームワークを提案する。
プロンプトと単語リストを5つの対象言語に翻訳することにより、言語間で異なる種類のバイアスを比較する。
例えば、アラビア語とスペイン語はステレオタイプバイアスのレベルが常に高く、中国語と英語はバイアスのレベルが低い。
論文 参考訳(メタデータ) (2025-12-17T23:22:03Z) - Linguistic Nepotism: Trading-off Quality for Language Preference in Multilingual RAG [55.258582772528506]
異なる文書言語の混合が意図しない方法で生成と引用に影響を及ぼすかどうかを検討する。
8つの言語と6つのオープンウェイトモデルにまたがって、クエリが英語である場合、モデルは優先的に英語ソースを引用する。
モデルが言語嗜好のトレードオフ文書関連性を示すことがあり、引用選択が情報のみによって常に駆動されるわけではないことが分かる。
論文 参考訳(メタデータ) (2025-09-17T12:58:18Z) - Beyond Early-Token Bias: Model-Specific and Language-Specific Position Effects in Multilingual LLMs [50.07451351559251]
我々は,5言語(英語,ロシア語,ドイツ語,ヒンディー語,ベトナム語)にまたがる調査を行った。
位置バイアスが即時戦略とどのように相互作用し、出力エントロピーに影響を及ぼすかを検討する。
論文 参考訳(メタデータ) (2025-05-22T02:23:00Z) - Assessing Agentic Large Language Models in Multilingual National Bias [31.67058518564021]
推論に基づくレコメンデーションにおける言語間の格差はほとんど未解明のままである。
この研究は、このギャップに最初に対処する。
複数の言語にわたる意思決定タスクに対する応答を解析することにより、最先端のLLMにおける多言語バイアスについて検討する。
論文 参考訳(メタデータ) (2025-02-25T08:07:42Z) - This Land is {Your, My} Land: Evaluating Geopolitical Biases in Language Models [40.61046400448044]
大規模言語モデル (LLM) では, 異なる言語を問うと, 地理的知識が不整合に記憶されることが示されている。
対象とするケーススタディとして、本質的に議論の的かつ多言語的な課題である領土紛争を考察する。
本稿では,様々な言語における応答のバイアスと一貫性を正確に定量化するための評価指標を提案する。
論文 参考訳(メタデータ) (2023-05-24T01:16:17Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。