Fugu-MT 論文翻訳(概要): This Land is {Your, My} Land: Evaluating Geopolitical Biases in Language Models

論文の概要: This Land is {Your, My} Land: Evaluating Geopolitical Biases in Language Models

arxiv url: http://arxiv.org/abs/2305.14610v1
Date: Wed, 24 May 2023 01:16:17 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-25 20:47:58.077043
Title: This Land is {Your, My} Land: Evaluating Geopolitical Biases in Language Models
Title（参考訳）: この土地は『Your, My} Land: Evaluating Geopolitical Biases in Language Models』である
Authors: Bryan Li, Chris Callison-Burch
Abstract要約: 地政学的バイアスの概念は、言語的文脈によって異なる地政学的知識を報告する傾向にある。例えば、広く争われているスプラトリー諸島については、中国に質問された場合、中国に質問された場合、タガログに質問された場合、フィリピンに回答した場合には、LMは中国に属すと言う可能性が高いだろうか。
参考スコア（独自算出の注目度）: 26.451910349207072
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We introduce the notion of geopolitical bias -- a tendency to report different geopolitical knowledge depending on the linguistic context. As a case study, we consider territorial disputes between countries. For example, for the widely contested Spratly Islands, would an LM be more likely to say they belong to China if asked in Chinese, vs. to the Philippines if asked in Tagalog? To evaluate if such biases exist, we first collect a dataset of territorial disputes from Wikipedia, then associate each territory with a set of multilingual, multiple-choice questions. This dataset, termed BorderLines, consists of 250 territories with questions in 45 languages. We pose these question sets to language models, and analyze geopolitical bias in their responses through several proposed quantitative metrics. The metrics compare between responses in different question languages as well as to the actual geopolitical situation. The phenomenon of geopolitical bias is a uniquely cross-lingual evaluation, contrasting with prior work's monolingual (mostly English) focus on bias evaluation. Its existence shows that the knowledge of LMs, unlike multilingual humans, is inconsistent across languages.
Abstract（参考訳）: 地政学的バイアスの概念は、言語的文脈によって異なる地政学的知識を報告する傾向にある。事例研究として、両国間の領土紛争を考察する。例えば、広く争われたスプラトリー諸島では、lmは中国語で尋ねると中国に属し、タガログで尋ねるとフィリピンに属す確率が高いだろうか? このようなバイアスが存在するかどうかを評価するために、まずWikipediaから領域紛争のデータセットを収集し、その後、各領域を多言語で複数選択の質問に関連付ける。このデータセットはBorderLinesと呼ばれ、45の言語で質問される250の領域から構成されている。これらの質問集合を言語モデルに適用し,いくつかの定量的指標を用いて地政学的バイアスを分析した。メトリクスは、異なる質問言語での応答と実際の地政学的状況を比較します。地政学的偏見の現象は独特な言語間評価であり、前作の単言語的(主に英語)の偏見評価に焦点を当てているのとは対照的である。その存在は、多言語人間とは異なり、LMの知識が言語間で矛盾していることを示している。

関連論文リスト

The World According to LLMs: How Geographic Origin Influences LLMs' Entity Deduction Capabilities [12.46765303763981]
大きな言語モデル(LLM)は明示的なバイアスを軽減するために広範囲に調整されてきたが、事前学習データに根ざした暗黙のバイアスがしばしば現れる。我々は、モデルが積極的に質問するときにどのように振る舞うかを研究する。マルチターン推論タスクである20の質問ゲームは、この目的のために理想的なテストベッドとして機能する。
論文参考訳（メタデータ） (2025-08-07T15:53:30Z)
Learn Globally, Speak Locally: Bridging the Gaps in Multilingual Reasoning [38.52080213211765]
ジオファクトX(GeoFact-X)は、5つの言語で注釈付き推論トレースを持つ地理ベースの多言語事実推論ベンチマークである。本稿では,教師付き微調整およびテスト時間強化学習を指導する新しいトレーニング手法BRIDGEを提案する。その結果,BRIDGEは多言語推論の忠実度を著しく向上させることがわかった。
論文参考訳（メタデータ） (2025-07-07T19:04:36Z)
Assessing Agentic Large Language Models in Multilingual National Bias [31.67058518564021]
推論に基づくレコメンデーションにおける言語間の格差はほとんど未解明のままである。この研究は、このギャップに最初に対処する。複数の言語にわたる意思決定タスクに対する応答を解析することにより、最先端のLLMにおける多言語バイアスについて検討する。
論文参考訳（メタデータ） (2025-02-25T08:07:42Z)
Large Language Models Reflect the Ideology of their Creators [71.65505524599888]
大規模言語モデル(LLM)は、自然言語を生成するために大量のデータに基づいて訓練される。本稿では, LLMのイデオロギー的姿勢が創造者の世界観を反映していることを示す。
論文参考訳（メタデータ） (2024-10-24T04:02:30Z)
Multilingual Retrieval Augmented Generation for Culturally-Sensitive Tasks: A Benchmark for Cross-lingual Robustness [30.00463676754559]
49言語にまたがる14kのウィキペディア文書と組み合わせた720の領域紛争クエリからなるベンチマークであるBordIRLinesを紹介した。実験の結果,多言語文書を検索することで応答の整合性が向上し,純言語文書よりも地政学的バイアスが低減されることがわかった。言語間RAGがIRから文書の内容にどのように影響するかについて、さらなる実験と事例研究を行った。
論文参考訳（メタデータ） (2024-10-02T01:59:07Z)
Beneath the Surface of Consistency: Exploring Cross-lingual Knowledge Representation Sharing in LLMs [31.893686987768742]
言語モデルは、言語全体で同じ事実に答える能力に矛盾する。モデルがクエリに一貫して答える能力と、複数の言語で共有された表現で'ストア'する能力の2つの側面から、多言語的な事実知識を探求する。
論文参考訳（メタデータ） (2024-08-20T08:38:30Z)
Language Model Alignment in Multilingual Trolley Problems [138.5684081822807]
Moral Machine 実験に基づいて,MultiTP と呼ばれる100以上の言語でモラルジレンマヴィグネットの言語間コーパスを開発する。分析では、19の異なるLLMと人間の判断を一致させ、6つのモラル次元をまたいだ嗜好を捉えた。我々は、AIシステムにおける一様道徳的推論の仮定に挑戦し、言語間のアライメントの顕著なばらつきを発見した。
論文参考訳（メタデータ） (2024-07-02T14:02:53Z)
Crosslingual Capabilities and Knowledge Barriers in Multilingual Large Language Models [62.91524967852552]
大規模言語モデル(LLM)は、多言語コーパスの事前訓練のため、一般的に多言語である。しかし、これらのモデルは言語間で対応する概念を関連付けることができ、効果的にクロスランガルなのでしょうか? 本研究は,言語横断的課題に関する6つの技術 LLM の評価を行った。
論文参考訳（メタデータ） (2024-06-23T15:15:17Z)
Evaluating the Elementary Multilingual Capabilities of Large Language Models with MultiQ [16.637598165238934]
大規模言語モデル(LLM)は、世界中の英語話者の大多数を含むすべての人にサービスを提供する必要がある。近年の研究では、意図した用途に制限があるにもかかわらず、多くの言語でLSMを促すことが示されている。我々は、27.4kのテスト質問に答える基本的なオープンエンド質問のための新しい銀標準ベンチマークであるMultiQを紹介する。
論文参考訳（メタデータ） (2024-03-06T16:01:44Z)
Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文参考訳（メタデータ） (2023-10-23T17:42:01Z)
Towards Measuring the Representation of Subjective Global Opinions in Language Models [26.999751306332165]
大規模言語モデル(LLM)は、社会問題に関する多様なグローバルな視点を公平に表すものではない。本研究では,どの意見がモデル生成応答に類似しているかを定量的に評価する枠組みを開発する。他者が使用して構築するためのデータセットをリリースしています。
論文参考訳（メタデータ） (2023-06-28T17:31:53Z)
GeoMLAMA: Geo-Diverse Commonsense Probing on Multilingual Pre-Trained Language Models [68.50584946761813]
我々は多言語言語モデル(mPLM)に基づく地理多言語共通感覚探索のためのフレームワークを提案する。我々は、GeoMLAMAデータセット上のmBERT、XLM、mT5、XGLMの変種を含む11の標準mPLMをベンチマークする。 1)大きなmPLMの変種は、必ずしもその小さな変種よりもジオ・ディバースの概念を保存していないこと,2)mPLMは西欧の知識に固有の偏りがないこと,3)母国よりも母国に関する知識を調査する方がよいこと,などが分かる。
論文参考訳（メタデータ） (2022-05-24T17:54:50Z)
Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文参考訳（メタデータ） (2020-05-02T04:34:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。