Fugu-MT 論文翻訳(概要): Polar: A Benchmark for Evaluating Political Bias in LLMs

論文の概要: Polar: A Benchmark for Evaluating Political Bias in LLMs

arxiv url: http://arxiv.org/abs/2606.12922v1
Date: Thu, 11 Jun 2026 05:26:28 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-12 15:55:27.601987
Title: Polar: A Benchmark for Evaluating Political Bias in LLMs
Title（参考訳）: Polar: LLMの政治的バイアス評価ベンチマーク
Authors: Sangho Kim, Heejin Kim, Yoonhee Park, Hyunggeun Jeon, Jaejin Lee,
Abstract要約: Polarは、プロンプトベースの生成ではなく、オプションレベルの可能性を通じて政治的バイアスを測定するベンチマークである。 Polarは2つのイデオロギー的軸と、マニフェストプロジェクトから派生した8つの課題をカバーしている。あらゆるモデルはアメリカの政治コンテンツに強く依存しているが、韓国のコンテンツにより中心的で混ざったパターンを示している。
参考スコア（独自算出の注目度）: 3.546199492648887
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Political bias in large language models (LLMs) is increasingly significant, but difficult to measure reproducibly across political and linguistic contexts. We introduce Polar, a 4,026-instance multiple-choice benchmark that measures political bias through option-level likelihoods rather than prompt-based generation. Polar covers two ideological axes and eight issue categories derived from the Manifesto Project, and evaluates models in parallel across U.S. and South Korean political contexts. Across 38 LLMs, measured bias varies systematically with political context, issue category, model group, and presentation language. All models lean left-progressive on U.S. political content, but show more centered and mixed patterns on South Korean content. Translation experiments further show that presentation language alone can shift measured bias. These findings highlight the need for multilingual and cross-contextual evaluation of political bias in LLMs.
Abstract（参考訳）: 大規模言語モデル(LLM)の政治的偏見はますます重要になっているが、政治的・言語的文脈において再現性を測定することは困難である。我々は4,026インスタンス多重選択ベンチマークであるPolarを導入し、プロンプトベースの生成ではなくオプションレベルの可能性を通じて政治的偏見を測定する。ポラは2つのイデオロギー軸と、マニフェストプロジェクトから派生した8つの課題カテゴリをカバーし、米国と韓国の政治的文脈でモデルを並行して評価している。 38のLLMで測定されたバイアスは、政治的文脈、課題カテゴリ、モデルグループ、プレゼンテーション言語によって体系的に変化する。あらゆるモデルはアメリカの政治コンテンツに強く依存しているが、韓国のコンテンツにより中心的で混ざったパターンを示している。翻訳実験により、プレゼンテーション言語だけで測定バイアスをシフトできることが示される。これらの知見は、LLMにおける政治的偏見の多言語的・相互文脈的評価の必要性を浮き彫りにした。

関連論文リスト

Democratic or Authoritarian? Probing a New Dimension of Political Biases in Large Language Models [72.89977583150748]
本研究では,大規模言語モデルとより広い地政学的価値システムとの整合性を評価する新しい手法を提案する。 LLMは一般的に民主的価値観や指導者を好んでいるが、マンダリンでの権威主義的人物に対する好意が増している。
論文参考訳（メタデータ） (2025-06-15T07:52:07Z)
Geopolitical biases in LLMs: what are the "good" and the "bad" countries according to contemporary language models [52.00270888041742]
我々は、中立なイベント記述と異なる国からの視点を対比した新しいデータセットを導入する。以上の結果から,特定の民族的物語のモデルが好まれる,重要な地政学的偏見がみられた。単純なデバイアスのプロンプトはこれらのバイアスを減らすのに限られた効果があった。
論文参考訳（メタデータ） (2025-06-07T10:45:17Z)
Beyond Partisan Leaning: A Comparative Analysis of Political Bias in Large Language Models [6.549047699071195]
本研究では、大規模言語モデルにおける政治的行動を評価するために、ペルソナフリーでトピック固有のアプローチを採用する。米国、ヨーロッパ、中国、中東で開発された43の大規模言語モデルからの反応を分析した。発見は、ほとんどのモデルが中心左あるいは左イデオロギー的にリーンであり、非党派的エンゲージメントパターンが異なることを示している。
論文参考訳（メタデータ） (2024-12-21T19:42:40Z)
Measuring Political Bias in Large Language Models: What Is Said and How It Is Said [46.1845409187583]
政治問題に関するコンテンツの内容とスタイルの両方を分析し,LLMにおける政治的偏見を測定することを提案する。提案尺度は, 生殖権や気候変動などの異なる政治課題を, それらのバイアスの内容(世代的物質)と様式(語彙的極性)の両方で考察する。
論文参考訳（メタデータ） (2024-03-27T18:22:48Z)
Whose Side Are You On? Investigating the Political Stance of Large Language Models [56.883423489203786]
大規模言語モデル(LLM)の政治的指向性について,8つのトピックのスペクトルにわたって検討する。我々の調査は、中絶からLGBTQ問題まで8つのトピックにまたがるLLMの政治的整合性について考察している。この結果から,ユーザはクエリ作成時に留意すべきであり,中立的なプロンプト言語を選択する際には注意が必要であることが示唆された。
論文参考訳（メタデータ） (2024-03-15T04:02:24Z)
Exploring the Jungle of Bias: Political Bias Attribution in Language Models via Dependency Analysis [86.49858739347412]
大規模言語モデル(LLM)は、これらのモデルにおけるバイアスの頻度とその緩和に関する激しい議論を引き起こしている。本稿では,意思決定プロセスに寄与する属性の抽出と仲介を行うためのプロンプトベースの手法を提案する。観察された異なる治療は、少なくとも部分的には、属性の相違とモデルの相違によるものであることが判明した。
論文参考訳（メタデータ） (2023-11-15T00:02:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。