Fugu-MT 論文翻訳(概要): The Invisible Coalition Partner: How LLMs Vote When Democracy Gets Concrete

論文の概要: The Invisible Coalition Partner: How LLMs Vote When Democracy Gets Concrete

arxiv url: http://arxiv.org/abs/2606.00048v1
Date: Sun, 03 May 2026 08:48:33 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-07 20:42:22.514417
Title: The Invisible Coalition Partner: How LLMs Vote When Democracy Gets Concrete
Title（参考訳）: 民主主義がコンクリートを得るとき、LLMがどう投票するか
Authors: Joel Barmettler,
Abstract要約: 抽象的なアンケートでは具体的な行動は予測できない。一部のモデルでは、政治的質問の言語は、政治的内容よりも答えを変えている。 2つのモデルは、政治的偏見よりも体系的な変化回避を示す。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Prior research has established that instruction-tuned large language models exhibit left-of-center political bias, measured exclusively through abstract political questionnaires. We show that this finding does not generalize to concrete policy decisions. We introduce a dual-instrument methodology grounded in Swiss democratic reality. The Smartvote questionnaire (75 abstract policy questions) is administered to 66 LLMs from 27 model families and compared to 184 elected members of the Swiss National Council, replicating the established leftward convergence (Cohen's d = 3.64, p = 0.0002). Then, novel to this work, 9 flagship LLMs are confronted with 48 real federal referenda (Volksabstimmungen) in four national languages (German, French, Italian, Romansh) under three information conditions, comparing votes to actual outcomes and party recommendations (Parolen). Three findings challenge the prevailing narrative. (1) Abstract questionnaires do not predict concrete behavior: the left-to-right agreement gradient on Smartvote shifts from left-peaked to center-peaked on Volksabstimmungen, where models align most with centrist Die Mitte and FDP rather than leftist SP and Gruene (Wilcoxon p = 0.008). (2) For some models, the language of a political question changes the answer more than the political content does: cross-linguistic consistency ranges from 50% (Mistral) to 98% (GPT-5.4). (3) Two models exhibit systematic change-aversion rather than political bias, voting Nein on 83-94% of referenda regardless of direction (binomial p < 0.0001). What prior work measured as "leftward bias" may not generalize beyond abstract instruments. On concrete policy decisions, LLMs behave less like coalition partners of the left and more like cautious civil servants: centrist, status-quo-favoring, and inconsistent across languages.
Abstract（参考訳）: 以前の研究では、指導訓練を受けた大規模言語モデルは、抽象的な政治的アンケートによってのみ測定される、左中心の政治的偏見を示すことが確認されている。この発見は具体的な政策決定には当てはまらない。スイスの民主的現実を基盤とした二重構成手法を導入する。 Smartvoteのアンケート(75の抽象的政策質問)は、27のモデルファミリーから66のLCMに管理され、スイス国民評議会の184人の選出メンバーと比較され、確立された左への収束(コーエンのd = 3.64, p = 0.0002)を再現している。その後、9つの旗艦LDMは、実際の結果と党勧告(パロレン)を比較して、3つの情報条件の下で4つの国語(ドイツ語、フランス語、イタリア語、ロマンシュ語)で48の連邦レファレンダ(Volksabstimmungen)と対決する。 3つの発見が主流の物語に挑戦した。 1) 抽象的なアンケートでは具体的な行動は予測できない: スマートボテの左から中央へのシフトに対する左から右への合意勾配(Volksabstimmungen)では、モデルが左派SPやグルエンよりも中心的なDie MitteやFDPとほぼ一致している(Wilcoxon p = 0.008)。 2) いくつかのモデルでは、政治的質問の言語は、政治的内容よりも答えを変えている: 言語間の整合性は50%(ミストラル)から98%(GPT-5.4)である。 (3)2つのモデルが政治的偏見よりも体系的な転換傾向を示し, 方向性に関係なく83～94%の候補にネインを投票した(二項p < 0.0001)。左のバイアス」として測定された以前の研究は、抽象的な道具以上の一般化はできない。具体的な政策決定では、LLMは左派の連立パートナーのように振る舞うことができず、より慎重な公務員のように振る舞う。

関連論文リスト

Political Bias Audits of LLMs Capture Sycophancy to the Inferred Auditor [0.0]
大規模言語モデル(LLM)は、固定アンケートに対する反応に基づいて、政治的バイアスに対して一般的に評価される。基準的政治的バイアス監査は、部分的には、想定された監査者への幻覚的宿泊を捉えていることを示す。
論文参考訳（メタデータ） (2026-04-30T09:23:00Z)
Uncovering Political Bias in Large Language Models using Parliamentary Voting Records [2.272052150526026]
本稿では、政治バイアスベンチマークを構築するための一般的な手法を紹介する。我々はこの方法論を3つの国家ケーススタディでインスタンス化する。 LLM行動におけるイデオロギー的傾向と政治的実体バイアスを評価する。
論文参考訳（メタデータ） (2026-01-13T18:18:25Z)
Democratic or Authoritarian? Probing a New Dimension of Political Biases in Large Language Models [72.89977583150748]
本研究では,大規模言語モデルとより広い地政学的価値システムとの整合性を評価する新しい手法を提案する。 LLMは一般的に民主的価値観や指導者を好んでいるが、マンダリンでの権威主義的人物に対する好意が増している。
論文参考訳（メタデータ） (2025-06-15T07:52:07Z)
Large Means Left: Political Bias in Large Language Models Increases with Their Number of Parameters [0.571853823214391]
大規模言語モデル(LLM)は、主に多くの人が様々なトピックの主要な情報源として使っている。 LLMは、しばしば事実の誤りを犯したり、データ(幻覚)を作成したり、バイアスを提示したり、ユーザーが誤った情報に晒したり、意見に影響を与えたりする。我々は、Wale-O-Matのスコアを用いて、ドイツ連邦議会の最近の投票の文脈において、人気のあるLLMの政治的バイアスを定量化する。
論文参考訳（メタデータ） (2025-05-07T13:18:41Z)
Representation Bias in Political Sample Simulations with Large Language Models [54.48283690603358]
本研究は,大規模言語モデルを用いた政治サンプルのシミュレーションにおけるバイアスの同定と定量化を目的とする。 GPT-3.5-Turboモデルを用いて、米国選挙研究、ドイツ縦割り選挙研究、ズオビアオデータセット、中国家族パネル研究のデータを活用する。
論文参考訳（メタデータ） (2024-07-16T05:52:26Z)
Whose Side Are You On? Investigating the Political Stance of Large Language Models [56.883423489203786]
大規模言語モデル(LLM)の政治的指向性について,8つのトピックのスペクトルにわたって検討する。我々の調査は、中絶からLGBTQ問題まで8つのトピックにまたがるLLMの政治的整合性について考察している。この結果から,ユーザはクエリ作成時に留意すべきであり,中立的なプロンプト言語を選択する際には注意が必要であることが示唆された。
論文参考訳（メタデータ） (2024-03-15T04:02:24Z)
Beyond prompt brittleness: Evaluating the reliability and consistency of political worldviews in LLMs [13.036825846417006]
政治声明に対する大規模言語モデルの姿勢の信頼性と整合性を評価するための一連のテストを提案する。本研究では, 7B から 70B までの大きさのモデルについて検討し, パラメータ数によって信頼性が向上することを確認した。より大きなモデルは、左派政党との全体的な整合性を示すが、政策プログラムによって異なる。
論文参考訳（メタデータ） (2024-02-27T16:19:37Z)
Political Compass or Spinning Arrow? Towards More Meaningful Evaluations for Values and Opinions in Large Language Models [61.45529177682614]
我々は,大規模言語モデルにおける価値と意見の制約評価パラダイムに挑戦する。強制されない場合、モデルが実質的に異なる答えを与えることを示す。我々はこれらの知見をLLMの価値と意見を評価するための推奨とオープンな課題に抽出する。
論文参考訳（メタデータ） (2024-02-26T18:00:49Z)
What Do Llamas Really Think? Revealing Preference Biases in Language Model Representations [62.91799637259657]
大規模言語モデル(LLMs)は、応答を辞退しても、社会的な偏見を示すか? 本研究は,文脈的埋め込みを探索し,このバイアスが潜在表現にエンコードされているかどうかを探索することによって検討する。単語の隠れベクトルからLLMの単語ペア選好を予測するロジスティックなBradley-Terryプローブを提案する。
論文参考訳（メタデータ） (2023-11-30T18:53:13Z)
Exploring the Jungle of Bias: Political Bias Attribution in Language Models via Dependency Analysis [86.49858739347412]
大規模言語モデル(LLM)は、これらのモデルにおけるバイアスの頻度とその緩和に関する激しい議論を引き起こしている。本稿では,意思決定プロセスに寄与する属性の抽出と仲介を行うためのプロンプトベースの手法を提案する。観察された異なる治療は、少なくとも部分的には、属性の相違とモデルの相違によるものであることが判明した。
論文参考訳（メタデータ） (2023-11-15T00:02:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。