論文の概要: Diagnosing Korean-Language LLM Political Bias via Census-Grounded Agent Simulation
- arxiv url: http://arxiv.org/abs/2605.18395v1
- Date: Mon, 18 May 2026 13:42:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:49.638869
- Title: Diagnosing Korean-Language LLM Political Bias via Census-Grounded Agent Simulation
- Title(参考訳): Census-Grounded Agent Simulation による韓国系LLM政治バイアスの診断
- Authors: Sungwoo Kang,
- Abstract要約: 大規模言語モデル(LLM)は、有権者シミュレーションにおいて体系的な政治的バイアスを示すが、その基盤となるメカニズムと言語間一般化は理解されていない。
韓国の6つの選挙において,4つのモデルにまたがる韓国の政治行動を評価する,国勢調査に基づくシミュレーションフレームワークであるDynamo-Kを紹介した。
本研究では,(1)中等度エージェントのプログレッシブバイアス,(2)モデル依存の第三者サリエンス崩壊,(2)サリエンス障害と意思決定バイアスの区別,(3)モデルが双方向に予測下にある地域偏極崩壊の3つの系統的障害モードを同定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) exhibit systematic political biases in voter simulations, but their underlying mechanisms and cross-lingual generalizations remain poorly understood. We introduce Dynamo-K, a census-grounded simulation framework evaluating Korean-language LLM political behavior across four models on six Korean elections (2017-2025). Using this framework, we identify three systematic failure modes: (1) progressive bias in moderate agents, where explicit mitigation reduces Mean Absolute Error (MAE) by 5.2 times; (2) model-dependent third-party salience collapse, distinguishing between salience failure and decision bias; and (3) regional polarization collapse, where models bidirectionally under-predict historical party strongholds. To address these failures, we demonstrate that scenario reframing recovers 62% of 2017 MAE by restoring third-party visibility. Furthermore, we introduce a learned reweighting adapter that successfully calibrates opposing-valence models without relying on candidate names at train or test time. Validating our diagnostic framework, Dynamo-K accurately predicts 3/3 presidential winners - including a 2.1%p MAE on the highly contested 0.73%p-margin 2022 race - and correctly identifies the dominant party in a held-out local election. The pipeline is open-source and provides a scalable, cost-effective method for diagnosing LLM political behavior.
- Abstract(参考訳): 大規模言語モデル(LLM)は、有権者シミュレーションにおいて体系的な政治的バイアスを示すが、その基盤となるメカニズムと言語間一般化は理解されていない。
韓国の6回の選挙(2017-2025)において、韓国語LLMの政治行動を評価するため、国勢調査に基づくシミュレーションフレームワークDynamo-Kを紹介した。
この枠組みを用いて,(1) 明らかな緩和が平均絶対誤差(MAE)を5.2倍に減少させる中等エージェントのプログレッシブバイアス,(2) サリエンス障害と決定バイアスを区別するモデル依存の第三者サリエンス崩壊,(3) モデルが双方向に予測下にある地域偏極崩壊の3つの系統的障害モードを同定する。
これらの障害に対処するため、2017年のMAEの62%のシナリオリフレーミングが、サードパーティの可視性を取り戻すことによって回復することを示した。
さらに,列車やテスト時に候補名に頼らずに,対価モデルの校正に成功した学習的再重み付けアダプタを提案する。
診断の枠組みを検証するため、Dynamo-Kは2.1%のMAEを含む3/3人の大統領候補を正確に予測する。
パイプラインはオープンソースで、LLMの政治的振る舞いを診断するためのスケーラブルで費用対効果の高い方法を提供する。
関連論文リスト
- Moral Sensitivity in LLMs: A Tiered Evaluation of Contextual Bias via Behavioral Profiling and Mechanistic Interpretability [22.32075837181307]
大規模言語モデル(LLM)は、微妙な倫理的推論を必要とする設定に徐々にデプロイされている。
偏りのある出力の確率を定量化する指標であるMoral Sensitivity Index (MSI)を導入する。
我々は、モデル間で最高のMSIスコアを生み出した犯罪バイアスシナリオを選択する。
論文 参考訳(メタデータ) (2026-05-04T23:12:32Z) - When Names Change Verdicts: Intervention Consistency Reveals Systematic Bias in LLM Decision-Making [0.0]
ICE-Guardは、3種類の突発的な機能依存を検出するために介入整合性テストを適用するフレームワークである。
10領域にわたる11大言語モデル(LLM)を評価した。
本研究では,ICE誘導型検出・診断・緩和・検証ループを用いて,累積78%のバイアス低減を実現した。
論文 参考訳(メタデータ) (2026-03-19T06:21:08Z) - Dependence-Aware Label Aggregation for LLM-as-a-Judge via Ising Models [55.94503936470247]
大規模なAI評価は、審査員を含む、$K$アノテータからのバイナリ判断を集約することにますます依存している。
ほとんどの古典的なメソッドは、アノテータが条件的に独立であると仮定するが、真のラベルは$Yin0,1$であり、この仮定は LLM の審査員によってしばしば違反される。
我々はIsingグラフィカルモデルと潜在因子に基づく依存認識モデルの階層構造を通してラベルアグリゲーションを研究する。
論文 参考訳(メタデータ) (2026-01-29T21:26:50Z) - Agentic World Modeling for 6G: Near-Real-Time Generative State-Space Reasoning [70.56067503630486]
第6世代(6G)インテリジェンスは、流動的なトークン予測ではなく、想像と選択の能力を校正している、と我々は主張する。
We showed that WM-MS3M cuts mean absolute error (MAE) by 1.69% vs MS3M with 32% less parameters and similar latency, and achieve a 35-80% lower root mean squared error (RMSE) than attention/hybrid baselines with 2.3-4.1x faster inference。
論文 参考訳(メタデータ) (2025-11-04T17:22:22Z) - HALF: Harm-Aware LLM Fairness Evaluation Aligned with Deployment [52.374772443536045]
HALF(Harm-Aware LLM Fairness)は、現実的なアプリケーションにおけるモデルバイアスを評価し、有害度によって結果を評価するフレームワークである。
HALFは、以前のベンチマークの成功とデプロイメントの準備の整合性の間に明らかなギャップがあることを示します。
論文 参考訳(メタデータ) (2025-10-14T07:13:26Z) - Persona-driven Simulation of Voting Behavior in the European Parliament with Large Language Models [3.217354895187878]
限られた情報によるゼロショットペルソナが、個別の投票決定を正確に予測できるかどうかを解析する。
欧州議会議員の投票行動は、重み付けされたF1スコアが約0.793で合理的にシミュレートできることがわかった。
論文 参考訳(メタデータ) (2025-06-13T14:02:21Z) - Representation Bias in Political Sample Simulations with Large Language Models [54.48283690603358]
本研究は,大規模言語モデルを用いた政治サンプルのシミュレーションにおけるバイアスの同定と定量化を目的とする。
GPT-3.5-Turboモデルを用いて、米国選挙研究、ドイツ縦割り選挙研究、ズオビアオデータセット、中国家族パネル研究のデータを活用する。
論文 参考訳(メタデータ) (2024-07-16T05:52:26Z) - Electoral Forecasting Using a Novel Temporal Attenuation Model:
Predicting the US Presidential Elections [91.3755431537592]
予備選別世論調査データを用いて予測精度を向上させる新しいマクロスケール時間減衰(TA)モデルを開発した。
我々の仮説は、世論調査を公表するタイミングは、特に選挙直前の世論の変動に重要な役割を果たす、というものである。
我々は,48年間の平均予測誤差2.8-3.28点を蓄積するTAモデルの2つの異なる実装を提案する。
論文 参考訳(メタデータ) (2020-04-30T09:21:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。