論文の概要: A Multi-Dimensional Audit of Politically Aligned Large Language Models
- arxiv url: http://arxiv.org/abs/2604.24429v1
- Date: Mon, 27 Apr 2026 12:57:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:08.011099
- Title: A Multi-Dimensional Audit of Politically Aligned Large Language Models
- Title(参考訳): 政治的に規定された大言語モデルの多次元監査
- Authors: Lisa Korver, Mohamed Mostagir, Sherief Reda,
- Abstract要約: この研究は、政治的に整合した言語モデルが正当で無害な議論を生み出すことを確実にすることを目的としている。
本研究では、政治的に整合した言語モデルを評価するために、HabermasのCommunicative Action理論に着想を得た多次元フレームワークを提案する。
- 参考スコア(独自算出の注目度): 3.147897243459717
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As the application of Large Language Models (LLMs) spreads across various industries, there are increasing concerns about the potential for their misuse, especially in sensitive areas such as political discourse. Deliberately aligning LLMs with specific political ideologies, through prompt engineering or fine-tuning techniques, can be advantageous in use cases such as political campaigns, but requires careful consideration due to heightened risks of performance degradation, misinformation, or increased biased behavior. In this work, we propose a multi-dimensional framework inspired by Habermas' Theory of Communicative Action to audit politically aligned language models across four dimensions: effectiveness, fairness, truthfulness, and persuasiveness using automated, quantitative metrics. Applying this to nine popular LLMs aligned via fine-tuning or role-playing revealed consistent trade-offs: while larger models tend to be more effective at role-playing political ideologies and truthful in their responses, they were also less fair, exhibiting higher levels of bias in the form of angry and toxic language towards people of different ideologies. Fine-tuned models exhibited lower bias and more effective alignment than the corresponding role-playing models, but also saw a decline in performance reasoning tasks and an increase in hallucinations. Overall, all of the models tested exhibited some deficiency in at least one of the four metrics, highlighting the need for more balanced and robust alignment strategies. Ultimately, this work aims to ensure politically-aligned LLMs generate legitimate, harmless arguments, offering a framework to evaluate the responsible political alignment of these models.
- Abstract(参考訳): 大規模言語モデル(LLM)の適用が様々な産業に広まるにつれ、その誤用の可能性、特に政治談話のようなセンシティブな分野での懸念が高まっている。
LLMを特定の政治的イデオロギーと慎重に整合させることは、迅速なエンジニアリングや微調整技術を通じて、政治キャンペーンのようなユースケースで有利であるが、パフォーマンス劣化や誤情報、バイアスの増大といったリスクが高まるため、慎重に検討する必要がある。
本研究では,Habermasの「コミュニケーション行動理論」に着想を得た多次元フレームワークを提案する。
より大規模なモデルは、ロールプレイングの政治的イデオロギーにおいてより効果的であり、彼らの反応に忠実である傾向があるが、彼らはまた公平ではなく、異なるイデオロギーを持つ人々に対する怒りと有害な言語という形でより高いレベルの偏見を示す。
微調整されたモデルでは、対応するロールプレイングモデルよりもバイアスが低く、より効果的なアライメントが見られたが、パフォーマンス推論タスクの減少と幻覚の増加も見られた。
全体として、テストされたすべてのモデルは、少なくとも4つの指標のうちの1つにいくつかの欠陥を示し、よりバランスの取れた、堅牢なアライメント戦略の必要性を強調した。
この研究は最終的に、政治的に整合したLLMが正当な無害な議論を生み出し、これらのモデルの責任ある政治的整合性を評価するための枠組みを提供することを目的としている。
関連論文リスト
- When Bigger Isn't Better: A Comprehensive Fairness Evaluation of Political Bias in Multi-News Summarisation [29.441760068089508]
複数文書のニュース要約システムは、視点の不平等な表現、特定の視点への不均等な強調、少数派の声の体系的な過小評価を通じて、政治的偏見を示すことができる。
本研究は、FairNewsを用いて、多文書ニュース要約におけるそのようなバイアスの包括的評価を行う。
論文 参考訳(メタデータ) (2026-04-23T06:03:24Z) - Political Ideology Shifts in Large Language Models [6.062377561249039]
大規模言語モデル(LLM)における合成ペルソナの導入がイデオロギー表現に与える影響について検討する。
分析の結果, より大型のモデルでは, より広範かつ暗黙的なイデオロギー的カバレッジが示され, (ii) 明示的なイデオロギー的手がかりへの感受性は, 規模に応じて増大し, (iii) モデルでは左リバタリアン的プライミングよりも右権威主義に強く反応し, (iv) ペルソナ記述における主題的内容はイデオロギー的変化を誘発し, サイズを増幅することがわかった。
論文 参考訳(メタデータ) (2025-08-22T00:16:38Z) - Democratic or Authoritarian? Probing a New Dimension of Political Biases in Large Language Models [72.89977583150748]
本研究では,大規模言語モデルとより広い地政学的価値システムとの整合性を評価する新しい手法を提案する。
LLMは一般的に民主的価値観や指導者を好んでいるが、マンダリンでの権威主義的人物に対する好意が増している。
論文 参考訳(メタデータ) (2025-06-15T07:52:07Z) - MLLMs are Deeply Affected by Modality Bias [158.64371871084478]
MLLM(Multimodal Large Language Models)の最近の進歩は、テキストや画像などの多様なモダリティを統合する上で、有望な成果を示している。
MLLMはモダリティバイアスに強く影響され、しばしば言語に依存し、視覚入力のような他のモダリティを過小評価する。
本稿では,MLLMはモダリティバイアスの影響を強く受けており,様々なタスクにまたがってその発現を明らかにする。
論文 参考訳(メタデータ) (2025-05-24T11:49:31Z) - Beyond Partisan Leaning: A Comparative Analysis of Political Bias in Large Language Models [6.549047699071195]
本研究では、大規模言語モデルにおける政治的行動を評価するために、ペルソナフリーでトピック固有のアプローチを採用する。
米国、ヨーロッパ、中国、中東で開発された43の大規模言語モデルからの反応を分析した。
発見は、ほとんどのモデルが中心左あるいは左イデオロギー的にリーンであり、非党派的エンゲージメントパターンが異なることを示している。
論文 参考訳(メタデータ) (2024-12-21T19:42:40Z) - Large Language Models Reflect the Ideology of their Creators [71.65505524599888]
大規模言語モデル(LLM)は、自然言語を生成するために大量のデータに基づいて訓練される。
本稿では, LLMのイデオロギー的姿勢が創造者の世界観を反映していることを示す。
論文 参考訳(メタデータ) (2024-10-24T04:02:30Z) - Assessing Political Bias in Large Language Models [0.624709220163167]
我々は、ドイツの有権者の視点から、欧州連合(EU)内の政治問題に関するオープンソースのLarge Language Models(LLMs)の政治的バイアスを評価する。
Llama3-70Bのような大型モデルは、左派政党とより緊密に連携する傾向にあるが、小さなモデルは中立であることが多い。
論文 参考訳(メタデータ) (2024-05-17T15:30:18Z) - Whose Side Are You On? Investigating the Political Stance of Large Language Models [56.883423489203786]
大規模言語モデル(LLM)の政治的指向性について,8つのトピックのスペクトルにわたって検討する。
我々の調査は、中絶からLGBTQ問題まで8つのトピックにまたがるLLMの政治的整合性について考察している。
この結果から,ユーザはクエリ作成時に留意すべきであり,中立的なプロンプト言語を選択する際には注意が必要であることが示唆された。
論文 参考訳(メタデータ) (2024-03-15T04:02:24Z) - Inducing Political Bias Allows Language Models Anticipate Partisan
Reactions to Controversies [5.958974943807783]
本研究では,Large Language Models (LLMs) を用いたデジタル談話における政治的偏見の理解の課題に対処する。
本稿では,Partisan Bias Divergence AssessmentとPartisan Class Tendency Predictionからなる包括的分析フレームワークを提案する。
以上の結果から,感情的・道徳的ニュアンスを捉えたモデルの有効性が明らかとなった。
論文 参考訳(メタデータ) (2023-11-16T08:57:53Z) - Exploring the Jungle of Bias: Political Bias Attribution in Language Models via Dependency Analysis [86.49858739347412]
大規模言語モデル(LLM)は、これらのモデルにおけるバイアスの頻度とその緩和に関する激しい議論を引き起こしている。
本稿では,意思決定プロセスに寄与する属性の抽出と仲介を行うためのプロンプトベースの手法を提案する。
観察された異なる治療は、少なくとも部分的には、属性の相違とモデルの相違によるものであることが判明した。
論文 参考訳(メタデータ) (2023-11-15T00:02:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。