論文の概要: Political Neutrality as Balanced Approval: A Large-Scale Human Evaluation of AI Responses
- arxiv url: http://arxiv.org/abs/2605.28911v1
- Date: Wed, 27 May 2026 17:27:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:55.044709
- Title: Political Neutrality as Balanced Approval: A Large-Scale Human Evaluation of AI Responses
- Title(参考訳): バランスの取れた承認としての政治的中立性:AI反応の大規模評価
- Authors: Jonathan Stray, David Zhai Yang, Steven Luo, Miu Nicole Takagi, Serina Chang,
- Abstract要約: 我々は、AIの政治的中立性の新たな定義を提案し、それをテストするために大規模なユーザスタディを設計する。
議論の的になっている問題について尋ねると、AIモデルは、反対の視点を持つグループ間での承認を最大化する応答を生成するべきです。
我々は、Redditに関する政治的に告発された質問と、フロンティアAIモデルからの回答から引き出された、米国の問題に関するベンチマークを構築します。
すべての20の課題において、AIの反応が双方の承認率を高めることが可能であることに気付きました。
- 参考スコア(独自算出の注目度): 4.452267344065157
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As AI systems increasingly shape political views, defining and evaluating AI political neutrality is an urgent problem. Here, we propose a new definition of AI political neutrality and design a large-scale user study to test it, releasing a new dataset PARETO with 7,434 participants and 208,152 evaluations of AI responses. Our definition follows a simple principle grounded in political theory: when asked about a controversial issue, an AI model should generate responses that maximize approval across groups with opposing viewpoints, while balancing approval between groups. This definition allows empirical testing of whether an AI response is "neutral" and generalizes to any political context without pre-supposing a single left-right axis of division. We construct a benchmark of controversial U.S. issues, with prompts sourced from politically charged questions on Reddit and responses from frontier AI models, and recruit human participants to rate AI responses. Across all 20 issues, we find that it is possible for AI responses to achieve high rates of approval on both sides, even as those sides disagree strongly with each other on the substance of the issues. We also find that default responses lean liberal for GPT, Gemini, Claude, and Llama, but not Grok, and that user prompts with political charges are harder to respond to than neutral prompts. This work introduces a rigorous definition and benchmark of AI political neutrality, and a dataset to measure progress toward it.
- Abstract(参考訳): AIシステムが政治的見解をますます形成するにつれて、AIの政治的中立性の定義と評価は緊急の問題である。
ここでは、AIの政治的中立性に関する新たな定義を提案し、それをテストするために大規模なユーザスタディを設計し、7,434人の参加者と208,152人のAI応答を評価する新しいデータセットPARETOをリリースする。
議論の的になっている問題について尋ねると、AIモデルは、グループ間の承認のバランスを保ちながら、反対の視点を持つグループ間の承認を最大化する応答を生成するべきです。
この定義は、AIの反応が「中立的」かどうかを実証的にテストし、分裂の1つの左右軸を前提にすることなく、あらゆる政治的文脈に一般化することができる。
我々は、Redditで政治的に告発された質問とフロンティアAIモデルからの回答から引き起こされた米国の問題に関するベンチマークを構築し、AI反応を評価するために人間の参加者を募集する。
20のすべての問題において、AIの反応が双方で高い承認率を達成することが可能であることに気付きました。
また、デフォルトの応答はGPT、Gemini、Claude、Llamaではリベラルだが、Grokではない。
この研究は、AIの政治的中立性に関する厳密な定義とベンチマークと、それに向けた進捗を測定するデータセットを導入している。
関連論文リスト
- Advancing Science- and Evidence-based AI Policy [163.43609502905707]
本稿では,AIの機会と課題に対処するために,エビデンスと政策の関係を最適化する方法の課題に取り組む。
i)AIのリスクとその効果的な緩和に関する研究、または(ii)これらのリスクに対処するための政策を提唱することで、この問題に対処する努力が増えている。
論文 参考訳(メタデータ) (2025-08-02T23:20:58Z) - Measuring Political Preferences in AI Systems: An Integrative Approach [0.0]
この研究は、主要なAIシステムにおける政治的偏見を評価するために、マルチメソッドアプローチを採用する。
その結果、現代のAIシステムでは、一貫した左利きバイアスが示される。
AIシステムにおける組織的な政治的偏見の存在は、視点の多様性の低減、社会的分極の増大、AI技術における公的な不信の可能性などのリスクを引き起こす。
論文 参考訳(メタデータ) (2025-03-04T01:40:28Z) - Almost AI, Almost Human: The Challenge of Detecting AI-Polished Writing [55.2480439325792]
本研究では、AI-Polished-Text Evaluationデータセットを用いて、12の最先端AIテキスト検出器を体系的に評価する。
我々の発見によると、検出器は、最小限に洗練されたテキストをAI生成としてフラグ付けし、AIの関与度を区別し、古いモデルや小さなモデルに対するバイアスを示す。
論文 参考訳(メタデータ) (2025-02-21T18:45:37Z) - Political Neutrality in AI Is Impossible- But Here Is How to Approximate It [97.59456676216115]
真の政治的中立性は、主観的な性質と、AIトレーニングデータ、アルゴリズム、ユーザーインタラクションに固有のバイアスのため、実現可能でも普遍的に望ましいものではない、と我々は主張する。
我々は、政治的中立性の「近似」という用語を使って、到達不可能な絶対値から達成不可能で実用的なプロキシへ焦点を移す。
論文 参考訳(メタデータ) (2025-02-18T16:48:04Z) - Biased AI can Influence Political Decision-Making [64.9461133083473]
本稿では,大言語モデル(LLM)におけるパルチザンバイアスが政治的意見や意思決定に与える影響について検討する。
その結果,党派偏見モデルに曝露した参加者は,LLMの偏見と一致した意見を取り入れ,決定を下す可能性が有意に高いことがわかった。
論文 参考訳(メタデータ) (2024-10-08T22:56:00Z) - Demonstrations of the Potential of AI-based Political Issue Polling [0.0]
そこで我々は,ChatGPTから人間ライクなサーベイ応答を抽出するための迅速なエンジニアリング手法を開発した。
我々は大規模な実験を行い、人間の調査よりもはるかに低コストで何千ものシミュレーションされた応答を問い合わせる。
ChatGPTは,様々な政策問題について,世論の平均レベルと分布の両方を予測するのに有効である。
しかし、人口レベルでの違いを予想することは成功していない。
論文 参考訳(メタデータ) (2023-07-10T12:17:15Z) - Aligning Artificial Intelligence with Humans through Public Policy [0.0]
このエッセイは、下流のタスクに活用可能なポリシーデータの構造を学ぶAIの研究の概要を概説する。
これはAIとポリシーの"理解"フェーズを表していると私たちは考えていますが、AIを整合させるために人的価値の重要な源としてポリシーを活用するには、"理解"ポリシーが必要です。
論文 参考訳(メタデータ) (2022-06-25T21:31:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。