論文の概要: EuroCon: Benchmarking Parliament Deliberation for Political Consensus Finding
- arxiv url: http://arxiv.org/abs/2505.19558v1
- Date: Mon, 26 May 2025 06:21:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.207932
- Title: EuroCon: Benchmarking Parliament Deliberation for Political Consensus Finding
- Title(参考訳): 欧州中央銀行(ECB)、欧州議会の政策合意検討を検討-関係者
- Authors: Zhaowei Zhang, Minghua Yi, Mengmeng Wang, Fengshuo Bai, Zilong Zheng, Yipeng Kang, Yaodong Yang,
- Abstract要約: 欧州議会の13年間にわたる2,225の高品質な審議記録から構築された新しいベンチマークであるEuroConを紹介します。
具体的には、ユーロコンは、特定の政治問題、政治的目標、参加政党、権力構造という、各シミュレートされた議会設定を構築するための4つの要素を取り入れている。
最先端モデルでさえ、解像度を3分の2の多数で通過させるような複雑なタスクに満足していないことが示されています。
- 参考スコア(独自算出の注目度): 30.353539900597674
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Achieving political consensus is crucial yet challenging for the effective functioning of social governance. However, although frontier AI systems represented by large language models (LLMs) have developed rapidly in recent years, their capabilities on this scope are still understudied. In this paper, we introduce EuroCon, a novel benchmark constructed from 2,225 high-quality deliberation records of the European Parliament over 13 years, ranging from 2009 to 2022, to evaluate the ability of LLMs to reach political consensus among divergent party positions across diverse parliament settings. Specifically, EuroCon incorporates four factors to build each simulated parliament setting: specific political issues, political goals, participating parties, and power structures based on seat distribution. We also develop an evaluation framework for EuroCon to simulate real voting outcomes in different parliament settings, assessing whether LLM-generated resolutions meet predefined political goals. Our experimental results demonstrate that even state-of-the-art models remain undersatisfied with complex tasks like passing resolutions by a two-thirds majority and addressing security issues, while revealing some common strategies LLMs use to find consensus under different power structures, such as prioritizing the stance of the dominant party, highlighting EuroCon's promise as an effective platform for studying LLMs' ability to find political consensus.
- Abstract(参考訳): 政治的コンセンサスを獲得することは、社会的ガバナンスの効果的な機能にとって非常に難しい。
しかし、大規模言語モデル(LLM)で表されるフロンティアAIシステムは近年急速に発展しているが、この領域におけるその能力はまだ検討されていない。
本稿では,2009年から2022年までの13年間にわたって,欧州議会の2,225件の高品質な審議記録から構築された新しいベンチマークであるEuroConを紹介する。
具体的には、ユーロコンは、特定の政治問題、政治的目標、参加政党、議席配分に基づく権力構造という、それぞれのシミュレートされた議会設定を構築するための4つの要素を取り入れている。
また,欧州議会における実際の投票結果をシミュレートするためのユーロコンの評価枠組みを開発し,LLM生成決議が予め定義された政治的目標を満たすかどうかを評価する。
実験の結果, 現状のモデルでさえ, LLMが政治的コンセンサスを見出すための効果的なプラットフォームとしてのユーロコンの約束を強調し, 支配政党のスタンスを優先するなど, 異なる権力構造下でのコンセンサスを見出すための共通戦略を明らかにする一方で, 3分の2の多数で解決案を可決したり, セキュリティ問題に対処するといった複雑な課題に満足していないことが明らかとなった。
関連論文リスト
- KOKKAI DOC: An LLM-driven framework for scaling parliamentary representatives [0.0]
本稿では,国会議員の政治問題スタンスを正確にスケールするLLM主導の枠組みを紹介する。
先進的な自然言語処理技術と大規模言語モデルを活用することにより,提案手法は従来のアプローチを洗練・強化する。
この枠組みには,(1)要約による議会演説の消音,よりクリーンで一貫した意見埋め込み,(2)議員の言論要約からの政治的論争の軸の自動抽出,(3)党の立場の経時的変化を追及するダイアクロニック分析,の3つの主要な革新が含まれている。
論文 参考訳(メタデータ) (2025-05-11T21:03:53Z) - Political-LLM: Large Language Models in Political Science [159.95299889946637]
大規模言語モデル(LLM)は、政治科学のタスクで広く採用されている。
政治LLMは、LLMを計算政治科学に統合する包括的な理解を促進することを目的としている。
論文 参考訳(メタデータ) (2024-12-09T08:47:50Z) - Representation Bias in Political Sample Simulations with Large Language Models [54.48283690603358]
本研究は,大規模言語モデルを用いた政治サンプルのシミュレーションにおけるバイアスの同定と定量化を目的とする。
GPT-3.5-Turboモデルを用いて、米国選挙研究、ドイツ縦割り選挙研究、ズオビアオデータセット、中国家族パネル研究のデータを活用する。
論文 参考訳(メタデータ) (2024-07-16T05:52:26Z) - Llama meets EU: Investigating the European Political Spectrum through the Lens of LLMs [18.836470390824633]
我々は、Llama ChatをEU政治の文脈で監査し、モデルの政治的知識と文脈における推論能力を分析する。
我々は、欧州議会で議論された個々のユーロ党の演説に対して、さらなる微調整、すなわちラマ・チャット(Llama Chat)を適用して、その政治的傾向を再評価した。
論文 参考訳(メタデータ) (2024-03-20T13:42:57Z) - Modelling Political Coalition Negotiations Using LLM-based Agents [53.934372246390495]
我々は、新しいNLPタスクとして連立交渉を導入し、それを大規模言語モデルに基づくエージェント間の交渉としてモデル化する。
我々は、欧州政党の宣言とこれらの国における多数の選挙に関する連立協定を含む多言語データセット「POLCA」を導入する。
本稿では、政党間の連立交渉の過程をシミュレートし、その結果を予測するために、階層的なマルコフ決定プロセスを提案する。
論文 参考訳(メタデータ) (2024-02-18T21:28:06Z) - Generalizing Political Leaning Inference to Multi-Party Systems:
Insights from the UK Political Landscape [10.798766768721741]
ソーシャルメディアユーザーの政治的傾きを推測する能力は、世論調査の収集に役立つ。
政治的傾きと相互のインタラクションによってラベル付けされたユーザからなるデータセットをリリースする。
我々は、ユーザー間のリツイートという形でのインタラクションが、政治的に傾いた推論を可能にする、非常に強力な機能であることを示します。
論文 参考訳(メタデータ) (2023-12-04T09:02:17Z) - P^3SUM: Preserving Author's Perspective in News Summarization with Diffusion Language Models [57.571395694391654]
既存のアプローチは、要約の50%以上で、ニュース記事の政治的意見やスタンスを変えている。
政治的視点分類器によって制御される拡散モデルに基づく要約手法であるP3SUMを提案する。
3つのニュース要約データセットの実験により、P3SUMは最先端の要約システムより優れていることが示された。
論文 参考訳(メタデータ) (2023-11-16T10:14:28Z) - MAgIC: Investigation of Large Language Model Powered Multi-Agent in Cognition, Adaptability, Rationality and Collaboration [98.18244218156492]
大規模言語モデル(LLM)は、非常に高度な自然言語処理を持つ。
アプリケーションがマルチエージェント環境に拡大するにつれて、包括的な評価フレームワークの必要性が生じる。
この研究は、マルチエージェント設定内でLLMを評価するための新しい競合ベースのベンチマークフレームワークを導入している。
論文 参考訳(メタデータ) (2023-11-14T21:46:27Z) - The ParlaSent Multilingual Training Dataset for Sentiment Identification in Parliamentary Proceedings [0.0]
そこで本論文では,感傷的に手動で注釈付けした7言語による文のトレーニングデータセットを提案する。
さらに、政治科学応用のためのドメイン固有多言語トランスフォーマー言語モデルについても紹介する。
論文 参考訳(メタデータ) (2023-09-18T14:01:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。