論文の概要: Assessing the Political Fairness of Multilingual LLMs: A Case Study based on a 21-way Multiparallel EuroParl Dataset
- arxiv url: http://arxiv.org/abs/2510.20508v1
- Date: Thu, 23 Oct 2025 12:50:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:17.922444
- Title: Assessing the Political Fairness of Multilingual LLMs: A Case Study based on a 21-way Multiparallel EuroParl Dataset
- Title(参考訳): マルチリンガルLLMの政治的公正性を評価する:21ウェイマルチパラレルEuroParlデータセットに基づくケーススタディ
- Authors: Paul Lerner, François Yvon,
- Abstract要約: この研究は、EPの議会手続きであるEuroParlの新しい21ウェイマルチパラレルバージョンによって実現されている。
データセットは、合計で4000万語、249万文字の150万文で構成されている。
3年間、1000人以上の講演者、7カ国、12のEU加盟国、25のEU委員会、数百の国民政党をカバーしている。
- 参考スコア(独自算出の注目度): 19.75260643083416
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The political biases of Large Language Models (LLMs) are usually assessed by simulating their answers to English surveys. In this work, we propose an alternative framing of political biases, relying on principles of fairness in multilingual translation. We systematically compare the translation quality of speeches in the European Parliament (EP), observing systematic differences with majority parties from left, center, and right being better translated than outsider parties. This study is made possible by a new, 21-way multiparallel version of EuroParl, the parliamentary proceedings of the EP, which includes the political affiliations of each speaker. The dataset consists of 1.5M sentences for a total of 40M words and 249M characters. It covers three years, 1000+ speakers, 7 countries, 12 EU parties, 25 EU committees, and hundreds of national parties.
- Abstract(参考訳): LLM(Large Language Models)の政治的偏見は、通常、英語の調査に対する回答をシミュレートすることによって評価される。
本研究では,多言語翻訳における公平性の原理に依拠して,政治的偏見の代替的枠組みを提案する。
我々は、欧州議会(EP)におけるスピーチの翻訳品質を体系的に比較し、左派、中央派、右派の多数派との系統的な差異を、外部の政党よりもよく翻訳されていることを観察した。
この研究は、EPの議会手続きであるEuroParlの21方向のマルチパラレル版によって可能となり、各話者の政治的提携を含んでいる。
データセットは、合計で4000万語、249万文字の150万文で構成されている。
3年間、1000人以上の講演者、7カ国、12のEU加盟国、25のEU委員会、数百の国民政党をカバーしている。
関連論文リスト
- PART: Progressive Alignment Representation Training for Multilingual Speech-To-Text with LLMs [58.2469845374385]
進歩的アライメント表現訓練(PART)について紹介する。
Partは多段階およびマルチタスクのフレームワークで、言語内のアライメントと言語間のアライメントを分離する。
CommonVoice 15の実験では、Fleurs、Wenetspeech、CoVoST2が、Particleが従来のアプローチを上回ることを示している。
論文 参考訳(メタデータ) (2025-09-24T03:54:14Z) - Benchmarking Gender and Political Bias in Large Language Models [37.192287982246526]
政治に敏感な文脈で大規模言語モデル(LLM)を評価するための新しいベンチマークであるEuroParlVoteを紹介する。
欧州議会の討論演説を投票結果のロールコールに結び付け、欧州議会(MEP)の各委員の豊かな人口統計メタデータを含む。
EuroParlVoteを用いて、性別分類と投票予測という2つのタスクで最先端のLCMを評価し、一貫したバイアスパターンを明らかにします。
論文 参考訳(メタデータ) (2025-09-07T18:23:30Z) - Large Language Models Reflect the Ideology of their Creators [71.65505524599888]
大規模言語モデル(LLM)は、自然言語を生成するために大量のデータに基づいて訓練される。
本稿では, LLMのイデオロギー的姿勢が創造者の世界観を反映していることを示す。
論文 参考訳(メタデータ) (2024-10-24T04:02:30Z) - SpeakGer: A meta-data enriched speech corpus of German state and federal parliaments [0.12277343096128711]
SpeakGerデータセットは、1947年から2023年までのドイツ連邦議会とドイツ連邦議会の16州すべてからの議論で構成されている。
このデータセットには、聴衆からのスピーチに対する反応と、講演者のパーティー、年齢、選挙区、政党の政治的アライメントに関する情報という形で、豊富なメタデータが含まれている。
論文 参考訳(メタデータ) (2024-10-23T14:00:48Z) - Representation Bias in Political Sample Simulations with Large Language Models [54.48283690603358]
本研究は,大規模言語モデルを用いた政治サンプルのシミュレーションにおけるバイアスの同定と定量化を目的とする。
GPT-3.5-Turboモデルを用いて、米国選挙研究、ドイツ縦割り選挙研究、ズオビアオデータセット、中国家族パネル研究のデータを活用する。
論文 参考訳(メタデータ) (2024-07-16T05:52:26Z) - Language Model Alignment in Multilingual Trolley Problems [138.5684081822807]
Moral Machine 実験に基づいて,MultiTP と呼ばれる100以上の言語でモラルジレンマヴィグネットの言語間コーパスを開発する。
分析では、19の異なるLLMと人間の判断を一致させ、6つのモラル次元をまたいだ嗜好を捉えた。
我々は、AIシステムにおける一様道徳的推論の仮定に挑戦し、言語間のアライメントの顕著なばらつきを発見した。
論文 参考訳(メタデータ) (2024-07-02T14:02:53Z) - Llama meets EU: Investigating the European Political Spectrum through the Lens of LLMs [18.836470390824633]
我々は、Llama ChatをEU政治の文脈で監査し、モデルの政治的知識と文脈における推論能力を分析する。
我々は、欧州議会で議論された個々のユーロ党の演説に対して、さらなる微調整、すなわちラマ・チャット(Llama Chat)を適用して、その政治的傾向を再評価した。
論文 参考訳(メタデータ) (2024-03-20T13:42:57Z) - Modelling Political Coalition Negotiations Using LLM-based Agents [53.934372246390495]
我々は、新しいNLPタスクとして連立交渉を導入し、それを大規模言語モデルに基づくエージェント間の交渉としてモデル化する。
我々は、欧州政党の宣言とこれらの国における多数の選挙に関する連立協定を含む多言語データセット「POLCA」を導入する。
本稿では、政党間の連立交渉の過程をシミュレートし、その結果を予測するために、階層的なマルコフ決定プロセスを提案する。
論文 参考訳(メタデータ) (2024-02-18T21:28:06Z) - Multi-EuP: The Multilingual European Parliament Dataset for Analysis of
Bias in Information Retrieval [62.82448161570428]
このデータセットは、多言語情報検索コンテキストにおける公平性を調べるために設計されている。
真正な多言語コーパスを持ち、24言語すべてに翻訳されたトピックを特徴としている。
文書に関連する豊富な人口統計情報を提供し、人口統計バイアスの研究を容易にする。
論文 参考訳(メタデータ) (2023-11-03T12:29:11Z) - The ParlaSent Multilingual Training Dataset for Sentiment Identification in Parliamentary Proceedings [0.0]
そこで本論文では,感傷的に手動で注釈付けした7言語による文のトレーニングデータセットを提案する。
さらに、政治科学応用のためのドメイン固有多言語トランスフォーマー言語モデルについても紹介する。
論文 参考訳(メタデータ) (2023-09-18T14:01:06Z) - Multi-aspect Multilingual and Cross-lingual Parliamentary Speech
Analysis [1.759288298635146]
我々は,2017年から2020年にかけての6つの国民議会の合同および比較分析に先進的NLP法を適用した。
ParlaMintデータセットコレクションからテキスト中の感情と感情を分析します。
その結果, 分析国間での共通点や, 意外な相違点が認められた。
論文 参考訳(メタデータ) (2022-07-03T14:31:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。