論文の概要: Ideology Prediction of German Political Texts
- arxiv url: http://arxiv.org/abs/2605.14352v1
- Date: Thu, 14 May 2026 04:25:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.615551
- Title: Ideology Prediction of German Political Texts
- Title(参考訳): ドイツ政治文書のイデオロギー予測
- Authors: Sinclair Schneider, Florian Steuber, Joao A. G. Schneider, Gabi Dreo Rodosek,
- Abstract要約: 本稿では,テキストの政治的指向を連続的な左から右へのスペクトルに投影するトランスフォーマーモデルを提案する。
この研究は、トランスフォーマーモデルが、世論調査のレベルにおいて、ドイツのニュースにおける政治的フレーミングを認識できることを示した。
- 参考スコア(独自算出の注目度): 0.7349727826230863
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Elections represent a crucial milestone in a nation's ongoing development. To better understand the political rhetoric from various movements, ranging from left to right, we propose a transformer-based model capable of projecting the political orientation of a text on a continuous left-to-right spectrum, represented by a normalized scalar d between -1 and 1. This approach enables analysts to focus on specific segments of the political landscape, such as conservatives, while excluding liberal and far-right movements. Such a task can only be achieved with multiclass classifiers, provided that the desired orientation is incorporated within one of their predefined classes. To determine the most suitable foundation model among 13 candidate transformers for this task, we constructed four distinct corpora. One corpus comprised annotated plenary notes from the German Bundestag, while another was based on an official online decision-making tool, Wahl-O-Mat. The third corpus consisted of articles from 33 newspapers, each identified by its political orientation, and the fourth included 535,200 tweets from 597 members of the 20th and 21st German Bundestag. To mitigate overfitting, we used two distinct corpora for training and two for testing, respectively. For in-domain performance, DeBERTa-large achieved the highest F1 score F1=0.844 as well as for the X (Twitter) out-of-domain test ACC=0.864. Regarding the newspaper out-of-domain test, Gemma2-2B excelled (MAE = 0.172). This study demonstrates that transformer models can recognize political framing in German news at the level of public opinion polls. Our findings suggest that both the model architecture and the availability of domain-specific training data can be as influential as model size for estimating political bias. We discuss methodological limitations and outline directions for improving the robustness of bias measurement.
- Abstract(参考訳): 選挙は国家の継続的な発展における重要なマイルストーンである。
左から右への様々な動きからの政治的レトリックをよりよく理解するために, テキストの政治的指向を連続的な左から右へのスペクトルに投影し, -1から1の間の正規化されたスカラーdで表現できるトランスフォーマーモデルを提案する。
このアプローチは、リベラル派や極右派を除いたまま、保守派のような政治情勢の特定の部分に焦点を当てることを可能にする。
このようなタスクは、所望の向きが事前に定義されたクラスの1つに組み込まれていることを前提として、マルチクラス分類器でのみ達成できる。
この課題に対して,13の候補変換器のうち,最も適切な基礎モデルを決定するために,4つの異なるコーパスを構築した。
1つのコーパスはドイツ連邦議会の注釈付き文書で構成され、もう1つのコーパスは公式のオンライン意思決定ツールであるWahl-O-Matに基づいていた。
第3のコーパスは33の新聞の記事で構成され、それぞれが政治的指向によって識別され、第4のツイートには第20および第21ドイツ連邦議会議員597人の535,200のツイートが含まれていた。
オーバーフィッティングを緩和するために、トレーニングには2つの異なるコーパス、テストには2つのコーパスを使用しました。
ドメイン内のパフォーマンスでは、DeBERTa-largeがF1=0.844、X (Twitter) out-of-domain test ACC=0.864を達成している。
新聞のドメイン外試験では、Gemma2-2Bは優れている(MAE = 0.172)。
この研究は、トランスフォーマーモデルが、世論調査のレベルにおいて、ドイツのニュースにおける政治的フレーミングを認識できることを示した。
以上の結果から,モデルアーキテクチャとドメイン固有のトレーニングデータの可用性は,政治的バイアスを推定するためのモデルサイズと同じくらいの影響を及ぼす可能性が示唆された。
本稿では,バイアス測定のロバスト性向上のための方法論的限界と方向性について論じる。
関連論文リスト
- Large-Scale, Longitudinal Study of Large Language Models During the 2024 US Election Season [43.092041950140164]
2024年アメリカ合衆国大統領選挙は、大きな言語モデル(LLM)が普及して以来、アメリカ合衆国で最初の主要大会である。
この瞬間は、LLMが情報エコシステムをどう形成し、政治談話に影響を与えるかという緊急の疑問を提起する。
我々は,2024年7月から11月にかけて,ほぼ毎日のケイデンスに関する12,000以上の質問を構造化された調査を用いて,12種類のモデルについて大規模な縦断調査を行った。
論文 参考訳(メタデータ) (2025-09-22T22:04:19Z) - The Enemy from Within: A Study of Political Delegitimization Discourse in Israeli Political Speech [0.21485350418225244]
政治復調談話(PDD)の大規模計算研究について紹介する。
PDDは、政治的実体の規範的妥当性に対する象徴的な攻撃である。
我々は、クネセト語から引かれた10,410文からなるヘブライ語コーパスを使用する。
論文 参考訳(メタデータ) (2025-08-21T12:57:04Z) - Analyzing German Parliamentary Speeches: A Machine Learning Approach for Topic and Sentiment Classification [3.3595341706248876]
本研究は、ドイツの議会である連邦議会における政治談話について、約28,000の議会演説を分析して調査する。
トピック分類と感情分類のための2つの機械学習モデルを開発し、手動でラベル付けされたデータセットで訓練した。
これらのモデルでは, トピック分類において, 受信機動作特性曲線(AUROC)0.94の領域を達成し, 高い分類性能を示した。
論文 参考訳(メタデータ) (2025-08-05T07:44:42Z) - Representation Bias in Political Sample Simulations with Large Language Models [54.48283690603358]
本研究は,大規模言語モデルを用いた政治サンプルのシミュレーションにおけるバイアスの同定と定量化を目的とする。
GPT-3.5-Turboモデルを用いて、米国選挙研究、ドイツ縦割り選挙研究、ズオビアオデータセット、中国家族パネル研究のデータを活用する。
論文 参考訳(メタデータ) (2024-07-16T05:52:26Z) - Multilingual estimation of political-party positioning: From label
aggregation to long-input Transformers [3.651047982634467]
我々は、政党マニフェストの自動スケーリング分析に2つのアプローチを実装し、比較する。
このタスクは最先端のモデルによって効率よく解決でき、ラベルアグリゲーションが最良の結果をもたらすことが判明した。
論文 参考訳(メタデータ) (2023-10-19T08:34:48Z) - Computational Assessment of Hyperpartisanship in News Titles [55.92100606666497]
われわれはまず、超党派ニュースタイトル検出のための新しいデータセットを開発するために、人間の誘導する機械学習フレームワークを採用する。
全体的に右派メディアは比例的に超党派的なタイトルを使う傾向にある。
我々は、外国問題、政治システム、ニュースタイトルにおける過党主義を示唆する社会問題を含む3つの主要なトピックを識別する。
論文 参考訳(メタデータ) (2023-01-16T05:56:58Z) - Design and analysis of tweet-based election models for the 2021 Mexican
legislative election [55.41644538483948]
選挙日前の6ヶ月の間に、1500万件の選挙関連ツイートのデータセットを使用します。
地理的属性を持つデータを用いたモデルが従来のポーリング法よりも精度と精度で選挙結果を決定することがわかった。
論文 参考訳(メタデータ) (2023-01-02T12:40:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。