論文の概要: Multilingual estimation of political-party positioning: From label
aggregation to long-input Transformers
- arxiv url: http://arxiv.org/abs/2310.12575v1
- Date: Thu, 19 Oct 2023 08:34:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-20 16:07:43.447805
- Title: Multilingual estimation of political-party positioning: From label
aggregation to long-input Transformers
- Title(参考訳): 複数言語による政党位置推定:ラベルアグリゲーションからロングインプット・トランスフォーマーへ
- Authors: Dmitry Nikolaev and Tanise Ceron and Sebastian Pad\'o
- Abstract要約: 我々は、政党マニフェストの自動スケーリング分析に2つのアプローチを実装し、比較する。
このタスクは最先端のモデルによって効率よく解決でき、ラベルアグリゲーションが最良の結果をもたらすことが判明した。
- 参考スコア(独自算出の注目度): 3.651047982634467
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Scaling analysis is a technique in computational political science that
assigns a political actor (e.g. politician or party) a score on a predefined
scale based on a (typically long) body of text (e.g. a parliamentary speech or
an election manifesto). For example, political scientists have often used the
left--right scale to systematically analyse political landscapes of different
countries. NLP methods for automatic scaling analysis can find broad
application provided they (i) are able to deal with long texts and (ii) work
robustly across domains and languages. In this work, we implement and compare
two approaches to automatic scaling analysis of political-party manifestos:
label aggregation, a pipeline strategy relying on annotations of individual
statements from the manifestos, and long-input-Transformer-based models, which
compute scaling values directly from raw text. We carry out the analysis of the
Comparative Manifestos Project dataset across 41 countries and 27 languages and
find that the task can be efficiently solved by state-of-the-art models, with
label aggregation producing the best results.
- Abstract(参考訳): スケーリング分析(英語: Scaling analysis)とは、政治学者(政治家や政党など)が(典型的には)テキストの本体(議会演説や選挙宣言など)に基づいて事前に定義された尺度でスコアを割り当てる計算政治学の技法である。
例えば、政治学者は、異なる国の政治情勢を体系的に分析するために、しばしば左利きの尺度を用いてきた。
自動スケーリング解析のためのNLP法は, 適用範囲が広い。
(i)長文を扱うことができる。
(ii)ドメインや言語をまたいだ堅牢な作業。
本研究では,ラベルアグリゲーション,マニフェストからの個々のステートメントのアノテーションに依存したパイプライン戦略,原文から直接のスケーリング値を計算するロングインプット・トランスフォーマーモデルという,政党のマニフェストの自動スケーリング分析のための2つのアプローチを実装・比較する。
41か国27か国にまたがる比較マニフェストプロジェクトデータセットの分析を行い、その課題が最先端のモデルによって効率的に解決され、ラベルアグリゲーションが最良の結果を生み出すことを見出した。
関連論文リスト
- Paired Completion: Flexible Quantification of Issue-framing at Scale with LLMs [0.41436032949434404]
我々は,大規模なテキストデータセット内の問題フレーミングと物語分析のための新しい検出手法を開発し,厳密に評価する。
問題フレーミングは大きなコーパスにおいて, 与えられた問題に対して, いずれの視点でも, 確実に, 効率的に検出できることを示す。
論文 参考訳(メタデータ) (2024-08-19T07:14:15Z) - Representation Bias in Political Sample Simulations with Large Language Models [54.48283690603358]
本研究は,大規模言語モデルを用いた政治サンプルのシミュレーションにおけるバイアスの同定と定量化を目的とする。
GPT-3.5-Turboモデルを用いて、米国選挙研究、ドイツ縦割り選挙研究、ズオビアオデータセット、中国家族パネル研究のデータを活用する。
論文 参考訳(メタデータ) (2024-07-16T05:52:26Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - Classifying multilingual party manifestos: Domain transfer across
country, time, and genre [0.0]
政治的マニフェストの大規模データベースにおいて、地理的な場所、言語、時間、ジャンルをまたいだドメイン転送の可能性を示す。
ジャンルの変更には、ニュージーランドの政治家による書き起こされたスピーチの外部コーパスを使用し、その他の3次元では、マニフェストデータベースのカスタムスプリットを使用します。
DistilBERTは低い計算コストで競争力があることを証明し、時間と国をまたいでさらなる実験に使用される。
論文 参考訳(メタデータ) (2023-07-31T09:16:13Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - A Greek Parliament Proceedings Dataset for Computational Linguistics and
Political Analysis [4.396860522241306]
我々は,1989年から2020年までの期間を経時的に延ばす,ギリシャ議会紀要のキュレートされたデータセットを紹介した。
5,355の議会記録ファイルから抽出された、100万以上のスピーチと豊富なメタデータで構成されている。
論文 参考訳(メタデータ) (2022-10-23T23:23:28Z) - Optimizing text representations to capture (dis)similarity between
political parties [1.2891210250935146]
政党間の相互類似性をモデル化する問題を考察する。
我々の研究課題は、ロバストなテキスト表現を作成するのに必要な構造情報のレベルである。
我々は、2021年の連邦選挙におけるドイツの政党の宣言について、我々のモデルを評価した。
論文 参考訳(メタデータ) (2022-10-21T14:24:57Z) - Electoral Programs of German Parties 2021: A Computational Analysis Of
Their Comprehensibility and Likeability Based On SentiArt [0.0]
我々は、2021年の総選挙の前に発行された6つのドイツ政党の選挙プログラムを分析する。
SentiArtで計算されたテキストの読みやすさと感情のポテンシャルの新たな指標を用いて、プログラムの類似点と相違点に光を当てた。
彼らは、SPDとCDUのプログラムが理解しやすく、好まれる最良の機会があることを明らかにした。
論文 参考訳(メタデータ) (2021-09-26T05:27:14Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Cross-lingual Spoken Language Understanding with Regularized
Representation Alignment [71.53159402053392]
外部リソースを使わずに言語間で単語レベルの表現と文レベルの表現を整列する正規化手法を提案する。
言語間言語理解タスクの実験により、我々のモデルは、数ショットとゼロショットの両方のシナリオにおいて、最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-09-30T08:56:53Z) - Learning Universal Representations from Word to Sentence [89.82415322763475]
この研究は普遍的な表現学習、すなわち一様ベクトル空間における言語単位の異なるレベルへの埋め込みを導入し、探求する。
本稿では, 単語, 句, 文の観点から, 類似したデータセットを構築するためのアプローチを提案する。
適切なトレーニング設定を組み込んだよく訓練されたトランスフォーマーモデルが、効果的に普遍的な表現が得られることを実証的に検証する。
論文 参考訳(メタデータ) (2020-09-10T03:53:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。