論文の概要: Political Leaning and Politicalness Classification of Texts
- arxiv url: http://arxiv.org/abs/2507.13913v1
- Date: Fri, 18 Jul 2025 13:44:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-21 20:43:26.299607
- Title: Political Leaning and Politicalness Classification of Texts
- Title(参考訳): 文章の政治学習と政治的分類
- Authors: Matous Volf, Jakub Simko,
- Abstract要約: 本稿では, トランスフォーマーモデルを用いて, 政治的傾きと政治的態度によるテキストの自動分類の課題に対処する。
政治傾向の分類のための12のデータセットと、既存の18のデータセットを適切なラベルで拡張することで、政治的傾向の新たなデータセットを作成することで、多様なデータセットをコンパイルする。
- 参考スコア(独自算出の注目度): 1.203618099959761
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper addresses the challenge of automatically classifying text according to political leaning and politicalness using transformer models. We compose a comprehensive overview of existing datasets and models for these tasks, finding that current approaches create siloed solutions that perform poorly on out-of-distribution texts. To address this limitation, we compile a diverse dataset by combining 12 datasets for political leaning classification and creating a new dataset for politicalness by extending 18 existing datasets with the appropriate label. Through extensive benchmarking with leave-one-in and leave-one-out methodologies, we evaluate the performance of existing models and train new ones with enhanced generalization capabilities.
- Abstract(参考訳): 本稿では, トランスフォーマーモデルを用いて, 政治的傾きと政治的態度によるテキストの自動分類の課題に対処する。
我々は、これらのタスクのための既存のデータセットとモデルの包括的概要を作成し、現在のアプローチが、配布外テキストで不十分に動作するサイロ化されたソリューションを作成することを発見した。
この制限に対処するために、政治的傾き分類のための12のデータセットを組み合わせて、既存の18のデータセットを適切なラベルで拡張することで、政治的に新しいデータセットを作成することで、多様なデータセットをコンパイルする。
本研究では,既存のモデルの性能評価と,一般化能力の強化による新しいモデルの評価を行う。
関連論文リスト
- Strategies for political-statement segmentation and labelling in unstructured text [2.5338097608867542]
MARPORプロジェクトの参加者によって、バイステートメントな政治的スタンスラベルを持つマニフェストの大規模なコーパスが作成されている。
本稿では,テキストデータから文を共同で分割・分類することのできる,統一された分割・ラベルのフレームワークを提案し,検証する。
本手法は,政治宣言の原文に適用した場合,競争精度が向上することを示し,英国庶民院の記録に応用することで,その研究可能性を示す。
論文 参考訳(メタデータ) (2025-03-10T10:56:06Z) - A Survey on Tabular Data Generation: Utility, Alignment, Fidelity, Privacy, and Beyond [53.56796220109518]
異なるユースケースは、実際に有用な異なる要件を満たすために合成データを要求する。
合成データの実用性、合成データのドメイン固有の知識との整合性、実際のデータ分布と比較しての合成データ分布の統計的忠実度、プライバシ保護能力の4つの要件をレビューする。
今後の分野の方向性と、現在の評価方法を改善する機会について論じる。
論文 参考訳(メタデータ) (2025-03-07T21:47:11Z) - Concept Navigation and Classification via Open-Source Large Language Model Processing [0.0]
本稿では,オープンソースのLarge Language Models (LLMs) を用いたテキストデータから潜在構造を検出・分類するための新しい手法を提案する。
提案手法は,自動要約とループ内検証を組み合わせることで,構造同定の精度と解釈性を向上させる。
論文 参考訳(メタデータ) (2025-02-07T08:42:34Z) - Summarization of Opinionated Political Documents with Varied Perspectives [11.399915001583059]
多様な視点の正確な要約を生成することができるモデルは、ユーザーを別の視点に露出させることで、そのような偏極を減らすのに役立つ。
本稿では、各政治的視点を独立に要約する新しいデータセットと課題を、意見のあるニュース記事から一括して紹介する。
自動評価と人的評価の両方を通じて、さまざまなサイズとアーキテクチャの10のモデルをベンチマークする。
論文 参考訳(メタデータ) (2024-11-06T18:14:48Z) - SciER: An Entity and Relation Extraction Dataset for Datasets, Methods, and Tasks in Scientific Documents [49.54155332262579]
我々は,科学論文のデータセット,メソッド,タスクに関連するエンティティに対して,新たなエンティティと関係抽出データセットをリリースする。
我々のデータセットには、24k以上のエンティティと12kの関係を持つ106の注釈付きフルテキストの科学出版物が含まれています。
論文 参考訳(メタデータ) (2024-10-28T15:56:49Z) - Political Leaning Inference through Plurinational Scenarios [4.899818550820576]
この研究は、スペインにおける3つの多様な地域(バスク州、カタルーニャ州、ガリシア州)に焦点を当て、多党の分類の様々な方法を探究する。
我々は、リツイートから得られた教師なしユーザ表現と、その後の政治的傾き検出に使用される2段階の手法を用いる。
論文 参考訳(メタデータ) (2024-06-12T07:42:12Z) - Casual Conversations v2: Designing a large consent-driven dataset to
measure algorithmic bias and robustness [34.435124846961415]
Metaは、カテゴリの包括的なリストを持つ大規模な同意駆動データセットの収集に取り組んでいる。
本稿では,このようなカテゴリの設計とCasual Conversations v2のサブカテゴリについて述べる。
論文 参考訳(メタデータ) (2022-11-10T19:06:21Z) - Retrieval Enhanced Data Augmentation for Question Answering on Privacy
Policies [74.01792675564218]
本研究では,ラベルのないポリシー文書から関連するテキストセグメントを抽出する検索モデルに基づくデータ拡張フレームワークを開発する。
拡張データの多様性と品質を改善するために,複数の事前学習言語モデル(LM)を活用し,ノイズ低減フィルタモデルでそれらをカスケードする。
PrivacyQAベンチマークの強化データを使用して、既存のベースラインを大きなマージン(10% F1)に高め、新しい最先端のF1スコアを50%達成します。
論文 参考訳(メタデータ) (2022-04-19T15:45:23Z) - Data-to-text Generation with Variational Sequential Planning [74.3955521225497]
非言語的な入力からテキスト出力を生成することを目的としたデータ・ツー・テキスト生成の課題について考察する。
協調的かつ有意義な方法で高レベルの情報を整理する責任を負う計画要素を付加したニューラルモデルを提案する。
我々は、計画と生成のステップをインターリーブしながら、構造化された変動モデルで逐次、潜在計画を推測する。
論文 参考訳(メタデータ) (2022-02-28T13:17:59Z) - Partially-Aligned Data-to-Text Generation with Distant Supervision [69.15410325679635]
我々はPADTG(Partially-Aligned Data-to-Text Generation)と呼ばれる新しい生成タスクを提案する。
自動的にアノテートされたデータをトレーニングに利用し、アプリケーションドメインを大幅に拡張するため、より実用的です。
我々のフレームワークは、全てのベースラインモデルより優れており、部分整合データの利用の可能性を検証する。
論文 参考訳(メタデータ) (2020-10-03T03:18:52Z) - A Revised Generative Evaluation of Visual Dialogue [80.17353102854405]
本稿では,VisDialデータセットの改訂評価手法を提案する。
モデルが生成した回答と関連する回答の集合のコンセンサスを測定する。
DenseVisDialとして改訂された評価スキームのこれらのセットとコードをリリースする。
論文 参考訳(メタデータ) (2020-04-20T13:26:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。