論文の概要: POLITICS: Pretraining with Same-story Article Comparison for Ideology
Prediction and Stance Detection
- arxiv url: http://arxiv.org/abs/2205.00619v1
- Date: Mon, 2 May 2022 02:10:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-03 14:26:19.836025
- Title: POLITICS: Pretraining with Same-story Article Comparison for Ideology
Prediction and Stance Detection
- Title(参考訳): POLITICS:イデオロギー予測とスタンス検出のための同一記事比較による事前学習
- Authors: Yujian Liu, Xinliang Frederick Zhang, David Wegsman, Nick Beauchamp,
Lu Wang
- Abstract要約: イデオロギーは政治科学研究の核心である。しかしながら、さまざまなジャンルのテキストでイデオロギーを特徴づけ、予測するための汎用的なツールはいまだに存在しない。
異なるイデオロギーのメディアによって書かれた記事の比較に依拠する,新しいイデオロギー駆動の事前学習目標を用いた事前学習言語モデルについて検討した。
我々のモデルPOLITICSは、イデオロギー予測と姿勢検出タスクにおける強力なベースラインと過去の最先端モデルよりも優れています。
- 参考スコア(独自算出の注目度): 6.399608844195599
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ideology is at the core of political science research. Yet, there still does
not exist general-purpose tools to characterize and predict ideology across
different genres of text. To this end, we study Pretrained Language Models
using novel ideology-driven pretraining objectives that rely on the comparison
of articles on the same story written by media of different ideologies. We
further collect a large-scale dataset, consisting of more than 3.6M political
news articles, for pretraining. Our model POLITICS outperforms strong baselines
and the previous state-of-the-art models on ideology prediction and stance
detection tasks. Further analyses show that POLITICS is especially good at
understanding long or formally written texts, and is also robust in few-shot
learning scenarios.
- Abstract(参考訳): イデオロギーは政治科学研究の核心にある。
しかし、様々なジャンルのテキストにまたがるイデオロギーを特徴付け、予測するための汎用ツールはまだ存在しない。
そこで本研究では,異なるイデオロギーのメディアによって書かれた同一記事の記事の比較に依存する新しいイデオロギー駆動事前学習目標を用いて,事前学習された言語モデルについて検討する。
我々はさらに360万以上の政治ニュース記事からなる大規模データセットを事前学習のために収集する。
我々のモデルPOLITICSは、イデオロギー予測と姿勢検出タスクにおける強力なベースラインと過去の最先端モデルよりも優れている。
さらに分析したところ、POLITICSは特に長文や正式なテキストを理解するのが得意であり、また数ショットの学習シナリオにおいても堅牢であることがわかった。
関連論文リスト
- P^3SUM: Preserving Author's Perspective in News Summarization with Diffusion Language Models [57.571395694391654]
既存のアプローチは、要約の50%以上で、ニュース記事の政治的意見やスタンスを変えている。
政治的視点分類器によって制御される拡散モデルに基づく要約手法であるP3SUMを提案する。
3つのニュース要約データセットの実験により、P3SUMは最先端の要約システムより優れていることが示された。
論文 参考訳(メタデータ) (2023-11-16T10:14:28Z) - Late Fusion with Triplet Margin Objective for Multimodal Ideology
Prediction and Analysis [9.85098393546375]
政治内容とテキストイメージのペアが与えられた場合、モデルが二分あるいは五点スケールのイデオロギーの傾きを予測するマルチモーダルイデオロギー予測のタスクを導入する。
我々は、ニュース記事の詳細な分析を行い、政治的スペクトルにおける画像の内容と使用法の違いを明らかにする。
我々の最高のパフォーマンスモデルであるレイトフュージョンアーキテクチャは、マルチモーダルコンテンツよりも三重対物で事前訓練され、最先端のテキストのみのモデルよりも約4%性能が向上します。
論文 参考訳(メタデータ) (2022-11-04T05:45:26Z) - Contextual information integration for stance detection via
cross-attention [59.662413798388485]
スタンス検出は、著者の目標に対する姿勢を特定することを扱う。
既存のスタンス検出モデルの多くは、関連するコンテキスト情報を考慮していないため、制限されている。
文脈情報をテキストとして統合する手法を提案する。
論文 参考訳(メタデータ) (2022-11-03T15:04:29Z) - Panning for gold: Lessons learned from the platform-agnostic automated
detection of political content in textual data [48.7576911714538]
異なるプラットフォーム間で政治的コンテンツを検出するために、これらの技術がどのように使用できるかについて議論する。
辞書,教師付き機械学習,ニューラルネットワークに依存する3つの検出手法のパフォーマンスを比較した。
この結果から,ニューラルネットワークと機械学習に基づくモデルによって達成されるノイズの少ないデータに対して,事前処理がモデル性能に与える影響が限定された。
論文 参考訳(メタデータ) (2022-07-01T15:23:23Z) - Towards Understanding Large-Scale Discourse Structures in Pre-Trained
and Fine-Tuned Language Models [30.615883375573432]
本稿では,任意の長さの文書から談話構造を推定する新しい手法について述べる。
第2に,BERTモデルとBARTモデルにおいて,内在的談話がどの程度正確に捕捉されるかを明らかにするために,新しいタイプの分析手法を提案する。
生成した構造が,モデル内およびモデル間の分布だけでなく,さまざまなベースラインにどの程度類似しているかを評価する。
論文 参考訳(メタデータ) (2022-04-08T20:42:08Z) - Encoding Heterogeneous Social and Political Context for Entity Stance
Prediction [7.477393857078695]
本稿では,エンティティスタンス予測の新しい課題を提案する。
我々は、現代アメリカの政治に関する社会団体に関する事実をウィキペディアから回収する。
そして、我々は、ドメインの専門家の助けを借りて、政治イデオロギーに対する社会団体のスタンスに注釈を付ける。
論文 参考訳(メタデータ) (2021-08-09T08:59:43Z) - Political Ideology and Polarization of Policy Positions: A
Multi-dimensional Approach [19.435030285532854]
我々は,政策のイデオロギーを,姿勢とイデオロギーの曖昧な共存を区別して検討する。
政治学の理論的な記述と相まって、イデオロギーを多次元的構成として扱う。
この枠組みは, 時間的・多面的なイデオロギー距離の測定値である分極の定量的解析を可能にすることを示す。
論文 参考訳(メタデータ) (2021-06-28T04:03:04Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - We Can Detect Your Bias: Predicting the Political Ideology of News
Articles [35.761722515882646]
我々は、政治的イデオロギーのために手動で注釈付けされた34,737項目のデータセットを公表した。
私たちは、テスト例がトレーニング中に見られなかったメディアから得られる、挑戦的な実験的なセットアップを使用しています。
実験結果から,最先端の事前学習型トランスに比べて非常に大きな改善が得られた。
論文 参考訳(メタデータ) (2020-10-11T20:27:55Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - Deep Learning Based Text Classification: A Comprehensive Review [75.8403533775179]
本稿では,近年開発されたテキスト分類のための150以上のディープラーニングモデルについてレビューする。
また、テキスト分類に広く使われている40以上の一般的なデータセットの要約も提供する。
論文 参考訳(メタデータ) (2020-04-06T02:00:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。