論文の概要: Performance Comparison of Crowdworkers and NLP Tools on Named-Entity
Recognition and Sentiment Analysis of Political Tweets
- arxiv url: http://arxiv.org/abs/2002.04181v2
- Date: Tue, 11 Aug 2020 22:04:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 01:46:10.346284
- Title: Performance Comparison of Crowdworkers and NLP Tools on Named-Entity
Recognition and Sentiment Analysis of Political Tweets
- Title(参考訳): 政治ツイートの固有認識と感性分析におけるクラウドワーカーとNLPツールのパフォーマンス比較
- Authors: Mona Jalal, Kate K. Mays, Lei Guo, Margrit Betke
- Abstract要約: クラウドワーカーと7つの自然言語処理(NLP)ツールキットの精度を比較した。
我々は、2016年2月のアメリカ合衆国大統領選挙で収集された、1000の政治的ツイートからなる挑戦的なデータセットに焦点を当てている。
政治ツイートのデータセットでは、最も正確なNERシステムであるGoogle Cloud NLが、クラウドワーカーとほぼ同等に実行されました。
- 参考スコア(独自算出の注目度): 10.845299122710449
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We report results of a comparison of the accuracy of crowdworkers and seven
Natural Language Processing (NLP) toolkits in solving two important NLP tasks,
named-entity recognition (NER) and entity-level sentiment (ELS) analysis. We
here focus on a challenging dataset, 1,000 political tweets that were collected
during the U.S. presidential primary election in February 2016. Each tweet
refers to at least one of four presidential candidates, i.e., four named
entities. The groundtruth, established by experts in political communication,
has entity-level sentiment information for each candidate mentioned in the
tweet. We tested several commercial and open-source tools. Our experiments show
that, for our dataset of political tweets, the most accurate NER system, Google
Cloud NL, performed almost on par with crowdworkers, but the most accurate ELS
analysis system, TensiStrength, did not match the accuracy of crowdworkers by a
large margin of more than 30 percent points.
- Abstract(参考訳): 本研究では,NLPの2つの課題,NER(name-entity recognition)とELS( entity-level sentiment)分析における,クラウドワーカーと自然言語処理(NLP)ツールキットの精度の比較結果について報告する。
ここでは、2016年2月の米大統領選挙で収集された1000の政治的ツイートに関する挑戦的なデータセットに焦点を当てる。
各ツイートは4人の大統領候補のうち少なくとも1人、すなわち4人の名前を冠した人物を指す。
政治コミュニケーションの専門家が設立した土台は、ツイートで言及された候補者ごとにエンティティレベルの感情情報を持っている。
いくつかの商用およびオープンソースツールをテストしました。
我々の実験によると、私たちの政治的ツイートのデータセットでは、最も正確なNERシステムであるGoogle Cloud NLが、クラウドワーカーとほぼ同等に実行されましたが、最も正確なESS分析システムであるTensiStrengthは、クラウドワーカーの精度を30%以上の大きなマージンで一致させませんでした。
関連論文リスト
- ChatGPT-4 Outperforms Experts and Crowd Workers in Annotating Political
Twitter Messages with Zero-Shot Learning [0.0]
本稿では、ツイートの内容に基づいて、Twitterポスターの政治的関連を分類するテキスト分析タスクにおいて、Large Language Model (LLM) ChatGPT-4の精度、信頼性、バイアスを評価する。
2020年の大統領選挙では、米国政治家のTwitterメッセージを使い、正確さを測定するための根拠となる真実を提供します。
論文 参考訳(メタデータ) (2023-04-13T14:51:40Z) - Bias or Diversity? Unraveling Fine-Grained Thematic Discrepancy in U.S.
News Headlines [63.52264764099532]
われわれは、2014年から2022年までの米国の主要メディアから、180万件のニュース記事の大規模なデータセットを使用している。
我々は、国内政治、経済問題、社会問題、外交の4つの主要なトピックに関連する、きめ細かいテーマの相違を定量化する。
以上の結果から,国内政治や社会問題においては,一定のメディア偏見が原因であることが示唆された。
論文 参考訳(メタデータ) (2023-03-28T03:31:37Z) - Computational Assessment of Hyperpartisanship in News Titles [55.92100606666497]
われわれはまず、超党派ニュースタイトル検出のための新しいデータセットを開発するために、人間の誘導する機械学習フレームワークを採用する。
全体的に右派メディアは比例的に超党派的なタイトルを使う傾向にある。
我々は、外国問題、政治システム、ニュースタイトルにおける過党主義を示唆する社会問題を含む3つの主要なトピックを識別する。
論文 参考訳(メタデータ) (2023-01-16T05:56:58Z) - Design and analysis of tweet-based election models for the 2021 Mexican
legislative election [55.41644538483948]
選挙日前の6ヶ月の間に、1500万件の選挙関連ツイートのデータセットを使用します。
地理的属性を持つデータを用いたモデルが従来のポーリング法よりも精度と精度で選挙結果を決定することがわかった。
論文 参考訳(メタデータ) (2023-01-02T12:40:05Z) - Novelty in news search: a longitudinal study of the 2020 US elections [62.997667081978825]
我々は、トップニュース検索結果に現れる新しい項目を測定するノベルティを解析する。
トピックや安定したクエリに比べて,選挙関連クエリに新たな項目が出現する傾向にある。
このような不均衡は、選挙期間中のニュース検索における政治候補者の可視性に影響を与えると論じる。
論文 参考訳(メタデータ) (2022-11-09T08:42:37Z) - Tweets2Stance: Users stance detection exploiting Zero-Shot Learning
Algorithms on Tweets [0.06372261626436675]
この研究の目的は、TwitterのパーティアカウントがTwitterで書いたことを悪用する各声明に関して、党pのスタンスを予測することである。
複数の実験から得られた結果から、Tweets2Stanceは、タスクの複雑さを考慮して、一般的な最小値である1.13の姿勢を正確に予測できることがわかった。
論文 参考訳(メタデータ) (2022-04-22T14:00:11Z) - Shifting Polarization and Twitter News Influencers between two U.S.
Presidential Elections [92.33485580547801]
我々は2016年米大統領選挙と2020年米大統領選挙の間の分極の変化を分析した。
トップインフルエンサーのほとんどが、両選挙の間にメディア組織に所属していた。
2020年のトップインフルエンサーの75%は2016年は存在しなかった。
論文 参考訳(メタデータ) (2021-11-03T20:08:54Z) - The Matter of Chance: Auditing Web Search Results Related to the 2020
U.S. Presidential Primary Elections Across Six Search Engines [68.8204255655161]
私たちは、Google、Baidu、Bing、DuckDuckGo、Yahoo、Yandexの"US Election"、"Donald trump"、"Joe Biden"、"bernie Sanders"の検索結果を調べます。
その結果, 検索エンジン間の検索結果と, エージェント間の検索結果の相違が有意な差があることが示唆された。
論文 参考訳(メタデータ) (2021-05-03T11:18:19Z) - Exploring the political pulse of a country using data science tools [0.0]
我々は、政党の指導者からのツイートを、政治プログラムやアイデアのダイナミックな代行と見なしている。
ソーシャルメディアに適応した新しいツールを用いて、ツイートにおける肯定的感情と否定的感情のレベルを分析する。
私たちは、ツイートの政治的関連を認識するために人工知能を訓練します。
論文 参考訳(メタデータ) (2020-11-20T08:17:12Z) - Inferring Political Preferences from Twitter [0.0]
ソーシャルメディアの政治的センチメント分析は、政治ストラテジストが政党や候補者のパフォーマンスを精査するのに役立つ。
選挙期間中、ソーシャルネットワークはブログ、チャット、討論、政党や政治家の展望に関する議論で溢れている。
本研究では、従来の機械学習を用いて、テキスト分類問題としてモデル化することで、ツイートに存在する政治的意見の傾きを特定することを選んだ。
論文 参考訳(メタデータ) (2020-07-21T05:20:43Z) - Political Advertising Dataset: the use case of the Polish 2020
Presidential Elections [4.560033258611709]
ポーランド語における特定のテキストチャンクや政治広告のカテゴリを検出するための、最初の公開データセットを提示する。
9つのカテゴリーにタグ付けされた1,705件の人称注釈付きツイートが含まれており、これはポーランドの選挙法の下でのキャンペーンである。
論文 参考訳(メタデータ) (2020-06-17T23:58:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。