論文の概要: Electoral Agitation Data Set: The Use Case of the Polish Election
- arxiv url: http://arxiv.org/abs/2307.07007v1
- Date: Thu, 13 Jul 2023 18:14:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-17 15:51:44.056070
- Title: Electoral Agitation Data Set: The Use Case of the Polish Election
- Title(参考訳): 選挙人扇動データセット:ポーランド選挙のユースケース
- Authors: Mateusz Baran, Mateusz W\'ojcik, Piotr Kolebski, Micha{\l} Bernaczyk,
Krzysztof Rajda, {\L}ukasz Augustyniak, Tomasz Kajdanowicz
- Abstract要約: ポーランド語における選挙の扇動を検出するための最初の公開データセットを提示する。
これには、法的に条件付けされた4つのカテゴリにタグ付けされた6,112人の人手によるツイートが含まれている。
新たに作成されたデータセットは、HerBERTと呼ばれるポーランド語モデルの微調整に使用された。
- 参考スコア(独自算出の注目度): 3.671887117122512
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The popularity of social media makes politicians use it for political
advertisement. Therefore, social media is full of electoral agitation
(electioneering), especially during the election campaigns. The election
administration cannot track the spread and quantity of messages that count as
agitation under the election code. It addresses a crucial problem, while also
uncovering a niche that has not been effectively targeted so far. Hence, we
present the first publicly open data set for detecting electoral agitation in
the Polish language. It contains 6,112 human-annotated tweets tagged with four
legally conditioned categories. We achieved a 0.66 inter-annotator agreement
(Cohen's kappa score). An additional annotator resolved the mismatches between
the first two improving the consistency and complexity of the annotation
process. The newly created data set was used to fine-tune a Polish Language
Model called HerBERT (achieving a 68% F1 score). We also present a number of
potential use cases for such data sets and models, enriching the paper with an
analysis of the Polish 2020 Presidential Election on Twitter.
- Abstract(参考訳): ソーシャルメディアの人気は政治家を政治広告に利用させる。
それゆえ、ソーシャルメディアは選挙運動の間、特に選挙の扇動(選挙参加)に満ちている。
選挙行政は、選挙法の下で扇動として数えられるメッセージの拡散と量を追跡できない。
これは重要な問題に対処すると同時に、これまで効果的にターゲットにされていないニッチも明らかにする。
そこで,ポーランド語における選挙行動を検出するための最初の公開データセットを提案する。
6,112件の人間注釈付ツイートに4つの法的条件付きカテゴリーがタグ付けされている。
我々は0.66のアノテーション間合意(コーエンのkappaスコア)を達成した。
追加のアノテータは、アノテーションプロセスの一貫性と複雑さを改善する最初の2つの間のミスマッチを解決した。
新たに作成されたデータセットは、HerBERT(F1スコア68%)と呼ばれるポーランド語モデルの微調整に使用された。
また,このようなデータセットやモデルのユースケースを数多く紹介するとともに,2020年ポーランド大統領選挙のtwitter上での分析を通じて,論文を充実させた。
関連論文リスト
- On the Use of Proxies in Political Ad Targeting [49.61009579554272]
我々は、主要な政治広告主がプロキシ属性をターゲットとして緩和を回避したことを示す。
本研究は政治広告の規制に関する議論に重要な意味を持つ。
論文 参考訳(メタデータ) (2024-10-18T17:15:13Z) - Two-Stage Classifier for Campaign Negativity Detection using Axis
Embeddings: A Case Study on Tweets of Political Users during 2021
Presidential Election in Iran [0.0]
世界中の選挙において、候補者は失敗や時間的プレッシャーのため、ネガティビティへのキャンペーンを転換する可能性がある。
本稿では,2つの機械学習モデルの強みを組み合わせた2段階分類器によるキャンペーン負性検出のハイブリッドモデルを提案する。
我々の最良のモデル(RF-RF)はマクロF1スコアの79%、重み付きF1スコアの82%を達成できた。
論文 参考訳(メタデータ) (2023-10-31T20:31:41Z) - Prediction of the 2023 Turkish Presidential Election Results Using
Social Media Data [0.5156484100374059]
我々は,従来の世論調査データとソーシャルメディアデータを組み合わせることで,トルコにおける2023年の選挙に参加する政党の投票シェアを予測することを目的とする。
私たちのアプローチは、コンテンツではなく、ソーシャルメディアのインタラクションの数を考慮したボリュームベースのアプローチです。
論文 参考訳(メタデータ) (2023-05-28T13:17:51Z) - Design and analysis of tweet-based election models for the 2021 Mexican
legislative election [55.41644538483948]
選挙日前の6ヶ月の間に、1500万件の選挙関連ツイートのデータセットを使用します。
地理的属性を持つデータを用いたモデルが従来のポーリング法よりも精度と精度で選挙結果を決定することがわかった。
論文 参考訳(メタデータ) (2023-01-02T12:40:05Z) - Novelty in news search: a longitudinal study of the 2020 US elections [62.997667081978825]
我々は、トップニュース検索結果に現れる新しい項目を測定するノベルティを解析する。
トピックや安定したクエリに比べて,選挙関連クエリに新たな項目が出現する傾向にある。
このような不均衡は、選挙期間中のニュース検索における政治候補者の可視性に影響を与えると論じる。
論文 参考訳(メタデータ) (2022-11-09T08:42:37Z) - Political Communities on Twitter: Case Study of the 2022 French
Presidential Election [14.783829037950984]
われわれは、2022年のフランス大統領選挙でTwitter上に形成された政治コミュニティを特定することを目指している。
われわれは、12万人のユーザーと6260万人のツイートを含む大規模なTwitterデータセットを作成し、選挙に関連するキーワードについて言及している。
ユーザのリツイートグラフ上でコミュニティ検出を行い、各コミュニティのスタンスを詳細に分析する。
論文 参考訳(メタデータ) (2022-04-15T12:18:16Z) - Shifting Polarization and Twitter News Influencers between two U.S.
Presidential Elections [92.33485580547801]
我々は2016年米大統領選挙と2020年米大統領選挙の間の分極の変化を分析した。
トップインフルエンサーのほとんどが、両選挙の間にメディア組織に所属していた。
2020年のトップインフルエンサーの75%は2016年は存在しなかった。
論文 参考訳(メタデータ) (2021-11-03T20:08:54Z) - Reaching the bubble may not be enough: news media role in online
political polarization [58.720142291102135]
分極を減らす方法は、異なる政治的指向を持つ個人に党間のニュースを分配することである。
本研究は、ブラジルとカナダにおける全国選挙の文脈において、これが成立するかどうかを考察する。
論文 参考訳(メタデータ) (2021-09-18T11:34:04Z) - Mundus vult decipi, ergo decipiatur: Visual Communication of Uncertainty
in Election Polls [56.8172499765118]
我々は、今放送と予測におけるバイアスの潜在的な源について論じる。
概念は、誤認識された正確性の問題を軽減するために提示される。
主要なアイデアの1つは、パーティーシェアではなくイベントの確率を使うことである。
論文 参考訳(メタデータ) (2021-04-28T07:02:24Z) - Political Advertising Dataset: the use case of the Polish 2020
Presidential Elections [4.560033258611709]
ポーランド語における特定のテキストチャンクや政治広告のカテゴリを検出するための、最初の公開データセットを提示する。
9つのカテゴリーにタグ付けされた1,705件の人称注釈付きツイートが含まれており、これはポーランドの選挙法の下でのキャンペーンである。
論文 参考訳(メタデータ) (2020-06-17T23:58:01Z) - Embeddings-Based Clustering for Target Specific Stances: The Case of a
Polarized Turkey [6.130136112098865]
本稿では、偏極状態、特にトルコ政治における標的特異的姿勢検出の教師なし手法を提案する。
複数のターゲットにまたがる分散したグループのユーザを適切にクラスタリングする上で,本手法の有効性を示す。
トルコの選挙関連ツイート108万件と、トルコユーザーのタイムラインツイート168万件について分析を行った。
論文 参考訳(メタデータ) (2020-05-19T13:52:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。