論文の概要: Does Twitter know your political views? POLiTweets dataset and
semi-automatic method for political leaning discovery
- arxiv url: http://arxiv.org/abs/2207.07586v1
- Date: Tue, 14 Jun 2022 10:28:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-09 09:36:56.399498
- Title: Does Twitter know your political views? POLiTweets dataset and
semi-automatic method for political leaning discovery
- Title(参考訳): Twitterはあなたの政治的見解を知っているか?
政治的傾き発見のためのPOLiTweetsデータセットと半自動手法
- Authors: Joanna Baran, Micha{\l} Kajstura, Maciej Zi\'o{\l}kowski, Krzysztof
Rajda
- Abstract要約: POLiTweetsは、複数政党のセットアップで政治的アフィリエイトを発見するための、ポーランド初の公開データセットである。
ポーランド語で書かれたユーザ約10万のツイートと、166人のユーザ約40万のツイートが、手動でテストセットとして注釈付けされている。
私たちは、トピックやコンテンツライターのタイプ、一般市民対プロの政治家のコンテキストにおけるドメインシフトの側面を研究するために、私たちのデータを使用しました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Every day, the world is flooded by millions of messages and statements posted
on Twitter or Facebook. Social media platforms try to protect users' personal
data, but there still is a real risk of misuse, including elections
manipulation. Did you know, that only 13 posts addressing important or
controversial topics for society are enough to predict one's political
affiliation with a 0.85 F1-score? To examine this phenomenon, we created a
novel universal method of semi-automated political leaning discovery. It relies
on a heuristical data annotation procedure, which was evaluated to achieve 0.95
agreement with human annotators (counted as an accuracy metric). We also
present POLiTweets - the first publicly open Polish dataset for political
affiliation discovery in a multi-party setup, consisting of over 147k tweets
from almost 10k Polish-writing users annotated heuristically and almost 40k
tweets from 166 users annotated manually as a test set. We used our data to
study the aspects of domain shift in the context of topics and the type of
content writers - ordinary citizens vs. professional politicians.
- Abstract(参考訳): 毎日、世界中は何百万ものメッセージや声明がtwitterやfacebookに投稿されている。
ソーシャルメディアプラットフォームはユーザーの個人情報を保護しようとするが、選挙操作を含む誤用のリスクは依然として残っている。
社会にとって重要な話題や議論の的になっている13の投稿だけで、その人の政治的提携を0.85F1スコアで予測できると知っていましたか?
この現象を調べるために、我々は半自動的政治的傾き発見の新しい普遍的方法を開発した。
これはヒューリスティックなデータアノテーションの手順に依存しており、人間のアノテータとの0.95の合意を達成するために評価された。
我々はpolitweetsも紹介する。politweetsはポーランドの政治関連発見のための最初の公開データセットで、約1万1000人のポーランド文字ユーザーからの147万ツイートと、166人のユーザーの約4万ツイートをテストセットとして手動でアノテートした。
私たちは、トピックやコンテンツライターのタイプ、一般市民対プロの政治家のコンテキストにおけるドメインシフトの側面を研究するために、私たちのデータを使用しました。
関連論文リスト
- On the Use of Proxies in Political Ad Targeting [49.61009579554272]
我々は、主要な政治広告主がプロキシ属性をターゲットとして緩和を回避したことを示す。
本研究は政治広告の規制に関する議論に重要な意味を持つ。
論文 参考訳(メタデータ) (2024-10-18T17:15:13Z) - Electoral Agitation Data Set: The Use Case of the Polish Election [3.671887117122512]
ポーランド語における選挙の扇動を検出するための最初の公開データセットを提示する。
これには、法的に条件付けされた4つのカテゴリにタグ付けされた6,112人の人手によるツイートが含まれている。
新たに作成されたデータセットは、HerBERTと呼ばれるポーランド語モデルの微調整に使用された。
論文 参考訳(メタデータ) (2023-07-13T18:14:43Z) - Design and analysis of tweet-based election models for the 2021 Mexican
legislative election [55.41644538483948]
選挙日前の6ヶ月の間に、1500万件の選挙関連ツイートのデータセットを使用します。
地理的属性を持つデータを用いたモデルが従来のポーリング法よりも精度と精度で選挙結果を決定することがわかった。
論文 参考訳(メタデータ) (2023-01-02T12:40:05Z) - Top Gear or Black Mirror: Inferring Political Leaning From Non-Political
Content [8.435739379764408]
分極とエコーチャンバーは選挙のような明確な政治的出来事の文脈でしばしば研究される。
非政治的文脈における政治的分極は、しばしば不明である。
政治的傾きは「ラテ・ドライキング・リベラル」のようなステレオタイプにつながる多くのライフスタイルの選択と相関することが知られている。
論文 参考訳(メタデータ) (2022-08-11T06:41:23Z) - Tweets2Stance: Users stance detection exploiting Zero-Shot Learning
Algorithms on Tweets [0.06372261626436675]
この研究の目的は、TwitterのパーティアカウントがTwitterで書いたことを悪用する各声明に関して、党pのスタンスを予測することである。
複数の実験から得られた結果から、Tweets2Stanceは、タスクの複雑さを考慮して、一般的な最小値である1.13の姿勢を正確に予測できることがわかった。
論文 参考訳(メタデータ) (2022-04-22T14:00:11Z) - Political Communities on Twitter: Case Study of the 2022 French
Presidential Election [14.783829037950984]
われわれは、2022年のフランス大統領選挙でTwitter上に形成された政治コミュニティを特定することを目指している。
われわれは、12万人のユーザーと6260万人のツイートを含む大規模なTwitterデータセットを作成し、選挙に関連するキーワードについて言及している。
ユーザのリツイートグラフ上でコミュニティ検出を行い、各コミュニティのスタンスを詳細に分析する。
論文 参考訳(メタデータ) (2022-04-15T12:18:16Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - Reaching the bubble may not be enough: news media role in online
political polarization [58.720142291102135]
分極を減らす方法は、異なる政治的指向を持つ個人に党間のニュースを分配することである。
本研究は、ブラジルとカナダにおける全国選挙の文脈において、これが成立するかどうかを考察する。
論文 参考訳(メタデータ) (2021-09-18T11:34:04Z) - Political Posters Identification with Appearance-Text Fusion [49.55696202606098]
外観特徴とテキストベクトルを効率的に活用し, 政治ポスターを高精度に分類する手法を提案する。
この作品の大半は、特定の政治イベントのプロモーションとして機能するように設計された政治ポスターに焦点を当てている。
論文 参考訳(メタデータ) (2020-12-19T16:14:51Z) - Political audience diversity and news reliability in algorithmic ranking [54.23273310155137]
本稿では,ウェブサイトのオーディエンスの政治的多様性を質の指標として活用することを提案する。
ドメインの専門家によるニュースソースの信頼性評価と6,890人の米国市民の多様なサンプルによるWebブラウジングデータを用いて、より極端な、政治的に多様性の低いWebサイトが、ジャーナリストの基準を低くしていることを示す。
論文 参考訳(メタデータ) (2020-07-16T02:13:55Z) - Political Advertising Dataset: the use case of the Polish 2020
Presidential Elections [4.560033258611709]
ポーランド語における特定のテキストチャンクや政治広告のカテゴリを検出するための、最初の公開データセットを提示する。
9つのカテゴリーにタグ付けされた1,705件の人称注釈付きツイートが含まれており、これはポーランドの選挙法の下でのキャンペーンである。
論文 参考訳(メタデータ) (2020-06-17T23:58:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。