論文の概要: How Twitter Data Sampling Biases U.S. Voter Behavior Characterizations
- arxiv url: http://arxiv.org/abs/2006.01447v1
- Date: Tue, 2 Jun 2020 08:33:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-17 09:01:57.750127
- Title: How Twitter Data Sampling Biases U.S. Voter Behavior Characterizations
- Title(参考訳): Twitterのデータサンプリングは、米国の有権者の行動特性を左右する
- Authors: Kai-Cheng Yang, Pik-Mai Hui, Filippo Menczer
- Abstract要約: 近年の研究では、悪質な社会ボットやトロルのような不正なアクターの存在が明らかにされている。
本稿では,2018年米国中間選挙のTwitterデータを用いて,このギャップを埋めることを目的としている。
ハイパーアクティブアカウントは、様々な不審な振る舞いを示し、低信頼度情報を共有する傾向にあることを示す。
- 参考スコア(独自算出の注目度): 6.364128212193265
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online social media are key platforms for the public to discuss political
issues. As a result, researchers have used data from these platforms to analyze
public opinions and forecast election results. Recent studies reveal the
existence of inauthentic actors such as malicious social bots and trolls,
suggesting that not every message is a genuine expression from a legitimate
user. However, the prevalence of inauthentic activities in social data streams
is still unclear, making it difficult to gauge biases of analyses based on such
data. In this paper, we aim to close this gap using Twitter data from the 2018
U.S. midterm elections. Hyperactive accounts are over-represented in volume
samples. We compare their characteristics with those of randomly sampled
accounts and self-identified voters using a fast and low-cost heuristic. We
show that hyperactive accounts are more likely to exhibit various suspicious
behaviors and share low-credibility information compared to likely voters.
Random accounts are more similar to likely voters, although they have slightly
higher chances to display suspicious behaviors. Our work provides insights into
biased voter characterizations when using online observations, underlining the
importance of accounting for inauthentic actors in studies of political issues
based on social media data.
- Abstract(参考訳): オンラインソーシャルメディアは、政治問題について議論する上で重要なプラットフォームである。
その結果、研究者はこれらのプラットフォームからのデータを、世論の分析や選挙結果の予測に利用した。
近年の研究では、悪意のあるソーシャルボットやトロールのような真偽のアクタの存在が明らかにされ、全てのメッセージが正当なユーザーからの本物の表現であるとは限らないことが示唆されている。
しかし、社会的データストリームにおける不正確な活動の頻度はいまだ不明であり、そのようなデータに基づいて分析のバイアスを計測することは困難である。
本稿では,2018年中間選挙のtwitterデータを用いて,このギャップを埋めることを目的とする。
ハイパーアクティブアカウントはボリュームサンプルで過剰に表現される。
これらの特徴を,高速かつ低コストなヒューリスティックを用いて,ランダムにサンプリングされたアカウントと自己識別された有権者の特性と比較した。
我々は,多能性アカウントが様々な不審な行動を示し,低信頼度情報を共有する傾向にあることを示した。
ランダムアカウントはおそらく有権者に似ていますが、不審な行動を示す確率は少し高くなります。
本研究は,オンライン観察を用いた偏りのある投票者特性に関する知見を提供し,ソーシャルメディアデータに基づく政治問題研究における不正行為者に対する会計の重要さを概説する。
関連論文リスト
- Unveiling the Hidden Agenda: Biases in News Reporting and Consumption [59.55900146668931]
イタリアのワクチン論争に関する6年間のデータセットを構築し、物語と選択バイアスを特定するためにベイジアン潜在空間モデルを採用する。
バイアスとエンゲージメントの間に非線形な関係が見られ、極端な位置へのエンゲージメントが高くなった。
Twitter上でのニュース消費の分析は、同様のイデオロギー的な立場のニュースメディアの間で、一般的なオーディエンスを明らかにしている。
論文 参考訳(メタデータ) (2023-01-14T18:58:42Z) - Design and analysis of tweet-based election models for the 2021 Mexican
legislative election [55.41644538483948]
選挙日前の6ヶ月の間に、1500万件の選挙関連ツイートのデータセットを使用します。
地理的属性を持つデータを用いたモデルが従来のポーリング法よりも精度と精度で選挙結果を決定することがわかった。
論文 参考訳(メタデータ) (2023-01-02T12:40:05Z) - Trust and Believe -- Should We? Evaluating the Trustworthiness of
Twitter Users [5.695742189917657]
ソーシャルメディア上のフェイクニュースは、個人と社会の両方に悪影響を及ぼす大きな問題である。
この作業において、私たちは、ソーシャルネットワークコミュニティに信頼を喚起するソリューションを提供したいと考えている。
本モデルでは,Twitter上で5万人の政治家の行動を分析し,評価されたユーザ毎に影響スコアを割り当てる。
論文 参考訳(メタデータ) (2022-10-27T06:57:19Z) - Fast Few shot Self-attentive Semi-supervised Political Inclination
Prediction [12.472629584751509]
政策立案者やジャーナリストにとって、特定の場所にいる人々の政治的傾向を理解するために、ソーシャルメディア上でオンライン世論調査を作成することは、今やますます一般的になっている。
我々は、その目的をさらに進めるために、政治的傾き検出のための自己注意型半教師付きフレームワークを導入する。
資源制約のある設定でも,モデルは非常に効率的であることがわかった。
論文 参考訳(メタデータ) (2022-09-21T12:07:16Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - News consumption and social media regulations policy [70.31753171707005]
我々は、ニュース消費とコンテンツ規制の間の相互作用を評価するために、反対のモデレーション手法であるTwitterとGabを強制した2つのソーシャルメディアを分析した。
以上の結果から,Twitterが追求するモデレーションの存在は,疑わしいコンテンツを著しく減少させることがわかった。
Gabに対する明確な規制の欠如は、ユーザが両方のタイプのコンテンツを扱う傾向を生じさせ、ディスカウント/エンドレスメントの振る舞いを考慮に入れた疑わしいコンテンツに対してわずかに好みを示す。
論文 参考訳(メタデータ) (2021-06-07T19:26:32Z) - Leveraging Administrative Data for Bias Audits: Assessing Disparate
Coverage with Mobility Data for COVID-19 Policy [61.60099467888073]
管理データのリンクによって,バイアスに対するモビリティデータの監査が可能かを示す。
我々は、高齢者や非白人の有権者が移動データによって捕えられる可能性が低いことを示した。
このような移動データに基づく公衆衛生資源の配分は、高リスク高齢者や少数民族に不当に害を与える可能性があることを示す。
論文 参考訳(メタデータ) (2020-11-14T02:04:14Z) - Causal Understanding of Fake News Dissemination on Social Media [50.4854427067898]
我々は、ユーザーがフェイクニュースを共有するのに、ユーザー属性が何をもたらすかを理解することが重要だと論じている。
偽ニュース拡散において、共同創設者は、本質的にユーザー属性やオンライン活動に関連する偽ニュース共有行動によって特徴づけられる。
本稿では,偽ニュース拡散における選択バイアスを軽減するための原則的アプローチを提案する。
論文 参考訳(メタデータ) (2020-10-20T19:37:04Z) - Inferring Political Preferences from Twitter [0.0]
ソーシャルメディアの政治的センチメント分析は、政治ストラテジストが政党や候補者のパフォーマンスを精査するのに役立つ。
選挙期間中、ソーシャルネットワークはブログ、チャット、討論、政党や政治家の展望に関する議論で溢れている。
本研究では、従来の機械学習を用いて、テキスト分類問題としてモデル化することで、ツイートに存在する政治的意見の傾きを特定することを選んだ。
論文 参考訳(メタデータ) (2020-07-21T05:20:43Z) - Neutral bots probe political bias on social media [7.41821251168122]
Twitter上でさまざまなニュースソースをフォローし始める中立的なソーシャルボットをデプロイし、プラットフォームメカニズムとユーザインタラクションから生じる偏見を調査します。
ニュースフィードに政治的偏見の強い、あるいは一貫した証拠は見つからない。
保守的なアカウントの相互作用は右向きに歪められているが、リベラルなアカウントは、彼らの経験を政治的中心へとシフトさせる穏健なコンテンツに晒されている。
論文 参考訳(メタデータ) (2020-05-17T01:20:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。