論文の概要: Sampled Datasets Risk Substantial Bias in the Identification of Political Polarization on Social Media
- arxiv url: http://arxiv.org/abs/2406.19867v1
- Date: Fri, 28 Jun 2024 12:13:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-01 16:50:10.592337
- Title: Sampled Datasets Risk Substantial Bias in the Identification of Political Polarization on Social Media
- Title(参考訳): ソーシャルメディア上での政治分極の同定におけるサンプルデータセットのリスク状態バイアス
- Authors: Gabriele Di Bona, Emma Fraxanet, Björn Komander, Andrea Lo Sasso, Virginia Morini, Antoine Vendeville, Max Falkenberg, Alessandro Galeazzi,
- Abstract要約: ポーランドの政治論争の構造分極を24時間にわたって調査する。
大規模なサンプルはプラットフォーム上の政治的議論全体を表すことができるが、小さなサンプルはオンラインでの偏光の真の構造を正確に反映することができない。
- 参考スコア(独自算出の注目度): 34.192291430580454
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Following recent policy changes by X (Twitter) and other social media platforms, user interaction data has become increasingly difficult to access. These restrictions are impeding robust research pertaining to social and political phenomena online, which is critical due to the profound impact social media platforms may have on our societies. Here, we investigate the reliability of polarization measures obtained from different samples of social media data by studying the structural polarization of the Polish political debate on Twitter over a 24-hour period. First, we show that the political discussion on Twitter is only a small subset of the wider Twitter discussion. Second, we find that large samples can be representative of the whole political discussion on a platform, but small samples consistently fail to accurately reflect the true structure of polarization online. Finally, we demonstrate that keyword-based samples can be representative if keywords are selected with great care, but that poorly selected keywords can result in substantial political bias in the sampled data. Our findings demonstrate that it is not possible to measure polarization in a reliable way with small, sampled datasets, highlighting why the current lack of research data is so problematic, and providing insight into the practical implementation of the European Union's Digital Service Act which aims to improve researchers' access to social media data.
- Abstract(参考訳): X(Twitter)や他のソーシャルメディアプラットフォームによる最近のポリシー変更に続いて、ユーザインタラクションデータへのアクセスがますます困難になっている。
これらの制限は、社会や政治現象に関する堅牢な研究を妨げるものであり、これはソーシャルメディアプラットフォームが社会に深く影響しているためである。
そこで本稿では,24時間にわたるポーランド政治討論会において,ソーシャルメディアデータの異なるサンプルから得られる偏極対策の信頼性について検討する。
まず、Twitter上の政治的議論は、Twitterのより広い議論のごく一部にすぎないことを示す。
第二に、大規模なサンプルはプラットフォーム上での政治的議論全体を表すことができるが、小さなサンプルはオンラインでの偏光の真の構造を正確に反映することができない。
最後に,キーワードを多用して選択した場合,キーワードベースのサンプルが代表的であることを示すが,未選択のキーワードはサンプルデータに政治的偏見を生じさせる可能性がある。
我々の研究結果は、小さなサンプルデータセットで信頼できる方法で偏光を測定することは不可能であることを示すとともに、現在の研究データ不足がなぜ問題なのかを強調し、研究者のソーシャルメディアデータへのアクセスを改善することを目的とした欧州連合のデジタルサービス法(Digital Service Act)の実践的実装に関する洞察を提供する。
関連論文リスト
- On the Use of Proxies in Political Ad Targeting [49.61009579554272]
我々は、主要な政治広告主がプロキシ属性をターゲットとして緩和を回避したことを示す。
本研究は政治広告の規制に関する議論に重要な意味を持つ。
論文 参考訳(メタデータ) (2024-10-18T17:15:13Z) - Can LLMs Help Predict Elections? (Counter)Evidence from the World's Largest Democracy [3.0915192911449796]
ソーシャルメディアが世論の形成にどのように影響し、政治的結果に影響を及ぼすかについての研究は、一般的な調査分野である。
本稿では,Large Language Models (LLMs) の機能を活用し,ソーシャルメディアデータを調べ,選挙結果を予測する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-13T15:13:23Z) - Modeling Political Orientation of Social Media Posts: An Extended
Analysis [0.0]
オンラインソーシャルメディア上で政治的分極を特徴付ける機械学習モデルを開発することは、大きな課題である。
これらの課題は主に、注釈付きデータの欠如、ソーシャルメディアデータセットにおけるノイズの存在、膨大な量のデータなど、さまざまな要因に起因している。
本稿では、ソーシャルメディア投稿のラベル付けに、メディアバイアスと投稿コンテンツを活用する2つの方法を紹介する。
ソーシャルメディア投稿の政治的指向を予測することで,現在の機械学習モデルの性能向上を実証する。
論文 参考訳(メタデータ) (2023-11-21T03:34:20Z) - Quantitative Analysis of Forecasting Models:In the Aspect of Online
Political Bias [0.0]
ソーシャルメディア投稿を5つの異なる政治傾向カテゴリーに分類する手法を提案する。
我々のアプローチは、政治的イデオロギーの異なる2つのソーシャルメディアデータセット上で、既存の時系列予測モデルを活用することである。
論文 参考訳(メタデータ) (2023-09-11T16:17:24Z) - Unveiling the Hidden Agenda: Biases in News Reporting and Consumption [59.55900146668931]
イタリアのワクチン論争に関する6年間のデータセットを構築し、物語と選択バイアスを特定するためにベイジアン潜在空間モデルを採用する。
バイアスとエンゲージメントの間に非線形な関係が見られ、極端な位置へのエンゲージメントが高くなった。
Twitter上でのニュース消費の分析は、同様のイデオロギー的な立場のニュースメディアの間で、一般的なオーディエンスを明らかにしている。
論文 参考訳(メタデータ) (2023-01-14T18:58:42Z) - Design and analysis of tweet-based election models for the 2021 Mexican
legislative election [55.41644538483948]
選挙日前の6ヶ月の間に、1500万件の選挙関連ツイートのデータセットを使用します。
地理的属性を持つデータを用いたモデルが従来のポーリング法よりも精度と精度で選挙結果を決定することがわかった。
論文 参考訳(メタデータ) (2023-01-02T12:40:05Z) - Fast Few shot Self-attentive Semi-supervised Political Inclination
Prediction [12.472629584751509]
政策立案者やジャーナリストにとって、特定の場所にいる人々の政治的傾向を理解するために、ソーシャルメディア上でオンライン世論調査を作成することは、今やますます一般的になっている。
我々は、その目的をさらに進めるために、政治的傾き検出のための自己注意型半教師付きフレームワークを導入する。
資源制約のある設定でも,モデルは非常に効率的であることがわかった。
論文 参考訳(メタデータ) (2022-09-21T12:07:16Z) - Reaching the bubble may not be enough: news media role in online
political polarization [58.720142291102135]
分極を減らす方法は、異なる政治的指向を持つ個人に党間のニュースを分配することである。
本研究は、ブラジルとカナダにおける全国選挙の文脈において、これが成立するかどうかを考察する。
論文 参考訳(メタデータ) (2021-09-18T11:34:04Z) - Two-Faced Humans on Twitter and Facebook: Harvesting Social Multimedia
for Human Personality Profiling [74.83957286553924]
我々は、"PERS"と呼ばれる新しい多視点融合フレームワークを適用して、マイアーズ・ブリッグス・パーソナリティ・タイプインジケータを推定する。
実験の結果,多視点データからパーソナリティ・プロファイリングを学習する能力は,多様なソーシャル・マルチメディア・ソースからやってくるデータを効率的に活用できることが示唆された。
論文 参考訳(メタデータ) (2021-06-20T10:48:49Z) - TIMME: Twitter Ideology-detection via Multi-task Multi-relational
Embedding [26.074367752142198]
我々は、人々のイデオロギーや政治的傾向を予測する問題を解決することを目的としている。
我々は、Twitterデータを用いてそれを推定し、分類問題として定式化する。
論文 参考訳(メタデータ) (2020-06-02T00:00:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。