論文の概要: How Many Tweets DoWe Need?: Efficient Mining of Short-Term Polarized
Topics on Twitter: A Case Study From Japan
- arxiv url: http://arxiv.org/abs/2211.16305v1
- Date: Tue, 29 Nov 2022 15:41:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 12:43:06.235123
- Title: How Many Tweets DoWe Need?: Efficient Mining of Short-Term Polarized
Topics on Twitter: A Case Study From Japan
- Title(参考訳): ツイートはいくつ必要か?
Twitterにおける短期分極トピックの効率的なマイニング : 日本からの事例研究
- Authors: Tomoki Fukuma, Koki Noda, Hiroki Kumagai, Hiroki Yamamoto, Yoshiharu
Ichikawa, Kyosuke Kambe, Yu Maubuchi and Fujio Toriumi
- Abstract要約: そこで本研究では,Twitter上の偏光トピックを短時間,すなわち12時間で識別する手法を開発した。
また、ランダムに収集したつぶやきを用いて偏極レベルを推定する機械学習手法を用いた予測手法を開発した。
私たちの研究は、低リソースのツイートでトピックの偏極レベルを予測する最初のものです。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, social media has been criticized for yielding polarization.
Identifying emerging disagreements and growing polarization is important for
journalists to create alerts and provide more balanced coverage. While recent
studies have shown the existence of polarization on social media, they
primarily focused on limited topics such as politics with a large volume of
data collected in the long term, especially over months or years. While these
findings are helpful, they are too late to create an alert immediately. To
address this gap, we develop a domain-agnostic mining method to identify
polarized topics on Twitter in a short-term period, namely 12 hours. As a
result, we find that daily Japanese news-related topics in early 2022 were
polarized by 31.6\% within a 12-hour range. We also analyzed that they tend to
construct information diffusion networks with a relatively high average degree,
and half of the tweets are created by a relatively small number of people.
However, it is very costly and impractical to collect a large volume of tweets
daily on many topics and monitor the polarization due to the limitations of the
Twitter API. To make it more cost-efficient, we also develop a prediction
method using machine learning techniques to estimate the polarization level
using randomly collected tweets leveraging the network information. Extensive
experiments show a significant saving in collection costs compared to baseline
methods. In particular, our approach achieves F-score of 0.85, requiring 4,000
tweets, 4x savings than the baseline. To the best of our knowledge, our work is
the first to predict the polarization level of the topics with low-resource
tweets. Our findings have profound implications for the news media, allowing
journalists to detect and disseminate polarizing information quickly and
efficiently.
- Abstract(参考訳): 近年、ソーシャルメディアは偏光を放つと批判されている。
ジャーナリストが警告を作成し、よりバランスのとれた報道を提供することが重要である。
近年の研究ではソーシャルメディアにおける分極の存在が示されているが、特に数ヶ月や数年にわたって収集された大量のデータを持つ政治などの限られたトピックに焦点が当てられている。
これらの発見は役に立つが、すぐにアラートを作成するには遅すぎる。
このギャップに対処するため,Twitter上での分極トピックを短時間,すなわち12時間で識別するドメインに依存しないマイニング手法を開発した。
その結果,2022年前半の日刊ニュース関連トピックは,12時間以内で31.6\%の偏光が見られた。
また、比較的高い平均度で情報拡散ネットワークを構築する傾向があり、ツイートの半分が比較的少数の人によって作られていることも分析した。
しかし、Twitter APIの制限により、多くのトピックで毎日大量のツイートを収集し、偏光を監視するのは非常にコストがかかり、現実的ではない。
コスト効率を高めるために,ネットワーク情報を活用したランダムに収集したつぶやきを用いて偏光レベルを推定する機械学習手法を用いた予測手法を開発した。
広範な実験により、ベースラインメソッドと比較して収集コストが大幅に削減されることが示された。
特に,f-score は 0.85 で,ベースラインよりも 4 倍の節約が要求される。
我々の知る限りでは、低リソースのツイートでトピックの偏極レベルを予測するのは、私たちの仕事が初めてです。
我々の発見は、ジャーナリストが偏光情報を迅速かつ効率的に検出し、広めることを可能にし、ニュースメディアに深く影響している。
関連論文リスト
- Sampled Datasets Risk Substantial Bias in the Identification of Political Polarization on Social Media [34.192291430580454]
ポーランドの政治論争の構造分極を24時間にわたって調査する。
大規模なサンプルはプラットフォーム上の政治的議論全体を表すことができるが、小さなサンプルはオンラインでの偏光の真の構造を正確に反映することができない。
論文 参考訳(メタデータ) (2024-06-28T12:13:29Z) - Bias or Diversity? Unraveling Fine-Grained Thematic Discrepancy in U.S.
News Headlines [63.52264764099532]
われわれは、2014年から2022年までの米国の主要メディアから、180万件のニュース記事の大規模なデータセットを使用している。
我々は、国内政治、経済問題、社会問題、外交の4つの主要なトピックに関連する、きめ細かいテーマの相違を定量化する。
以上の結果から,国内政治や社会問題においては,一定のメディア偏見が原因であることが示唆された。
論文 参考訳(メタデータ) (2023-03-28T03:31:37Z) - Unveiling the Hidden Agenda: Biases in News Reporting and Consumption [59.55900146668931]
イタリアのワクチン論争に関する6年間のデータセットを構築し、物語と選択バイアスを特定するためにベイジアン潜在空間モデルを採用する。
バイアスとエンゲージメントの間に非線形な関係が見られ、極端な位置へのエンゲージメントが高くなった。
Twitter上でのニュース消費の分析は、同様のイデオロギー的な立場のニュースメディアの間で、一般的なオーディエンスを明らかにしている。
論文 参考訳(メタデータ) (2023-01-14T18:58:42Z) - Adherence to Misinformation on Social Media Through Socio-Cognitive and
Group-Based Processes [79.79659145328856]
誤報が広まると、これはソーシャルメディア環境が誤報の付着を可能にするためである、と我々は主張する。
偏光と誤情報付着が密接な関係にあると仮定する。
論文 参考訳(メタデータ) (2022-06-30T12:34:24Z) - NeuS: Neutral Multi-News Summarization for Mitigating Framing Bias [54.89737992911079]
様々な政治スペクトルの複数のニュース見出しから中立的な要約を生成する新しい課題を提案する。
最も興味深い観察の1つは、生成モデルは、事実的に不正確なコンテンツや検証不可能なコンテンツだけでなく、政治的に偏ったコンテンツにも幻覚を与えることができることである。
論文 参考訳(メタデータ) (2022-04-11T07:06:01Z) - Reaching the bubble may not be enough: news media role in online
political polarization [58.720142291102135]
分極を減らす方法は、異なる政治的指向を持つ個人に党間のニュースを分配することである。
本研究は、ブラジルとカナダにおける全国選挙の文脈において、これが成立するかどうかを考察する。
論文 参考訳(メタデータ) (2021-09-18T11:34:04Z) - Uncovering the structure of the French media ecosystem [0.0]
1年間にわたって、フランスにおけるオンラインニュースの制作と流通に関するデータを集めている。
構造体のブロックモデルは、別クラスタにおける反情報プレスの系統的拒絶を示す。
結論として、フランスのメディアエコシステムは、米国のメディアエコシステムと同等の偏極に苦しめられていない。
論文 参考訳(メタデータ) (2021-07-26T09:51:54Z) - News consumption and social media regulations policy [70.31753171707005]
我々は、ニュース消費とコンテンツ規制の間の相互作用を評価するために、反対のモデレーション手法であるTwitterとGabを強制した2つのソーシャルメディアを分析した。
以上の結果から,Twitterが追求するモデレーションの存在は,疑わしいコンテンツを著しく減少させることがわかった。
Gabに対する明確な規制の欠如は、ユーザが両方のタイプのコンテンツを扱う傾向を生じさせ、ディスカウント/エンドレスメントの振る舞いを考慮に入れた疑わしいコンテンツに対してわずかに好みを示す。
論文 参考訳(メタデータ) (2021-06-07T19:26:32Z) - Exploring Polarization of Users Behavior on Twitter During the 2019
South American Protests [15.065938163384235]
われわれは、2019年に南アメリカのいくつかの国を麻痺させた抗議活動について、異なる文脈でTwitter上で偏極を探っている。
政治家のツイートやハッシュタグキャンペーンに対するユーザの支持を(反対かにかかわらず)抗議に対する明確なスタンスで活用することにより、何百万人ものユーザーによる弱いラベル付きスタンスデータセットを構築します。
イベント中の「フィルターバブル」現象の実証的証拠は、ユーザベースがスタンスの観点から均質であるだけでなく、異なるクラスタのメディアからユーザが移行する確率も低いことを示すものである。
論文 参考訳(メタデータ) (2021-04-05T07:13:18Z) - High-level Approaches to Detect Malicious Political Activity on Twitter [0.0]
2020年5月、約500万のアカウントと1億2000万以上のツイートで撮影されたデータスナップショットを調査した。
分析期間は2019年8月から2020年5月までで、2019年10月6日のポルトガル総選挙に焦点が当てられている。
私たちは、Twitterのサスペンションパターンが、ポルトガルのTwitter圏で見られる政治的トロルのタイプに適していないことを知りました。
論文 参考訳(メタデータ) (2021-02-04T22:54:44Z) - Towards A Sentiment Analyzer for Low-Resource Languages [0.0]
本研究は,当時盛んに議論されてきた特定のトレンドトピックに対して,ユーザの感情を分析することを目的としている。
2019年のインドネシア大統領選挙で話題になったハッシュタグのtextit#kpujangancurangを使っています。
本研究は,ラピッドマイニングツールを用いて,Twitterデータを生成し,Nieve Bayes,K-Nearest Neighbor,Decision Tree,Multi-Layer Perceptronの分類手法を比較し,Twitterデータの感情を分類する。
論文 参考訳(メタデータ) (2020-11-12T13:50:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。