論文の概要: Unveiling Global Narratives: A Multilingual Twitter Dataset of News
Media on the Russo-Ukrainian Conflict
- arxiv url: http://arxiv.org/abs/2306.12886v1
- Date: Thu, 22 Jun 2023 13:52:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-23 14:26:28.154386
- Title: Unveiling Global Narratives: A Multilingual Twitter Dataset of News
Media on the Russo-Ukrainian Conflict
- Title(参考訳): global narratives: 露ウクライナ紛争に関するニュースメディアの多言語twitterデータセット
- Authors: Sherzod Hakimov and Gullal S. Cheema
- Abstract要約: ロシアとウクライナの紛争は世界中で激しいメディア報道の対象となっている。
ソーシャルメディア上でニュースやメディアが投稿したつぶやきを収集・処理することで,この話題に焦点を当てた新しいデータセットを提案する。
私たちは2022年2月から2023年5月までのツイートを収集し、60の言語で約150万のツイートを取得しました。
- 参考スコア(独自算出の注目度): 1.2437226707039446
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The ongoing Russo-Ukrainian conflict has been a subject of intense media
coverage worldwide. Understanding the global narrative surrounding this topic
is crucial for researchers that aim to gain insights into its multifaceted
dimensions. In this paper, we present a novel dataset that focuses on this
topic by collecting and processing tweets posted by news or media companies on
social media across the globe. We collected tweets from February 2022 to May
2023 to acquire approximately 1.5 million tweets in 60 different languages.
Each tweet in the dataset is accompanied by processed tags, allowing for the
identification of entities, stances, concepts, and sentiments expressed. The
availability of the dataset serves as a valuable resource for researchers
aiming to investigate the global narrative surrounding the ongoing conflict
from various aspects such as who are the prominent entities involved, what
stances are taken, where do these stances originate, and how are the different
concepts related to the event portrayed.
- Abstract(参考訳): ロシアとウクライナの紛争は世界中で激しいメディア報道の対象となっている。
この話題を取り巻く世界的物語を理解することは、多面的次元に関する洞察を得ることを目指す研究者にとって極めて重要である。
本稿では,ソーシャルメディア上でニュースやメディアが投稿したつぶやきを収集・処理することで,この話題に焦点を当てた新しいデータセットを提案する。
私たちは2022年2月から2023年5月までのツイートを収集し、60の言語で約150万のツイートを取得しました。
データセット内の各ツイートには処理されたタグが添付されており、エンティティ、スタンス、コンセプト、感情の識別が可能だ。
データセットの可用性は、誰が重要なエンティティであるか、どのようなスタンスが取られるのか、これらのスタンスがどこから生まれたのか、イベントに関連するさまざまな概念がどのように表現されているのかなど、さまざまな側面から、現在進行中の紛争を取り巻く世界的物語を調査することを目的とした研究者にとって、貴重な情報源となる。
関連論文リスト
- IsamasRed: A Public Dataset Tracking Reddit Discussions on Israel-Hamas
Conflict [14.937352663734178]
われわれは、2023年8月から2023年11月にかけて、40万件近い会話と、Redditからの800万件以上のコメントを慎重に収集したデータセットを提示する。
このデータセットに関する最初の分析では、話題、論争、感情的、道徳的な言語傾向を時間とともに調査し、感情的に荷電され、複雑な言論の性質を強調した。
このデータセットは、オンライン議論の理解を深めることを目的としており、デジタル空間におけるイデオロギー、感情、コミュニティエンゲージメントの間の複雑な相互作用に光を当てている。
論文 参考訳(メタデータ) (2024-01-16T08:30:41Z) - News and Misinformation Consumption in Europe: A Longitudinal
Cross-Country Perspective [49.1574468325115]
本研究では,欧州4カ国における情報消費について検討した。
フランス、ドイツ、イタリア、イギリスのニュースメディアアカウントから3年間のTwitter活動を分析した。
信頼性のある情報源が情報ランドスケープを支配していることを示しているが、信頼性の低いコンテンツは依然としてすべての国に存在している。
論文 参考訳(メタデータ) (2023-11-09T16:22:10Z) - Bias or Diversity? Unraveling Fine-Grained Thematic Discrepancy in U.S.
News Headlines [63.52264764099532]
われわれは、2014年から2022年までの米国の主要メディアから、180万件のニュース記事の大規模なデータセットを使用している。
我々は、国内政治、経済問題、社会問題、外交の4つの主要なトピックに関連する、きめ細かいテーマの相違を定量化する。
以上の結果から,国内政治や社会問題においては,一定のメディア偏見が原因であることが示唆された。
論文 参考訳(メタデータ) (2023-03-28T03:31:37Z) - Automated multilingual detection of Pro-Kremlin propaganda in newspapers
and Telegram posts [5.886782001771578]
ロシア連邦とウクライナの大規模な紛争は、前例のない量のニュース記事やソーシャルメディアデータを生み出した。
本研究は、ウクライナ語、ロシア語、ルーマニア語、英語のニュース記事やテレグラムのニュースチャンネルを用いて、戦初月にメディアが世論にどう影響し、どのように反映したかを分析した。
我々はトランスフォーマーと言語特徴に基づく多言語自動プロパガンダ識別の2つの手法を提案し,比較する。
論文 参考訳(メタデータ) (2023-01-25T14:25:37Z) - Computational Assessment of Hyperpartisanship in News Titles [69.3939291118954]
我々は,2200個の手動ラベル付き,1.8万個の機械ラベル付きタイトルを用いた超党派ニュースタイトル検出のための新しいデータセットを開発した。
我々は、ニュースタイトルにおけるパルチザンの程度と動態を定量化するために、計算分析を行う。
全体的に右派メディアは比例して超党派的なタイトルを使う傾向にある。
論文 参考訳(メタデータ) (2023-01-16T05:56:58Z) - Unveiling the Hidden Agenda: Biases in News Reporting and Consumption [59.55900146668931]
イタリアのワクチン論争に関する6年間のデータセットを構築し、物語と選択バイアスを特定するためにベイジアン潜在空間モデルを採用する。
バイアスとエンゲージメントの間に非線形な関係が見られ、極端な位置へのエンゲージメントが高くなった。
Twitter上でのニュース消費の分析は、同様のイデオロギー的な立場のニュースメディアの間で、一般的なオーディエンスを明らかにしている。
論文 参考訳(メタデータ) (2023-01-14T18:58:42Z) - Twitter Dataset on the Russo-Ukrainian War [68.713984286035]
Twitter APIから現在進行中のデータセットの取得を開始しています。
データセットは770万人のユーザーを起源とする5730万ツイートに達している。
我々は、最初のボリュームと感情分析を適用し、データセットはトピック分析、ヘイトスピーチ、プロパガンダ認識、ボットネットのような潜在的な悪意のあるエンティティを示すためにさらに探索的な調査に使用することができる。
論文 参考訳(メタデータ) (2022-04-07T12:33:06Z) - Tweets in Time of Conflict: A Public Dataset Tracking the Twitter
Discourse on the War Between Ukraine and Russia [14.000779544058144]
2022年2月24日、ロシアはウクライナに侵攻し、その後、戦争が急速にエスカレートしたと報道された。
ロシアは直ちに世界からの反発と非難に直面した。
戦争はウクライナで進行中の人道的・難民危機に引き続き貢献しているが、オンライン空間では第2の戦場が出現している。
論文 参考訳(メタデータ) (2022-03-14T20:52:02Z) - A Weibo Dataset for the 2022 Russo-Ukrainian Crisis [59.258530429699924]
我々は、最初のリリースで350万以上のユーザー投稿とコメントを含む、ロシア・ウクライナ危機Weiboデータセットを提示する。
我々のデータはhttps://github.com/yrf1/Russia-Ukraine_weibo_dataset.comから入手可能です。
論文 参考訳(メタデータ) (2022-03-09T19:06:04Z) - TBCOV: Two Billion Multilingual COVID-19 Tweets with Sentiment, Entity,
Geo, and Gender Labels [5.267993069044648]
この研究は、新型コロナウイルス(COVID-19)のパンデミックに関連する20億以上の多言語ツイートを1年以上にわたって収集した大規模なTwitterデータセットTBCOVを提示する。
いくつかの最先端のディープラーニングモデルは、感情ラベル、名前付きエンティティ、人物の言及、組織、場所、ユーザータイプ、性別情報など、重要な属性でデータを強化するために使用される。
我々の感情と傾向分析は興味深い洞察を示し、TBCOVが重要なトピックを幅広くカバーしていることを確認する。
論文 参考訳(メタデータ) (2021-10-04T06:17:12Z) - BLM-17m: A Large-Scale Dataset for Black Lives Matter Topic Detection on
Twitter [25.881740515679393]
我々は,1700万ツイートを含むトピック検出のためのラベル付きデータセットを提案する。
これらのツイートは、2020年5月25日から8月21日までの89日間に収集される。
論文 参考訳(メタデータ) (2021-05-04T07:27:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。